监督学习和无监督学习
oldbirds 2/3/2025 aiml机器学习
# 1. 监督学习(Supervised Learning)
监督学习是指在训练模型时,我们有已知的“标签”数据,也就是输入数据和对应的正确输出结果。例如,我们给模型提供一组图片(输入数据),并且标注好每张图片是什么动物(输出结果),模型的任务就是学会从输入数据中预测出正确的结果。
举个例子,假如你有很多猫和狗的照片,并且每张照片都标注了它是猫还是狗。监督学习的目标就是让模型学会识别猫和狗的不同特征,以便在给它一张新图片时,它能判断是猫还是狗。
# 2. 无监督学习(Unsupervised Learning)
无监督学习则不同,它不依赖于有标签的训练数据。在无监督学习中,数据没有明确的“答案”,模型的任务是从数据中发现某种模式或结构。也就是说,模型会自己分析数据之间的关系,尝试把数据分成几类,或者发现数据中的隐藏规律。
举个例子,你有一堆动物的图片,但你并不知道每张图片是什么动物。无监督学习的目标是根据图片的特征(例如颜色、形状等)将这些图片分成若干组,可能分出一组是猫,一组是狗,等等,但这些分组是模型自己发现的,并没有明确告诉模型每组是什么。
# 对比表格
特征 | 监督学习(Supervised Learning) | 无监督学习(Unsupervised Learning) |
---|---|---|
数据类型 | 需要带标签的数据(输入和输出已知) | 不需要标签的数据(只有输入数据) |
任务类型 | 分类、回归(预测一个已知的结果) | 聚类、降维(发现数据中的潜在结构或模式) |
结果 | 输出是已知的,模型用来进行预测 | 输出未知,模型自行分析数据中的规律或分组 |
举例 | 给图片加标签,预测房价,语音识别等 | 市场细分,客户聚类,降维处理等 |
# 总结
- 监督学习:数据有明确标签,模型学会预测结果。
- 无监督学习:数据没有标签,模型从数据中找规律。