分类与回归

2/19/2025 aiml机器学习分类回归

# 1. 分类(Classification)

# 定义

分类是监督学习中的一种任务,其目标是将输入数据分配到预定义的类别中。例如,判断一封电子邮件是垃圾邮件还是正常邮件,或者判断一张图片中的动物是猫还是狗。

# 应用场景

  • 医疗诊断:根据患者的症状和检查结果,判断患者是否患有某种疾病。比如医生通过分析患者的体温、血液指标、影像检查等数据,判断患者是否感染流感。
  • 信用评估:根据客户的信用历史和个人信息,评估客户的信用风险。银行在审批信用卡时,会根据申请人的收入、负债情况、还款记录等信息,判断其信用等级是高、中还是低。
  • 日常购物推荐:电商平台根据用户的浏览历史、购买记录、收藏偏好等信息,将用户分类为不同的消费群体,然后为每个群体推荐合适的商品。例如,经常购买运动装备的用户可能会被归为运动爱好者群体,平台就会向他们推荐新的运动产品。

# 常见算法

  • 逻辑回归(Logistic Regression):虽然名字中有“回归”,但它是一种常用的分类算法,用于二分类问题。
  • 决策树(Decision Tree):通过构建树形结构进行分类决策。
  • 支持向量机(Support Vector Machine, SVM):在高维空间中寻找最优的分类超平面。

# 2. 回归(Regression)

# 定义

回归也是监督学习中的一种任务,其目标是预测一个连续的数值输出。例如,预测房价、股票价格等。

# 应用场景

  • 房地产市场:根据房屋的面积、位置、房龄等特征,预测房屋的价格。比如,在一个小区中,面积越大、房龄越新、周边配套设施越完善的房子,价格往往越高。
  • 天气预报:根据气象数据,预测未来的气温、降水量等。气象部门通过分析大气压力、湿度、风速等数据,预测未来几天的天气情况。
  • 日常消费预测:商家根据历史销售数据、季节因素、促销活动等信息,预测未来一段时间内的销售额。例如,一家咖啡店会根据过往的销售记录和节假日信息,预测在即将到来的情人节期间的咖啡销量。

# 常见算法

  • 线性回归(Linear Regression):假设输入特征和输出之间存在线性关系。
  • 岭回归(Ridge Regression):在线性回归的基础上加入正则化项,防止过拟合。
  • 随机森林回归(Random Forest Regression):基于决策树的集成学习算法,用于回归任务。

# 3. 分类与回归的对比

特征 分类 回归
输出类型 离散的类别标签 连续的数值
评估指标 准确率、召回率、F1值等 均方误差(MSE)、平均绝对误差(MAE)等
应用场景 需要进行类别判断的场景 需要预测数值的场景
上次更新: 2/19/2025, 9:37:08 AM