佳熹小说网 > 科幻小说 > 职场小聪明 > 第603章 机器学习里的分类问题和回归问题,一个故事解释

第603章 机器学习里的分类问题和回归问题,一个故事解释

推荐阅读:闭关三年,下山即无敌御兽:欺我母弱?我自化天灾!宝藏主播:榜一竞争太激烈权力巅峰:重生后我选择京圈老婆杀戮轮回!马族大明:殿下请登基分手后,五个高官女儿爱上我蜗牛少女的求生日常穿越暴富,想躺平,却被逼上进

    用故事解释分类问题和回归问题
    1. 分类问题的故事——森林里的神秘果子
    在一片神秘的森林里,小明发现了许多奇怪的果子。有些果子可以吃,而有些果子有毒。他想找到一个方法来区分这些果子。
    他观察到:
    ? 颜色:红色的果子通常是可食用的,紫色的果子通常是有毒的。
    ? 形状:圆形的果子大多能吃,尖尖的果子往往有毒。
    ? 大小:太小的果子似乎更危险。
    于是,小明决定建立一个“吃不吃果子”的规则系统:
    ? 如果果子是红色且圆形,就吃!
    ? 如果是紫色且尖尖的,就不吃!
    ? 其他情况要谨慎判断。
    这个过程就是分类问题——它的目标是给每个果子打上一个“可吃”或“不可吃”的标签。
    分类问题的典型特征:
    答案是离散的类别(例如:“可吃” vs. “不可吃”)
    数据用于区分不同类别(红色vs. 紫色,圆形vs. 尖形)
    最终输出是一个标签(1=可吃,0=不可吃)
    现实中的应用:
    ? 邮件是否是垃圾邮件?(垃圾 vs. 非垃圾)
    ? 贷款申请者是否值得批准?(批准 vs. 拒绝)
    ? 识别图片中的动物是什么?(猫 vs. 狗)
    2. 回归问题的故事——小明卖柠檬水
    夏天到了,小明在街头卖柠檬水。他想预测明天应该准备多少杯柠檬水,以免浪费或卖不够。
    他发现:
    ? 温度越高,卖出的柠檬水越多。
    ? 天气越晴朗,卖出的柠檬水也越多。
    ? 湿度太高时,人们反而不太想买柠檬水。
    他收集了一些数据,比如:
    ? 昨天 30°C,卖出 50 杯
    ? 昨天 35°C,卖出 70 杯
    ? 昨天 28°C,卖出 45 杯
    他想建立一个预测模型,比如:
    这样,如果明天预测是 32°C,他可以计算:
    那么,他就应该准备大约 76 杯柠檬水。
    这个过程就是回归问题——它的目标是预测一个连续的数值,而不是一个固定类别。
    回归问题的典型特征:
    答案是一个数值,而不是分类标签(如“明天卖 76 杯”而不是“卖得多”或“卖得少”)
    数据之间有连续性的关系(温度从 20°C 到 40°C,销量随之变化)
    最终输出是一个数值预测(如“销量=76”)
    现实中的应用:
    ? 预测房价(基于面积、地段等因素预测房价)
    ? 预测股票价格(基于历史数据预测未来走势)
    ? 预测某人未来的收入(基于年龄、教育、工作经验等)
    用比喻解释分类问题和回归问题
    1. 分类问题——“选择哪种衣服?”
    想象你站在衣柜前,思考今天穿什么衣服。你会根据天气决定:
    ? 晴天 → 穿T恤
    ? 下雨 → 穿雨衣
    ? 下雪 → 穿羽绒服
    这是一个分类问题,因为你的决策结果是几个固定选项之一(T恤、雨衣、羽绒服)。
    2. 回归问题——“决定穿多厚?”
    如果你不仅要决定穿什么,还想确定该穿多厚的衣服,就成了回归问题。
    你会想:
    ? 10°C,应该穿厚毛衣+外套(厚度 8 分)
    ? 20°C,应该穿薄外套(厚度 5 分)
    ? 30°C,应该穿短袖(厚度 2 分)
    这样,你的决定不只是T恤/雨衣/羽绒服,而是一个连续数值(衣服的厚度),这就类似于回归问题。
    总结
    对比点 分类问题 回归问题
    输出类型 固定类别(离散值) 连续数值
    目标 识别类别(苹果 or 橘子) 预测数值(温度 vs. 柠檬水销量)
    典型应用 垃圾邮件分类、疾病诊断 房价预测、销量预测
    示例 这封邮件是垃圾邮件吗?(是/否) 明天应该卖多少杯柠檬水?(75 杯)
    分类问题适合选出某个类别,而回归问题适合预测一个数值。希望这些比喻能帮你更容易理解它们的区别!

本文网址:https://jxkel.com/xs/1/1235/399576.html,手机用户请浏览:https://jxkel.com享受更优质的阅读体验。

温馨提示:按 回车[Enter]键 返回书目,按 ←键 返回上一页, 按 →键 进入下一页,加入书签方便您下次继续阅读。章节错误?点此举报