你有没有想过,你的手机是怎么认出你的脸?相册又是怎么把猫狗照片自动分类?这些我们习以为常的场景,背后都藏着人工智能(AI)的“学习方式”。AI的学习方式就像我们人类上学一样,有不同的“门派”。今天,就让我们一起走进AI的学习世界,了解其中一个重要门派——监督学习。

监督学习——有“老师”引路的“应试学霸”
1.什么是监督学习?
监督学习,简单说就是有“老师”指导、有“标准答案”的学习模式,也是AI最常用的学习方式之一。它的核心逻辑很简单:用已经标注好“标准答案”的数据,一点点学习规律,最后训练成一个能精准判断模型。即便遇到没见过的新问题,它也能根据学到的规律,尽可能做出合理判断。
我们可以用一个生活化的例子理解:就像学生做练习册(训练集),每道题后面都附带上标准答案(行业里称为“标签”)。学生做题时尝试给出答案(AI的“预测”),对照标准答案发现错误后,对照标准答案发现差距后,通过算法不断调整自己的“解题方式”(AI中的“参数优化”);经过成千上万次的练习,学生就能掌握这类题的解题规律。等到考试时(实际应用),即便遇到新题目,也能凭借积累的经验给出更接近正确答案的判断——这就是监督学习的大致过程。

2.理解监督学习的三个关键词:
·标签:这是监督学习的“灵魂”,也就是数据的“标准答案”。比如给每一张照片都标好了“猫”或“狗”,没有这些“标签”,AI无从判断自己学得对不对;
·分类:AI的核心任务之一,就是预测“离散的类别”,比如判断一张图片是“猫”还是“狗”,一封邮件是“正常邮件”还是“垃圾邮件”,这类需要判断类别的问题,属于分类任务;
·回归:和分类不同,回归是预测“连续的数值”,比如根据猫的体重、毛色,预测猫的年龄,这些需要给出具体数值的任务,就是回归任务。

图片来源:由AI生成
3.监督学习的应用场景
我们每天在用的刷脸解锁、垃圾短信拦截等场景中,监督学习常常是重要技术之一。
监督学习同样还走进了青少年心理健康领域。琶洲实验室朱心红教授团队研发的智能心语聊天室(IMC),就是一套面向青少年群体的AI抑郁风险辅助筛查系统。它通过采集青少年的语音、文本及问卷信息,结合机器学习模型,对抑郁风险进行辅助识别,为青少年抑郁风险辅助识别、校园心理筛查和后续专业评估提供支持。

这款小程序操作简单,包含互动式语音任务和心理问卷等板块,首次使用还有新手引导教程。青少年可以在小程序里分享开心或烦恼的事、给未来的自己留言等等——在知情同意和规范流程下,这些语音、文本和问卷信息会被采集并用于分析。与此同时,专业评估人员会结合访谈、量表和临床/心理评估结果,形成模型训练所需的标签。

IMC就像认真学习的“学霸”,反复学习青少年语音中的音高、语速、停顿、响度、能量等声学特征,再对照医生的评估结果不断调整,慢慢摸清“什么样的表达方式,可能暗藏抑郁风险”。目前,在一项13–18岁青少年MDD识别研究中,IMC结合文本与声学特征的混合融合模型,在内部验证中准确率达到0.91。在独立医院外部验证样本中,模型对MDD个体的识别灵敏度达到0.90,显示出较好的辅助识别潜力。成为老师和医护人员的“好帮手”,帮助他们更快发现需要支持的同学。

AI有多种学习方式,但不管哪种学习方法,最终目标都一样,让AI变得更聪明,帮人类解决更难的问题。就像智能心语聊天室(IMC)能辅助专业人员识别青少年抑郁风险,不同的学习方式,都能在各自的领域发光发热,为我们的生活带来改变。

看到这里,相信你已经读懂了“监督学习”~是不是一下子就懂了AI的学习秘诀?我们下期再见啦!