想要理解 AI 欠缺什么,最好的办法是描述一个需要将各种人类习以为常的认知能力结合在一起的场景,通过分析人类的行为反应,来对比发掘,AI和人类的差距。
想象一下你和你的朋友刚买了一个复杂的新棋类游戏,有一块精致的板子和各种各样的棋子、卡片以及复杂的规则,没有人知道怎么玩它,但是在读完说明书之后你们开始游戏。有些人可能会犯一些错误,但几轮下来,每个人都学会了游戏规则,至少可以尝试赢得比赛。
在学习这个游戏的过程中发生了什么?
1.语言解析:读游戏规则的玩家必须将符号转换成口语。听游戏规则的玩家必须分析口语。
2.模式识别:玩家必须把所朗读的单词和游戏中的物体连接起来。如果该说明书有插图,那么它们必须与现实中的物体相匹配。在游戏中,玩家必须识别出旗子和卡片的错综组合,以及事件发生的关键序列。优秀的玩家还会学习去识别其他玩家的游戏模式,从而有效建立起有关他人心理状态的模型。
3.运动控制:玩家必须能够将棋子和卡片移动到棋盘上的正确位置。
4.规则遵守与规则推断:玩家必须理解规则并检查规则是否得到了正确的应用。在掌握了基本的规则之后,优秀的玩家还应该能够发现更高级别的规则或有助于他们取得胜利的倾向。这种推论能力与塑造他人思维模型的能力密切相关。(这在心理学中被称为心智理论,theory of mind)。
5.社交礼仪:玩家之间是朋友伙伴的关系,即使有些玩家犯了错误或扰乱了游戏进程,也应当友好相处。
6.处理干扰:如果门铃响了,外卖到了,玩家们必须能够从比赛中抽身,与送货人打交道,然后再投入到比赛中,回忆起游戏的进展,譬如轮到谁了。
在所有这些子问题中,AI 在部分环节的处理上取得了一些进展。在某些特定领域,虽然也有各种各样识别失败的情况发生,但人工智能的模式识别水平已经优于人类。
不过,人工智能方法识别物体和序列的能力还不如人类模式识别那样优秀。具体表现为,人类有能力创造出不变性表示。例如,即使视角不同、存在遮挡物、光照条件变幻莫测,人类仍然能够识别出特定的视觉模式(比如可以在黑暗里凭借眼睛认出一只猫,看到被建筑物遮挡到只剩一个尾灯的车,仍然能自动识别出车在建筑物后的位置)。我们的听觉模式识别技能或许更加出彩,能够在噪音干扰以及速度、音高、音色和节奏的起伏中识别出乐句。现阶段的人工智能正在这一领域取得稳步进展。
对于人工智能来说,更为严重的问题是,随着单个领域识别能力的不断进步,自己将已习得的表示在新环境中泛化(generalize)的能力是否也会随之提高,也就是说人工智能是否能做到像生物智能那样轻易实现大规模能力整合。
现有的人工智能游戏玩家都无法解析这样一句话:「这个游戏就像太空版的《卡坦岛》(This game is like Settlers of Catan, but in Space)」。语言解析可能是人工智能最为棘手的部分。人类可以使用语言获取新信息和新技能,部分原因是我们拥有关于世界的丰富的背景知识。此外,我们可以利用上下文来十分灵活地运用这些背景知识,因此我们可以辨别出内容之间相关与否。
一个常见的能力集成方面的挑战是符号接地问题(symbol grounding problem)。即符号系统(例如数学符号或语言中的词)如何与感知现象——视觉、声音、纹理等相连接。
粗略地说,人工智能方法分为两类:符号化(symbolic)和亚符号化(sub-symbolic)。符号化方法被用于「经典的」或「传统的」人工智能。它们非常适用于基于规则的确定性场景,比如下棋(但通常我们必须预先编码好规则)。如果人类提前做了符号接地(symbol-grounding),符号处理过程就会很轻松。如果让人工智能直接处理「原始」输入信息,比如光、声音、纹理和压力这些数据,效果就没那么好了。
在另一个极端,我们有亚符号方法,如神经网络(深度学习网络是其中的一种)。这些方法接收原始输入信息的数字化版本——像素、声音文件等作为输入。亚符号方法适用于许多形式的模式识别和分类问题,但是我们仍然没有可以从类别标签转换到基于规则进行操纵的符号系统的可靠方法。
综上所述,当代的人工智能和机器学习方法可以处理需要单一能力的问题(当然,处理效果各不相同),但整合这些能力,与现实世界进行实时的交互,却仍然是个远大的目标,需要工程师们继续努力。
-
人工智能
+关注
关注
1776文章
43845浏览量
230598
原文标题:AI|人工智能的能力边界在哪里?
文章出处:【微信号:THundersoft,微信公众号:ThunderSoft中科创达】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论