0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

当前的AI还不擅长处理哪些种类的问题?

zhKF_jqr_AI 来源:未知 作者:李倩 2018-10-13 09:02 次阅读

编者按:数据科学家Shayaan Jagtap以马里奥和精灵宝可梦为例,解释了当前的AI还不擅长处理哪些种类的问题。

你大概早就听说机器能以超人的水平玩游戏。这些机器可能经过明确编程,对设定的输入作出反应,给出设定的输出,也可能自行学习演化,以不同的方式对相同的输入作出反应,希望找到最优的反应。

一些著名的例子:

AlphaZero,24小时训练之后,成为地球上最强大的国际象棋选手。

AlphaGo,著名的围棋机器人,击败了世界级棋手李世乭和柯洁。

MarI/O,可自行学习以任意等级进行游戏的超级马里奥机器人。

这些游戏很复杂,训练上面的机器需要精心组合复杂的算法,反复模拟,大量时间。本文将重点讨论MarI/O,以及为何我们无法使用相似的方法通关精灵宝可梦游戏。

在这方面,马里奥和精灵宝可梦有三个关键不同:

目标数量

分支因子

全局优化与局部优化

目标数量

机器学习的方式是优化某种目标函数。不管它是最大化奖励函数(强化学习)、适应度函数(遗传算法),还是最小化代价函数(监督学习),目标都是类似的:取得尽可能好的分数。

马里奥只有一个目标:到达本级别的终点。简单来说,在死亡之前,到达的地方越靠右,表现就越好。这是一个单一的目标函数,模型的能力可以由这一个数字直接衡量。

精灵宝可梦的目标……有很多。击败精英4级?捕获所有宝可梦?训练最强团队?上面所有这些?还是其他完全不同的目标?

我们不仅需要定义什么是最终目标,还要定义进展看起来是什么样的?这样,任意时刻,大量可能选择之中的每种行动才能和奖励或损失对应起来。

这引出了下一项主题。

分支因子

简单说,分支因子是任意一步可以做出的可能选择数量。国际象棋的分支因子平均是35,围棋是250. 额外考虑的未来每一步,都有(分支因子)步数项选择需要评估。

马里奥中,要么向左,要么向右,要么起跳,要么什么也不做。机器需要评估的选择数很小。同时,从算力上说,分支因子越小,机器人可以预计的步数就越多。

精灵宝可梦则是一个开放世界游戏,这意味着,任意给定时刻都有大量选择。简单的向上、向下、向左、向右无法有效计算分支因子数量。相反,我们需要查看下一个有意义的行动。下一个行动是进入战斗,和NPC交谈,还是进入左/右/上/下方的小地图?随着游戏的进行,可能的选择范围越来越大。

创建一个可以找到最佳选择组合的机器,需要考虑短期和长期目标,这引出了最后一项主题。

全局优化与局部优化

局部优化与全局优化既包括空间层面,也包括时间层面。短期目标和周围地理区域属于局部,长期目标和城市、全地图这样较大的区域属于全局。

拆分每一步可以是一种分解精灵宝可梦问题的方式。如何从A点到B点的局部优化是容易的,但决定哪个目的地是最优的B点则是一个困难得多的问题。贪心算法在这里无法奏效,因为局部最优的决策不一定导向全局最优。

马里奥地图很小,而且是线性的。而精灵宝可梦却有着错综复杂的非线性大地图。为了达到高阶目标,当前优先级会随着时间而改变,将全局目标转换为优先局部优化问题不是一项容易的任务。这不是我们当前的模型具有足够能力可以处理的事情。

最后一点

从机器人的角度来说,精灵宝可梦不是一个游戏。机器人都是专门的,当你遭遇要战斗的NPC时,帮助你在地图上移动的机器人对此束手无策——这是两个完全不同的任务。

在战斗阶段,每个回合有许多选项。选择如何移动,切换到哪个宝可梦,何时使用不同的物品,本身就是一个复杂的优化问题。我看到过一篇介绍如何创建战斗模拟器的文章,考虑得很周到,在没有考虑物品使用这一决定战斗结果的关键因素的前提下,复杂度已经高得惊人了。

目前,我们能够创造出能够在我们自己的游戏中战胜我们的机器人,我们该为此感到高兴。这些游戏在数学上很复杂,但在目标上很简单。随着AI技术的进展,我们将创造能够解决有越来越大影响力的真实世界问题的机器人,这些机器人将通过自行学习复杂优化问题来解决真实世界问题。可以放心的是,还是有很多事情我们要比机器更擅长,其中包括我们童年时玩的游戏——至少到目前为止是这样。感谢阅读!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    206

    文章

    26978

    浏览量

    201309
  • AI
    AI
    +关注

    关注

    87

    文章

    26364

    浏览量

    263958
  • 函数
    +关注

    关注

    3

    文章

    3859

    浏览量

    61297

原文标题:为什么AI可以通关马里奥,却玩不好精灵宝可梦?

文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    触控按键之无须做特别的绝缘处理

    `触控按键之无须做特别的绝缘处理你的触控按键还需做特别处理绝缘问题吗?女生一般对电器之类的都比较不擅长,特别是没有把 绝缘处理好的情况下,更加不敢碰,深圳市沃迩玛电子有限公司生产的触控
    发表于 09-13 09:49

    CPU和GPU擅长不擅长的地方

    不擅长”。 芯片的速度主要取决于三个方面:微架构、主频、IPC(每个时钟周期执行的指令数)。 1.微架构从微架构上看,CPU和GPU看起来完全不是按照相同的设计思路设计的,当代CPU的微架构是按照兼顾
    发表于 12-03 15:43

    CPU和GPU擅长不擅长的地方

    不擅长”。芯片的速度主要取决于三个方面:微架构、主频、IPC(每个时钟周期执行的指令数)。1.微架构从微架构上看,CPU和GPU看起来完全不是按照相同的设计思路设计的,当代CPU的微架构是按照兼顾“指令
    发表于 12-03 20:08

    AD蛇形布线和等长处理技巧

    添加类:做等长处理的往往是多根线,需要将多根线归成一类,设置netclass方法如下:在原理图中:Place-directives-BlanketPlace-directives-NetClass标记结果如下:仅作参考,比如将电源归位电源类
    发表于 05-24 08:57

    请问电路分析不擅长该怎么抄板?

    电路分析不擅长,怎么抄板,有没有大师分享点经验
    发表于 07-03 05:35

    什么是数字信号处理器性价比的新标杆?

    很强的数据处理能力,然而系统必要的控制功能是DSP所不擅长的。什么是数字信号处理器性价比的新标杆?我们需要注意什么?
    发表于 08-02 07:25

    为什么AI设计师要特别区分:相关性 VS. 因果性呢?

    最低(最佳)的组合(解)。 AI设计师很清楚:AI擅长找规律,但不擅长找正确(最佳)解,能有80%准确度就很棒了,所以AI设计师跳出传统程式
    发表于 11-26 10:21

    诠释AI的两大特征:黑盒子与不确定性

    for Uncertainty in Artificial Intelligence,简称AUAI)。并且定期召开大型会议,研讨各种可能的解决途径。 5.2 AI不擅长<不确定性>
    发表于 11-26 10:45

    芯片的速度取决于哪几个方面?

    芯片的速度取决于哪几个方面?CPU和GPU擅长不擅长的地方看了就知道
    发表于 04-06 09:05

    单片机数字滤波算法的实现方法

    关注、星标公众号,直达精彩内容ID:技术让梦想更伟大整理:李肖遥单片机主要作用是控制外围的器件,并实现一定的通信和数据处理。但在某些特定场合,不可避免地要用到数学运算,尽管单片机并不擅长...
    发表于 02-09 06:36

    探讨一下用于单片机的几种C语言算法

    单片机主要作用是控制外围的器件,并实现一定的通信和数据处理。虽然单片机不擅长实现算法和进行复杂...
    发表于 02-25 07:21

    现在的人工智能系统是怎样的状态

    所谓窄AI,是指那些特别擅长处理单一任务或者特定范围内工作的系统。
    发表于 04-22 17:41 1488次阅读

    女性也能撑起人工智能的半边天!

    谁说女性并不擅长理科?!在各种硬核的科技领域,
    发表于 03-08 14:55 785次阅读

    擅长PCB画板但不擅长APP开发,如何才能克服不足,将家用电器改造成智能电器呢?

    正所谓术业有专攻,自从踏入电子信息这领域,从大学主攻模电数电,到上班后画PCB、做EMC测试等等,我在硬件工程师的路上越走越远了,在计算机领域的Java、Swift等等语言,了解的也少了,更是不擅长
    的头像 发表于 03-17 10:50 230次阅读
    我<b class='flag-5'>擅长</b>PCB画板但<b class='flag-5'>不擅长</b>APP开发,如何才能克服不足,将家用电器改造成智能电器呢?

    苹果发布研究论文:揭示Ferret-UI AI系统,破解MLLMs移动应用理解难题

    目前围绕人工智能(AI)技术,出现了如ChatGPT这样的大语言模型(LLMs),这些模型擅长处理文本资料。然而,对于像图片、视频和声音等多媒体类型的非文本n内容,就需要扩大AI模型的适用范围,相应地,多模态大语言模型(MLLM
    的头像 发表于 04-10 10:17 167次阅读