0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AlphaStar横空出世 星际争霸2人类1:10输给AI

独爱72H 来源:刘林华 作者:电子发烧友 2019-01-25 09:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AlphaStar横空出世 星际争霸2人类1:10输给AI

刚刚,我们见证了 AI 与人类 PK 的又一次重大进展!DeepMind 北京时间 1 月 25 日凌晨 2:00 起公布了其录制的 AI 在《星际争霸 2》中与2位职业选手的比赛过程:AlphaStar 5:0 战胜职业选手TLO ,5:0战胜 2018 年 WSC 奥斯汀站亚军 MaNa 。与两位人类对手的比赛相隔约两周,AI 自学成才,经历了从与TLO 对战时的菜鸟级别,进化到完美操作的过程,尤其是与MaNa 的对战,已经初步显示了可以超越人类极限的能力。

这次的演示也是 DeepMind 的星际争霸 2 AI AlphaStar 的首次公开亮相。除了此前比赛录像的展示外,AlphaStar 还和MaNa 现场来了一局,不过,这局AlphaStar 输给了人类选手MaNa 。

我们不难看出,尽管其神经网络已经趋于长期优化,但似乎仍然会在一定程度上陷入局部最优,被人类发现固定模式,落入圈套,而且从 5 个小叮当抱团,到纯追猎部队,都显示出它对游戏兵种的理解尚不到位,如果最后一局它可以像人类一样直接派出凤凰防守棱镜,或许它将继续凭借超强的微操一波推平 MaNa。

比赛回放过程中,主持人问到 DeepMind 科学家,平时如何训练 AlphaStar,DeepMind 科学家 Oriol Vinyals、David Silver 表示,首先是模仿学习,团队从许多选手那里获得了很多比赛回放资料,并试图让 AI 通过观察一个人所处的环境,尽可能地模仿某个特定的动作,从而理解星际争霸的基本知识。这其中所使用到的训练资料不但包括专业选手,也包括业余选手。这是 AlphaStar 成型的第一步。

之后,团队会使用一个称为“Alpha League”的方法。在这个方法中,Alpha League 的第一个竞争对手就是从人类数据中训练出来的神经网络,然后进行一次又一次的迭代,产生新的 agent 和分支,用以壮大“Alpha League”。

图 | Alpha League 示意图

然后,这些 agent 通过强化学习过程与“Alpha League”中的其他竞争对手进行比赛,以便尽可能有效地击败所有这些不同的策略,此外,还可以通过调整它们的个人学习目标来鼓励竞争对手朝着特定方式演进,比如说旨在获得特定的奖励。

最后,团队在“Alpha League”中选择了最不容易被利用的 agent,称之为“the nash of League”,这就是 TLO 所对战的5个。

近几年,除了 DeepMind 以外,已经有越来越多的人工智能公司或者研究机构投身到开发游戏类AI的浪潮中,例如 OpenAI 和腾讯的 AI lab 等等。

归根结底,这些团队对游戏AI的热情,恐怕都源于打造通用型人工智能的这一终极目标:游戏AI的研发将会进一步拓宽人类对于AI能力的认知,这样的研究最终将探索的问题 AI 能否能够通过游戏规则进行自主学习,达到更高层次的智能乃至通用型人工智能。例如,在游戏AI的设计中,增强学习算法的改进将至关重要。增强学习是一种能够提高 AI 能力的核心算法,它让 AI 能够解决具有不确定性动态的决策问题(比如游戏 AI,智能投资,自动驾驶,个性化医疗),这些问题往往也更加复杂。

而 DeepMind 团队的成果已经为此带来了一丝曙光——AlphaGo Zero在短时间内精通围棋、象棋、国际象棋三种棋类游戏,已有棋类通用AI雏形。棋类游戏之后,最值得期待的进展,就是各家开发的AI在即时战略类 RTS 游戏或多人在线竞技类 MOBA 游戏上的表现了。此前,腾讯 AI Lab 负责人之一姚星就介绍过,在游戏AI的研究上,腾讯 AI Lab 已从围棋 AI “绝艺”等单个 AI 的完全信息博弈类游戏,转移到规则不明确、任务多样化、情况复杂的游戏类型,如星际争霸和 Dota2 等复杂的即时战略类 RTS 游戏或多人在线竞技类 MOBA 游戏。

在刚刚过去的2018年,OpenAI 开发出的 AI OpenAI Five 就是针对 Dota2 开发的AI,但是它与人类 PK 的过程可谓充满戏剧性。2018 年 8 月初,OpenAI Five 战胜一支人类玩家高水平业余队伍(天梯 4000 分左右),然而,到了 8 月底 OpenAI Five 被两支专业队伍打败, AI 提前结束了其在本届 DOTA 2 国际顶尖赛事 TI 8 的旅程。回顾那次失败的过程,其实OpenAI 的系统仍然无法全面理解 DOTA 复杂的游戏系统和规则。

现在,DeepMind 的星际争霸2 AI 已经以其超强实力打响游戏 AI 2019 年第一战,接下来还有哪些游戏AI将横空出世呢?各大游戏AI又将如何迈向通用人工智能,让我们拭目以待。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    42023

    浏览量

    303088
  • 人工智能
    +关注

    关注

    1821

    文章

    50523

    浏览量

    267772
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Q3净利润猛增2.67倍!10家上市企业扎堆端侧AI,谁交出最靓成绩单?

    ,围绕用户变化,体验中心变为AI智能体,向手机、眼镜、手表、汽车等AI硬件设备不断扩充,端侧AI芯片成为主要AI设备落地的驱动力。 瑞芯微董事长兼CEO励民指出,受益于大模型的
    的头像 发表于 11-09 01:46 1.3w次阅读
    Q3净利润猛增2.67倍!<b class='flag-5'>10</b>家上市企业扎堆端侧<b class='flag-5'>AI</b>,谁交出最靓成绩单?

    2026年第一季度恩智浦新品大盘点

    新年伊始,马力全开!2026年开年,恩智浦推“芯”势头强劲,既有新锐产品的横空出世,也有成熟平台的稳步扩展,覆盖从机器到软件定义汽车等前沿领域,助力开发者解锁智能边缘的无限可能!
    的头像 发表于 03-28 10:16 1431次阅读

    从记录到决策:云翎智能AI+RTK执法记录仪推动巡检向“主动防御”模式转型

    传统的巡检模式,那种依赖人工经验、手持纸笔、在事故发生后才去追溯补救的“事后诸葛亮”式管理,早已无法匹配今日交通强国与能源互联网的宏大叙事。云翎智能AI+RTK执法记录仪的横空出世,绝非仅仅是一款
    的头像 发表于 03-25 22:06 446次阅读
    从记录到决策:云翎智能<b class='flag-5'>AI</b>+RTK执法记录仪推动巡检向“主动防御”模式转型

    论马斯克的预言:AI使人类边缘化

    当地时间3月11日,在“Abundance Summit”科技峰会上,马斯克谈及AI进展时表示,AI已经进入自我改进阶段,在超高量级AI面前,人类终将走向边缘化。以下是对这一预言的相关
    发表于 03-14 05:27

    苹果联姻博通,&quot;Baltra&quot;横空出世!英伟达霸主地位将变?

    电子发烧友网报道(文/莫婷婷)在全球科技巨头竞逐人工智能高地的背景下,苹果公司也在发起一场算力革命。业内媒体报道,苹果已启动代号“Baltra”的首款AI服务器芯片研发计划,并与半导体芯片巨头博
    的头像 发表于 12-20 07:43 1.1w次阅读
    苹果联姻博通,&quot;Baltra&quot;<b class='flag-5'>横空出世</b>!英伟达霸主地位将变?

    工业制造颠覆性挑战

    当下AI以前所未有的触角,渗透人类各生活场景,但在工作制造领域,因为工业基础模型的不确定性,AI仍处于止步不前的试探期,但豆包AI手机横空出世
    的头像 发表于 12-17 22:09 640次阅读
    工业制造颠覆性挑战

    把CW32L010用FLASH模拟EEPROM

    CW32L010横空出世,定时器和ADC变化很大,FLASH基本和以前型号一样,但有一点改动,BUSY位从CR1寄存器改到ISR寄存器了。 把F003的程序改改就能用,太棒了,拿走不谢。 只有一个
    发表于 11-24 07:40

    云天励飞如何助力中国AI芯片突围

    过去两年,人工智能以惊人的速度席卷全球。从ChatGPT的横空出世,到Sora等多模态模型的突破,再到中国DeepSeek R1的开源,AI技术正以前所未有的节奏重塑产业格局。算力消耗不断攀升,模型迭代从“年”缩短到“周”,全球
    的头像 发表于 10-27 10:01 793次阅读

    CoWoP能否挑战CoWoS的霸主地位

    封装的代名词。但近期,CoWoP(ChiponWaferonPCB)技术横空出世,迅速引发行业关注——它能否挑战CoWoS的霸主地位?今天我们就来拆解这个封装界的“新选手”。
    的头像 发表于 09-03 13:59 3534次阅读
    CoWoP能否挑战CoWoS的霸主地位

    边缘计算AI硬件如何接入DeepSeek吗?需要具备哪些条件?

    2025年伊始,一款来自中国初创公司“深度求索”的AI大模型DeepSeek横空出世,惊艳全球。DeepSeek厉害之处在于,在中国被外国芯片封锁的背景下,在性能上接近美国顶尖AI模型,但研发
    的头像 发表于 08-21 10:30 2109次阅读
    边缘计算<b class='flag-5'>AI</b>硬件如何接入DeepSeek吗?需要具备哪些条件?

    【免费送书】AI芯片,从过去走向未来:《AI芯片:前沿技术与创新未来》

    最重大的技术变革无疑就是大模型的横空出世人类的时间仿佛被装上了加速器,从ChatGPT到DeepSeek,大模型应用密集出现、频繁升级,这让作者意识到有必要撰写一本新的AI芯片图书,以紧跟时代
    的头像 发表于 07-29 08:06 1344次阅读
    【免费送书】<b class='flag-5'>AI</b>芯片,从过去走向未来:《<b class='flag-5'>AI</b>芯片:前沿技术与创新未来》

    【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》

    计算等类别AI芯片的及时、全面而富有远见的书。” 那么时至今日,这个世界发生了什么变化呢? 在这四年间,最重大的技术变革无疑就是大模型的横空出世人类的时间仿佛被装上了加速器,从ChatGPT到
    发表于 07-28 13:54

    基于富芮坤FR8016芯片的智控AI翻页笔方案亮点

    ,智控 AI 翻页笔方案横空出世,它深度融合了富芮坤 FR8016 芯片的算力与无线连接技术,彻底重新定义了演示工具的价值边界。
    的头像 发表于 07-15 16:35 1962次阅读
    基于富芮坤FR8016芯片的智控<b class='flag-5'>AI</b>翻页笔方案亮点

    东芝24TB超大容量CMR硬盘评测

    大模型的横空出世不仅改变了计算行业,也深刻影响了存储行业。
    的头像 发表于 07-10 09:46 2923次阅读
    东芝24TB超大容量CMR硬盘评测

    华为Pura80 Ultra“一镜双目长焦”横空出世,手机影像格局要变天?

    的影像升级,Pura80 Ultra以1英寸超高动态主摄、一镜双目长焦、AI辅助构图等突破性创新,重新定义了“影像旗舰”的新内涵。 图:华为余承东展示Pura80 Ultra新机 “2024年4月推出的Pura70系列,上市一年来获得了千万用户的喜爱。今年3月份,华为推出
    的头像 发表于 06-12 09:12 1.2w次阅读
    华为Pura80 Ultra“一镜双目长焦”<b class='flag-5'>横空出世</b>,手机影像格局要变天?