0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AlphaStar横空出世 星际争霸2人类1:10输给AI

独爱72H 来源:刘林华 作者:电子发烧友 2019-01-25 09:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AlphaStar横空出世 星际争霸2人类1:10输给AI

刚刚,我们见证了 AI 与人类 PK 的又一次重大进展!DeepMind 北京时间 1 月 25 日凌晨 2:00 起公布了其录制的 AI 在《星际争霸 2》中与2位职业选手的比赛过程:AlphaStar 5:0 战胜职业选手TLO ,5:0战胜 2018 年 WSC 奥斯汀站亚军 MaNa 。与两位人类对手的比赛相隔约两周,AI 自学成才,经历了从与TLO 对战时的菜鸟级别,进化到完美操作的过程,尤其是与MaNa 的对战,已经初步显示了可以超越人类极限的能力。

这次的演示也是 DeepMind 的星际争霸 2 AI AlphaStar 的首次公开亮相。除了此前比赛录像的展示外,AlphaStar 还和MaNa 现场来了一局,不过,这局AlphaStar 输给了人类选手MaNa 。

我们不难看出,尽管其神经网络已经趋于长期优化,但似乎仍然会在一定程度上陷入局部最优,被人类发现固定模式,落入圈套,而且从 5 个小叮当抱团,到纯追猎部队,都显示出它对游戏兵种的理解尚不到位,如果最后一局它可以像人类一样直接派出凤凰防守棱镜,或许它将继续凭借超强的微操一波推平 MaNa。

比赛回放过程中,主持人问到 DeepMind 科学家,平时如何训练 AlphaStar,DeepMind 科学家 Oriol Vinyals、David Silver 表示,首先是模仿学习,团队从许多选手那里获得了很多比赛回放资料,并试图让 AI 通过观察一个人所处的环境,尽可能地模仿某个特定的动作,从而理解星际争霸的基本知识。这其中所使用到的训练资料不但包括专业选手,也包括业余选手。这是 AlphaStar 成型的第一步。

之后,团队会使用一个称为“Alpha League”的方法。在这个方法中,Alpha League 的第一个竞争对手就是从人类数据中训练出来的神经网络,然后进行一次又一次的迭代,产生新的 agent 和分支,用以壮大“Alpha League”。

图 | Alpha League 示意图

然后,这些 agent 通过强化学习过程与“Alpha League”中的其他竞争对手进行比赛,以便尽可能有效地击败所有这些不同的策略,此外,还可以通过调整它们的个人学习目标来鼓励竞争对手朝着特定方式演进,比如说旨在获得特定的奖励。

最后,团队在“Alpha League”中选择了最不容易被利用的 agent,称之为“the nash of League”,这就是 TLO 所对战的5个。

近几年,除了 DeepMind 以外,已经有越来越多的人工智能公司或者研究机构投身到开发游戏类AI的浪潮中,例如 OpenAI 和腾讯的 AI lab 等等。

归根结底,这些团队对游戏AI的热情,恐怕都源于打造通用型人工智能的这一终极目标:游戏AI的研发将会进一步拓宽人类对于AI能力的认知,这样的研究最终将探索的问题 AI 能否能够通过游戏规则进行自主学习,达到更高层次的智能乃至通用型人工智能。例如,在游戏AI的设计中,增强学习算法的改进将至关重要。增强学习是一种能够提高 AI 能力的核心算法,它让 AI 能够解决具有不确定性动态的决策问题(比如游戏 AI,智能投资,自动驾驶,个性化医疗),这些问题往往也更加复杂。

而 DeepMind 团队的成果已经为此带来了一丝曙光——AlphaGo Zero在短时间内精通围棋、象棋、国际象棋三种棋类游戏,已有棋类通用AI雏形。棋类游戏之后,最值得期待的进展,就是各家开发的AI在即时战略类 RTS 游戏或多人在线竞技类 MOBA 游戏上的表现了。此前,腾讯 AI Lab 负责人之一姚星就介绍过,在游戏AI的研究上,腾讯 AI Lab 已从围棋 AI “绝艺”等单个 AI 的完全信息博弈类游戏,转移到规则不明确、任务多样化、情况复杂的游戏类型,如星际争霸和 Dota2 等复杂的即时战略类 RTS 游戏或多人在线竞技类 MOBA 游戏。

在刚刚过去的2018年,OpenAI 开发出的 AI OpenAI Five 就是针对 Dota2 开发的AI,但是它与人类 PK 的过程可谓充满戏剧性。2018 年 8 月初,OpenAI Five 战胜一支人类玩家高水平业余队伍(天梯 4000 分左右),然而,到了 8 月底 OpenAI Five 被两支专业队伍打败, AI 提前结束了其在本届 DOTA 2 国际顶尖赛事 TI 8 的旅程。回顾那次失败的过程,其实OpenAI 的系统仍然无法全面理解 DOTA 复杂的游戏系统和规则。

现在,DeepMind 的星际争霸2 AI 已经以其超强实力打响游戏 AI 2019 年第一战,接下来还有哪些游戏AI将横空出世呢?各大游戏AI又将如何迈向通用人工智能,让我们拭目以待。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38103

    浏览量

    296626
  • 人工智能
    +关注

    关注

    1813

    文章

    49736

    浏览量

    261534
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    DeepSeek横空出世,存储产业的寒武纪大爆发来了

    学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。 去年12月底发布的DeepSeek-V3模型,整个训练使用2
    的头像 发表于 02-10 07:35 5062次阅读
    DeepSeek<b class='flag-5'>横空出世</b>,存储产业的寒武纪大爆发来了

    把CW32L010用FLASH模拟EEPROM

    CW32L010横空出世,定时器和ADC变化很大,FLASH基本和以前型号一样,但有一点改动,BUSY位从CR1寄存器改到ISR寄存器了。 把F003的程序改改就能用,太棒了,拿走不谢。 只有一个
    发表于 11-24 07:40

    云天励飞如何助力中国AI芯片突围

    过去两年,人工智能以惊人的速度席卷全球。从ChatGPT的横空出世,到Sora等多模态模型的突破,再到中国DeepSeek R1的开源,AI技术正以前所未有的节奏重塑产业格局。算力消耗不断攀升,模型迭代从“年”缩短到“周”,全球
    的头像 发表于 10-27 10:01 383次阅读

    【免费送书】AI芯片,从过去走向未来:《AI芯片:前沿技术与创新未来》

    最重大的技术变革无疑就是大模型的横空出世人类的时间仿佛被装上了加速器,从ChatGPT到DeepSeek,大模型应用密集出现、频繁升级,这让作者意识到有必要撰写一本新的AI芯片图书,以紧跟时代
    的头像 发表于 07-29 08:06 865次阅读
    【免费送书】<b class='flag-5'>AI</b>芯片,从过去走向未来:《<b class='flag-5'>AI</b>芯片:前沿技术与创新未来》

    东芝24TB超大容量CMR硬盘评测

    大模型的横空出世不仅改变了计算行业,也深刻影响了存储行业。
    的头像 发表于 07-10 09:46 1977次阅读
    东芝24TB超大容量CMR硬盘评测

    Deepseek横空出世!中美AI之间的差距逆转了吗?

    DeepSeek的横空出世确实在中美AI竞争中引起了巨大反响,但要判断中美AI之间的差距是否因此逆转,还需从多个维度进行深入分析。 一、技术性能与成本 DeepSeek以其卓越的性能和低廉的成本
    的头像 发表于 04-15 18:14 755次阅读

    兆瓦闪充横空出世,120kw充电桩面临淘汰?

    120千瓦直流充电桩短期内并不会被淘汰,仍将在未来5-10年保持市场主力地位
    的头像 发表于 04-15 10:25 881次阅读
    兆瓦闪充<b class='flag-5'>横空出世</b>,120kw充电桩面临淘汰?

    端侧AI革命:移远通信如何用大模型重构人机交互

    2025年春节前后,DeepSeek横空出世,改变了全球AI产业的市场格局与发展范式。DeepSeek爆火进一步激发了“边缘+AI”的市场刚需,显著降低了大模型在边缘设备的部署及运营成本。一时间
    的头像 发表于 04-03 19:06 1045次阅读
    端侧<b class='flag-5'>AI</b>革命:移远通信如何用大模型重构人机交互

    利用腾讯ima收藏公众号推文构建个人知识库,拒绝AI幻觉

    专业领域,使用AI的局限在哪里?2023年ChatGPT横空出世之际,赵工曾就SiCMOSFET的短路问题和ChatGPT掰头过,围观达6000多,当时ChatGPT表现不尽如人意,详见一步步纠正
    的头像 发表于 03-19 18:32 1.1w次阅读
    利用腾讯ima收藏公众号推文构建个人知识库,拒绝<b class='flag-5'>AI</b>幻觉

    “Mini LED宗师”出手,TCL Q10L系列QD-Mini LED电视横空出世

    ”2025电视春季新品发布会上先声夺人,推出划时代旗舰产品TCL Q10L 系列极景QD-Mini LED电视,突破常规产品迭代逻辑,以"石破天惊"之姿,展现变革力量。 TCL Q10L 系列集极景·无
    的头像 发表于 03-12 09:47 875次阅读

    DeepSeek大模型如何推动“AI+物流”融合创新

    在人工智能技术的迭代浪潮中,大模型(Large Language Models, LLM)正从文本生成、图像创作走向垂直行业赋能。2025年新年,国产 AI 大模型 DeepSeek 横空出世,凭借其低成本、高精度和多模态能力,迅速成为“新晋网红”,并在各行各业引发广泛讨
    的头像 发表于 02-28 16:36 1040次阅读

    富唯智能 AMR 机器:开启智能物流新时代

    在当下竞争白热化的商业环境中,物流运作效率直接决定着企业的发展速度与竞争力。富唯智能 AMR 机器横空出世,为企业物流难题提供了完美的解决方案,助力企业降本增效,在行业赛道上一路领先。
    的头像 发表于 02-28 15:04 705次阅读
    富唯智能 AMR 机器<b class='flag-5'>人</b>:开启智能物流新时代

    研华边缘AI平台测试DeepSeek蒸馏版模型的最新数据

    随着Deepseek大模型的横空出世,预计对整个工业领域会产生颠覆性的影响力,尤其针对边缘部署部分独创动态剪枝与量化技术,DeepSeek大模型支持在边缘设备低功耗运行(最低适配5 TOPS算力硬件),推理速度能够提升3倍。
    的头像 发表于 02-24 10:40 1639次阅读
    研华边缘<b class='flag-5'>AI</b>平台测试DeepSeek蒸馏版模型的最新数据

    如何在MATLAB中使用DeepSeek模型

    在 DeepSeek-R1(https://github.com/deepseek-ai/DeepSeek-R1) AI 模型横空出世后,人
    的头像 发表于 02-13 09:20 4063次阅读
    如何在MATLAB中使用DeepSeek模型

    高盛:2025年工智能的五大发展趋势

    两年前,ChatGPT横空出世,在全球掀起了生成式人工智能的热潮。高盛首席信息官 Marco Argenti(曾任亚马逊云服务技术副总裁)指出,随着大语言模型(LLMs)的进步和机器技术的突破
    的头像 发表于 01-20 13:59 1182次阅读
    高盛:2025年<b class='flag-5'>人</b>工智能的五大发展趋势