0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AlphaStar横空出世 星际争霸2人类1:10输给AI

独爱72H 来源:刘林华 作者:电子发烧友 2019-01-25 09:40 次阅读

AlphaStar横空出世 星际争霸2人类1:10输给AI

刚刚,我们见证了 AI 与人类 PK 的又一次重大进展!DeepMind 北京时间 1 月 25 日凌晨 2:00 起公布了其录制的 AI 在《星际争霸 2》中与2位职业选手的比赛过程:AlphaStar 5:0 战胜职业选手TLO ,5:0战胜 2018 年 WSC 奥斯汀站亚军 MaNa 。与两位人类对手的比赛相隔约两周,AI 自学成才,经历了从与TLO 对战时的菜鸟级别,进化到完美操作的过程,尤其是与MaNa 的对战,已经初步显示了可以超越人类极限的能力。

这次的演示也是 DeepMind 的星际争霸 2 AI AlphaStar 的首次公开亮相。除了此前比赛录像的展示外,AlphaStar 还和MaNa 现场来了一局,不过,这局AlphaStar 输给了人类选手MaNa 。

我们不难看出,尽管其神经网络已经趋于长期优化,但似乎仍然会在一定程度上陷入局部最优,被人类发现固定模式,落入圈套,而且从 5 个小叮当抱团,到纯追猎部队,都显示出它对游戏兵种的理解尚不到位,如果最后一局它可以像人类一样直接派出凤凰防守棱镜,或许它将继续凭借超强的微操一波推平 MaNa。

比赛回放过程中,主持人问到 DeepMind 科学家,平时如何训练 AlphaStar,DeepMind 科学家 Oriol Vinyals、David Silver 表示,首先是模仿学习,团队从许多选手那里获得了很多比赛回放资料,并试图让 AI 通过观察一个人所处的环境,尽可能地模仿某个特定的动作,从而理解星际争霸的基本知识。这其中所使用到的训练资料不但包括专业选手,也包括业余选手。这是 AlphaStar 成型的第一步。

之后,团队会使用一个称为“Alpha League”的方法。在这个方法中,Alpha League 的第一个竞争对手就是从人类数据中训练出来的神经网络,然后进行一次又一次的迭代,产生新的 agent 和分支,用以壮大“Alpha League”。

图 | Alpha League 示意图

然后,这些 agent 通过强化学习过程与“Alpha League”中的其他竞争对手进行比赛,以便尽可能有效地击败所有这些不同的策略,此外,还可以通过调整它们的个人学习目标来鼓励竞争对手朝着特定方式演进,比如说旨在获得特定的奖励。

最后,团队在“Alpha League”中选择了最不容易被利用的 agent,称之为“the nash of League”,这就是 TLO 所对战的5个。

近几年,除了 DeepMind 以外,已经有越来越多的人工智能公司或者研究机构投身到开发游戏类AI的浪潮中,例如 OpenAI 和腾讯的 AI lab 等等。

归根结底,这些团队对游戏AI的热情,恐怕都源于打造通用型人工智能的这一终极目标:游戏AI的研发将会进一步拓宽人类对于AI能力的认知,这样的研究最终将探索的问题 AI 能否能够通过游戏规则进行自主学习,达到更高层次的智能乃至通用型人工智能。例如,在游戏AI的设计中,增强学习算法的改进将至关重要。增强学习是一种能够提高 AI 能力的核心算法,它让 AI 能够解决具有不确定性动态的决策问题(比如游戏 AI,智能投资,自动驾驶,个性化医疗),这些问题往往也更加复杂。

而 DeepMind 团队的成果已经为此带来了一丝曙光——AlphaGo Zero在短时间内精通围棋、象棋、国际象棋三种棋类游戏,已有棋类通用AI雏形。棋类游戏之后,最值得期待的进展,就是各家开发的AI在即时战略类 RTS 游戏或多人在线竞技类 MOBA 游戏上的表现了。此前,腾讯 AI Lab 负责人之一姚星就介绍过,在游戏AI的研究上,腾讯 AI Lab 已从围棋 AI “绝艺”等单个 AI 的完全信息博弈类游戏,转移到规则不明确、任务多样化、情况复杂的游戏类型,如星际争霸和 Dota2 等复杂的即时战略类 RTS 游戏或多人在线竞技类 MOBA 游戏。

在刚刚过去的2018年,OpenAI 开发出的 AI OpenAI Five 就是针对 Dota2 开发的AI,但是它与人类 PK 的过程可谓充满戏剧性。2018 年 8 月初,OpenAI Five 战胜一支人类玩家高水平业余队伍(天梯 4000 分左右),然而,到了 8 月底 OpenAI Five 被两支专业队伍打败, AI 提前结束了其在本届 DOTA 2 国际顶尖赛事 TI 8 的旅程。回顾那次失败的过程,其实OpenAI 的系统仍然无法全面理解 DOTA 复杂的游戏系统和规则。

现在,DeepMind 的星际争霸2 AI 已经以其超强实力打响游戏 AI 2019 年第一战,接下来还有哪些游戏AI将横空出世呢?各大游戏AI又将如何迈向通用人工智能,让我们拭目以待。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26464

    浏览量

    264090
  • 人工智能
    +关注

    关注

    1776

    文章

    43888

    浏览量

    230632
收藏 人收藏

    评论

    相关推荐

    简析:目前国产算力和国外的差距

    点击上方蓝字关注我们今年2月份,SORA横空出世,算力需求倍增,AI领域再次沸腾,国产算力的话题再次登上AI领域热搜。由于SORA,算力需求有望持续呈现几何规模的倍增,同时
    的头像 发表于 03-16 08:25 424次阅读
    简析:目前国产算力和国外的差距

    火了这么久的大模型,到底能为模组产业带来什么?

    全球新一轮产业技术变革加速来临,大模型作为人工智能发展的核心引擎,正引发一场全新的工业革命,可能彻底改变人类社会的生产和生活方式。▌大模型:从横空出世到百花齐放回顾上一年度,ChatGPT横空出世
    的头像 发表于 03-15 17:34 409次阅读
    火了这么久的大模型,到底能为模组产业带来什么?

    针对高速光模块应用,小华半导体推出HC32F472系列模拟丰富MCU新品

    2023年以来,生成式人工智能ChatGPT及横空出世的视频生成模型Sora极大地影响人类科技发展的方向。
    的头像 发表于 03-15 17:28 568次阅读
    针对高速光模块应用,小华半导体推出HC32F472系列模拟丰富MCU新品

    新火种AI|秒杀GPT-4,狙杀GPT-5,横空出世的Claude 3振奋人心!

    2024年第一季度才刚过半,AI领域就大动作不断,大家卯着劲的出新品,可谓卷出天际。   3月4日,Anthropic发布了最新的Claude 3系列模型,用Anthropic的话说,Claude
    的头像 发表于 03-06 22:22 325次阅读
    新火种<b class='flag-5'>AI</b>|秒杀GPT-4,狙杀GPT-5,<b class='flag-5'>横空出世</b>的Claude 3振奋人心!

    贾扬清质疑Groq CEO“其芯片价格接近免费” 前员工:不切实际!

    在人工智能的世界里,正在发生一场翻天覆地的变化,随着 ChatGPT、Sora 的横空出世
    的头像 发表于 02-25 14:04 588次阅读
    贾扬清质疑Groq CEO“其芯片价格接近免费” 前员工:不切实际!

    全球首款可折叠137英寸MicroLED电视亮相CES 2024

    在近日的 CES 2024 展会上,一款引人注目的产品横空出世,吸引了全球消费者的广泛关注。那就是由知名品牌 C SEED 推出的全球首款可折叠 137 英寸 MicroLED 电视——C SEED N1 电视。
    的头像 发表于 01-12 14:46 511次阅读

    台积电:半导体制程技术发展的三大趋势

    陈平博士认为,生成式AI横空出世成为了划时代颠覆式的应用,重要意义不亚于计算机诞生与互联网诞生,甚至瓦特蒸汽机。他表示,大数据、大模型、大算力是支持生成式AI基础的三大要素,前两个部分是AI
    的头像 发表于 12-06 17:24 626次阅读
    台积电:半导体制程技术发展的三大趋势

    国产手机OLED出货量激增116%!华为小米新机“卖爆”面板厂商获益

    先是华为Mate 60系列在8月底横空出世且受到热捧,Counterpoint Research最新数据显示,今年10月份,华为手机销量同比增幅高达83%;此后,小米于10月下旬推出14系列,销量远超市场预期
    的头像 发表于 11-16 10:44 543次阅读

    华为小米新机“卖爆”,TCL华星、维信诺、京东方OLED出货大涨

    先是华为Mate 60系列在8月底横空出世且受到热捧,Counterpoint Research最新数据显示,今年10月份,华为手机销量同比增幅高达83%;此后,小米于10月下旬推出14系列,销量远超市场预期
    的头像 发表于 11-16 10:20 432次阅读
    华为小米新机“卖爆”,TCL华星、维信诺、京东方OLED出货大涨

    AI时代,程序员真的要被淘汰了吗?如何才能提高竞争力?

    随着 ChatGPT 的横空出世,给全球带来了巨大冲击,各种大语言模型如雨后春笋不断出现。国外如谷歌 Bard、Anthropic 的 Claude,国内如百度文心一言、阿里通义千问、讯飞星火认知大模型、昆仑万维天工大模型等。
    的头像 发表于 08-01 15:17 871次阅读

    “百模大战”:盘点国内外横空出世AI大模型

    从全球已经发布的大模型分布来看,中美两国数量合计占全球总数的超 80%,美国在大模型数量方面居全球之首。有专家披露,据不完全统计,目前中国 10 亿参数规模以上的大模型已发布 79 个。
    的头像 发表于 07-13 16:27 9965次阅读
    “百模大战”:盘点国内外<b class='flag-5'>横空出世</b>的<b class='flag-5'>AI</b>大模型

    RedisJson横空出世,比ES快7倍,惊爆了!

    此外,RedisJSON 的读取、写入和负载搜索延迟在更高的百分位数中远比 ElasticSearch 和 MongoDB 稳定。当增加写入比率时,RedisJSON 还能处理越来越高的整体吞吐量,而当写入比率增加时,ElasticSearch 会降低它可以处理的整体吞吐量。
    的头像 发表于 07-11 15:09 526次阅读
    RedisJson<b class='flag-5'>横空出世</b>,比ES快7倍,惊爆了!

    AI教练与你同在

    自从ChatGPT横空出世之后,“AI”这个词又火了起来,AI即为人工智能(ArtificialIntelligence)的缩写。一种被研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术
    的头像 发表于 06-21 17:44 300次阅读
    <b class='flag-5'>AI</b>教练与你同在

    安信可新品雷达模组Rd-03搭配STM32制作简易人体感应雷达灯教程

    安信可最新雷达模组Rd-03已经横空出世,为了方便大家使用该模组,本教程将使用STM32F103C8T6搭配Rd-03制作一个简易的人体检测雷达灯。
    的头像 发表于 06-14 16:16 827次阅读
    安信可新品雷达模组Rd-03搭配STM32制作简易人体感应雷达灯教程

    ChatGPT横空出世 人工智能进入大模型时代

    1、 OpenAI 引领,人工智能进入大模型时代 1.1、 ChatGPT 横空出世,引领人工智能新浪潮 人工智能历经多年发展,在诸多领域超越人类。自 1956 年 8 月达特茅斯会议上 “人工智能
    的头像 发表于 06-02 15:58 847次阅读
    ChatGPT<b class='flag-5'>横空出世</b> 人工智能进入大模型时代