0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepMind刚向星际争霸 II 的玩家们下了战书!

Hf1h_BigDataDig 来源:YXQ 2019-07-12 10:09 次阅读

欧洲的星际争霸玩家们即日将有机会和Deepmind AI打场比赛了!

出战的AI是由DeepMind和暴雪联合培养的,经过了“特别的训练方式”,在星际争霸界 II 早有过赫赫战绩,连续在10场比赛中击败了人类职业选手。

其实,在今年年初的那次交锋总共有11场比赛,只有全球直播现场交手那一次,由于比赛限制了AI的“视觉”能力,MaNa帮人类赢了一场。

另外10场比赛,代表人类出战的是职业选手TLO和MaNa。两位选手分别与AlphaStar打了五场。如果说与TLO对战时AlphaStar还是萌新的话,那么与MaNa的对战则完全显示出了其战术的老辣。毕竟,两个比赛才相隔2周,AI 自学成才的能力已经初步显示了可以超越人类极限的潜力。

AlphaStar VS TLO

那次输给AI后,不少星际争霸 II 的人类玩家都跃跃欲试,希望能亲自挑战AI,但只有少数职业玩家有权与AI对抗。

直到今天,星际争霸官方发推表示,欧洲区星际争霸 II 的玩家,将有机会在限定时间内与 DeepMind 的Alphastar人工智能对抗。

你的对手可能是只AI,而你毫不知情

作为正在进行的人工智能研究的一部分,DeepMind 星际争霸 II 代理商 AlphaStar 的实验版本很快将在欧洲竞争激烈的平台上与人类玩家对抗。

在官方“战书”中,Deepmind表示,如果你希望有机会和DeepMind 与 AlphaStar 打匹配,你可以点击游戏内部弹出窗口上的"选择加入"按钮进行选择。你可以随时使用1v1 Versus 菜单上的"DeepMind opt-in"按钮来改变你的选择。

为了确保测试数据的真实,玩家不会被告知他们正在和阿尔法星人工智能对抗。因为当玩家知道自己在对抗AI时,他们的反应可能会有所不同。玩家可能会参与社区中所谓的"奶酪策略",而 AI 可能还没有准备好。

从本质上讲,"奶酪策略"是一种非常规的战略,旨在让对手措手不及。这些游戏不会被纳入AlphaStar的训练中,系统只能从人类回放和自我对战中学习。

AlphaStar是如何训练的?

DeepMind也在今天的博客中描述了AlphaStar的训练方式。

AlphaStar是由一个深度神经网络生成的,它接收来自原始游戏界面的输入数据,并输出一系列指令,构成游戏中的一个动作。更具体地说,神经网络体系结构将transformer框架运用于模型单元(类似于关系深度强化学习),结合一个深度LSTM核心、一个带有pointer network的自回归策略前端和一个集中的值基线。这种先进的模型将有助于解决机器学习研究中涉及长期序列建模和大输出空间(如翻译、语言建模和视觉表示)的许多其他挑战。

AlphaStar还使用了一种新的多智能体学习算法。该神经网络最初是通过在Blizzard发布的匿名人类游戏中进行监督学习来训练的。这使得AlphaStar能够通过模仿学习星际争霸上玩家所使用的基本微观和宏观策略。这个初级智能体在95%的游戏中击败了内置的“精英”AI关卡(相当于人类玩家的黄金级别)。

OMT: 知己知彼,百战百胜?

最后,其实就在上周,一个由澳大利亚开发人员、机器学习工程师和研究人员组成的团队——StarAi就基于星际争霸的人机对抗开发了一个机器学习课程,并且在线免费发布,只用浏览器就能学!不如先去了解一下你的对手,再来试试看胜算有多大呀!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26363

    浏览量

    263957
  • DeepMind
    +关注

    关注

    0

    文章

    126

    浏览量

    10707

原文标题:DeepMind刚向星际争霸 II 的玩家们下了战书!你的对手可能是只AI,而你毫不知情

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    谷歌DeepMind资深AI研究员创办AI Agent创企

    近日,刚从谷歌DeepMind离职的资深AI研究员Ioannis Antonoglou宣布创办了一家名为“AI Agent”的创企。Ioannis Antonoglou常驻伦敦,此前曾担任谷歌DeepMind的首席开发人员,自去年9月份以来,他是第4位离开谷歌Gemini
    的头像 发表于 02-04 10:02 358次阅读

    SpaceX计划2月份进行星际飞船系统第三次飞行测试

    SpaceX公司的高管近日宣布,美国联邦航空局(FAA)计划在今年2月份批准星际飞船系统进行第三次飞行测试。这意味着,星际飞船有望再次升空,继续其太空探索之旅。
    的头像 发表于 01-11 14:35 214次阅读

    什么是强化学习

    强化学习是机器学习的方式之一,它与监督学习、无监督学习并列,是三种机器学习训练方法之一。 在围棋上击败世界第一李世石的 AlphaGo、在《星际争霸2》中以 10:1 击败了人类顶级职业玩家
    的头像 发表于 10-30 11:36 1528次阅读
    什么是强化学习

    请问ucos-ii如何任务传递参数?

    ucos-ii如何任务传递参数?
    发表于 10-11 06:48

    GPT-5正秘密训练!DeepMind联创爆料,这模型比GPT-4大100倍

    另外,采访中,Suleyman还爆出了很多自己在DeepMind和Inflection AI工作时的内部信息,包括了谷歌当时收购DeepMind和之后的抓马,某种程度上解释了为什么DeepMind相比于OpenAI「起了个大早,
    的头像 发表于 09-04 16:28 455次阅读
    GPT-5正秘密训练!<b class='flag-5'>DeepMind</b>联创爆料,这模型比GPT-4大100倍

    电竞键盘M0系列: 玩家级酷炫灯光效果

    电竞键盘M0系列: 玩家级酷炫灯光效果 玩家级酷炫灯光效果: 采用MG32F02U128芯片的键盘的应用,其键盘的RGB灯效控制乃是透过硬件除法器计算灯效,然后再透过PWM输出一个很漂亮
    发表于 08-29 15:34

    谷歌DeepMind发布机器人大模型RT-2,提高泛化与涌现能力

    7月28日,谷歌DeepMind推出了一款新的机器人模型Robotics Transformer 2(RT-2)。
    发表于 08-02 14:22 267次阅读
    谷歌<b class='flag-5'>DeepMind</b>发布机器人大模型RT-2,提高泛化与涌现能力

    VersaClock II 用户指南 手册

    VersaClock II 用户指南 手册
    发表于 07-27 18:32 0次下载
    VersaClock <b class='flag-5'>II</b> 用户指南 手册

    QSpan II User 手册

    QSpan II User 手册
    发表于 07-14 09:42 0次下载
    QSpan <b class='flag-5'>II</b> User 手册

    【免费送书】 通用人工智能:初心与未来

    Intelligence,AI)便成为计算机领域持续的研究热点。时至今日,以深度学习为代表的新一波人工智能正在兴起。自然语言处理、人脸识别、自动驾驶、无人系统等复杂人工智能任务相继取得大的突破,人工智能在很多特定问题(如围棋、《星际争霸》游戏、医疗诊断等)的
    的头像 发表于 06-27 08:20 298次阅读
    【免费送书】 通用人工智能:初心与未来

    详解DeepMind排序算法

    DeepMind 的这一发现确实居功至伟,但不幸的是,他们未能解释清楚算法。下面,我们来详细看看他们发布的一段汇编代码,这是一个包含三个元素的数组的排序,我们将伪汇编转换为汇编:
    的头像 发表于 06-21 15:38 251次阅读

    谷歌DeepMind发现更快排序算法,已集成到C++库

    AlphaDev 基于 AlphaZero。DeepMind 向来以开发能自学游戏规则的 AI 软件而闻名。这种思路被证明效果拔群,也先后攻克了国际象棋、围棋和《星际争霸》等诸多游戏难题。虽然具体
    的头像 发表于 06-09 17:11 546次阅读
    谷歌<b class='flag-5'>DeepMind</b>发现更快排序算法,已集成到C++库

    如何使用 QDR(TM) II SRAM 和 DDR II SRAM 用户手册

    如何使用 QDR(TM) II SRAM 和 DDR II SRAM 用户手册
    发表于 04-27 20:25 6次下载
    如何使用 QDR(TM) <b class='flag-5'>II</b> SRAM 和 DDR <b class='flag-5'>II</b> SRAM 用户手册

    大敌当前,Google Brain与DeepMind合并!

    Google 旗下的 Brain 团队和 DeepMind 都是各自研究各自的 AI,基本没有什么紧密合作。DeepMind 也只是提供一些技术来帮助 Google 改进产品和服务(比如
    的头像 发表于 04-27 14:56 603次阅读

    谷歌合并Brain和DeepMind,加速人工智能技术研究

    电子发烧友网报道(文/李弯弯)日前,谷歌母公司Alphabet表示合并旗下两个主要的人工智能研究部门——Google Brain(谷歌大脑)和DeepMind。新部门名为Google
    的头像 发表于 04-26 01:10 1477次阅读