0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepMind AI以总比分 2:0 分别战胜两位职业人类选手

电子工程师 来源:lq 2019-01-28 09:30 次阅读

刚刚,在更复杂的《星际争霸 II》游戏中,DeepMind AI 以总比分 2:0 分别战胜两位职业人类选手。这或许是自 2017 年 AlphaGo 在围棋上战胜人类后,再次让人类刷新 AI 认知的人机大战。

此次与人类对战的 AI 是 AlphaGo 兄弟:AlphaStar。开赛前几个小时,DeepMind CEO 在 Twitter 上公布了这一名字。而在开赛前一天,DeepMind 宣布 AI 将与人类在《星际争霸 II》中公开对战的消息,并表示在《星际争霸 II》游戏的疯狂难度模式下,其 AI 的胜率为 50%。

需要说明的是,正如之前打 Dota 的 OpenAI 受到的降低反应速度一样,DeepMind 此次将 AlphaStar 的反应速度“限制”到 APM 280,大致相当于星际中等职业玩家的水平。就 AlphaStar 的表现来看,虽然最终在现场 PK 时输了最后一局比赛,但整体上还是完虐人类。

比赛开始,与 AlphaStar 对战的第一个职业选手是 TLO,其世界排名为第 68 位。此次人机大战是五局三胜制,TLO 虽然不是顶级星际选手,但让人足够惊叹的是,AlphaStar 最终在约五十分钟内结束战斗,以 3:0 的成绩获胜,人类职业选手似乎毫无还手之力。

先来简单回顾下人机大战第一场:AlphaStar 第一局一开始就表现的很有全局观,在 PvP 两矿打一矿的情况下,TLO 很快被击败;第二局一度打得很焦灼,但 AlphaStar 依然以 2:0 再赢一局;十分钟后,TLO 溃败给 AlphaStar,有网友说选手太初级,批评 TLO 作为职业选手在瞎打,没有尊重熬夜看人机大赛的观众。不过,也有人说 AI 很可怕。

如果说第一回合 AlphaStar 战胜的是“初级”选手,那随后与其对战的职业选手是世界排名第 19 位的 MaNa ,其职业水平至少是中上游。

上图显示的是 AlphaStar 的决策过程,具体比赛过程就不说了,结果是 MaNa 在大约 45 分钟内连输五局被 AlphaStar 斩落马下。

前一个职业选手 TLO 在 MaNa 输掉比赛后称,“相信我, 和一个像 AlphaStar 这样的对手比赛是非常困难的, 它的打法和人类完全不同,是你以前从未有过的经验。 AlphaStar 给人留下了极深的印象, 这在游戏 AI 中也是前所未有的。"

AlphaStar 遇神杀神,干脆利落。这次应该没人责怪 MaNa 打得不好,他显然拼尽了全力,而网友发出的慨叹是希望终结者不会来那么快。

但最后一局让网友们为人类命运紧张的情绪稍稍放松,与 MaNa 现场对战的 AlphaStar 一着不慎,让 MaNa 扳回一局,但最终以 1:5 输掉比赛。

AlphaStar 的来历

早在 2016 年,谷歌 DeepMind 的 AI 研究人员已经开始关注暴雪娱乐的《星际争霸 II》。通过游戏来确定 AI 是否可以胜过人类相对简单的复杂任务是 DeepMind 的研究人员长期以来都在尝试的项目。同年 11 月,DeepMind 曾在暴雪嘉年华上宣布与暴雪达成合作协议,将在《星际争霸》系列游戏中进行合作,将在游戏平台中引入机器学习方法,进行人工智能研究。

2017 年 8 月,Deepmind 与暴雪共同发布了合作计划的首个成果:基于《星际争霸 II》的人工智能研究环境 SC2LE,它允许研究者在 Linux 系统中接入游戏 API,开放了 65000 场比赛的数据缓存用于训练 AI,并将添加 50 万场游戏数据到缓存中。

2018 年,同样在暴雪嘉年华上,他们分享了人工智能模型在《星际争霸》游戏中的突破。人工智能模型能执行基本的宏观战略,还能防御像 Tower Rush 这样的激进战术。而刚刚结束的“星际争霸”赛则是是一项“重大挑战”,因为这要求 AI 智能体“实现和平衡一些子目标”,以便最终击败人类选手。

例如,虽然游戏的目标是击败对手,但玩家还必须考虑平衡多个子目标,比如收集资源(水晶和气矿)或建筑。此外,一场比赛的时间通常为几分钟到一小时不等,这意味着游戏中提早执行的行动会在很长时间不见成效。最后,由于玩家智能看到部分地图,这意味着智能体必须结合记忆与规划才能成功。

AlphaStar 背后的 AI 技术

在围棋任务中,对手间可以看到整个棋盘,但《星际争霸 II》与此不同,我们通常无法看到整个地图,需要派小兵出去侦查。而且游戏是不间断进行的,整个游戏甚至会有超过 5000 步的操作。

DeepMind 科学家 Oriol Vinyals 曾在去年的一场以《AI 对战星际争霸胜算几何?》的演讲中提到,这个游戏基本上就是建造一些建筑物以及单位,在同一个地图里与不同的组织相互竞争。在这个游戏中,哪怕只是建造建筑物,也需要做出许多决策。除此之外,他们还要不断收集和利用资源、建造不同的建筑物、不断扩张,因此整个游戏非常具有挑战性。

他们在这个游戏中使用的方法依旧是强化学习。他们要让 AI 模仿人类玩这个游戏的方式,但即使是模仿人类点击鼠标和敲击键盘的行为也非常困难,需要收集整个《星际争霸》玩家的行为进行分析。为此还引入了一个游戏引擎。

DeepMind 还为游戏过程设计了不同的指令和模式,这使得整个玩《星际争霸》的过程变得独一无二。如今,我们看到的 AlphaStar 正是上述想法的结晶。

现在的 AlphaStar 还是刚出生的婴幼儿,不过以其极快的进化速度,你也能想到日后的进化版会是多么无可匹敌。到现在,或许还有很多人期待 2 月 15 日 AlphaStar 与世界排名第一的 Serral 进行终极对决,但最终的结果可想而知。正如柯洁输给 AlphaGo 时面临的绝望一样,人类可能不愿意面对这样的现实:在更多复杂的场景中,人类可能正以难以想象的速度输给 AI。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26129

    浏览量

    263709
  • 机器学习
    +关注

    关注

    66

    文章

    8061

    浏览量

    130439
  • DeepMind
    +关注

    关注

    0

    文章

    124

    浏览量

    10705

原文标题:2:0!谷歌 AI “AlphaStar“ 虐杀职业星际玩家

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    谷歌DeepMind推出SIMI通用AI智能体

    近日,谷歌的DeepMind团队发布了其最新研究成果——SIMI(Scalable Instructable Multiworld Agent),这是一个通用人工智能智能体,能够在多种3D虚拟环境
    的头像 发表于 03-18 11:39 281次阅读

    谷歌DeepMind推新AI模型Genie,能生成2D游戏平台

    据报道,谷歌公司的DeepMind团队近期发布了AI模型Genie,此模型拥有多达110亿个参数,能够依据用户提供的图片及提示词创建出相当完整的2D游戏场景。
    的头像 发表于 02-27 14:53 298次阅读

    谷歌DeepMind资深AI研究员创办AI Agent创企

    近日,刚从谷歌DeepMind离职的资深AI研究员Ioannis Antonoglou宣布创办了一家名为“AI Agent”的创企。Ioannis Antonoglou常驻伦敦,此前曾担任谷歌
    的头像 发表于 02-04 10:02 337次阅读

    奥特曼称相信AI无法替代人类

    奥特曼称相信AI无法替代人类 AI对于人类的威胁一直有很多讨论,各有不同观点,很多人对于科幻电影中的场景AI机器人伤害
    的头像 发表于 01-19 11:43 617次阅读

    关于AD6688输出的宽问题

    论坛的大牛们好,我最近在使用AD6688,是一款14的ADC,但是如果配置N=16,CS=0的话,输出的数据会是16的。我本以为是高两位或低两位
    发表于 12-01 07:31

    S3C2410A GPB端口低两位与次低两位个反逻辑LED指示灯的交替闪烁

    各位大神求指导, S3C2410AGPB端口低两位与次低两位个反逻辑LED指示灯的交替闪烁,这个当初没好好学,求指导
    发表于 11-14 20:22

    单片机串口显示正常,为什么数据统计的数量少两位呢?

    单片机串口显示正常,为什么数据统计的数量少两位
    发表于 10-25 06:34

    山东省大力发展元宇宙产业,DeepMind创始人访谈:AI像把双刃剑

    大家好,欢迎收看河套IT WALK第102期。 今天,我们为大家带来两则科技新闻。首先,我们将深入探讨DeepMind创始人对AI技术的看法,他认为AI技术就像一把双刃剑,既有巨大的潜力,也存在不少
    的头像 发表于 09-08 21:00 319次阅读
    山东省大力发展元宇宙产业,<b class='flag-5'>DeepMind</b>创始人访谈:<b class='flag-5'>AI</b>像把双刃剑

    GPT-5正秘密训练!DeepMind联创爆料,这模型比GPT-4大100倍

    另外,采访中,Suleyman还爆出了很多自己在DeepMind和Inflection AI工作时的内部信息,包括了谷歌当时收购DeepMind和之后的抓马,某种程度上解释了为什么DeepMi
    的头像 发表于 09-04 16:28 442次阅读
    GPT-5正秘密训练!<b class='flag-5'>DeepMind</b>联创爆料,这模型比GPT-4大100倍

    最难被ai取代的职业

    最难被ai取代的职业 “最难被AI取代的职业”究竟是哪些?这是个众所周知的话题,因为随着人工智能技术的不断发展,它似乎已经到了任何职业都有可
    的头像 发表于 08-15 16:22 329次阅读

    AI 人工智能的未来在哪?

    人工智能、AI智能大模型已经孵化;繁衍过程将突飞猛进,ChatGPT已经上线。 世界首富马斯克认为AI人类是一种威胁;谷歌前CEO施密特认为AI和机器学习对
    发表于 06-27 10:48

    求助,新唐单片机485通信数据格式的停止位能否设置两位

    以前没有做的两位停止的485通信,最近刚碰到
    发表于 06-19 10:29

    谷歌DeepMindAI改进数据排序

      人工智能研究所谷歌Google DeepMind推出了三种ai工具AlphaZero、MuZero、AlphaDev,这些工具提高数据中心的资源利用率,提高视频压缩效率,更快的算法发现,整个计算优化生态系统。
    的头像 发表于 06-09 10:30 660次阅读

    大敌当前,Google Brain与DeepMind合并!

    Google 旗下的 Brain 团队和 DeepMind 都是各自研究各自的 AI,基本没有什么紧密合作。DeepMind 也只是提供一些技术来帮助 Google 改进产品和服务(比如
    的头像 发表于 04-27 14:56 592次阅读

    IMXRT1176 MIPI CSI2外设一错误和两位错误未设置是怎么回事?

    我有 imxrt1166 评估板和 ovp5640 相机。当我将 SDK 示例中的“tHsSettle_EscClk”参数更改为更高的值时,我分别从带有调试器的 MIPICSI2RX 外设中得到一
    发表于 04-18 07:07