0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OpenAI Five在Dota2国际竞赛TI8中进行首次对战以失败告终

DPVg_AI_era 来源:未知 作者:李倩 2018-08-24 08:53 次阅读

刚刚,OpenAI Five在Dota2最受关注的国际竞赛TI8中进行了首场表演赛,对战职业玩家队伍paiNGame,也是TI8中最先被淘汰的一支队伍,然而却饮恨惜败。双方经过激烈对战,AI在操控速度和团队支援方面远远超过人类,但对于技能的释放和兵线的理解还有很大提升空间。

OpenAI Five,输了。

此前以惊人的速度不断进化,并且成功碾压Dota2准职业玩家后,OpenAI Five剑指TI8,挑战现役职业人类玩家,并于刚刚结束了首场与人类的对战。

51分钟的时间里,OpenAI Five虽然在控制速度和团队支援上远超人类,但金币数量只有一次稍稍领先,说明对英雄技能的释放以及兵线的理解还有待提高。

OpenAI Five 在DOTA2 5V5团队战中战胜Top 05%玩家,让好多研究强化学习的人激动了一把,更何况还有比尔·盖茨的那句评价:“这是人工智能发展历史上的一座重大里程碑”。

因此,对于这次在TI8的首场对战,可谓吸足了眼球。

战火一触即发!

第一场演示赛,OpenAI Five对战人类职业玩家队伍paiN Game。

这是Pg的现役队员

虽然pg是18支参赛队伍中最弱的一队(最先被淘汰),但不要忘了,这相当于参加奥运赛短跑决赛中跑得最慢的那一位,也是人类的强中之强啊。

这次对战,OpenAI选择的英雄分别是:潮汐猎人、矮人直升机、水晶室女、死亡先知、巫妖。PG这方则选的是:莱恩、瘟疫法师、巫医、狙击手和斧王。

一上场,OpenAI的兵线就比当时Benchmark赛的时候更加靠前,这是因为从5个信使变成了1个。

根据对战前的预测,大部分投票者还是认为人类会赢(55%)。这或许也是OpenAI团队怀着忐忑心情上场的原因。

实际战况开始双方势均力敌,在地图各处都在开打,难分难解,但开场20分钟后,OpenAI Five就推倒了两座塔,不过双方的伤亡几乎差不多。

几分钟后,OpenAI首次在金币总量上超过了PG一点点,然后逐渐获得优势,23杀vs18,OpenAI Five要领先2k。

如果你以为AI就会这样获胜,那么就想错了!

OpenAI的英雄DP总喜换守在Roahn那里。不朽者Roshan是Dota 2中最为强大的中立生物,他是游戏中首个生成的单位,在比赛载入完成后即会出现,并且是唯一随着时间成长的NPC。

OpenAI Five研究人员表示,DP守在Roshan那里,是因为要确认具体位置,这是训练时Roshan随机化的一个副作用,AI控制的英雄不知道Roshan会从哪里出现,因此就喜欢守在那里确认。

至于人类这边,坦白说,斧王一直表现不好,AI虽然在整体执行力、控制技能释放以及保命道具使用上远超人类,但对于游戏的理解、兵线的牵扯以及大招的释放还有待提高。

兵线对于游戏是很重要的,如果是人类这边进行更多带线牵扯,AI可能会提前10分钟被推掉高地。

也很明显能看出来,PG并没有认真去对战。OpenAI这边的C位是飞机,但在买活死亡后且复活时间有100多秒,而人类这边一直在AI的高地下玩,这段时间本是可以推下至少一路高地的。

一直到游戏结束,AI这边人头数量都是超过PG战队的,说明AI团战和支援的速度更强,但是人类这边经济始终没有落后太多并在取得优势的情况下,迅速拉开经济差,说明现役职业玩家在DOTA2的资源分配和对兵线的理解上,仍然是人类的希望。

OpenAI Five训练:从简单的操作中学到专业级的策略

1、OpenAI FIVE是如何工作的?

OpenAI Five是一个由5个人工神经网络组成的队伍,可以把它想象成一个模拟的“大脑”,是专门为学习Dota而设计的。OpenAI Five将世界看作一个包含20000个数字的列表,这些数字对可见的游戏状态(仅限于人类玩家被允许看到的信息)进行编码,并通过发出8个数字的列表来选择一个动作。

OpenAI团队编写的代码在游戏状态/操作和数字列表之间进行映射。 一旦经过训练,这些神经网络就是纯粹本能的生物——它们的神经网络实现了记忆,但不会进一步学习。OpenAI Five虽然是一个团队,但并没有设计特殊的沟通、交流结构,只提供他们一种激励(incentive)。

2、OpenAI Five的训练过程

OpenAI Five的神经网络从随机参数开始,使用通用的训练系统Rapid来学习更好的参数。Rapid拥有OpenAI的5个游戏副本,此前的报道中也提到过,OpenAI Five每天通过成千上万的并发游戏生成180年的游戏数据,使用了128,000个CPU内核和256个GPU

在每个游戏框架中,Rapid会计算出一个数值奖励,当有好事发生时(比如一个盟军英雄获得了经验)是正数,当有坏事发生时(比如一个盟军英雄被杀)是负数。而后Rapid应用近端策略优化(Proximal Policy Optimization)算法来更新神经网络制定动作的参数。

3、TAKEAWAY

就像人类在规划一天的生活时不会计划肌肉运动一样,OpenAI社区(包括OpenAI)也期望通过长期规划来获取算法,以此来解决短期和长期的计划,可能通过强化学习得以突破。

尽管OpenAI Five的底层算法非常简单,但在没有提供任何人工数据的情况下,它从简单的操作中可以学到专业级的策略。

OpenAI DOTA进化时间线:只用1年,从1v1到5v5!

2016.11.05OpenAI选择将Dota作为要攻克的目标,因为这是Twitch在Linux上最受欢迎的游戏,并且有API。

2016.11.09OpenAI首次在Dota库中提交。

2017.03.09首先在Rapid库中提交。

2017.08.11OpenAI在Dota国际竞赛TI7中,1v1战胜了顶级Dota 2职业玩家Dendi。

2017.09.07OpenAI在Dota 2 1v1普通模式(normal gameplay)首次战胜了职业玩家,后续又有十几个职业玩家与其挑战,对战了上千次。

2018年1月在特定有限条件下(只有5位固定英雄,没有守卫,不能隐身等),OpenAI Five战胜了脚本bot。

2018年4月OpenAI Five在有限制的情况下,战胜了OpenAI自己组建的半职业人类玩家队伍(双方阵容固定而且一样的:NEC,火枪,毒龙,冰女,巫妖;不能插眼;没有肉山;不能用隐身道具;不能使用召唤物和幻象;没有圣剑,瓶子,补刀斧,飞鞋,知识之书,魂泪;5只不能被攻击的信使;不能扫描),被比尔·盖茨称之为“人工智能的一大里程碑”。

2018.06.06OpenAI Five战胜了OpenAI自己组建的队伍,这次的游戏限制相比上次少了一些。很多DOTA 2玩家表示,插眼和肉山非常重要,如果排除这些因素,对战并不公平。所以,OpenAI Five学会了插眼与打肉山。

2018.08.05OpenAI在全球10万+观众的直播见证下,战胜了Dota 2 Top 0.5%的玩家(Blitz、Cap、Fogged、Merlini和MoonMeander,其中有四人是Dota2前职业玩家),创造了OpenAI Five Benchmark。这次的胜利解除了一些限制,比如英雄池有18个可供选择,将AI时间调整为更接近人类的200ms。更详细的介绍可以看此前新智元的报道。此前,很多评论员认为实现这一进步至少需要一年的时间,但OpenAI用差不多一个月就做到了。

2018.08.20OpenAI被指责不是通过机器视觉而是游戏API获取数据,而人类玩家仅通过“看”来判断,因此AI得出的结果和测距更加精准,从而也更具优势。但OpenAI在赛前便公开所有条件,并不能称“作弊”。

2018.08.22OpenAI Five在Dota2国际竞赛TI8中进行首次对战,对战现役职业玩家队伍Pain Game(是TI8中第一支被淘汰的队伍),虽然人头数一直领先,但最终不敌对手,首场比赛以失败告终。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26364

    浏览量

    263962
  • 人工智能
    +关注

    关注

    1775

    文章

    43723

    浏览量

    230505

原文标题:人类奋起反击!OpenAI遭滑铁卢,Dota2顶级淘汰赛开场惨败!

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    OpenAI CEO萨姆·阿尔特曼个人资产首次破20亿美元

    今年38岁的阿尔特曼因担任OpenAI CEO为人熟知。尽管OpenAI近期市值飙升至860亿美元,但据彭博社报道,阿尔特曼股权最为主要的来源为风投基金及初创企业投资网络。
    的头像 发表于 03-04 14:13 185次阅读

    cyusb3014将固件程序编程到SPI Flash中进行调试,系统会提示我重置设备怎么解决?

    你好,我现在想把我的固件程序编程到 SPI Flash 中进行调试。 但是,第一次烧录之后,如果我想再次烧录它,系统会提示我重置设备。 重置或关闭电源不允许我重新编程,但我想在每次编写固件时将其
    发表于 02-27 08:21

    TC234boot中进行Deinit CANFD失败了的原因?

    大家好: 问题描述:项目已从启动切换到应用程序。 如果在应用程序中使用不同的 MO 并以相同的 ID 启动,则无法接收应用程序的消息。 我本来希望 boot 中进行 Deinit CANFD,但我
    发表于 01-31 06:31

    新火种AI|这家“中国OpenAI”,能赶超OpenAI吗?

    全面对标OpenAI,智谱AI能成为“中国的OpenAI”吗?
    的头像 发表于 01-18 17:56 324次阅读
    新火种AI|这家“中国<b class='flag-5'>OpenAI</b>”,能赶超<b class='flag-5'>OpenAI</b>吗?

    如何在CY8CPROTO-062S2-43439对CYW43439进行射频测量?

    如何在 CY8CPROTO-062S2-43439 对CYW43439进行射频测量? 对于外置天线,我移除了R15,添加了R11,并在密西根大学添加了天线连接器。 但是
    发表于 01-18 09:58

    OpenAI重新开放ChatGPT Plus订阅

    OpenAI早先曾于11月7日举办首次开发者大会DevDay,会上推出了新的AI产品GPTs,为开发商和企业提供定制化ChatGPT的机会,以便满足特定需求及服务。
    的头像 发表于 12-14 10:30 286次阅读

    AD7606模块的BUSY引脚是否必须接入到主控芯片中进行控制处理呢?

    AD7606模块的BUSY引脚是否必须接入到主控芯片中进行控制处理呢?我使用的串行SPI进行传输,BUSY引脚接入到一个GPIO口,设备树文件是否需要将该 引脚信息添加进去
    发表于 12-04 08:12

    AD2S1210初始化读写寄存器失败的原因?如何解决?

    确认: AD2S1210芯片在工作,能够采集到输出的正弦波信号。 代码的配置是没问题的。因为上述问题是使用boot刷写app后,app出现的问题;调试器烧录app后,app能够正
    发表于 12-04 06:33

    AD8475的spice模型有问题,无法导入TINA-TI中进行仿真计算怎么解决?

    (dA8475, ad8475) (dA8475, ad8475)的spice模型有问题,无法导入TINA-TI中进行仿真计算
    发表于 11-17 07:43

    荣誉揭晓 TI 杯 2023 年全国大学生电子设计竞赛总测评圆满收官

    济南2023年8月29日 /美通社/ -- TI 杯 2023 年全国大学生电子设计竞赛总测评日前在山东大学成功举办, 431 支来自全国各赛区的参赛队伍齐聚山东大学,参与 TI 杯全国奖项总测评
    的头像 发表于 08-29 22:06 862次阅读
    荣誉揭晓 <b class='flag-5'>TI</b> 杯 2023 年全国大学生电子设计<b class='flag-5'>竞赛</b>总测评圆满收官

    AI如何对抗Dota人类游戏高手

    AI如何对抗Dota人类游戏高手?OpenAI这样回答
    的头像 发表于 08-01 15:01 362次阅读

    IAR Embedded Workbench中进行ARM+RISC-V多核调试

    之前的文章,我们介绍了如何在IAR Embedded Workbench for Arm中进行多核调试,其中所有的CPU内核都是基于ARM架构。近些年来,随着RISC-V的兴起,不少芯片集成
    发表于 06-14 16:55

    求分享使用Arduino兼容的esp8266板配置文件xcode IDE中进行编程的经验吗?

    无法更改它预设的查找 esp 板配置文件的路径。 任何人都有使用 Arduino 兼容的 esp8266 板配置文件 xcode IDE 中进行编程的经验吗?
    发表于 06-12 07:44

    8MIC-RPI-MX8是否需要在asound.conf中进行一些自定义配置?

    失败,行:2842 我有几个关于这个的问题: 1) 由于我们使用的是 8MIC-RPI-MX8 板,是否需要在 asound.conf 中进行一些自定义配置,以便 alsa 和 portaudio
    发表于 06-08 06:14

    双显示器imx8mq-evk不起作用的原因?

    文件,我在其中启用了 mipi_dsi 节点,即使在那之后什么也没有正在展出。 引导时出现此问题:adv7511 2-003d:探测失败。远程端口 \'mipi_dsi@30a00000\' 已禁用 但是我已经 dts 文
    发表于 05-30 13:42