0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

终于,AI还是对《王者荣耀》下手了

DPVg_AI_era 来源:lq 2018-12-25 09:22 次阅读

腾讯AI Lab团队在arXiv发表论文,通过对AI进行训练,并与《王者荣耀》顶级人类玩家PK,最后获得了48%的胜率。

终于,AI还是对《王者荣耀》下手了。

19日,腾讯AI Lab团队在arXiv上发表文章,训练AI大战人类玩家,而此次所选择的游戏,正是火遍大江南北的手游——《王者荣耀》。

论文地址:https://arxiv.org/pdf/1812.07887.pdf

腾讯团队表示,游戏AI的下一个挑战是即时策略(RTS)游戏。在与顶尖人类玩家大战250回合之后,取得了48%的胜率!

AI“杀戮”王者峡谷

近年来,微观层面的操作取得了很大的进步,但宏观战略的完整解决方案仍然缺乏。

腾讯AI Lab团队提出了一种新的基于学习的分层宏观策略模型,用于掌握RTS子类型游戏——MOBA游戏。

在层次宏观战略模型的训练下,智能体能够明确地做出宏观战略决策,并进一步指导其微观层面的操作。

此外,每个智能体都可以在做出独立的战略决策的同时,通过利用一种新颖的模仿交叉通信机制与盟友进行沟通。

团队从《王者荣耀》职业联赛(KPL)比赛和训练中收集了30万个游戏回放记录。最后,用于训练的实例数量高达2.5亿个。

在视觉方面,团队提取了85个特征,例如所有单位的位置和生命点,然后将视觉特征模糊为12*12的分辨率;在属性方面,团队提取了181个特性,如英雄角色、游戏时间、英雄ID、英雄的金币和等级状态以及死亡、助攻量统计。

团队将卷积层和完全连接层混合使用,分别从视觉和属性特征方面获取输入。

而如何开局是MOBA最重要的策略之一。

下图展示了通过模型学到不同英雄的开局注意力。每个子图由两个正方形组成。左侧方形图表示右侧MOBA mini-map的注意力分布。

不同英雄的开场策略。最热的区域用红色圆圈标出。

从左至右分别是貂蝉(法师,中路)、韩信(刺客,打野)、亚瑟(战士,辅助)、后裔(射手,下路)。

根据注意力预测,貂蝉将去中路,韩信将去蓝Buff区域,亚瑟和后裔将去红Buff区域,除此之外,宫本武藏(战士,上单)将去上路发育。

这样的开局策略在《王者荣耀》中非常流行。

随着游戏的进行,注意力的分布是会发生变化的,如下图所示:

为了体现宏观策略、跨智能体通信机制以及相位层的重要性,团队设计了如下实验进行比较:

团队删除了宏观策略,并加入录像中的微观操作来训练模型。微观模型的设计类似于OpenAI Five;

在没有跨智能体通信机制的情况下,将HMS与经过训练的HMS进行匹配;

删除相位层,并将其与完整版HMS进行了比较;

为了更准确的评估AI的表现,还邀请了250位人类玩家团队,他们的排名处于前1%。同样,游戏规则和正常玩法一样,也会涉及BAN英雄。

其结果如下表所示:

比赛统计。250场比赛是针对人类玩家,40场比赛分别针对无宏观策略、无交流和无阶段的比赛。

MOBA游戏介绍:以《王者荣耀》为例

MOBA类游戏现在占世界网络游戏市场的30%,Dota、《王者荣耀》、《英雄联盟》均属此类游戏。MOBA类游戏在PC游戏和移动平台游戏市场上均排名首位。

一局标准的游戏是5V5的组队对抗赛,每个玩家控制一个单位,即英雄。王者荣耀中有80多个英雄可供选用,每个英雄有不同的战斗特点和技能。玩家在游戏控制英雄移动,并释放技能。

如图所示。玩家使用左下角转向按钮来控制移动,而右下角则设置按钮来控制技能。可通过主屏幕观察周围环境,还可以通过左上角迷你地图了解完整的地图情况,其中可观察的炮塔,小兵和英雄显示为缩略图。只有当他们是盟友的单位或与盟友单位相距一定距离内时才能观察到该单位。

每个队都有三组防御塔,每路各有三个塔。地图上还有四个丛林区域,可以收集资源以增加金钱和经验。每个英雄都以最低金币值和等级1出生。两队都试图利用资源获得尽可能多的黄金和经验,以购买物品和升级。最终目标是摧毁敌人的基地。 MOBA的概念图如图所示。 1B。

要想精通MOBA游戏,玩家需要具备出色的宏观策略操作和熟练的微操。常见的宏观策略包括开放,限制,传递消息,伏击等。熟练的微观层面执行需要高度的控制准确性和对技能的损害和影响的深刻理解。宏观策略操作和微观层次执行都需要掌握优秀的时机,这使得它极具挑战性和趣味性。

(a)《王者荣耀》的游戏UI。玩家使用左下角转向按钮来控制动作,而右下角则设置按钮来控制技能。玩家可以通过屏幕观察周围环境,并使用左上角查看小地图。(b)MOBA的示例地图。这两支队伍的颜色为蓝色和红色,每个队伍有9个炮塔(圆圈)和一个基地(方块)。四个丛林区域的编号从1到4

下面以《王者荣耀》为例,对MOBA的计算复杂度进行量化。

MOBA游戏计算复杂度的量化

一局《王者荣耀》一般游戏长度约为20分钟,即游戏核心约为20000帧。在每一帧中,玩家需要在数十个选项中做出决定,包括24方向的移动方向控制,以及向相应的位置/方向上释放技能等。即使具有显着的离散化和简化处理,并将最快反应时间增加到200ms,需要处理动作空间也达到101500

至于状态空间,王者荣耀地图的分辨率是130,000*130,000像素,每个单位的直径是1000像素。在每一帧上,每个单位可能有不同的状态,如生命值,等级,金币数量等。同样,状态空间大小为1020,000。下表中列出了MOBA和围棋之间的动作空间和状态空间复杂度的比较。

围棋和MOBA游戏的计算复杂度比较

MOBA游戏中AI的宏观战略架构

我们设计MOBA AI宏观战略模型的动机源于人类玩家如何做出战略决策。在MOBA游戏中,经验丰富的人类玩家完全了解游戏的每个阶段,例如开局阶段,推线阶段,游戏中期和游戏后期阶段。在每个阶段中,玩家都会关注游戏地图,并根据英雄的位置做出相应的决定。例如,在推线阶段,玩家倾向于更多地关注自己所在的路,而不是去支持队友,而在中后期阶段,玩家更多地关注团战点,并推向敌人的基地。

综上所述,我们将宏观战略运作过程表述为“阶段识别 - >关注预测 - >执行”。为了模拟这个过程,我们提出了一个两层的宏观策略架构,即阶段层和注意力层:

•阶段层负责识别当前的游戏阶段,以便注意力层可以更好地了解应该注意的位置。

•注意力层旨在预测游戏地图上的最佳区域,将英雄移动至该区域。

阶段层和注意力层充当微级执行的高级指导。我们将在下一节中描述建模的细节。微观模型的网络结构几乎与OpenAI Five1中使用的网络结构相同,但是采用监督学习方式。我们做了一些小修改,以使其适应王者荣耀,比如删除了瞬移技能。

分层宏观战略模型

我们提出了一种分层宏观策略(HMS)模型,以在统一的神经网络中考虑阶段层和注意力层。我们将首先介绍统一的网络架构。然后,我们将说明如何构建每个阶段层和注意力层。

概述

我们提出了一种分层宏观策略模型(HMS),将注意力层和相位层作为多任务模型进行建模。它将游戏功能作为输入。输出包括两个任务,即将注意力层作为主要任务,阶段层作为辅助任务。注意力层的输出直接将宏观策略嵌入,传递给微观模型,而资源层则作为一个有用的任务,细化注意力层和阶段层任务之间的共享层。 HMS的网络结构如图所示。

HMS将图像和矢量特征作为输入,分别承载视觉特征和全局特征。在图像部分使用卷积层。在矢量部分使用全连接层。图像和矢量部分合并在两个单独的任务中,即注意力层和阶段层。最终,注意力和阶段任务从共享层通过自己的层输出,并输出到计算损失。

注意力层

与玩家根据游戏地图做出决策的方式类似,注意力层会预测智能体移动的最佳目标区域。但是,从数据中判断出玩家的目的地在哪里是很困难的。我们观察到,发生攻击动作的区域可以指示玩家英雄的移动目的地。根据这一观察,我们将地面真实区域定义为玩家进行下一次攻击的区域。如图所示。

设s为包含多个帧的游戏中的一个会话,s-1表示s之前的会话。 s- 1是游戏中的第一个会话。让ts成为s的起始框架。请注意,会话以攻击行为结束,因此在英雄进行攻击的ts中存在区域y。如图所示。s-1的标签是ys,而s的标签是ys + 1。直观地说,以这种方式设置标签,是希望智能体学会在游戏开始时移动到ys处。

阶段层

阶段层旨在识别当前的游戏阶段。提取关于游戏阶段基础信息是很困难的,因为人类玩家使用的阶段定义是抽象的。虽然游戏阶段与时间大致相关,但是更多取决于对当前比赛情况的复杂判断,这使得想从重放录像中提取真实的比赛阶段信息非常难。

幸运的是,我们观察到游戏阶段与主要资源数量之间的存在明显的关联。例如,在开局阶段,玩家通常会瞄准外塔和baron,而在游戏后期,玩家会操纵目标摧毁敌人的基地。

因此,我们对主要资源进行阶段性建模。更具体地说,主要资源表示炮塔、baron、龙和基地。我们在图4A中标出了地图上的主要资源。对阶段层的标签定义类似于注意力层。唯一的区别是,阶段层中的ys表示对炮塔,baron、和基地的攻击行为,而不是区域。我们不会将其他资源(如英雄、小兵和中立生物)视为主要目标,因为通常这些资源是为了实现更大的目标,例如摧毁炮塔或基地。

对多智能体间的通信的模拟

多智能体间的通信对于智能体团队合作至关重要。关于多智能体强化学习研究中的通信问题已有很多研究文献。然而,在监督学习中使用训练数据来学习通信是具有挑战性的,因为实际的通信情况是未知的。

为了使智能体能够在监督学习环境中进行通信,我们设计了一种新的通信机制。在训练阶段,我们将盟友的注意力标签作为训练特征。在测试阶段,我们将盟友的注意力预测作为特征进行相应的决策。通过这种方式,我们的智能体可以实现彼此“沟通”。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4572

    浏览量

    98714
  • AI
    AI
    +关注

    关注

    87

    文章

    26415

    浏览量

    264022
  • 智能体
    +关注

    关注

    1

    文章

    111

    浏览量

    10424

原文标题:Dota之后,《王者荣耀》也被AI攻陷,势把人类顶级玩家拉下马

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    王者荣耀辅助挂机脚本教程-安卓免root

    》入门级别,这个级别主要用来刷金,也不容易送人头,杀人数量还是很可观的哦!4、高级功能(低血闪现回撤,回撤加血,逃避防御塔)!(看战绩你就知道我有多么拟人操作!)【安卓免root王者荣耀辅助挂机脚本使用说明
    发表于 04-21 16:49

    VS-RK3399 主板既然能流畅运行“王者荣耀”,帧率达60帧,不可思议。

    `VS-RK3399 主板既然能流畅运行“王者荣耀”,帧率达60帧,不可思议。这有讨论,说的不错。bbs.videostrong.com`
    发表于 12-13 14:41

    基于stm32作品设计的相关资料分享

    。有一个难以入眠的夜晚,我打开了王者荣耀,我习惯了玩手机都要开着灯打,终于,赢了好几把,时间已经到了凌晨2点半,我也开始有睡意,当我放下手
    发表于 11-11 06:46

    搭载Elliptic Labs AI Virtual Proximity Sensor™的智能手机荣耀60和60SE正式发布

    全球AI软件及AI Virtual Smart Sensors™领域的世界领导者Elliptic Labs (EuroNext Growth: ELABS.OL)在荣耀最新发布的智能手机60
    发表于 12-02 15:25

    一加手机3T强势加入 率先体验王者荣耀高帧率模式

    在画质还是动作的连贯性,都有着非常巨大的提升,因此该模式对于手机的优化与配置都有着极高的要求,今日《王者荣耀》正式宣布一加手机3T、三星GALAX S7 edge、三星GALAX S6 edge和ZUK Z2 Pro将支持该模式
    发表于 03-01 10:53 6139次阅读

    一加3T,ZUKZ2Pro这3台王者手机,打王者荣耀一点也不卡

    王者荣耀的60帧模式可以说是王者荣耀里最顶级的画面模式了。开了之后跟玩另外一个游戏似的,特效杠杠的!这就是为什么一票玩家都要追求这个60帧了。
    发表于 03-06 15:35 1.6w次阅读

    王者荣耀用什么手机好?荣耀9和一加5玩王者荣耀时的区别评测

    2017年上半年,在手机界除了有许多重磅新机发布之外,还有一个大事件就是手机游戏《王者荣耀》的影响力已经超过了诸多传统的PC游戏和主机游戏,似乎宣示了移动游戏时代的到来。这样一款有影响的游戏
    发表于 07-19 15:34 1.5w次阅读

    游戏体验更流畅,玩王者就选OPPOR11王者荣耀限量版

    9月7日,王者荣耀官方宣布将联合OPPO推出R11王者荣耀周年庆限量版定制版。王者荣耀毫无疑问是
    发表于 09-07 17:14 1.6w次阅读

    王者荣耀延迟高怎么办?选一颗骁龙强芯

    王者荣耀延迟高怎么办?其实《王者荣耀》这款游戏对手机性能要求相对较低。但是,作为一款多人在线战术竞技类游戏,对于网络环境,特别是网速和网络延迟的要求十分苛刻。手机游戏玩家在玩
    发表于 06-26 08:58 2751次阅读

    坚果Pro2玩王者荣耀怎么样

    作为时下最火的手游之一,《王者荣耀》的吸引力就不需要笔者多言了。因此,在手机甚至平板圈围绕《王者荣耀》做文章、找买点也就不足为其。尽管老罗在坚果Pro 2发布会上表示自己并非“农药”选
    的头像 发表于 12-13 09:18 4436次阅读

    酷派cool1玩王者荣耀怎么样

    不知道从什么时候起,王者荣耀这款游戏在笔者朋友圈变得相当的活跃,其中不乏工薪一族和学生。最近,筒子们眼瞅着双十一临近,想着借活动把旧机给换了入一部新货,常常来问什么手机合适。笔者考虑学生、工薪族
    的头像 发表于 12-10 11:03 3901次阅读

    OPPOR15玩王者荣耀卡不卡

    OPPO R15首发了联发科P60中端处理器,通过测试得知,这款新机安兔兔跑分高达13万多分,这样的跑分成绩相信很多玩家认为畅玩王者荣耀。那么事实真的如此吗?最近部分网友提问:OPPO R15玩王者
    的头像 发表于 06-26 10:59 5441次阅读

    OPPOReno玩王者荣耀怎么样

    OPPO Reno玩王者荣耀怎么样?为了满足部分消费者在游戏方面的特殊需求,不少手机厂商都推出了主打游戏性能的设备,OPPO Reno也是其中的一员。那么,OPPO Reno玩王者荣耀
    的头像 发表于 07-05 08:37 7942次阅读

    华为推出nova8 Pro王者荣耀定制机

    现在,手机厂商和游戏的联动越来越频繁,比如去年12月曝光的华为nova8系列和王者荣耀的联动。现在,王者荣耀官方已经“摊牌”了。根据官方消息,华为nova8 Pro
    的头像 发表于 01-12 15:10 4325次阅读

    教你实现用Python自动玩王者荣耀

    王者荣耀」想必大家就算没有玩过,也都听过。 腾讯 AI Lab 开发的策略协作型“绝悟”,最强 AI 分分教你做人。 但那个是像 Alpha Go 一样,需要掌握海量数据和机器的团队
    的头像 发表于 11-19 10:49 4194次阅读
    教你实现用Python自动玩<b class='flag-5'>王者</b><b class='flag-5'>荣耀</b>