0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepMind部署自学AI 攻陷FPS“雷神之锤”

电子工程师 来源:yxw 2019-06-02 10:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AI攻占了国际象棋和围棋高地之后,DeepMind在第一人称射击游戏(FPS)上也有了新进展。

1997年5月“深蓝”击败国际象棋世界冠军卡斯巴罗夫,有玩家在庆幸,我不下象棋,只下围棋。

2017年5月AlphaGo打败围棋世界冠军柯洁,有玩家庆幸,还好,我不下棋。

2018年6月,OpenAI 人工智能在dota2 5V5模式中以4000分水平击败人类玩家,依旧有玩家庆幸,我不玩RPG(角色扮演)对战,我只玩FPS(第一人称射击)。

如今,FPS也被AI攻陷。

近日,DeepMind的研究人员在本周的《科学》杂志上发表了一篇论文,描述描述了一个完全无监督的自学程序,不仅能够学习如何玩“ Quake III Arena ”(雷神之锤III竞技场,一款第一人称射击游戏),还能设计出胜过人类团队的新颖战略。

国际象棋和围棋最初是用来模拟战争游戏的,但却对战争复盘的不好。因为这类游戏通常涉及一个或多个队友和敌人。而且一个优秀的战争游戏必然是三维展开。

DeepMind使用的AI叫For The Win(FTW),本质是用卷积神经网络直接通过屏幕上进行训练,屏幕数据会被传递到两个LSTM网络或能够学习长期依赖性的网络。这两个LSTM一个是在快速时间尺度上,另一个是在慢速时间尺度上运行。它们通过目标耦合,能够对游戏世界进行预测并通过模拟游戏控制器输出动作。

FTW总共训练了30个游戏角色,为他们提供了一系列队友和对手,并随机选择游戏阶段,以防止他们通过记忆惯性做出选择。每个角色都明确自己的奖励信号,从而拥有自己独特的目标(比如夺取旗帜)。此外,他们利用双层流程(two-tier process)来优化内部奖励,通过这些奖励加强学习,来制定最重要的游戏策略。每个角色都单独玩了大约450,000场比赛,相当于拥有大约四年的经验。

训练过后的FTW在地图,团队名单和团队规模选择方面都可以作出有利的选择。他们学习了类似人类的行为,例如跟随队友,在对手的基地露营,以及在一波攻击中捍卫他们自己的基地。而随着训练的进行,他们还学会避免人类玩家的一些弱点,比如过于关注队友的行为。

在一场有40名人类参加的比赛中,人类和AI在比赛中随机匹配(对手或队友),结果,AI大胜人类玩家,FTW的Elo评级(相当于获胜的概率)为1600,而最好的人类玩家也只有1300,人类玩家平均评级为1050。

伦敦全球大学计算机科学教授,DeepMind科学家Thore Graepel表示,这项工作显示了多智能体培训(multiagent)推动人工智能发展的潜力。这是人机交互和系统相互补充或协同工作的研究的一个重大进步。

AI训练思路

游戏分为两个阵营,两方的大本营在游戏时候开会随机设置在地图的两端。游戏中的玩家可以在游戏地图中“瞎逛”,借助地图中的建筑物、数目以及其他物品与玩家进行互动。

在游戏中,如果一方用激光击败了其他玩家,被击中的玩家丢掉旗帜,回大本营重生。

DeepMind采用的AI玩家会和人类有同样的视角,AI不知道其他玩家的信息,包括位置、状态等。另外这款游戏比其他棋牌游戏更能接近真实的战场。AI玩家从零开始,用强化学习训练,在游戏的开始,真实加入战场的AI角色是随机选择的,这会使得智能体的行为更能接近最初设置的策略目标。

每个智能体都能够为自己制定策略,这意味着不同角色会采用不同的战术,即不同AI玩家有不同的专攻方向。

当然,也会有限制,即在每1000次迭代后,系统会比较策略并评估整个团队在模仿与学习能力。如果一个智能体的获胜机会低于另一个智能体的70%,那么较弱的智能体会复制较强的智能体。同时,强化学习还要求AI通过其他指标的对比进行调整。

AI玩家在一开始就像一张白纸,研究人员给他们的目标不仅是游戏结束时候的得分,还要关注在游戏前期的得分。研究人员指出,如果奖励机制只和游戏结果有关(输/赢/平局),显然限制太少,导致学习效果非常不好,所以需要考虑动态的奖励机制,即根据游戏的点数流来变动。

当初始位置是随机生成时,AI通常击败人类玩家。即使人类已经练习了12个小时,他们仍然能够赢得25%的比赛,平局6%,剩下的是负。

然而,当两名职业游戏测试人员得到一张特别复杂的地图时,这张地图AI并没有见过。重新让AI在这张地图上训练的话,只需要6个小时的训练就能脱颖而出。

这一结果没有在论文说明,而是在向新闻界提供的一份补充文件中作了说明。

目前人们仍然可以在经过精心设计的定位战中击败AI,因为现实生活很少提供这样复盘重来的机会,毕竟淮海战役只能打一次!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    90

    文章

    38188

    浏览量

    296992
  • DeepMind
    +关注

    关注

    0

    文章

    131

    浏览量

    12138

原文标题:Science最新:DeepMind部署自学AI,攻陷FPS“雷神之锤”

文章出处:【微信号:smartman163,微信公众号:网易智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    使用瑞萨RUHMI工具实现AI模型部署过程

    AI无处不在。你在部署AI,你的竞争对手也在部署AI,几乎所有人都在做AI。然而,
    的头像 发表于 10-17 10:00 2377次阅读
    使用瑞萨RUHMI工具实现<b class='flag-5'>AI</b>模型<b class='flag-5'>部署</b>过程

    工业视觉网关:RK3576赋能多路检测与边缘AI

    边缘网关传统IPC+独显 通道并发12路1080P@30fps(优化可扩)受PCIe/采集卡限制,成本上升 功耗/体积低功耗、小尺寸,边缘部署友好功耗高、体积大、散热复杂 集成成本SoC一体化
    发表于 10-16 17:56

    BPI-AIM7 RK3588 AI与 Nvidia Jetson Nano 生态系统兼容的低功耗 AI 模块

    可以使用以下工具快速部署AI应用程序,而无需复杂的硬件编程: RKNN-Toolkit2 一键将 TensorFlow/PyTorch 模型转换为 RKNN 格式,用于 NPU 加速 INT8 量化
    发表于 10-11 09:08

    ai_cube训练模型最后部署失败是什么原因?

    ai_cube训练模型最后部署失败是什么原因?文件保存路径里也没有中文 查看AICube/AI_Cube.log,看看报什么错?
    发表于 07-30 08:15

    STM32F769是否可以部署边缘AI

    STM32F769是否可以部署边缘AI
    发表于 06-17 06:44

    企业部署AI大模型怎么做

    当下,AI大模型已成为驱动决策自动化、服务智能化与产品创新的核心引擎。然而,企业面对动辄数百亿参数的大模型部署时,常陷入算力不足、响应延迟高、成本失控等困境。如何突破瓶颈,实现高效、稳定的AI
    的头像 发表于 06-04 09:26 686次阅读

    RAKsmart服务器如何赋能AI开发与部署

    AI开发与部署的复杂性不仅体现在算法设计层面,更依赖于底层基础设施的支撑能力。RAKsmart服务器凭借其高性能硬件架构、灵活的资源调度能力以及面向AI场景的深度优化,正在成为企业突破算力瓶颈、加速
    的头像 发表于 04-30 09:22 605次阅读

    Deepseek海思SD3403边缘计算AI产品系统

    海思SD3403边缘计算AI框架,提供了一套开放式AI训练产品工具包,解决客户低成本AI系统,针对差异化AI 应用场景,自己采集样本数据,进行AI
    发表于 04-28 11:05

    部署image_classification模型卡住了怎么解决?

    我按照如下教程部署,然后编译卡住了,谁能帮忙看看是咋回事。 https://github.com/STMicroelectronics/stm32ai-modelzoo-services/blob
    发表于 04-27 06:29

    AI端侧部署案例(SC171开发套件V3)

    AI端侧部署案例(SC171开发套件V3) 序列 课程名称 视频课程时长 视频课程链接 课件链接 工程源码 1 初学者入门手写数字识别案例 20分02秒 https://t.elecfans.com
    发表于 04-16 18:33

    AI端侧部署开发(SC171开发套件V3)

    AI端侧部署开发(SC171开发套件V3) 序列 课程名称 视频课程时长 视频课程链接 课件链接 工程源码 1 Fibo AI Stack模型转化指南------Docker Desktop环境操作
    发表于 04-16 18:30

    AI Agent 应用与项目实战》阅读心得3——RAG架构与部署本地知识库

    继续学习迪哥的AI Agent入门引导书籍。 LLM在落地应用中面临着专业领域表现不足、知识更新困难、容易产生\"幻觉\"等问题,这些挑战严重制约了AI技术在各行业的深入
    发表于 03-07 19:49

    DeepMind创始人预计年内有AI设计药物进入临床试验

    近日,英国人工智能公司DeepMind的创始人兼首席执行官德米斯·哈萨比斯(Demis Hassabis)透露,预计在今年年底前,将有人工智能(AI)设计的药物进入临床试验阶段。
    的头像 发表于 01-24 15:46 2582次阅读

    谷歌加速AI部门整合:AI Studio团队并入DeepMind

    近日,谷歌正紧锣密鼓地推进其人工智能(AI)部门的整合工作。据谷歌AI Studio主管Logan Kilpatrick在领英页面上的透露,谷歌已将AI Studio团队整体转移至DeepMi
    的头像 发表于 01-13 14:40 1152次阅读

    企业AI模型部署攻略

    当下,越来越多的企业开始探索和实施AI模型,以提升业务效率和竞争力。然而,AI模型的部署并非易事,需要企业在多个层面进行细致的规划和准备。下面,AI部落小编为企业提供一份
    的头像 发表于 12-23 10:31 1314次阅读