0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

深度强化学习平台为玩家带来新的人工智能体验

星星科技指导员 来源:NVIDIA 作者:Michelle Horton 2022-04-07 16:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

得益于索尼 AI 、索尼互动娱乐( SIE )以及 GT Sport 的开发者 Polyphony Digital Inc 。的最新合作, Gran Turismo ( GT ) Sport 的竞争对手正面临一个新的、 AI 超级强大的竞争者。

被称为 Gran Turismo Sophy ( GT Sophy )的自主人工智能赛车代理最近击败了 GT 运动领域的世界最佳车手。发表在 Nature, 上的 工作 介绍了一种新的深度强化学习平台,用于创建 GT Sophy ,并可能为全球玩家带来新的人工智能体验。

索尼集团公司董事长、总裁兼首席执行官吉田健一郎在一份 发布。 的声明中说:“索尼的目的是‘通过创造力和技术的力量,让世界充满情感’,而大图里斯莫·索菲就是这一点的完美体现。”

“我们为游戏玩家打造了一款游戏 AI ,这是索尼作为一家创意娱乐公司的独特之处。它标志着 AI 发展的重大飞跃,同时也为全球 GT 粉丝提供了增强的体验。”

Smart gaming

人工智能对游戏来说并不新鲜。 2017 年,来自 DeepMind 的 Alpha Zero 项目在学会玩和征服国际象棋、日本象棋和使用深度强化学习( deep RL )围棋时成为新闻

作为机器学习的一种补偿, deep RL 在基本术语中使用计算 RL 代理通过试错来做出决策,以解决问题。在算法中引入深度学习后,智能体从非常大的数据集做出决策,并决定有效地实现其目标的行动。

Alpha Zero 程序使用了一种算法,一个未经训练的神经网络对自己进行了数百万次游戏,并根据其结果调整游戏。

然而,赛车人工智能对来自不同汽车、赛道、驾驶员、天气和对手的无数变量提出了更复杂的推理需求。作为最逼真的驾驶模拟器之一, GT Sport 使用真实的赛车和赛道尺寸,通过考虑空气阻力和轮胎摩擦等因素再现比赛环境。

强化良好行为

该团队创建了一个能够适应实时因素的赛车代理,并使用新开发的 deep RL 算法对 GT Sophy 进行了赛车控制、赛车战术和赛车礼仪三项具体技能的培训。根据 project’s website ,该算法使用最新的强化学习技术,根据赛车经纪人的行为对其进行奖励或惩罚。

研究人员在研究报告中写道:“使用 deep RL 开发赛车代理的优点之一是,工程师无需编程如何以及何时执行赢得比赛所需的技能,只要它暴露在正确的条件下,代理通过反复试验学会做正确的事。”。

该团队定制了一个基于网络的分布式异步部署和培训( DART )平台,使用 SIE 的全球云基础设施研究人员在 PlayStation 4 控制台上培训 GT Sophy ,然后使用 DART 收集培训数据并评估代理的版本。

使用这个系统,研究人员指定一个实验,自动运行,并在网络浏览器中查看数据。每个实验都在一个计算节点上使用一个培训师,该培训师使用 cuDNN 加速的 TensorFlow 深度学习框架和 NVIDIA V100 GPU 或 NVIDIA A100 GPU 的一半,再加上大约 8 个 CPU 和 55 个 记忆的碎片。

据 project’s website 报道,“该系统允许索尼人工智能的研究团队无缝地同时运行数百个实验,同时探索将 GT Sophy 提升到下一个水平的技术。”。

增压燃气轮机

在 2021 ,世界上最好的 GT 赛车手中有四人在两个单独的比赛中与 GT Suffy 竞争。这些比赛包括三个赛马场、四名 GT Sophy 经纪人和赛车。在首次亮相时, GT Sophy 在计时赛中表现出色,但在同一赛道上挑战赛车手时表现不佳。

该队在第一场比赛结果的基础上进行了改进,升级了训练体系,增加了网络规模,调整了特征和奖励,增强了对手。

这一结果造就了一名赛车经纪人,他可以在急转弯处超越一名人类驾驶员,处理拥挤的起跑,在滑流中进行弹弓传球,并执行防守动作。经纪人这样做的同时,也遵守了人类驾驶员理解和实践的微妙的体育道德考虑。在计时赛和 FIA 认证的格兰赛车锦标赛系列赛中,它也击败了顶尖的人力车手。

据报道, GT Sophy 在短短几个小时内就学会了绕道而行。在大约两天的时间里,它可以击败大约 95% 的人类玩家。给它 10 到 12 天,大约 45 , 00 个驾驶小时, GT Sophy 就等于或超过了世界顶级车手。

凭借其赛车实力, GT Sophy 的目标是让 GT 运动更有趣、更具竞争力和教育性。一些与 GT Sophy 竞争的专家报告说,他们学习了转弯和驾驶技术的新方法。

研究人员还发现, deep RL 有可能改善协作机器人无人机自动驾驶车辆等系统的实际应用。

关于作者

Michelle Horton 是 NVIDIA 的高级开发人员通信经理,拥有通信经理和科学作家的背景。她在 NVIDIA 为开发者博客撰文,重点介绍了开发者使用 NVIDIA 技术的多种方式。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    30600

    浏览量

    219657
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109110
  • 自动驾驶
    +关注

    关注

    791

    文章

    14672

    浏览量

    176621
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    自动驾驶中常提的“强化学习”是个啥?

    下,就是一个智能体在环境里行动,它能观察到环境的一些信息,并做出一个动作,然后环境会给出一个反馈(奖励或惩罚),智能体的目标是把长期得到的奖励累积到最大。和监督学习不同,强化学习没有一
    的头像 发表于 10-23 09:00 331次阅读
    自动驾驶中常提的“<b class='flag-5'>强化学习</b>”是个啥?

    【产品介绍】Altair RapidMiner数据分析与人工智能平台

    AltairRapidMiner赋能组织解锁数据洞察,运用数据分析和先进的人工智能自动化,提供可扩展的面向未来的解决方案。Altair数据分析和人工智能平台包括数据准备、数据科学、MLOps、编排
    的头像 发表于 09-18 17:56 650次阅读
    【产品介绍】Altair RapidMiner数据分析与<b class='flag-5'>人工智能</b><b class='flag-5'>平台</b>

    利用超微型 Neuton ML 模型解锁 SoC 边缘人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们将介绍这对开发人员意味着什么,以及使用 Neuton 模型如何改进您的开发和终端
    发表于 08-31 20:54

    人工智能+”行动重磅发布!ElfBoard助力嵌入式教育智能化升级

    、民生福祉、治理能力、全球合作等6大重点行动,强化8项基础支撑能力,推动人工智能与经济社会各行业各领域广泛深度融合。一、“人工智能+”行动的总体蓝图《意见》提出分三
    的头像 发表于 08-30 16:07 6124次阅读
    “<b class='flag-5'>人工智能</b>+”行动重磅发布!ElfBoard助力嵌入式教育<b class='flag-5'>智能</b>化升级

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    深度学习,构建起从基础到前沿的完整知识体系,一门实验箱就能满足多门课程的学习实践需求,既节省经费又不占地 。 五、代码全开源,学习底层算法 所有实验全部开源,这对于想要深入
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    深度学习,构建起从基础到前沿的完整知识体系,一门实验箱就能满足多门课程的学习实践需求,既节省经费又不占地 。 五、代码全开源,学习底层算法 所有实验全部开源,这对于想要深入
    发表于 08-07 14:23

    CES Asia 2025蓄势待发,聚焦低空经济与AI,引领未来产业新变革

    可能性。智能无人机在物流配送、巡检监测等领域的应用愈发成熟,大大提高了工作效率和精准度。低空经济的发展,不仅带动了相关技术的进步,还创造了新的就业机会和经济增长点。 人工智能领域同样发展迅猛,深度
    发表于 07-09 10:29

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模型正在工作生活
    发表于 07-04 11:10

    开售RK3576 高性能人工智能主板

    ,HDMI-4K 输出,支 持千兆以太网,WiFi,USB 扩展/重力感应/RS232/RS485/IO 扩展/I2C 扩展/MIPI 摄像头/红外遥控 器等功能,丰富的接口,一个全新八核拥有超强性能的人工智能
    发表于 04-23 10:55

    科大讯飞携手西安铁路局打造人工智能平台

    近日,科大讯飞携手中国铁路西安局集团有限公司(以下简称“西安铁路局”)打造的人工智能平台正式上线启用。该人工智能平台集成讯飞星火大模型技术,提供星火知识库、星火纪要、讯飞智文等产品,有
    的头像 发表于 03-17 16:14 806次阅读

    AI商业应用平台的特点

    AI商业应用平台集成了自然语言处理、机器学习深度学习等前沿的人工智能技术。以下,是对AI商业应用平台
    的头像 发表于 02-22 09:58 878次阅读

    军事应用中深度学习的挑战与机遇

    ,并广泛介绍了深度学习在两个主要军事应用领域的应用:情报行动和自主平台。最后,讨论了相关的威胁、机遇、技术和实际困难。主要发现是,人工智能技术并非无所不能,需要谨慎应用,同时考虑到其局
    的头像 发表于 02-14 11:15 825次阅读

    数学专业转人工智能方向:考研/就业前景分析及大学四年学习路径全揭秘

    随着AI技术的不断进步,专业人才的需求也日益增长。数学作为AI的基石,机器学习深度学习、数据分析等提供了理论基础和工具,因此越来越多的数学专业学生开始考虑在
    的头像 发表于 02-07 11:14 1706次阅读
    数学专业转<b class='flag-5'>人工智能</b>方向:考研/就业前景分析及大学四年<b class='flag-5'>学习</b>路径全揭秘

    人工智能和机器学习以及Edge AI的概念与应用

    作者:DigiKey Editor 人工智能(AI)已经是当前科技业最热门的话题,且其应用面涉及人类生活的各个领域,对于各个产业都带来相当重要的影响,且即将改变人类未来发展的方方面面。本文将为您介绍
    的头像 发表于 01-25 17:37 1582次阅读
    <b class='flag-5'>人工智能</b>和机器<b class='flag-5'>学习</b>以及Edge AI的概念与应用

    【「具身智能机器人系统」阅读体验】+初品的体验

    动态互动的。 该理论强调智能行为源于智能体的物理存在和行为能力,智能体必须具备感知环境并在其中执行任务的能力。具身智能的实现涵盖了机器学习
    发表于 12-20 19:17