我们正在共同构建能够解锁全新水平智能的强化学习基础设施。
强化学习智能体 —— 即通过不断试错来学习的 AI 系统,能够将算力转化为全新的知识。
这正是 NVIDIA 与 Ineffable Intelligence 之间全新工程级合作的核心内容。Ineffable Intelligence 是一家总部位于伦敦的 AI 实验室,由 AlphaGo 架构师 David Silver 创立,该公司在上周刚结束隐身模式,正式对外亮相。
NVIDIA 创始人兼首席执行官黄仁勋表示:“AI 的下一个前沿发展是超级学习者 —— 即能够从经验中持续学习的系统。我们很高兴能与 Ineffable Intelligence 合作,共同设计用于大规模强化学习的基础设施,助力其推动 AI 的前沿发展,并开创新一代智能系统。”
Silver 是强化学习领域的先驱之一,这种方法已经改变了 AI 研究。他致力于将这种方法进一步发展为一种全新的范式。
Silver 表示:“在 AI 领域研究人员已经基本解决了相对简单的问题:即如何构建能够掌握人类已有知识的系统。但现在,我们需要解决更难的 AI 问题:如何构建能够自主发现新知识的系统。这需要一种截然不同的方法 —— 即从经验中学习的系统。”
这种学习需要一条强大且高度优化的管线来支撑。与预训练不同,预训练是把固定的人类数据输入系统,而强化学习工作负载会实时生成数据。
该系统必须在紧密循环中持续执行操作、观察、评分和更新,这给互连技术、显存带宽和服务带来了预训练所没有的压力。此外,该系统将基于与人类语言和其他人类数据截然不同的丰富经验进行训练,可能需要全新的模型架构和训练算法。
这正是 NVIDIA 和 Ineffable 技术协作的重点所在:构建一个能够大规模为强化学习系统提供数据的管线。两家公司的工程师团队正通力合作,探索创建此训练管线的理想方式。
这项工作正基于 NVIDIA Grace Blackwell 平台上展开,并将成为首批探索即将推出的 NVIDIA Vera Rubin 平台的项目之一。随着 AI 世界转向通过仿真和经验而非人类数据进行学习的模型,此举旨在了解未来所需的下一代硬件和软件。
妥善构建这一基础设施将在高度复杂和丰富环境中解锁前所未有的大规模强化学习,使智能体能够在各个知识领域中取得突破性发现。
-
NVIDIA
+关注
关注
14文章
5721浏览量
110218 -
强化学习
+关注
关注
4文章
275浏览量
12012 -
算力
+关注
关注
2文章
1757浏览量
16849
原文标题:NVIDIA 与 Ineffable Intelligence 共同推进构建强化学习基础设施的未来
文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
在阿里云PAI平台的机器人感知强化学习规模化实践
上汽奥迪E5 Sportback车型升级搭载全新Momenta强化学习大模型
Momenta R6强化学习大模型上车东风日产NX8
IBM宣布扩大与NVIDIA的合作
NVIDIA推出Vera CPU以显著提升系统性能与能效
Meta与NVIDIA达成多年战略合作伙伴关系
自动驾驶中常提的离线强化学习是什么?
强化学习会让自动驾驶模型学习更快吗?
多智能体强化学习(MARL)核心概念与算法概览
NVIDIA BlueField-4数据处理器重塑新型AI原生存储基础设施
今日看点:智元推出真机强化学习;美国软件公司SAS退出中国市场
自动驾驶中常提的“强化学习”是个啥?
NVIDIA Isaac Lab可用环境与强化学习脚本使用指南
NVIDIA与Ineffable Intelligence合作打造强化学习基础设施
评论