0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么是AI模型的推理能力

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2025-09-23 15:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA 的数据工厂团队为NVIDIACosmos Reason 等 AI 模型奠定了基础,该模型近日在 Hugging Face 的物理推理模型排行榜中位列榜首。

AI 模型正以惊人的速度与规模不断发展。

但它们缺少了人类与生俱来的哪种能力呢?答案是“常识”。常识是一种通过现实生活经验形成的认知:比如鸟类无法倒着飞、镜子能够反射、冰会融化成水。

对人类而言,这些常识显而易见。但对于需要精准回答复杂问题、在工业仓库或道路等不可预测的物理环境中运行的 AI 模型来说,这些知识必须通过“教学”才能掌握。

为解决这一难题,NVIDIA 正在开发一套测试方案,旨在教会 AI 模型认知物理世界的运行边界。简言之,就是教会 AI 常识。

这些测试被用于开发推理模型,比如NVIDIA Cosmos Reason。这是一款用于物理 AI 应用的开源视觉语言推理模型(VLM),能够生成具有时间关联性的响应。目前,Cosmos Reason 已在 Hugging Face 的物理推理模型排行榜中位居第一。

相较于传统视觉语言模型,NVIDIACosmos Reason 的独特价值在于:它专为加速机器人自动驾驶汽车及智能空间等物理 AI 的开发而设计,能够基于物理常识知识,对之前没有经历过的场景进行推理。

要让 AI 模型真正理解工业空间、实验室等复杂环境,需从基础认知开始构建。例如,在下方展示的测试中,NVIDIACosmos Reason 需要回答关于视频中和相对运动有关的选择题。

NVIDIACosmos Reason 评估数据集的示例

什么是 AI 模型的推理能力?

为提升模型的推理能力,NVIDIA 采用‌强化学习‌的方式,让模型学习关于现实世界的物理常识。

举例说明,机器人无法凭直觉分辨左、右、上、下,它们需要通过训练才能理解这些时空概念;用于安全测试,比如汽车碰撞测试的 AI 驱动机器人,也必须经过训练才能理解自身物理形态如何与周围环境互动。

如果在训练过程中没有教会机器人常识,在实际部署时就可能出现问题。

NVIDIA Cosmos Reason 研究科学家 Yin Cui 表示:“如果缺乏对物理世界的基础认知,机器人可能跌倒,或者导致意外损毁物品,进而对人员及环境的安全构成威胁。”

NVIDIA 正通过将人类对物理世界的常识“注入”AI 模型,推动下一代 AI 的发展。

NVIDIA 数据工厂团队由来自生物工程、商业和语言学等多元背景的全球分析师构成,他们致力于开发、分析并整合数十万条数据单元,为生成式 AI 的推理训练提供核心数据支撑。

数据整理流程

NVIDIA 数据工厂团队的核心项目之一,是开发面向物理 AI 应用的世界基础模型。这些虚拟环境能构建深度学习神经网络,基于仿真场景为推理模型训练提供更安全、更高效的支持。

NVIDIA 数据标注团队率先启动流程,他们基于真实世界视频数据设计问答对。视频内容涵盖各类场景,从鸡在鸡舍中活动,到汽车在乡间道路行驶。

例如,某个标注员可能会针对下面的视频提出问题:“画面中的人是用哪只手切意大利面?”

NVIDIACosmos Reason 评估数据集的示例

随后,标注员会给出 A、B、C、D 四个选项。模型获取这些数据后,进行推理并选择正确答案。

Yin Cui 表示:“我们本质上是在给模型设计测试题。所有问题都采用选择题形式,就像学生在学校考试中遇到的题目一样。”

这些问答对随后由 Michelle Li 等 NVIDIA 的分析师进行质量检查。

Li 拥有公共卫生和数据分析学背景,这让她能够从更宏观的角度看待所分析的数据。

她说:“对于物理 AI ,我们的特定目标是训练模型理解物理世界,这一目标让我在审核问答对和问题类型时,始终保持全局视角。我会问自己,这些问答对是否符合项目的目标和准则要求?”

之后,数据会由项目的数据工厂负责人审核,确保其符合质量标准并可交付至NVIDIACosmos Reason 研究团队。科学家们随后将数十万条数据单元(即问答对)输入模型,通过强化学习训练其理解物理世界的边界和限制。

推理型 AI 有哪些应用场景?

推理模型的优势在于,它们既能理解自身所处的时空环境,也能预测结果。这类模型可分析情境,生成可能结果的逻辑思维网络,并推断出最可能的场景。

简而言之,推理式 AI 展现了类似人类的思维。它会展示思考过程,让用户能够理解其响应背后的逻辑。

用户可要求模型分析视频内容,如两辆车在路上行驶的场景。当被问到“如果这两辆车在同一车道上相向而行会发生什么?”时,模型能够推理并判定该假设情景的最可能结果,比如两车相撞。

NVIDIA Cosmos Reason 团队首席研究科学家 Tsung-Yi Lin 表示:“我们正在开发一种以物理 AI 为核心的突破性推理模型。“

随着 NVIDIA 持续推进推理模型创新,数据工厂团队的高质量数据生产能力,将对开发能安全与现实世界交互的自主的智能体以及物理 AI 系统起到关键作用。

您可以在 Hugging Face 和 GitHub 预览或下载 NVIDIA Cosmos-Reason1 模型。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109067
  • AI
    AI
    +关注

    关注

    89

    文章

    38087

    浏览量

    296413
  • 模型
    +关注

    关注

    1

    文章

    3648

    浏览量

    51701

原文标题:人类如何教会 AI 模型学会推理?

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为破解HBM依赖!AI推理黑科技UCM上线,9月正式开源

    8月12日,在2025金融AI推理应用落地与发展论坛上,华为公司副总裁、数据存储产品线总裁周越峰宣布,华为此次和银联联合创新,推出AI推理创新技术UCM(
    的头像 发表于 08-13 08:58 9677次阅读
    华为破解HBM依赖!<b class='flag-5'>AI</b><b class='flag-5'>推理</b>黑科技UCM上线,9月正式开源

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    和探索;人类级别的理解能力;常识推理;现实世界的知识整合。 3、测试时计算 测试时计算(TTC)是指在模型推理阶段利用额外的计算资源来提升泛化性能。 4、具身智能与渗透式
    发表于 09-18 15:31

    利用NVIDIA推理模型构建AI智能体

    开放式推理模型能够更快、更广泛地进行思考,为客户服务、网络安全、制造、物流和机器人等领域的 AI 智能体生成更明智的结果。
    的头像 发表于 08-13 14:32 1283次阅读
    利用NVIDIA<b class='flag-5'>推理模型</b>构建<b class='flag-5'>AI</b>智能体

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    DeepSeek-R1:强大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的新一代AI模型。其核心优势在于强大的
    发表于 07-16 15:29

    模型推理显存和计算量估计方法研究

    随着人工智能技术的飞速发展,深度学习大模型在各个领域得到了广泛应用。然而,大模型推理过程对显存和计算资源的需求较高,给实际应用带来了挑战。为了解决这一问题,本文将探讨大模型
    发表于 07-03 19:43

    基于RAKsmart云服务器的AI模型实时推理方案设计

    面对高并发请求、严格的响应延迟要求及波动的业务负载,传统本地化部署的算力瓶颈愈发显著。RAKsmart云服务器凭借其弹性计算资源池、分布式网络架构与全栈AI加速能力,为AI模型实时
    的头像 发表于 05-13 10:33 463次阅读

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    应用开发不用“等平台”,彻底释放开发效率和模型接入自由度。 自DeepSeek横空出世以来,这种更适合端侧部署,回答效率更高效的训练模式快速引爆了AI行业,主流大模型纷纷加强了推理
    发表于 04-13 19:52

    谷歌第七代TPU Ironwood深度解读:AI推理时代的硬件革命

    谷歌第七代TPU Ironwood深度解读:AI推理时代的硬件革命 Google 发布了 Ironwood,这是其第七代张量处理单元 (TPU),专为推理而设计。这款功能强大的 AI
    的头像 发表于 04-12 11:10 2884次阅读
    谷歌第七代TPU Ironwood深度解读:<b class='flag-5'>AI</b><b class='flag-5'>推理</b>时代的硬件革命

    详解 LLM 推理模型的现状

    2025年,如何提升大型语言模型(LLM)的推理能力成了最热门的话题之一,大量优化推理能力的新策略开始出现,包括扩展
    的头像 发表于 04-03 12:09 1237次阅读
    详解 LLM <b class='flag-5'>推理模型</b>的现状

    AI模型在汽车应用中的推理、降本与可解释性研究

    佐思汽研发布《2024-2025年AI模型及其在汽车领域的应用研究报告》。 推理能力成为大模型性能提升的驱动引擎 2024下半年以来,国内
    的头像 发表于 02-18 15:02 1819次阅读
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>在汽车应用中的<b class='flag-5'>推理</b>、降本与可解释性研究

    Qwen大模型助力开发低成本AI推理方案

    阿里巴巴的开源Qwen2.5模型近期在AI领域引发了广泛关注。这一大模型的推出,为斯坦福大学与伯克利大学的研究人员提供了强大的技术支持,使他们能够成功开发出低成本的AI
    的头像 发表于 02-12 09:19 978次阅读

    OpenAI即将推出o3 mini推理AI模型

    近日,OpenAI首席执行官Sam Altman在社交媒体平台X上发表了一篇引人关注的文章。在文章中,他透露了一个重要信息:OpenAI已经成功完成了全新推理AI模型o3 mini版本的研发工作,并
    的头像 发表于 01-20 10:54 780次阅读

    新品| LLM630 Compute Kit,AI 大语言模型推理开发平台

    处理器,集成了3.2TOPs@INT8算力的高能效NPU,提供强大的AI推理能力,能够高效执行复杂的视觉(CV)及大语言模型(LLM)任务,满足各类智能应用场景的需求
    的头像 发表于 01-17 18:48 1192次阅读
    新品| LLM630 Compute Kit,<b class='flag-5'>AI</b> 大语言<b class='flag-5'>模型</b><b class='flag-5'>推理</b>开发平台

    智谱推出深度推理模型GLM-Zero预览版

    近日,智谱公司正式发布了其深度推理模型GLM-Zero的预览版——GLM-Zero-Preview。这款模型标志着智谱在扩展强化学习技术训练推理模型方面的重大突破,成为其首个专注于增强AI
    的头像 发表于 01-03 10:42 762次阅读

    智谱GLM-Zero深度推理模型预览版正式上线

    。 GLM-Zero-Preview专注于提升AI推理能力,擅长处理数理逻辑、代码以及需要深度推理的复杂问题。据官方介绍,与同基座模型相比
    的头像 发表于 01-02 10:55 796次阅读