0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么是AI模型的推理能力

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2025-09-23 15:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA 的数据工厂团队为NVIDIACosmos Reason 等 AI 模型奠定了基础,该模型近日在 Hugging Face 的物理推理模型排行榜中位列榜首。

AI 模型正以惊人的速度与规模不断发展。

但它们缺少了人类与生俱来的哪种能力呢?答案是“常识”。常识是一种通过现实生活经验形成的认知:比如鸟类无法倒着飞、镜子能够反射、冰会融化成水。

对人类而言,这些常识显而易见。但对于需要精准回答复杂问题、在工业仓库或道路等不可预测的物理环境中运行的 AI 模型来说,这些知识必须通过“教学”才能掌握。

为解决这一难题,NVIDIA 正在开发一套测试方案,旨在教会 AI 模型认知物理世界的运行边界。简言之,就是教会 AI 常识。

这些测试被用于开发推理模型,比如NVIDIA Cosmos Reason。这是一款用于物理 AI 应用的开源视觉语言推理模型(VLM),能够生成具有时间关联性的响应。目前,Cosmos Reason 已在 Hugging Face 的物理推理模型排行榜中位居第一。

相较于传统视觉语言模型,NVIDIACosmos Reason 的独特价值在于:它专为加速机器人自动驾驶汽车及智能空间等物理 AI 的开发而设计,能够基于物理常识知识,对之前没有经历过的场景进行推理。

要让 AI 模型真正理解工业空间、实验室等复杂环境,需从基础认知开始构建。例如,在下方展示的测试中,NVIDIACosmos Reason 需要回答关于视频中和相对运动有关的选择题。

NVIDIACosmos Reason 评估数据集的示例

什么是 AI 模型的推理能力?

为提升模型的推理能力,NVIDIA 采用‌强化学习‌的方式,让模型学习关于现实世界的物理常识。

举例说明,机器人无法凭直觉分辨左、右、上、下,它们需要通过训练才能理解这些时空概念;用于安全测试,比如汽车碰撞测试的 AI 驱动机器人,也必须经过训练才能理解自身物理形态如何与周围环境互动。

如果在训练过程中没有教会机器人常识,在实际部署时就可能出现问题。

NVIDIA Cosmos Reason 研究科学家 Yin Cui 表示:“如果缺乏对物理世界的基础认知,机器人可能跌倒,或者导致意外损毁物品,进而对人员及环境的安全构成威胁。”

NVIDIA 正通过将人类对物理世界的常识“注入”AI 模型,推动下一代 AI 的发展。

NVIDIA 数据工厂团队由来自生物工程、商业和语言学等多元背景的全球分析师构成,他们致力于开发、分析并整合数十万条数据单元,为生成式 AI 的推理训练提供核心数据支撑。

数据整理流程

NVIDIA 数据工厂团队的核心项目之一,是开发面向物理 AI 应用的世界基础模型。这些虚拟环境能构建深度学习神经网络,基于仿真场景为推理模型训练提供更安全、更高效的支持。

NVIDIA 数据标注团队率先启动流程,他们基于真实世界视频数据设计问答对。视频内容涵盖各类场景,从鸡在鸡舍中活动,到汽车在乡间道路行驶。

例如,某个标注员可能会针对下面的视频提出问题:“画面中的人是用哪只手切意大利面?”

NVIDIACosmos Reason 评估数据集的示例

随后,标注员会给出 A、B、C、D 四个选项。模型获取这些数据后,进行推理并选择正确答案。

Yin Cui 表示:“我们本质上是在给模型设计测试题。所有问题都采用选择题形式,就像学生在学校考试中遇到的题目一样。”

这些问答对随后由 Michelle Li 等 NVIDIA 的分析师进行质量检查。

Li 拥有公共卫生和数据分析学背景,这让她能够从更宏观的角度看待所分析的数据。

她说:“对于物理 AI ,我们的特定目标是训练模型理解物理世界,这一目标让我在审核问答对和问题类型时,始终保持全局视角。我会问自己,这些问答对是否符合项目的目标和准则要求?”

之后,数据会由项目的数据工厂负责人审核,确保其符合质量标准并可交付至NVIDIACosmos Reason 研究团队。科学家们随后将数十万条数据单元(即问答对)输入模型,通过强化学习训练其理解物理世界的边界和限制。

推理型 AI 有哪些应用场景?

推理模型的优势在于,它们既能理解自身所处的时空环境,也能预测结果。这类模型可分析情境,生成可能结果的逻辑思维网络,并推断出最可能的场景。

简而言之,推理式 AI 展现了类似人类的思维。它会展示思考过程,让用户能够理解其响应背后的逻辑。

用户可要求模型分析视频内容,如两辆车在路上行驶的场景。当被问到“如果这两辆车在同一车道上相向而行会发生什么?”时,模型能够推理并判定该假设情景的最可能结果,比如两车相撞。

NVIDIA Cosmos Reason 团队首席研究科学家 Tsung-Yi Lin 表示:“我们正在开发一种以物理 AI 为核心的突破性推理模型。“

随着 NVIDIA 持续推进推理模型创新,数据工厂团队的高质量数据生产能力,将对开发能安全与现实世界交互的自主的智能体以及物理 AI 系统起到关键作用。

您可以在 Hugging Face 和 GitHub 预览或下载 NVIDIA Cosmos-Reason1 模型。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5696

    浏览量

    110120
  • AI
    AI
    +关注

    关注

    91

    文章

    41172

    浏览量

    302624
  • 模型
    +关注

    关注

    1

    文章

    3822

    浏览量

    52276

原文标题:人类如何教会 AI 模型学会推理?

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为破解HBM依赖!AI推理黑科技UCM上线,9月正式开源

    8月12日,在2025金融AI推理应用落地与发展论坛上,华为公司副总裁、数据存储产品线总裁周越峰宣布,华为此次和银联联合创新,推出AI推理创新技术UCM(
    的头像 发表于 08-13 08:58 1.1w次阅读
    华为破解HBM依赖!<b class='flag-5'>AI</b><b class='flag-5'>推理</b>黑科技UCM上线,9月正式开源

    模型 ai coding 比较

    序 我主要用途是 ai coding,从各种渠道获取到了很多 不同的大模型排序 最多的是 opus 4.6 > k2.5 > glm5 >
    发表于 02-19 13:43

    AI端侧部署开发(SC171开发套件V2-FAS)

    模型推理指南 17分03秒 https://t.elecfans.com/v/28540.html *附件:文档:Fibo AI Stack模型推理
    发表于 02-11 11:44

    AI推理芯片需求爆发,OpenAI欲寻求新合作伙伴

    领域占据主导,其GPU凭借强大的海量数据处理能力,成为全球AI爆炸式增长的重要基石。但随着AI不断演进,重点正从大规模训练转向对已训练模型推理
    的头像 发表于 02-03 17:15 3263次阅读

    使用NORDIC AI的好处

    ; 自定义 Neuton 模型博客] Axon NPU :集成在 nRF54LM20B 等高端 SoC 中的专用 AI 加速器,对 TensorFlow Lite 模型可实现最高约 15×
    发表于 01-31 23:16

    LLM推理模型是如何推理的?

    过程与核心见解拆解。一、核心论点与总览LRM(如o1,R1)的“推理能力提升,并非源于模型学会了人类式的逻辑推理,而是通过两类主要技术手段,优化了生成过程,使其
    的头像 发表于 01-19 15:33 708次阅读
    LLM<b class='flag-5'>推理模型</b>是如何<b class='flag-5'>推理</b>的?

    AI端侧部署开发(SC171开发套件V3)2026版

    Stack模型推理指南 11分55秒 https://t.elecfans.com/v/28526.html *附件:文档:Fibo AI Stack模型
    发表于 01-15 10:31

    华为数据存储与「DaoCloud 道客」发布AI推理加速联合解决方案

    AI产业已从“追求模型能力极限”转向“追求推理体验最优化”,推理体验决定用户与AI的交互质感。当
    的头像 发表于 11-28 10:03 484次阅读
    华为数据存储与「DaoCloud 道客」发布<b class='flag-5'>AI</b><b class='flag-5'>推理</b>加速联合解决方案

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    和探索;人类级别的理解能力;常识推理;现实世界的知识整合。 3、测试时计算 测试时计算(TTC)是指在模型推理阶段利用额外的计算资源来提升泛化性能。 4、具身智能与渗透式
    发表于 09-18 15:31

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    主要步骤: ①溯因②假说③实验 1、科学推理的类型 ①演绎②归纳 2、自动化科学发现框架 AI-笛卡儿-----自动化科学发现框架,利用数据和知识来生成和评估候选的科学假说。 4项规则:三、直觉
    发表于 09-17 11:45

    利用NVIDIA推理模型构建AI智能体

    开放式推理模型能够更快、更广泛地进行思考,为客户服务、网络安全、制造、物流和机器人等领域的 AI 智能体生成更明智的结果。
    的头像 发表于 08-13 14:32 1769次阅读
    利用NVIDIA<b class='flag-5'>推理模型</b>构建<b class='flag-5'>AI</b>智能体

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    DeepSeek-R1:强大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的新一代AI模型。其核心优势在于强大的
    发表于 07-16 15:29

    模型推理显存和计算量估计方法研究

    随着人工智能技术的飞速发展,深度学习大模型在各个领域得到了广泛应用。然而,大模型推理过程对显存和计算资源的需求较高,给实际应用带来了挑战。为了解决这一问题,本文将探讨大模型
    发表于 07-03 19:43

    基于RAKsmart云服务器的AI模型实时推理方案设计

    面对高并发请求、严格的响应延迟要求及波动的业务负载,传统本地化部署的算力瓶颈愈发显著。RAKsmart云服务器凭借其弹性计算资源池、分布式网络架构与全栈AI加速能力,为AI模型实时
    的头像 发表于 05-13 10:33 723次阅读