0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Knight Rider采用GAN模型:AI和NVIDIA Omniverse为KITT带来活力

西西 来源:厂商供稿 作者:NVIDIA 2021-04-23 14:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA 研究院的最新模型基于 GAN,将 2D 图像转化为3D,面向游戏开发者、艺术家、设计师和建筑师

NVIDIA 研究院 正在研发一种全新深度学习引擎,该引擎可以根据标准的 2D 图像来创建 3D模型,并可以在 NVIDIA Omniverse 中,为诸如由Knight Rider 的 AI 驱动的 KITT 等标志性汽车带来活力。

由多伦多的 NVIDIA AI 研究实验室开发的 GANverse3D 应用将平面图像放大成逼真的 3D 模型,可以在虚拟环境中可视化和控制。这种性能可以帮助建筑师、创作者、游戏开发人员和设计师轻松地将新对象添加到他们的实体模型中,而不需要 3D 建模方面的专业知识,也不需要在渲染上花费大量预算。

例如,单张汽车照片可以转换为3D模型,该模型可以在虚拟场景中行驶,并配有逼真的前灯、尾灯和转向灯。

为了生成训练数据集,研究人员利用生成性对抗网络 ——GAN合成图像,从多个角度描绘同一物体 — 就像摄影师绕着一辆停着的汽车走动,从不同的角度拍摄。这些多视图图像被插入到逆图形的渲染框架中,逆图形是从 2D 图像推断 3D 网格模型的过程。

一旦完成了多视图图像训练,GANverse3D 只需要一个 2D 图像即可预测 3D 网格模型。该模型可以与 3D 神经渲染器一起使用,使开发人员能够自定义对象和交换背景。

当作为 NVIDIA Omniverse 平台的扩展导入并在 NVIDIA RTX GPU 上运行时,GANverse3D 可将任何 2D 图像重建为 3D,就像流行的 20 世纪 80 年代 Knight Rider 电视节目中备受喜爱的打击犯罪的汽车 KITT 一样。

以前的逆图形模型依赖于 3D 图形作为训练数据。

相反,在没有 3D 要素的帮助下,“我们把 GAN 模型变成了一个非常高效的数据生成器,这样我们就可以基于网络上的任何 2D 图像创建出 3D 对象。”NVIDIA 的研究科学家、该项目的主要作者 Wenzheng Chen 说。

“因为我们是根据真实图像而不是合成数据进行训练的,所以 AI 模型能更好地推广到现实世界的应用中。”该项目的作者、NVIDIA 研究员 Jun Gao 表示。

GANverse3D 背后的研究将在两个即将召开的会议上发表:5 月份的ICLR和 6 月份的CVPR。

从爆胎到赛车 KITT

游戏、架构和设计领域的创作者依赖于虚拟环境,例如 NVIDIA Omniverse 模拟和协作平台,在创建最终产品之前测试新的想法并可视化原型。借助 Omniverse Connectors,开发人员可以在 Omniverse 中使用他们首选的 3D 应用程序,通过实时光线跟踪来模拟复杂的虚拟世界。

但并不是每个创作者都有时间和资源为他们所绘制的每一个对象创建 3D 模型。若要渲染展厅的汽车,或一条街的建筑,需捕获所需数量的多视图图像,成本可能高得令人望而却步。

在这方面,训练好的 GANverse3D 应用可以用来将汽车、建筑甚至一匹马的标准图像转换成可以在 Omniverse 中自定义和制作动画的 3D 图形。

为了重建 KITT,研究人员只需给训练好的模型输入汽车的图像,让 GANverse3D 预测相应的 3D 纹理网格,以及车辆的不同部分,例如车轮和前照灯。然后,他们使用 NVIDIA Omniverse 套件和 NVIDIA PhysX 工具将预测的纹理转换成高质量的材料,使 KITT 具有更真实的外观和感觉,并将其与其他汽车一起放置在动态驾驶序列中。

“Omniverse 让研究人员能够将激动人心的前沿研究直接带给创作者和最终用户。”NVIDIA 深度学习工程师 Jean-Francois Lafleche 说道。“作为 Omniverse 的扩展,GANverse3D 将帮助艺术家为游戏开发、城市规划甚至训练新的机器学习模型创建更丰富的虚拟世界。”

GAN 推动维度转变

因为从不同角度捕捉同一物体的真实数据集很少,所以大多数将图像从 2D 转换为 3D 的 AI 工具都是使用像 ShapeNet 这样的合成 3D 数据集进行训练的。

为了从现实世界的数据中获得多视图图像,例如网上公开的汽车图像,NVIDIA 研究人员转而使用GAN 模型,修改其神经网络层,将其转化为数据生成器。

该团队发现,仅训练神经网络的前4层,冻结剩余的 12 层参数,可以让 GAN 从不同的角度渲染同一对象的图像。

保持前4层参数冻结,其他 12 层可变,可以让神经网络基于同一角度生成不同的图像。通过手动分配标准角度,在特定高度和距离拍摄车辆照片,研究人员可以从单个 2D 图像快速生成多视图数据集。

最终的模型,在 55000 张由 GAN 生成的汽车图像上训练而得,优于在流行的 Pascal3D 数据集上训练的逆图形网络。

请阅读由 Wenzheng Chen、NVIDIA 研究员 Jun Gao 和 Huan Ling、NVIDIA 多伦多研究室主任Sanja Fidler、滑铁卢大学学生 Yuxuan Zhang、斯坦福大学学生 Yinan Zhang 和 MIT 教授 Antonio Torralba 撰写的 ICLR 论文全文。CVPR 论文的其他合作者包括 Jean-Francois Lafleche、NVIDIA 研究员 Kangxue Yin 和 Adela Barriuso。

NVIDIA 研究团队在全球拥有超过 200 名科学家,专注于人工智能计算机视觉自动驾驶汽车、机器人和图形等领域。GTC上,NVIDIA 首席执行官黄仁勋发表主题演讲,让大家了解更多关于NVIDIA的最新研究和行业突破。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4846

    浏览量

    108383
  • NVIDIA
    +关注

    关注

    14

    文章

    5727

    浏览量

    110297
  • AI
    AI
    +关注

    关注

    91

    文章

    42023

    浏览量

    303088
  • 3D建模
    +关注

    关注

    0

    文章

    36

    浏览量

    10192
  • 深度学习
    +关注

    关注

    73

    文章

    5614

    浏览量

    124757
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA发布Vera Rubin DSX AI Factory参考设计

    Rubin DSX 的 NVIDIA Omniverse DSX Blueprint,旨在为大规模设计、建设及运营提供物理精确的 AI 工厂数字孪生。
    的头像 发表于 03-18 14:42 728次阅读

    NVIDIA 扩展开放模型系列,推动代理式、物理和医疗 AI 下一阶段发展

    新闻摘要: ●NVIDIA Nemotron 3 全模态理解模型 (Omni-understanding Models) AI 智能体提供动力 ,使其能够实现自然对话、复杂推理和高
    的头像 发表于 03-17 09:18 630次阅读
    <b class='flag-5'>NVIDIA</b> 扩展开放<b class='flag-5'>模型</b>系列,推动代理式、物理和医疗 <b class='flag-5'>AI</b> 下一阶段发展

    NVIDIA Jetson模型赋能AI在边缘端落地

    开源生成式 AI 模型不再局限于数据中心,而是开始深入到现实世界的各种机器中。从 Orin 到 Thor,NVIDIA Jetson 系列正在成为运行 NVIDIA Nemotron、
    的头像 发表于 03-16 16:27 792次阅读
    <b class='flag-5'>NVIDIA</b> Jetson<b class='flag-5'>模型</b>赋能<b class='flag-5'>AI</b>在边缘端落地

    NVIDIA推出代理式AI蓝图与电信推理模型

    借助全新开源大型电信模型NVIDIA Blueprint,电信运营商能够利用自有数据训练 AI 智能体,构建自主网络。
    的头像 发表于 03-06 17:37 3164次阅读

    NVIDIA全新开放物理AI模型和框架加速人形机器人开发

    本文是洞悉 Omniverse 系列文章。“洞悉 Omniverse”重点介绍开发者、3D 从业者与企业如何使用 OpenUSD 和 NVIDIA Omniverse 的最新进展从根
    的头像 发表于 02-06 15:36 902次阅读

    使用OpenUSD与NVIDIA Halos构建安全物理AI系统

    如何使用 OpenUSD 和 NVIDIA Omniverse 的最新进展深入改变他们的工作流。 物理 AI 正从研究实验室走向现实世界,智能机器人和智能汽车 (如无人驾驶出租车)
    的头像 发表于 12-24 10:22 1099次阅读

    NVIDIA Omniverse基于Container的部署推流方案

    为了让客户能够高效安装和部署 NVIDIA OmniverseNVIDIA Isaac 平台,NVIDIA 现已推出简单便捷的容器化部署方案,以支持在数据中心的服务器中实现流式仿
    的头像 发表于 12-17 10:17 1076次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Omniverse</b>基于Container的部署推流方案

    NVIDIA推动面向数字与物理AI的开源模型发展

    NVIDIA 发布一系列涵盖语音、安全与辅助驾驶领域的全新 AI 工具,其中包括面向移动出行领域的行业级开源视觉-语言-动作推理模型(Reasoning VLA) NVIDIA DRI
    的头像 发表于 12-13 09:50 1664次阅读

    利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

    NVIDIA 最近发布了 NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI 模型的测试与验证数据生成。借助
    的头像 发表于 12-01 09:25 1627次阅读

    NVIDIA推出Omniverse DSX Blueprint

    在华盛顿特区 NVIDIA GTC 大会的主题演讲中,NVIDIA 创始人兼首席执行官黄仁勋介绍了 NVIDIA Omniverse DSX,这是一个全面、开放的蓝图,用于设计和运营吉
    的头像 发表于 11-03 15:08 1211次阅读

    什么是AI模型的推理能力

    NVIDIA 的数据工厂团队 NVIDIA Cosmos Reason 等 AI 模型奠定了基础,该
    的头像 发表于 09-23 15:19 1618次阅读

    NVIDIA Omniverse Extension开发秘籍

    NVIDIA Omniverse 是一个模块化平台,使用高级 API 和微服务来构建由 OpenUSD 和 NVIDIA RTX 提供支持的 3D 应用。OpenUSD 功能强大的 3D 框架与
    的头像 发表于 08-22 15:52 3962次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Omniverse</b> Extension开发秘籍

    NVIDIA通过全新 Omniverse库、Cosmos物理AI模型AI计算基础设施,机器人领域开启新篇章

    NVIDIA 通过全新 Omniverse 库、Cosmos 物理 AI 模型AI 计算基础设施,
    的头像 发表于 08-12 11:29 2101次阅读
    <b class='flag-5'>NVIDIA</b>通过全新 <b class='flag-5'>Omniverse</b>库、Cosmos物理<b class='flag-5'>AI</b><b class='flag-5'>模型</b>及<b class='flag-5'>AI</b>计算基础设施,<b class='flag-5'>为</b>机器人领域开启新篇章

    NVIDIA推出全新智慧城市AI Blueprint

    面向智慧城市 AINVIDIA Omniverse Blueprint 集成了 NVIDIA Omniverse、Cosmos、NeM
    的头像 发表于 06-16 14:21 1436次阅读

    使用NVIDIA Earth-2生成式AI基础模型革新气候建模

    NVIDIA 正通过 cBottle(Climate in a Bottle 的简称)这项工作带来新的突破,这是全球首个专为以公里尺度分辨率模拟全球气候而设计的生成式 AI 基础
    的头像 发表于 06-12 15:54 1524次阅读