0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达再出AI黑科技,通过生成模型渲染3D环境

张康康 2018-12-21 14:17 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,在蒙特利尔举行的神经信息处理系统大会(NeurIPS)上,英伟达在一篇题为“视频到视频合成(“Video-to-Video Synthesis” )”的技术论文中阐述了其最新AI成果。


据透露,英伟达最新研发的这项成果,是可以渲染合成交互式3D环境的AI技术。在创建逼真的3D环境时,英伟达研发团队不再使用传统的图形技术,而是使用神经网络 ,特别是“生成模型”,通过来自如YouTube等来源的真实视频,进行模型训练,最终构建逼真的3D虚拟世界。

英伟达研发团队之所以使用“生成模型”来提高输出的准确性,是由于这种模型要求机器必须有效地内化数据的本质,它也因此被广泛认为是促进机器“理解”大量数据之间关系的最有前途的方法之一。


但是,像所有神经网络一样,使用这个模型也需要训练数据。幸运的是,英伟达研发团队将AI模型应用于街景,通过自动驾驶项目采集到的大量视频数据,确保了其关于城市街道上行驶车辆的训练镜头,再以分段网络识别不同的对象类别,如地面,树木,汽车,天空,建筑物等,开发算法以了解每个对象与其他对象的关系,最终,这些模型创建了城市环境的基本拓扑结构,然后AI再从基于从训练数据中学到的东西,模拟世界外观,包括照明,材料和动态等,由此生成几乎是还原性的高逼真3D环境。


“由于场景是完全合成生成的,因此可以轻松编辑以删除,修改或添加对象”英伟达表示。

在论文中,英伟达研发团队得出的结论是:“我们提出了一种基于条件生成对抗网络(GAN)的通用视频到视频合成框架:通过精心设计的发生器、鉴别器网络以及时空对抗物镜,我们可以合成高分辨率、照片级真实、时间一致的视频,大量实验表明,我们的结果明显优于最先进方法的结果。”

不得不承认,迄今为止,AI已经是人类最强有力的创新“加速器”,它让人类的能力得以延展,并逐渐变得更加强大。我们都能看到,在全世界范围内,数以万计的科学家们都在为AI技术的前沿突破做出努力,除了英伟达之外,不论是像Google、Facebook这样的海外巨头,还是类似国内旷视科技、极链科技这样的AI科技公司,都致力于全力研发产出能像人一样思考的AI技术。今天,旷视科技已经实现AI识别人脸对象中的各种特征,极链科技已经实现AI理解海量视频的场景表达,而未来,AI必然不仅是会让机器“知其然”,还要做到让它“知其所以然”,以最终实现推动整个AI进入“深度智能”的伟大愿景。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    90

    文章

    38209

    浏览量

    297064
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    技术资讯 I 图文详解 Allegro X PCB Designer 中的 3D 模型映射

    本文要点面对市面上的一切要将PCB板放进一个盒子里的产品的设计都离不开3D模型映射这个功能,3D协同设计保证了产品的超薄化、高集成度的生命线;3D
    的头像 发表于 10-17 16:16 670次阅读
    技术资讯 I 图文详解 Allegro X PCB Designer 中的 <b class='flag-5'>3D</b> <b class='flag-5'>模型</b>映射

    玩转 KiCad 3D模型的使用

    “  本文将带您学习如何将 3D 模型与封装关联、文件嵌入,讲解 3D 查看器中的光线追踪,以及如何使用 CLI 生成 PCBA 的 3D
    的头像 发表于 09-16 19:21 1.1w次阅读
    玩转 KiCad <b class='flag-5'>3D</b><b class='flag-5'>模型</b>的使用

    索尼与VAST达成3D业务合作

    近日,索尼空间现实显示屏与VAST旗下的3D模型Tripo AI正式宣布达成业务合作:双方将围绕裸眼3D显示技术、AI驱动的
    的头像 发表于 08-28 17:32 1041次阅读

    生成AI 重塑自动驾驶仿真:4D 场景生成技术的突破与实践

    生成AI驱动的4D场景技术正解决传统方法效率低、覆盖不足等痛点,如何通过NeRF、3D高斯泼溅等技术实现高保真动态建模?高效
    的头像 发表于 08-06 11:20 4826次阅读
    <b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 重塑自动驾驶仿真:4<b class='flag-5'>D</b> 场景<b class='flag-5'>生成</b>技术的突破与实践

    基于 HT for Web 的轻量化 3D 数字孪生数据中心解决方案

    一、技术架构:HT for Web 的核心能力 图扑软件自主研发的 HT for Web 是基于 HTML5 的 2D/3D 可视化引擎,核心技术特性包括: 跨平台渲染 :采用 WebGL 技术
    的头像 发表于 05-30 14:33 629次阅读
    基于 HT for Web 的轻量化 <b class='flag-5'>3D</b> 数字孪生数据中心解决方案

    NVIDIA助力影眸科技3D生成工具Rodin升级

    在当今数字化与 AI 飞速发展的时代,3D 生成技术正逐渐成为推动各行业创新的关键力量。影眸科技(上海)有限公司专注于 3D 生成领域的探索
    的头像 发表于 04-27 15:09 1019次阅读

    英伟Cosmos-Reason1 模型深度解读

    英伟近期发布的 Cosmos-Reason1 模型在物理常识推理领域引发广泛关注。作为专为物理世界交互设计的多模态大语言模型,它通过融合视
    的头像 发表于 03-29 23:29 2629次阅读

    IBM携手英伟AI数据平台推动企业级AI创新

    近日,IBM(纽约证券交易所:IBM)宣布与英伟(纳斯达克股票代码:NVDA)开展全新合作,双方将基于英伟 AI 数据平台参考架构(re
    发表于 03-24 19:20 418次阅读

    一种以图像为中心的3D感知模型BIP3D

    在具身智能系统中,3D感知算法是一个关键组件,它在端侧帮助可以帮助智能体理解环境信息,在云端可以用来辅助生成3D场景和3D标签,具备重要的研
    的头像 发表于 03-17 13:44 964次阅读
    一种以图像为中心的<b class='flag-5'>3D</b>感知<b class='flag-5'>模型</b>BIP<b class='flag-5'>3D</b>

    使用海尔曼太通/HellermannTyton 3D CAD 模型进行快速高效的设计

    提供 3D 和 2D CAD 数据,可供免费下载。 直接嵌入三维设计环境模型下载功能 在海尔曼太通官网上点击【产品】选项,工程师现在可以查看和下载众多产品的
    发表于 03-14 16:55

    腾讯混元3D AI创作引擎正式发布

    AI技术,能够根据用户提供的提示词或图片,直接生成高质量的3D模型。这一功能极大地降低了3D内容创作的门槛,使得即使是缺乏专业
    的头像 发表于 01-23 10:33 990次阅读

    腾讯混元3D AI创作引擎正式上线

    近日,腾讯公司宣布其自主研发的混元3D AI创作引擎已正式上线。这一创新性的创作工具,标志着腾讯在3D内容生成领域迈出了重要一步。 混元3D
    的头像 发表于 01-22 10:26 979次阅读

    英伟发布Cosmos世界基础模型

    近日,在2025年1月6日于拉斯维加斯拉开帷幕的国际消费类电子产品展览会(CES)上,英伟宣布了一项重大创新——Cosmos世界基础模型平台。该平台集成了先进的生成世界基础
    的头像 发表于 01-09 10:23 946次阅读

    Google两款先进生成AI模型登陆Vertex AI平台

    新的 AI 模型,包括最先进的视频生成模型Veo以及最高品质的图像生成模型Imagen
    的头像 发表于 12-30 09:56 984次阅读

    英伟AI加速器新蓝图:集成硅光子I/O,3D垂直堆叠 DRAM 内存

    加速器设计的愿景。 英伟认为未来整个 AI 加速器复合体将位于大面积先进封装基板之上,采用垂直供电,集成硅光子 I/O 器件,GPU 采用多模块设计,3D 垂直堆叠 DRAM 内存
    的头像 发表于 12-13 11:37 1038次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b><b class='flag-5'>AI</b>加速器新蓝图:集成硅光子I/O,<b class='flag-5'>3D</b>垂直堆叠 DRAM 内存