0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达已首次实现SDF实时渲染 速度提升2-3个数量级

工程师邓生 来源:雷锋网 作者:贝爽 2021-02-01 09:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

“实时渲染”主要应用于游戏领域,它能够将图形数据实时转化为极具真实感的 3D 画面,是决定游戏体验的关键因素之一。

对于实时渲染而言,最大的挑战即是渲染速度。通常来讲,渲染一屏幕的游戏场景的图像,至少要在 1/24 秒以内,才不至于有 “翻 PPT”的感觉。

近日,英伟达发表一项最新研究成果将实时渲染速度提升了 2-3 个数量级。

而在渲染质量上,它也能够更好地处理复杂样式、比例的图形数据,甚至实时同步环境光照可能形成的阴影。

Facebook 与 MIT研究团队在 2019 年推出的 DeepSDF,是现有相关研究的最佳 3D 重建模型。

与之相比,无论是在渲染速度,还是质量方面,英伟达的最新研究还要更胜一筹。

橙色代表 DeepSDF 渲染效果

这项最新研究是一篇名为《神经几何细节水平:隐式 3D 形状的实时渲染》的论文,它是英伟达联合多伦多大学、麦吉尔大学研究人员共同发表的研究成果,目前已提交至预印论文库 arXiv。

论文中,研究人员表示,他们通过引入了一种高效的神经网络表示方法,首次实现了基于 SDF 的 3D 高保真实时渲染,同时达到了最先进的几何重建质量。更重要的是,与其他研究相比,它在渲染速度上提升了 2-3 个数量级。

SVO 编码,渲染速度翻倍

SDF,即符号距离函数 Signed Distance Function,是计算机图形学中一种有效的表示方法。

在现有研究中,通常是采用一个较大、具有固定尺寸的多层感知器(MLP)对 SDF 进行编码,以近似代表具有隐式曲面的复杂图形。然而,使用大型网络进行实时渲染导致了昂贵的计算成本,因为它需要让每个像素通过网络地进行向前传递。

基于此,研究团队提出了改用稀疏体素八叉树(SVO)来对几何形状进行编码的方法,它可以自适应地缩放不同的离散细节层次 LOD( Level of Detail ),并重建高度细节的几何结构。

如图,该方法在不同尺寸的几何体之间平滑地插值,并占用合理内存进行实时渲染。

研究人员介绍,与现有研究一样,他们同样使用了一个小型 MLP 来实现球体跟踪。并且受到经典曲面提取机制的启发,使用了存储距离值的正交和空间数据结构对欧几里德空间进行精细离散化,以使简单的线性基函数可以重建几何体。

在这些工作中,分辨率或树深度决定了 LOD(不同的 LOD 可以与 SDF 插值进行混合)。对此,研究人员使用了稀疏体素八叉树(SVO)来离散空间,并存储学习的特征向量,而不是符号距离值。

20450G5M-14.jpg

这样做的好处是,它允许向量可以通过浅层 MLP 解码成标量距离,在继承经典方法(如 LOD)优点的同时,能够进一步缩短树深度。

20450I926-16.jpg

在此基础上,研究人员还开发了一种针对该体系结构的光线遍历算法( Rray Traversal Algorithm),实现了比 DeepSDF 快 100 倍的渲染速度。另外,虽然无法与神经体积绘制方法进行直接比较,但在类似的实验环境中,其帧速度也要比 NeRF 快 500 倍,比 NSVF 快 50 倍。

实验测试,渲染质量更精细

在质量上,研究人员将该方法与 DeepSDF、FFN、SIREN 以及 Neural Implicits(NI)四种算法进行了比较,它们在过度拟合 3D 几何形状方面均达到了现有研究的最佳性能。

以下为不同算法在 ShapeNet、Thingi10K 和 TurboSquid 三个数据集上进行 3D 重建的比较结果。

20450L1V-18.jpg

可以看到,从 LOD3 开始该方法表现出了更好的性能。在第三个 LOD 中,不仅存储参数最小,而且推理参数在所有分辨率上都固定为 4737 个浮点值,与 FFN 相比减少了 99%,与 Neural Implicits 相比减少了 37%。

更重要的是,在低存储和推理参数的情况下,该方法表现出了更好的重建质量。如下图:

20450K139-20.jpg

与 NI、FFN 相比,该方法能够更加精准地渲染出图像的细节,而且速度比 FFN 快 50 倍。

另外,在渲染质量上,研究人员还将该方法在 Shadertoy 的两个特殊案例中进行了测试:Oldcar,它包含了一个高度非度量的有符号距离场;Mandelbulb,是一个只能用隐式曲面表示的递归分形结构。

这两种 SDF 都是由数学表达式定义的,他们从中提取并采样距离值,测试结果如下:

20450I608-22.jpg

相比之下,只有该方法的架构才能准确地捕捉复杂示例的高频细节。可以看出,FFN 和 SIREN 呈现的效果非常不理想,其原因可能是因为它们都只能拟合平滑距离场,无法处理不连续性和递归结构,以至于在渲染时很难突出显示几何细节。

总之,通过引入隐式 3D 图形的表示形式 LOD,该方法可以达到最先进的几何重建质量,同时允许更小占用内存下的实时渲染。不过,研究人员也坦言,该方法在大场景、或者非常薄、无体积的的物体上并不适用,这将是未来的一个研究方向。

但从当下来看,该方法代表了基于神经隐函数几何学的一个重大进步,因为它是第一个基于 SDF 实现实时渲染和呈现的表示形式,未来有望应用到场景重建、机器人路径规划、交互式内容创建等多个现实场景中。

相关作者

论文的一作是来自多伦多大学的计算机博士 Towaki Takikawa。他曾在的英伟达的超大规模图形处理研究(Hyperscale Graphics Research)小组工作。

主要研究方向集中在计算机视觉和计算机图形学,对探索机器学习驱动 3D 几何处理算法非常感兴趣。另外在机器人相关项目的软硬件方面也有一定的经验。

另外参与本次研究的还有 Joey Litalien、Kangxue Yin、Karsten Kreis1、Charles Loop、Derek Nowrouzezahrai、Alec Jacobson、Morgan McGuire、Sanja Fidler 等八位学者。

其中 Kangxue Yin 是一位华人学者,他曾在中国科学院深圳先进技术研究院(SIAT)工作 3 年,之后考入西蒙弗雷泽大学(Simon Fraser University)大学并取得了博士学位。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    3039

    浏览量

    115989
  • 渲染
    +关注

    关注

    0

    文章

    80

    浏览量

    11419
  • 英伟达
    +关注

    关注

    23

    文章

    4142

    浏览量

    99856
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    台积电晶圆厂采用英伟CUDA-X 光刻环节效率提升

    之一。计算光刻、晶体管模拟、工艺控制以及晶圆检测等关键环节,均需要海量级的仿真计算与实时优化能力。传统计算架构在支撑先进制程发展方面逐渐力不从心。 作为英伟
    的头像 发表于 06-03 11:46 340次阅读

    英伟Spectrum-X硅光技术全面量产

    2026年6月,英伟正式宣布NVIDIA Spectrum-X以太网硅光技术全面量产。新一代Spectrum-X交换机基于光电一体封装技术(CPO)构建,专为NVIDIA Vera Rubin
    的头像 发表于 06-03 09:34 212次阅读

    行业洞察篇__财务数字孪生的渲染选择:端渲染与流渲染的协同演进逻辑

    从来不是让领导看炫酷的3D动画,而是支持实时的“如果……会怎样”推演。比如修改一子公司的预算,立刻看到对集团现金流的影响。这种场景下,渲染
    发表于 05-22 11:02

    英伟市值突破5.5万亿美元

    近日,英伟(NVIDIA)股价在美股早盘后大涨约3%,总市值盘中首次突破5.5万亿美元,刷新全球上市公司市值历史最高纪录,成为人类商业史上首家站上这一里程碑的企业。
    的头像 发表于 05-15 10:31 855次阅读

    行业洞察篇__数字孪生IOC的“双引擎”时代:当端渲染遇见流渲染

    能够根据当前任务的类型、终端设备的硬件性能、甚至实时的网络条件,动态地选择最合适的渲染方式。你可以想象这样一场景:一安保人员在园区巡逻时,他手里的平板主要依靠端
    发表于 05-14 09:50

    英伟 Q3 狂揽 308 亿

    厂商季度合计 500 亿美元资本支出中,约 30% 流向了英伟。 新一代 Blackwell 芯片全面投产,Q3 交付 1.3 万 G
    的头像 发表于 11-20 18:11 1467次阅读

    看不见的精准感知:MEMS加速度计精度如何为尖端装备突破极限?

    当卫星天线在轨进行高精度的姿态调整,当飞机在复杂空域自主规避障碍,当医疗设备实现高精准的手术定位——这些尖端装备的背后,都离不开一共同的核心技术:MEMS加速度计的超高精度测量。在这个追求极致精度的领域里,精度每
    的头像 发表于 11-18 14:47 1349次阅读
    看不见的精准感知:MEMS加<b class='flag-5'>速度</b>计精度如何为尖端装备突破极限?

    NVIDIA新闻:英伟10亿美元入股诺基亚 英伟推出全新量子设备

    研发并推出相关产品。 英伟CEO黄仁勋出现在美国华盛顿的GTC DC大会上的演讲中表示;“今天我们宣布与诺基亚建立了合作关系,诺基亚是世界第二大电信制造商,这是一价值3万亿美元的产
    的头像 发表于 10-29 17:12 2611次阅读

    英伟力挺SOCAMM2,国产存储厂商紧密跟进

    电子发烧友网综合报道,据韩媒报道,英伟取消其第一代 SOCAMM内存模块的推广,并将开发重点转向名为SOCAMM2的新版本。   不久前,英伟
    发表于 09-21 02:32 2204次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b>力挺SOCAMM<b class='flag-5'>2</b>,国产存储厂商紧密跟进

    英伟下一代Rubin芯片流片

    为进入市场做准备,Rubin架构将会有6芯片,这些芯片都已经流片。这一消息在半导体和人工智能领域引起了广泛关注,预示着英伟在芯片技术上的又一次重大飞跃。 ​ Rubin芯片采用先进的台积电
    的头像 发表于 09-12 17:15 2144次阅读

    英伟自研HBM基础裸片

    电子发烧友网综合报道,据台媒消息,传闻英伟开始开发自己的HBM基础裸片,预计英伟的自研HBM基础裸片采用
    的头像 发表于 08-21 08:16 3137次阅读

    谷歌DeepMind重磅发布Genie 3首次实现世界模型实时交互

    电子发烧友网综合报道 当地时间2025年8月5日,谷歌DeepMind正式推出第三代通用世界模型Genie3。这款被英伟科学家Jim Fan誉为“游戏引擎2.0”的模型,通过单文本提示即可生成
    的头像 发表于 08-13 08:27 7311次阅读

    百亿赛道爆发!气凝胶:双碳下的“隔热王者”,谁将主导未来?(附核心企业全梳理)

    双碳目标下,这个“隔热王者”凭借导热系数低2-3个数量级、厚度减半、寿命翻倍的颠覆性优势,加速替代传统材料。新能源车电池安全刚需+建筑节能千亿市场,驱动渗透率飙升!宁德时代、比亚迪供应链布局现,2025年市场规模剑指百亿(开源
    的头像 发表于 08-08 07:29 5326次阅读
    百亿赛道爆发!气凝胶:双碳下的“隔热王者”,谁将主导未来?(附核心企业全梳理)

    摆脱依赖英伟!OpenAI首次转向使用谷歌芯片

    电子发烧友网报道(文/李弯弯)近日,据知情人士透露,OpenAI近期开始租用谷歌的张量处理单元(TPU),为旗下ChatGPT等热门产品提供算力支持。这一举措不仅标志着OpenAI首次实质性
    的头像 发表于 07-02 00:59 8686次阅读