0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达已首次实现SDF实时渲染 速度提升2-3个数量级

工程师邓生 来源:雷锋网 作者:贝爽 2021-02-01 09:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

“实时渲染”主要应用于游戏领域,它能够将图形数据实时转化为极具真实感的 3D 画面,是决定游戏体验的关键因素之一。

对于实时渲染而言,最大的挑战即是渲染速度。通常来讲,渲染一屏幕的游戏场景的图像,至少要在 1/24 秒以内,才不至于有 “翻 PPT”的感觉。

近日,英伟达发表一项最新研究成果将实时渲染速度提升了 2-3 个数量级。

而在渲染质量上,它也能够更好地处理复杂样式、比例的图形数据,甚至实时同步环境光照可能形成的阴影。

Facebook 与 MIT研究团队在 2019 年推出的 DeepSDF,是现有相关研究的最佳 3D 重建模型。

与之相比,无论是在渲染速度,还是质量方面,英伟达的最新研究还要更胜一筹。

橙色代表 DeepSDF 渲染效果

这项最新研究是一篇名为《神经几何细节水平:隐式 3D 形状的实时渲染》的论文,它是英伟达联合多伦多大学、麦吉尔大学研究人员共同发表的研究成果,目前已提交至预印论文库 arXiv。

论文中,研究人员表示,他们通过引入了一种高效的神经网络表示方法,首次实现了基于 SDF 的 3D 高保真实时渲染,同时达到了最先进的几何重建质量。更重要的是,与其他研究相比,它在渲染速度上提升了 2-3 个数量级。

SVO 编码,渲染速度翻倍

SDF,即符号距离函数 Signed Distance Function,是计算机图形学中一种有效的表示方法。

在现有研究中,通常是采用一个较大、具有固定尺寸的多层感知器(MLP)对 SDF 进行编码,以近似代表具有隐式曲面的复杂图形。然而,使用大型网络进行实时渲染导致了昂贵的计算成本,因为它需要让每个像素通过网络地进行向前传递。

基于此,研究团队提出了改用稀疏体素八叉树(SVO)来对几何形状进行编码的方法,它可以自适应地缩放不同的离散细节层次 LOD( Level of Detail ),并重建高度细节的几何结构。

如图,该方法在不同尺寸的几何体之间平滑地插值,并占用合理内存进行实时渲染。

研究人员介绍,与现有研究一样,他们同样使用了一个小型 MLP 来实现球体跟踪。并且受到经典曲面提取机制的启发,使用了存储距离值的正交和空间数据结构对欧几里德空间进行精细离散化,以使简单的线性基函数可以重建几何体。

在这些工作中,分辨率或树深度决定了 LOD(不同的 LOD 可以与 SDF 插值进行混合)。对此,研究人员使用了稀疏体素八叉树(SVO)来离散空间,并存储学习的特征向量,而不是符号距离值。

20450G5M-14.jpg

这样做的好处是,它允许向量可以通过浅层 MLP 解码成标量距离,在继承经典方法(如 LOD)优点的同时,能够进一步缩短树深度。

20450I926-16.jpg

在此基础上,研究人员还开发了一种针对该体系结构的光线遍历算法( Rray Traversal Algorithm),实现了比 DeepSDF 快 100 倍的渲染速度。另外,虽然无法与神经体积绘制方法进行直接比较,但在类似的实验环境中,其帧速度也要比 NeRF 快 500 倍,比 NSVF 快 50 倍。

实验测试,渲染质量更精细

在质量上,研究人员将该方法与 DeepSDF、FFN、SIREN 以及 Neural Implicits(NI)四种算法进行了比较,它们在过度拟合 3D 几何形状方面均达到了现有研究的最佳性能。

以下为不同算法在 ShapeNet、Thingi10K 和 TurboSquid 三个数据集上进行 3D 重建的比较结果。

20450L1V-18.jpg

可以看到,从 LOD3 开始该方法表现出了更好的性能。在第三个 LOD 中,不仅存储参数最小,而且推理参数在所有分辨率上都固定为 4737 个浮点值,与 FFN 相比减少了 99%,与 Neural Implicits 相比减少了 37%。

更重要的是,在低存储和推理参数的情况下,该方法表现出了更好的重建质量。如下图:

20450K139-20.jpg

与 NI、FFN 相比,该方法能够更加精准地渲染出图像的细节,而且速度比 FFN 快 50 倍。

另外,在渲染质量上,研究人员还将该方法在 Shadertoy 的两个特殊案例中进行了测试:Oldcar,它包含了一个高度非度量的有符号距离场;Mandelbulb,是一个只能用隐式曲面表示的递归分形结构。

这两种 SDF 都是由数学表达式定义的,他们从中提取并采样距离值,测试结果如下:

20450I608-22.jpg

相比之下,只有该方法的架构才能准确地捕捉复杂示例的高频细节。可以看出,FFN 和 SIREN 呈现的效果非常不理想,其原因可能是因为它们都只能拟合平滑距离场,无法处理不连续性和递归结构,以至于在渲染时很难突出显示几何细节。

总之,通过引入隐式 3D 图形的表示形式 LOD,该方法可以达到最先进的几何重建质量,同时允许更小占用内存下的实时渲染。不过,研究人员也坦言,该方法在大场景、或者非常薄、无体积的的物体上并不适用,这将是未来的一个研究方向。

但从当下来看,该方法代表了基于神经隐函数几何学的一个重大进步,因为它是第一个基于 SDF 实现实时渲染和呈现的表示形式,未来有望应用到场景重建、机器人路径规划、交互式内容创建等多个现实场景中。

相关作者

论文的一作是来自多伦多大学的计算机博士 Towaki Takikawa。他曾在的英伟达的超大规模图形处理研究(Hyperscale Graphics Research)小组工作。

主要研究方向集中在计算机视觉和计算机图形学,对探索机器学习驱动 3D 几何处理算法非常感兴趣。另外在机器人相关项目的软硬件方面也有一定的经验。

另外参与本次研究的还有 Joey Litalien、Kangxue Yin、Karsten Kreis1、Charles Loop、Derek Nowrouzezahrai、Alec Jacobson、Morgan McGuire、Sanja Fidler 等八位学者。

其中 Kangxue Yin 是一位华人学者,他曾在中国科学院深圳先进技术研究院(SIAT)工作 3 年,之后考入西蒙弗雷泽大学(Simon Fraser University)大学并取得了博士学位。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    2990

    浏览量

    113808
  • 渲染
    +关注

    关注

    0

    文章

    79

    浏览量

    11348
  • 英伟达
    +关注

    关注

    23

    文章

    4039

    浏览量

    97655
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    英伟 Q3 狂揽 308 亿

    厂商季度合计 500 亿美元资本支出中,约 30% 流向了英伟。 新一代 Blackwell 芯片全面投产,Q3 交付 1.3 万 G
    的头像 发表于 11-20 18:11 1055次阅读

    看不见的精准感知:MEMS加速度计精度如何为尖端装备突破极限?

    当卫星天线在轨进行高精度的姿态调整,当飞机在复杂空域自主规避障碍,当医疗设备实现高精准的手术定位——这些尖端装备的背后,都离不开一共同的核心技术:MEMS加速度计的超高精度测量。在这个追求极致精度的领域里,精度每
    的头像 发表于 11-18 14:47 775次阅读
    看不见的精准感知:MEMS加<b class='flag-5'>速度</b>计精度如何为尖端装备突破极限?

    英伟力挺SOCAMM2,国产存储厂商紧密跟进

    电子发烧友网综合报道,据韩媒报道,英伟取消其第一代 SOCAMM内存模块的推广,并将开发重点转向名为SOCAMM2的新版本。   不久前,英伟
    发表于 09-21 02:32 1608次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b>力挺SOCAMM<b class='flag-5'>2</b>,国产存储厂商紧密跟进

    英伟自研HBM基础裸片

    电子发烧友网综合报道,据台媒消息,传闻英伟开始开发自己的HBM基础裸片,预计英伟的自研HBM基础裸片采用
    的头像 发表于 08-21 08:16 2524次阅读

    谷歌DeepMind重磅发布Genie 3首次实现世界模型实时交互

    电子发烧友网综合报道 当地时间2025年8月5日,谷歌DeepMind正式推出第三代通用世界模型Genie3。这款被英伟科学家Jim Fan誉为“游戏引擎2.0”的模型,通过单文本提示即可生成
    的头像 发表于 08-13 08:27 6516次阅读

    百亿赛道爆发!气凝胶:双碳下的“隔热王者”,谁将主导未来?(附核心企业全梳理)

    双碳目标下,这个“隔热王者”凭借导热系数低2-3个数量级、厚度减半、寿命翻倍的颠覆性优势,加速替代传统材料。新能源车电池安全刚需+建筑节能千亿市场,驱动渗透率飙升!宁德时代、比亚迪供应链布局现,2025年市场规模剑指百亿(开源
    的头像 发表于 08-08 07:29 3251次阅读
    百亿赛道爆发!气凝胶:双碳下的“隔热王者”,谁将主导未来?(附核心企业全梳理)

    摆脱依赖英伟!OpenAI首次转向使用谷歌芯片

    电子发烧友网报道(文/李弯弯)近日,据知情人士透露,OpenAI近期开始租用谷歌的张量处理单元(TPU),为旗下ChatGPT等热门产品提供算力支持。这一举措不仅标志着OpenAI首次实质性
    的头像 发表于 07-02 00:59 7981次阅读

    TPS2813 2A/2A 双通道栅极驱动器,带一反相驱动器、一同相驱动器和内部稳压器数据手册

    TPS28xx 系列双通道高速 MOSFET 驱动器能够向高电容负载提供 2A 的峰值电流。这种性能是通过一种设计实现的,该设计本身就将击穿电流降至最低,并且消耗的电源电流比竞争产品少一个数量级
    的头像 发表于 05-22 14:01 544次阅读
    TPS2813 <b class='flag-5'>2</b>A/<b class='flag-5'>2</b>A 双通道栅极驱动器,带一<b class='flag-5'>个</b>反相驱动器、一<b class='flag-5'>个</b>同相驱动器和内部稳压器数据手册

    TPS2815 2A/2A 双通道栅极驱动器,每个输出具有两 NAND 输入数据手册

    TPS28xx 系列双通道高速 MOSFET 驱动器能够向高电容负载提供 2A 的峰值电流。这种性能是通过一种设计实现的,该设计本身就将击穿电流降至最低,并且消耗的电源电流比竞争产品少一个数量级
    的头像 发表于 05-22 13:51 638次阅读
    TPS2815 <b class='flag-5'>2</b>A/<b class='flag-5'>2</b>A 双通道栅极驱动器,每个输出具有两<b class='flag-5'>个</b> NAND 输入数据手册

    英伟GTC2025亮点:NVIDIA Blackwell加速计算机辅助工程软件,实现实时数字孪生性能数量级提升

    、Altair、Cadence、Siemens 和 Synopsys 等在内的领先计算机辅助工程(CAE)软件供应商正在使用 NVIDIA Blackwell 平台加速其仿真工具,速度提升高达 50 倍
    的头像 发表于 03-21 15:12 1251次阅读

    新思科技携手英伟加速芯片设计,提升芯片电子设计自动化效率

    解决方案在英伟 GPU和英伟 CUDA-X库上所实现的加速 基于英伟
    发表于 03-19 17:59 437次阅读

    新思科技亮相英伟GTC 2025大会

    为了实现这一速度提升,新思科技在GTC全球AI大会上宣布,正在使用英伟 CUDA-X库优化其下一代半导体开发解决方案。公司还在扩大对
    的头像 发表于 03-19 17:53 1125次阅读

    英伟市值一夜蒸发近2万亿 英伟股价下跌超8%

    财年第四财季和全财年业绩数据上看,2025财年第四财季及全年的营收和利润都实现了大幅增长,大家特别关注的数据中心业务也是业绩增长的核心动力,展现出英伟在AI领域的强大实力。而且英伟
    的头像 发表于 03-04 10:19 988次阅读

    英伟带来Reflex 2低延迟技术

    ,Reflex 1 主要通过简化 CPU 渲染队列来降低延迟,而 Reflex 2实现了更直接的信息对接,大大提升了效率。 不过,根据英
    的头像 发表于 02-05 15:15 2101次阅读

    英伟宣称显卡供电接口烧熔问题解决

    Cleveland及韩国技术营销常务金善旭表示,RTX 50系列显卡将不会出现类似问题。 英伟称,RTX 50系列显卡的供电接口进行优化。同时,PCI - SIG组织
    的头像 发表于 01-23 14:43 1130次阅读