0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达已首次实现SDF实时渲染 速度提升2-3个数量级

工程师邓生 来源:雷锋网 作者:贝爽 2021-02-01 09:42 次阅读

“实时渲染”主要应用于游戏领域,它能够将图形数据实时转化为极具真实感的 3D 画面,是决定游戏体验的关键因素之一。

对于实时渲染而言,最大的挑战即是渲染速度。通常来讲,渲染一屏幕的游戏场景的图像,至少要在 1/24 秒以内,才不至于有 “翻 PPT”的感觉。

近日,英伟达发表一项最新研究成果将实时渲染速度提升了 2-3 个数量级。

而在渲染质量上,它也能够更好地处理复杂样式、比例的图形数据,甚至实时同步环境光照可能形成的阴影。

Facebook 与 MIT研究团队在 2019 年推出的 DeepSDF,是现有相关研究的最佳 3D 重建模型。

与之相比,无论是在渲染速度,还是质量方面,英伟达的最新研究还要更胜一筹。

橙色代表 DeepSDF 渲染效果

这项最新研究是一篇名为《神经几何细节水平:隐式 3D 形状的实时渲染》的论文,它是英伟达联合多伦多大学、麦吉尔大学研究人员共同发表的研究成果,目前已提交至预印论文库 arXiv。

论文中,研究人员表示,他们通过引入了一种高效的神经网络表示方法,首次实现了基于 SDF 的 3D 高保真实时渲染,同时达到了最先进的几何重建质量。更重要的是,与其他研究相比,它在渲染速度上提升了 2-3 个数量级。

SVO 编码,渲染速度翻倍

SDF,即符号距离函数 Signed Distance Function,是计算机图形学中一种有效的表示方法。

在现有研究中,通常是采用一个较大、具有固定尺寸的多层感知器(MLP)对 SDF 进行编码,以近似代表具有隐式曲面的复杂图形。然而,使用大型网络进行实时渲染导致了昂贵的计算成本,因为它需要让每个像素通过网络地进行向前传递。

基于此,研究团队提出了改用稀疏体素八叉树(SVO)来对几何形状进行编码的方法,它可以自适应地缩放不同的离散细节层次 LOD( Level of Detail ),并重建高度细节的几何结构。

如图,该方法在不同尺寸的几何体之间平滑地插值,并占用合理内存进行实时渲染。

研究人员介绍,与现有研究一样,他们同样使用了一个小型 MLP 来实现球体跟踪。并且受到经典曲面提取机制的启发,使用了存储距离值的正交和空间数据结构对欧几里德空间进行精细离散化,以使简单的线性基函数可以重建几何体。

在这些工作中,分辨率或树深度决定了 LOD(不同的 LOD 可以与 SDF 插值进行混合)。对此,研究人员使用了稀疏体素八叉树(SVO)来离散空间,并存储学习的特征向量,而不是符号距离值。

20450G5M-14.jpg

这样做的好处是,它允许向量可以通过浅层 MLP 解码成标量距离,在继承经典方法(如 LOD)优点的同时,能够进一步缩短树深度。

20450I926-16.jpg

在此基础上,研究人员还开发了一种针对该体系结构的光线遍历算法( Rray Traversal Algorithm),实现了比 DeepSDF 快 100 倍的渲染速度。另外,虽然无法与神经体积绘制方法进行直接比较,但在类似的实验环境中,其帧速度也要比 NeRF 快 500 倍,比 NSVF 快 50 倍。

实验测试,渲染质量更精细

在质量上,研究人员将该方法与 DeepSDF、FFN、SIREN 以及 Neural Implicits(NI)四种算法进行了比较,它们在过度拟合 3D 几何形状方面均达到了现有研究的最佳性能。

以下为不同算法在 ShapeNet、Thingi10K 和 TurboSquid 三个数据集上进行 3D 重建的比较结果。

20450L1V-18.jpg

可以看到,从 LOD3 开始该方法表现出了更好的性能。在第三个 LOD 中,不仅存储参数最小,而且推理参数在所有分辨率上都固定为 4737 个浮点值,与 FFN 相比减少了 99%,与 Neural Implicits 相比减少了 37%。

更重要的是,在低存储和推理参数的情况下,该方法表现出了更好的重建质量。如下图:

20450K139-20.jpg

与 NI、FFN 相比,该方法能够更加精准地渲染出图像的细节,而且速度比 FFN 快 50 倍。

另外,在渲染质量上,研究人员还将该方法在 Shadertoy 的两个特殊案例中进行了测试:Oldcar,它包含了一个高度非度量的有符号距离场;Mandelbulb,是一个只能用隐式曲面表示的递归分形结构。

这两种 SDF 都是由数学表达式定义的,他们从中提取并采样距离值,测试结果如下:

20450I608-22.jpg

相比之下,只有该方法的架构才能准确地捕捉复杂示例的高频细节。可以看出,FFN 和 SIREN 呈现的效果非常不理想,其原因可能是因为它们都只能拟合平滑距离场,无法处理不连续性和递归结构,以至于在渲染时很难突出显示几何细节。

总之,通过引入隐式 3D 图形的表示形式 LOD,该方法可以达到最先进的几何重建质量,同时允许更小占用内存下的实时渲染。不过,研究人员也坦言,该方法在大场景、或者非常薄、无体积的的物体上并不适用,这将是未来的一个研究方向。

但从当下来看,该方法代表了基于神经隐函数几何学的一个重大进步,因为它是第一个基于 SDF 实现实时渲染和呈现的表示形式,未来有望应用到场景重建、机器人路径规划、交互式内容创建等多个现实场景中。

相关作者

论文的一作是来自多伦多大学的计算机博士 Towaki Takikawa。他曾在的英伟达的超大规模图形处理研究(Hyperscale Graphics Research)小组工作。

主要研究方向集中在计算机视觉和计算机图形学,对探索机器学习驱动 3D 几何处理算法非常感兴趣。另外在机器人相关项目的软硬件方面也有一定的经验。

另外参与本次研究的还有 Joey Litalien、Kangxue Yin、Karsten Kreis1、Charles Loop、Derek Nowrouzezahrai、Alec Jacobson、Morgan McGuire、Sanja Fidler 等八位学者。

其中 Kangxue Yin 是一位华人学者,他曾在中国科学院深圳先进技术研究院(SIAT)工作 3 年,之后考入西蒙弗雷泽大学(Simon Fraser University)大学并取得了博士学位。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    2753

    浏览量

    106438
  • 渲染
    +关注

    关注

    0

    文章

    60

    浏览量

    10751
  • 英伟达
    +关注

    关注

    22

    文章

    3316

    浏览量

    87717
收藏 人收藏

    评论

    相关推荐

    揭秘:实时渲染、离线渲染、云渲染和混合渲染的区别

    渲染,就是将3D模型转换成2D图像,并最终呈现在屏幕上的过程。常见的渲染类型有以下几种:实时渲染离线渲染
    的头像 发表于 12-26 08:27 237次阅读
    揭秘:<b class='flag-5'>实时</b><b class='flag-5'>渲染</b>、离线<b class='flag-5'>渲染</b>、云<b class='flag-5'>渲染</b>和混合<b class='flag-5'>渲染</b>的区别

    深入理解Linux RCU:从硬件说起之内存屏障

    上一篇文章我们谈到了内存Cache,并且描述了典型的Cache一致性协议MESI。Cache的根本目的,是解决内存与CPU速度多达两个数量级的性能差异。
    的头像 发表于 12-25 13:42 478次阅读
    深入理解Linux RCU:从硬件说起之内存屏障

    【昉·星光 2 高性能RISC-V单板计算机体验】体验Imagination GPU带来的丝滑3D图形渲染效果

    像素每秒的处理性能,大家可能没啥概念,1920x1080分辨率60FPS,对应的像素数量是1920x1080x60=124,416,000,比4G小一个数量级。 二、实验准备 本文所需要的设备
    发表于 12-24 21:24

    英伟将在越南设法人实体

    英伟行业资讯
    深圳市浮思特科技有限公司
    发布于 :2023年12月12日 10:29:04

    清华电化学电容新突破,比容量高出电解电容两个数量级

    相对来说,电化学电容器的比容量要比电解电容器高三个数量级,是微型化、集成化滤波电容的良好选择,但受限于缓慢的离子迁移动力学,电化学电容器无法做到滤波需求的高频率响应能力,因此电化学电容器往往需要以牺牲比容量的方式
    的头像 发表于 12-06 15:39 350次阅读
    清华电化学电容新突破,比容量高出电解电容两<b class='flag-5'>个数量级</b>

    英伟为何放不下中国?

    英伟行业资讯
    深圳市浮思特科技有限公司
    发布于 :2023年11月27日 15:11:09

    #英伟 #显卡 英伟全新旗舰显卡RTX 5090性能暴涨70%

    显卡英伟
    深圳市浮思特科技有限公司
    发布于 :2023年11月20日 14:19:25

    如何在不受电线等的影响下尽可能准确地测量如mΩ数量级的电阻值呢?

    如何在不受电线等的影响下尽可能准确地测量如mΩ数量级的电阻值呢? 引言: 电阻测量是电路分析和电子工程中非常重要的技术。然而,在测量低阻值时,电线、接触电阻、温度等因素可能对结果产生较大的影响。因此
    的头像 发表于 11-17 14:48 253次阅读

    #消费级显示被禁止出口 英伟RTX 4090显卡遭遇下架风波

    英伟
    深圳市浮思特科技有限公司
    发布于 :2023年10月19日 15:58:35

    实时渲染在高校虚拟仿真教学中应用的优势和价值分析

    ,随时随地使用,对原有应用更多赋能,提升硬件、内容的资源利用率。2、服务器机房集中管理,便于运维;同时可一机复用,降低硬件投入成本。3实时渲染
    发表于 08-22 14:52

    HarmonyOS/OpenHarmony应用开发-ArkTS语言渲染控制ForEach循环渲染

    项在源数组中移动而不做修改,因为索引发生改变,依赖该数组项的UI仍然需要重新渲染。例如,使用索引排序时,数组只需要将ForEach未修改的子UI节点移动到正确的位置,这对于框架来说是一量级操作。而使用索引时,所有子UI节点都
    发表于 08-18 10:50

    00032 Jetson TX2 NX开发者套件!TX2的性能,NANO的尺寸! #英伟 #jetson

    英伟
    学习电子知识
    发布于 :2023年07月02日 13:21:19

    联发科回应结盟英伟合攻 Arm 架构芯片传闻

    联发科计划周一下午举行 2023“旗舰科技 智领未来”记者会,由联发科 CEO 蔡力行与重量级嘉宾一同出席,这位嘉宾应该是近来引起全球关注、并成为 AI 创新推动者的英伟 CEO 黄仁勋。早些时候
    发表于 05-28 08:47

    机器学习让存储器设计提速N个数量级

    因此,存储器件变得容量越来越大,设计越来越复杂。在开发存储器件时,怎样做才能既满足严苛的性能、功耗、面积(PPA)目标,又能确保产品按时上市呢?
    的头像 发表于 05-25 14:33 483次阅读
    机器学习让存储器设计提速N<b class='flag-5'>个数量级</b>

    视觉处理,2d照片转3d模型

    首先,太阳高度是恒定的。 照片每像素的亮度可求。我们只需要求出太阳与眼睛到物体的夹角就能求出3d模型。 最多就是各种物质的反射率。 英伟的oir芯片就是做汽车视觉的,大家去取取经。 有时,2
    发表于 05-21 17:13