0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

最新NVIDIA OptiX渲染光线跟踪的速度增快

星星科技指导员 来源:NVIDIA 作者:Tony Kanell 2022-04-15 15:17 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA OptiX 射线跟踪引擎是一个可扩展的无缝框架,可在 GPU 上提供最佳的射线跟踪性能。在今年秋季更新英伟达 OpTIX SDK ,开发人员将能够利用新的编译技术,和优越的分层和时间去噪处理更多的射线跟踪工作负荷,更快。

更快的编译时间

NVIDIA OptiX 7. 4 附带了一项新功能,支持包含多个函数的 OptixModule 对象的并行编译。工作被表示为从 API 返回的任务对象,可以并发执行以实现并行性。当发现并行机会时,将返回其他任务。线程在 NVIDIA OptiX 之外通过从应用程序管理的线程执行任务来处理。该应用程序可以更容易地将并行工作集成到现有的作业调度器中。

改进的定制和性能

NVIDIA OptiX 7.4 已将光线有效载荷的大小从 8 个寄存器增加到 32 个寄存器。有效负载寄存器是 NVIDIA OptiX 提供的机制,用于从跟踪光线的调用方传递任意数据以及光线。这种有效负载机制非常轻量级,类似于向函数传递参数。有效负载的有限大小迫使许多人使用本地甚至全局内存缓冲区来传递光线数据,这可能会对性能产生负面影响。

新的有效负载大小提供了更多种类的应用程序,以便能够利用仅使用寄存器传递数据的优势。使用更多寄存器会增加寄存器压力,并可能导致内存溢出,因此新的 NVIDIA OptiX 7 . 4 有效负载增加还附带了新的 API 函数。这将帮助开发人员优化有效负载的使用。新的 API 允许您声明如何使用有效负载值,以便编译器有机会尽可能重用寄存器。

曲线添加和优化

我们还引入了一个新的曲线原语: Catmull-Rom 三次曲线。这种类型的曲线是直接通过其控制点的插值曲线的一种流行样式,用于在需要精度控制时微调曲线的放置。 Catmull Rom 曲线是电影和游戏行业头发、毛皮和其他曲线用途的流行选择。 NVIDIA OptiX 已经支持的其他曲线类型是三次和二次 B 样条曲线以及线性曲线。 B 样条曲线是一种近似曲线,比 Catmull Rom 曲线稍微平滑,但通常也不会直接通过其控制点。

除了新的曲线原语外, NVIDIA OptiX 还添加了一个选项,用于控制三次曲线和二次曲线的端点是开放的还是封闭的。为了避免着色器发散(与 endcap 法线的特殊情况处理有关),需要使用开放式曲线。 NVIDIA OptiX 曲线当前是背面消隐的,因此通过曲线开口端进入的光线将完全错过曲线。开放式曲线是常见的和可取的,而且性能更好。 NVIDIA OptiX 7.4 将三次曲线和二次曲线的默认端盖行为更改为开放式。

以前,这些曲线具有扁平闭合的圆盘形端盖,这对于需要仔细控制光线曲线行为或防止光线通过曲线的应用程序有时非常有用。为了节省内存, B 样条曲线和 Catmull Rom 曲线沿连接的线束段共享控制点。

说到节省内存, NVIDIA OptiX 7 . 4 启用了曲线自适应采样,这在默认情况下既减少了内存又提高了性能。对于拥有数百万条曲线的毛茸茸的生物来说,内存使用是至关重要的。对于最注重性能且内存可用的生物来说,使用构建标志 OPTIX \ u build \ u flag \ u prefere \ u FAST \ u TRACE 可以更快地渲染曲线。自适应采样使用的内存比以前稍微多一些(大约 10% ),以换取渲染性能平均提高 25%-50% ,甚至在我们的一些测试中提高 70% 。

两个主要的去噪功能结合在一起

NVIDIA OptiX 7.4 中的去噪器在质量和速度上不断提高。有了这个版本的 NVIDIA OptiX ,开发人员可以结合前面两个主要的去噪功能升级: AOV (或分层)去噪和时间去噪。 AOV 去噪是同时对多个任意渲染层进行去噪的功能,与单独对每个层进行去噪相比, AOV 去噪具有更好的效率。此外,同时对多个层进行去噪可以显著提高质量,因为所有层的去噪滤波器选择保持一致。这意味着,一旦将层重新组合在一起,可以看到较少的去噪伪影。

对单独的层进行去噪会导致为每个层独立选择不同的过滤器,并且会使某些层更容易出现可见的瑕疵。这对于非常稀疏的层尤其如此,例如大部分为空的镜面反射过程。时间去噪是 NVIDIA OptiX 7.3 的一项新功能,它可以在动画帧序列中保持帧间去噪的一致性。如果单独对帧进行去噪,它们可能看起来很不错,但是当您对它们进行动画播放时,通常会出现闪烁的瑕疵,因为去噪器会对每个帧进行独立的选择。时间 AOV 去噪在一个包中为您提供了两个功能—在不同层和动画序列中的去噪一致性。

随着需求量的增加,规模不断扩大

NVIDIA OptiX 中的 demand loading library 具有缓存逐出功能,用于动态替换缓存的磁贴,以节省更多内存。团队正在寻求需求加载库中的这个新功能的反馈,所以如果你使用它,请通过我们的英伟达论坛here或通过电子邮件来访问,让 Nvidia OpTIX 团队知道它对你的工作有多好。将按需加载库逐出功能带到生产就绪状态,并计划在未来版本的 NVIDIA OptiX 中进行其他改进。

关于作者

Tony Kanell 是 NVIDIA OptiX 团队的项目经理。托尼的职业生涯始于电子艺术公司的软件工程师,致力于模拟人生等 AAA 级游戏。在与一家由 WME 支持的创意机构合作创办新游戏工作室之前,他在该公司担任管理职务,并领导了几个项目。在与 Nickelodeon 、孩之宝、 Universal 、 Laika 和多个原创 IP 成功发布和合作发布后,他加入了 NVIDIA 的 OptiX 团队,在那里他帮助团队完成了多个发布。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109110
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5100

    浏览量

    134478
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA RTX PRO 2000 Blackwell GPU性能测试

    越来越多的应用正在使用 AI 加速,而无论工作站的大小或形态如何,都有越来越多的用户需要 AI 性能。NVIDIA RTX PRO 2000 Blackwell 是全新 NVIDIA
    的头像 发表于 11-28 09:39 3778次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell GPU性能测试

    Molex Quasar OptiX现场安装连接器技术解析与应用指南

    Molex Quasar OptiX现场安装型连接器使现场安装人员能够轻松地将工厂抛光型连接器安装到极端户外环境中的光缆上。这些连接器具有高光纤保持力,可保持恒定连接,确保提高信号强度和网络完整性
    的头像 发表于 11-17 15:45 198次阅读
    Molex Quasar <b class='flag-5'>OptiX</b>现场安装连接器技术解析与应用指南

    详解ROMA中复杂图表的渲染实现

    ,对缓存策略、视图加载和渲染过程进行了重构,确保渲染成功率,提升了渲染速度以及补充了异常重试的功能。 二、使用场景分析 京东金融App内有很多使用复杂图表的业务场景,以下截取部分场景。
    的头像 发表于 10-21 13:57 263次阅读
    详解ROMA中复杂图表的<b class='flag-5'>渲染</b>实现

    NVIDIA Omniverse Extension开发秘籍

    NVIDIA Omniverse 是一个模块化平台,使用高级 API 和微服务来构建由 OpenUSD 和 NVIDIA RTX 提供支持的 3D 应用。OpenUSD 功能强大的 3D 框架与 NVIDIA RTX 用于视觉
    的头像 发表于 08-22 15:52 3405次阅读
    <b class='flag-5'>NVIDIA</b> Omniverse Extension开发秘籍

    超过175款游戏和应用现已支持NVIDIA DLSS 4

    超过 175 款游戏和应用现已支持 DLSS 4,包括《生化危机:安魂曲》(Resident Evil Requiem)、《影之刃零》(Phantom Blade Zero)等支持光线追踪的大作,升级的 NVIDIA RTX Remix、Project G-Assist
    的头像 发表于 08-20 14:26 1069次阅读

    Molex简化户外安装的Quasar OptiX现场安装连接器在贸泽开售

    2025年7月31日 – 提供超丰富半导体和电子元器件™的业界知名新品引入 (NPI) 代理商贸泽电子 (Mouser Electronics) 即日起开售Molex的Quasar OptiX现场
    发表于 07-31 15:26 613次阅读
    Molex简化户外安装的Quasar <b class='flag-5'>OptiX</b>现场安装连接器在贸泽开售

    通道渲染:释放渲染的全部潜能!通道渲染的作用、类型、技巧

    在3D图形创作中,渲染通道(RenderPasses)是一项至关重要的技术,它通过将复杂的渲染图像拆分为多个图层,如阴影、光照、法线等,使艺术家能够在后期制作中更精准地控制和调整画面。我们常常惊叹于
    的头像 发表于 07-15 14:22 448次阅读
    通道<b class='flag-5'>渲染</b>:释放<b class='flag-5'>渲染</b>的全部潜能!通道<b class='flag-5'>渲染</b>的作用、类型、技巧

    CPU渲染、GPU渲染、XPU渲染详细对比:哪个渲染最快,哪个效果最好?

    动画渲染动画3D渲染技术需要应对复杂的计算任务和精细的图像处理,作为渲染技术人员,选择合适的渲染模式,会直接影响制作效率和成品质量。在主流的渲染
    的头像 发表于 04-15 09:28 1211次阅读
    CPU<b class='flag-5'>渲染</b>、GPU<b class='flag-5'>渲染</b>、XPU<b class='flag-5'>渲染</b>详细对比:哪个<b class='flag-5'>渲染</b>最快,哪个效果最好?

    NVIDIA实现神经网络渲染技术的突破性增强功能

    近日,NVIDIA 宣布了 NVIDIA RTX 神经网络渲染技术的突破性增强功能。NVIDIA 与微软合作,将在 4 月的 Microsoft DirectX 预览版中增加神经网络着
    的头像 发表于 04-07 11:33 874次阅读

    2D图形渲染缓慢怎么加快?

    我有一个图形应用程序,它似乎渲染屏幕的速度很慢。按下屏幕后,通常需要相当长的时间来更新,大约 50 或 100 毫秒。 在应用程序启动时,我看到一条错误消息“GDK 无法创建 GL 上下文,回退
    发表于 04-02 06:46

    光线追踪及降噪技术综述

    过程传递3D场景的结果。渲染主要包括光栅化(rasterization)[5]和光线追踪[6]两种方式。光栅化渲染采用局部光照原理,根据光源照射到物体上直接可见的
    的头像 发表于 04-01 11:31 799次阅读
    <b class='flag-5'>光线</b>追踪及降噪技术综述

    NVIDIA Omniverse Kit 107的安装部署步骤

    NVIDIA Omniverse 是一个模块化平台,使用高级 API 和微服务来构建由 OpenUSD 和 NVIDIA RTX 提供支持的 3D 应用。OpenUSD 功能强大的 3D 框架与 NVIDIA RTX 用于视觉
    的头像 发表于 03-28 10:37 1157次阅读
    <b class='flag-5'>NVIDIA</b> Omniverse Kit 107的安装部署步骤

    NVIDIA Blackwell RTX PRO 提供工作站和服务器两种规格,助力设计师、开发者、数据科学家和创作人员构建代理式

    月 18 日 —— NVIDIA 今日发布了 NVIDIA RTX PRO™ Blackwell 系列工作站和服务器 GPU,通过突破性的加速计算、AI 推理、光线追踪和神经渲染技术
    发表于 03-19 09:50 546次阅读
    <b class='flag-5'>NVIDIA</b> Blackwell RTX PRO 提供工作站和服务器两种规格,助力设计师、开发者、数据科学家和创作人员构建代理式

    GPU渲染才是大势所趋?CPU渲染与GPU渲染的现状与未来

    在3D建模和渲染领域,随着技术的发展,CPU渲染和GPU渲染这两种方法逐渐呈现出各自独特的优势,并且在不同的应用场景中各有侧重。尽管当前我们处在一个CPU渲染和GPU
    的头像 发表于 02-06 11:04 1241次阅读
    GPU<b class='flag-5'>渲染</b>才是大势所趋?CPU<b class='flag-5'>渲染</b>与GPU<b class='flag-5'>渲染</b>的现状与未来

    NVIDIA技术引领媒体行业AI革新

    在推动媒体行业向智能化转型中的核心地位。 几十年来,NVIDIA始终站在计算机图形技术的最前沿,从GPU的开创性研发,到RTX实时光线追踪技术的突破,再到神经渲染的创新应用,NVIDIA
    的头像 发表于 01-16 16:28 705次阅读