0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

最新NVIDIA OptiX渲染光线跟踪的速度增快

星星科技指导员 来源:NVIDIA 作者:Tony Kanell 2022-04-15 15:17 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA OptiX 射线跟踪引擎是一个可扩展的无缝框架,可在 GPU 上提供最佳的射线跟踪性能。在今年秋季更新英伟达 OpTIX SDK ,开发人员将能够利用新的编译技术,和优越的分层和时间去噪处理更多的射线跟踪工作负荷,更快。

更快的编译时间

NVIDIA OptiX 7. 4 附带了一项新功能,支持包含多个函数的 OptixModule 对象的并行编译。工作被表示为从 API 返回的任务对象,可以并发执行以实现并行性。当发现并行机会时,将返回其他任务。线程在 NVIDIA OptiX 之外通过从应用程序管理的线程执行任务来处理。该应用程序可以更容易地将并行工作集成到现有的作业调度器中。

改进的定制和性能

NVIDIA OptiX 7.4 已将光线有效载荷的大小从 8 个寄存器增加到 32 个寄存器。有效负载寄存器是 NVIDIA OptiX 提供的机制,用于从跟踪光线的调用方传递任意数据以及光线。这种有效负载机制非常轻量级,类似于向函数传递参数。有效负载的有限大小迫使许多人使用本地甚至全局内存缓冲区来传递光线数据,这可能会对性能产生负面影响。

新的有效负载大小提供了更多种类的应用程序,以便能够利用仅使用寄存器传递数据的优势。使用更多寄存器会增加寄存器压力,并可能导致内存溢出,因此新的 NVIDIA OptiX 7 . 4 有效负载增加还附带了新的 API 函数。这将帮助开发人员优化有效负载的使用。新的 API 允许您声明如何使用有效负载值,以便编译器有机会尽可能重用寄存器。

曲线添加和优化

我们还引入了一个新的曲线原语: Catmull-Rom 三次曲线。这种类型的曲线是直接通过其控制点的插值曲线的一种流行样式,用于在需要精度控制时微调曲线的放置。 Catmull Rom 曲线是电影和游戏行业头发、毛皮和其他曲线用途的流行选择。 NVIDIA OptiX 已经支持的其他曲线类型是三次和二次 B 样条曲线以及线性曲线。 B 样条曲线是一种近似曲线,比 Catmull Rom 曲线稍微平滑,但通常也不会直接通过其控制点。

除了新的曲线原语外, NVIDIA OptiX 还添加了一个选项,用于控制三次曲线和二次曲线的端点是开放的还是封闭的。为了避免着色器发散(与 endcap 法线的特殊情况处理有关),需要使用开放式曲线。 NVIDIA OptiX 曲线当前是背面消隐的,因此通过曲线开口端进入的光线将完全错过曲线。开放式曲线是常见的和可取的,而且性能更好。 NVIDIA OptiX 7.4 将三次曲线和二次曲线的默认端盖行为更改为开放式。

以前,这些曲线具有扁平闭合的圆盘形端盖,这对于需要仔细控制光线曲线行为或防止光线通过曲线的应用程序有时非常有用。为了节省内存, B 样条曲线和 Catmull Rom 曲线沿连接的线束段共享控制点。

说到节省内存, NVIDIA OptiX 7 . 4 启用了曲线自适应采样,这在默认情况下既减少了内存又提高了性能。对于拥有数百万条曲线的毛茸茸的生物来说,内存使用是至关重要的。对于最注重性能且内存可用的生物来说,使用构建标志 OPTIX \ u build \ u flag \ u prefere \ u FAST \ u TRACE 可以更快地渲染曲线。自适应采样使用的内存比以前稍微多一些(大约 10% ),以换取渲染性能平均提高 25%-50% ,甚至在我们的一些测试中提高 70% 。

两个主要的去噪功能结合在一起

NVIDIA OptiX 7.4 中的去噪器在质量和速度上不断提高。有了这个版本的 NVIDIA OptiX ,开发人员可以结合前面两个主要的去噪功能升级: AOV (或分层)去噪和时间去噪。 AOV 去噪是同时对多个任意渲染层进行去噪的功能,与单独对每个层进行去噪相比, AOV 去噪具有更好的效率。此外,同时对多个层进行去噪可以显著提高质量,因为所有层的去噪滤波器选择保持一致。这意味着,一旦将层重新组合在一起,可以看到较少的去噪伪影。

对单独的层进行去噪会导致为每个层独立选择不同的过滤器,并且会使某些层更容易出现可见的瑕疵。这对于非常稀疏的层尤其如此,例如大部分为空的镜面反射过程。时间去噪是 NVIDIA OptiX 7.3 的一项新功能,它可以在动画帧序列中保持帧间去噪的一致性。如果单独对帧进行去噪,它们可能看起来很不错,但是当您对它们进行动画播放时,通常会出现闪烁的瑕疵,因为去噪器会对每个帧进行独立的选择。时间 AOV 去噪在一个包中为您提供了两个功能—在不同层和动画序列中的去噪一致性。

随着需求量的增加,规模不断扩大

NVIDIA OptiX 中的 demand loading library 具有缓存逐出功能,用于动态替换缓存的磁贴,以节省更多内存。团队正在寻求需求加载库中的这个新功能的反馈,所以如果你使用它,请通过我们的英伟达论坛here或通过电子邮件来访问,让 Nvidia OpTIX 团队知道它对你的工作有多好。将按需加载库逐出功能带到生产就绪状态,并计划在未来版本的 NVIDIA OptiX 中进行其他改进。

关于作者

Tony Kanell 是 NVIDIA OptiX 团队的项目经理。托尼的职业生涯始于电子艺术公司的软件工程师,致力于模拟人生等 AAA 级游戏。在与一家由 WME 支持的创意机构合作创办新游戏工作室之前,他在该公司担任管理职务,并领导了几个项目。在与 Nickelodeon 、孩之宝、 Universal 、 Laika 和多个原创 IP 成功发布和合作发布后,他加入了 NVIDIA 的 OptiX 团队,在那里他帮助团队完成了多个发布。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5696

    浏览量

    110141
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5283

    浏览量

    136099
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    欧莱雅正与NVIDIA深化合作以大幅提升美妆研发速度

    美妆行业的未来,正由深厚的科学积累、创意灵感与代码共同谱写。欧莱雅正与 NVIDIA 深化合作,将 NVIDIA ALCHEMI(化学与材料创新 AI 实验室)引入价值数十亿美元的护肤领域。
    的头像 发表于 03-25 09:41 385次阅读

    NVIDIA DLSS 5发布并首次引入实时神经网络渲染模型

    NVIDIA 今天发布 NVIDIA DLSS 5,这是自 2018 年实时光线追踪首次亮相以来,NVIDIA 在计算机图形领域最重大的突破。
    的头像 发表于 03-19 15:33 391次阅读

    超擎数智为您深度解析NVIDIA Quantum-X800 InfiniBand平台

    NVIDIA
    专精特新
    发布于 :2026年01月08日 19:47:03

    NVIDIA RTX PRO 5000 Blackwell GPU的深度评测

    NVIDIA RTX PRO 5000 Blackwell 是 NVIDIA RTX 5000 Ada Generation 的升级迭代产品,其各项核心指标均针对 GPU 加速工作流的高性能
    的头像 发表于 01-06 09:51 4322次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 Blackwell GPU的深度评测

    NVIDIA RTX PRO 2000 Blackwell GPU性能测试

    越来越多的应用正在使用 AI 加速,而无论工作站的大小或形态如何,都有越来越多的用户需要 AI 性能。NVIDIA RTX PRO 2000 Blackwell 是全新 NVIDIA
    的头像 发表于 11-28 09:39 7122次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell GPU性能测试

    Molex Quasar OptiX现场安装连接器技术解析与应用指南

    Molex Quasar OptiX现场安装型连接器使现场安装人员能够轻松地将工厂抛光型连接器安装到极端户外环境中的光缆上。这些连接器具有高光纤保持力,可保持恒定连接,确保提高信号强度和网络完整性
    的头像 发表于 11-17 15:45 661次阅读
    Molex Quasar <b class='flag-5'>OptiX</b>现场安装连接器技术解析与应用指南

    大家好! 叠层工艺相比传统工艺,在响应速度上具体在哪里?

    大家好!叠层固态电容工艺相比传统的电容工艺,在响应速度上具体在哪里?
    发表于 11-15 10:03

    详解ROMA中复杂图表的渲染实现

    ,对缓存策略、视图加载和渲染过程进行了重构,确保渲染成功率,提升了渲染速度以及补充了异常重试的功能。 二、使用场景分析 京东金融App内有很多使用复杂图表的业务场景,以下截取部分场景。
    的头像 发表于 10-21 13:57 680次阅读
    详解ROMA中复杂图表的<b class='flag-5'>渲染</b>实现

    Smart Eye的AIS系统获得全球车队管理解决方案提供商Optix订单

    全球人类洞察AI与驾驶员监测系统(DMS)领域的领先者Smart Eye今日宣布,其AIS系统获得全球车队管理解决方案提供商Optix的一里程碑式订单。2025年,将有4000辆商用车辆率先集成Smart Eye的技术,这标志着全球范围内的首次大规模部署。
    的头像 发表于 09-12 10:38 1409次阅读

    NVIDIA Omniverse Extension开发秘籍

    NVIDIA Omniverse 是一个模块化平台,使用高级 API 和微服务来构建由 OpenUSD 和 NVIDIA RTX 提供支持的 3D 应用。OpenUSD 功能强大的 3D 框架与 NVIDIA RTX 用于视觉
    的头像 发表于 08-22 15:52 3879次阅读
    <b class='flag-5'>NVIDIA</b> Omniverse Extension开发秘籍

    超过175款游戏和应用现已支持NVIDIA DLSS 4

    超过 175 款游戏和应用现已支持 DLSS 4,包括《生化危机:安魂曲》(Resident Evil Requiem)、《影之刃零》(Phantom Blade Zero)等支持光线追踪的大作,升级的 NVIDIA RTX Remix、Project G-Assist
    的头像 发表于 08-20 14:26 1567次阅读

    Molex简化户外安装的Quasar OptiX现场安装连接器在贸泽开售

    2025年7月31日 – 提供超丰富半导体和电子元器件™的业界知名新品引入 (NPI) 代理商贸泽电子 (Mouser Electronics) 即日起开售Molex的Quasar OptiX现场
    发表于 07-31 15:26 1135次阅读
    Molex简化户外安装的Quasar <b class='flag-5'>OptiX</b>现场安装连接器在贸泽开售

    通道渲染:释放渲染的全部潜能!通道渲染的作用、类型、技巧

    在3D图形创作中,渲染通道(RenderPasses)是一项至关重要的技术,它通过将复杂的渲染图像拆分为多个图层,如阴影、光照、法线等,使艺术家能够在后期制作中更精准地控制和调整画面。我们常常惊叹于
    的头像 发表于 07-15 14:22 897次阅读
    通道<b class='flag-5'>渲染</b>:释放<b class='flag-5'>渲染</b>的全部潜能!通道<b class='flag-5'>渲染</b>的作用、类型、技巧

    NVIDIA借助神经渲染技术为物理AI开发场景注入新活力

    DiffusionRenderer 引入了一种神经渲染技术,可用于创意领域的内容生成和编辑,也可用于智能汽车和机器人开发的合成数据生成。
    的头像 发表于 06-16 14:41 1074次阅读

    NVIDIA Isaac Sim与NVIDIA Isaac Lab的更新

    在 COMPUTEX 2025 上,NVIDIA 宣布了机器人仿真参考应用 NVIDIA Isaac Sim 和机器人学习框架 NVIDIA Isaac Lab 的更新,以加速各种形态机器人的开发。
    的头像 发表于 05-28 10:06 2436次阅读