0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NeRF的研究目的是合成同一场景不同视角下的图像

3D视觉工坊 来源:3D视觉工坊 2023-01-29 10:54 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NeRF,即Neural Radiance Fields(神经辐射场)的缩写。研究员来自UCB、Google和UCSD

Title:NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis

Paper:https://arxiv.org/pdf/2003.08934.pdf

Code:https://github.com/bmild/nerf

写这篇文章的动机是,一方面NeRF实在太重要了代表着计算机视觉、图像学结合的未来重要方向;另一方面NeRF对于计算机视觉背景的同学有一定的理解门槛,这篇文章试图以最小背景知识补充、最少理解成本为前提介绍NeRF。

整体介绍

NeRF的研究目的是合成同一场景不同视角下的图像。方法很简单,根据给定一个场景的若干张图片,重构出这个场景的3D表示,然后推理的时候输入不同视角就可以合成(渲染)这个视角下的图像了。

「3D表示」有很多种形式,NeRF使用的是辐射场,然后用「体渲染」(Volume Rendering)技术,给定一个相机视角,把辐射场渲染成一张图像。选用辐射场+体渲染的原因很简单,全程可微分。这个过程很有意思,可以理解为把一个空间朝一个方向上拍扁,空间中的颜色加权求和得到平面上的颜色。

辐射场

7979651c-9f7f-11ed-bfe3-dac502259ad0.png

体渲染

所谓体渲染,直观地说,我们知道相机的焦点,焦点和像素的连线可以连出来一条射线,我们可以对这条射线上所有的点的颜色做某种求和就可以得到这个像素的颜色值。

理论上,我们可以对这条射线经过空间上的每个点的密度(只和空间坐标相关)和颜色(同时依赖空间坐标和入射角)进行某种积分就可以得到每个像素的颜色。当每个像素的颜色都计算出来,那么这个视角下的图像就被渲染出来了。如下图所示:

7984c5e2-9f7f-11ed-bfe3-dac502259ad0.jpg

从相机焦点出发,往一个像素连出一条射线,获取射穿过空间中每个点的属性,进行积分得到这个像素的颜色

为了顺利完成上面过程,我们可能需要维护硕大无朋Tensor来表示辐射场,查表获取RGB和密度。这里一个问题是空间有多大表就有多大,同时只能是离散表示的。NeRF要做的事情是用一个神经网络来建模辐射场,这样无论空间有多大,不影响我们表示辐射场的所需要的存储量,而且这个辐射场表示是连续的:�Θ:(�,�,�,�,�)→(�,�,�,�

799646fa-9f7f-11ed-bfe3-dac502259ad0.png

79a2b46c-9f7f-11ed-bfe3-dac502259ad0.jpg

用神经网络来代替查表的方式表示辐射场

整体过程

因为神经网络是可微分的,选取的体渲染方法是可微分;体渲染得到的图片和原图计算MSE Loss。整个过程可端到端地用梯度回传来优化非常漂亮。整个训练Pipeline如下图所示:

79b9f91a-9f7f-11ed-bfe3-dac502259ad0.jpg

看到这,读者就已经大致理解NeRF的原理了,后面章节是NeRF的具体细节。

用辐射场做体渲染

前面我们已经大致理解体渲染的过程是怎么做了。可是怎么沿着射线对空间中的颜色进行积分呢?如果我们把射线看作是光线,可以直观得到这个积分要满足的两个条件:

1、一个点的密度越高,射线通过它之后变得越弱,密度和透光度呈反比

2、一个点的密度越高,这点在这个射线下的颜色反应在像素上的权重越大

79c63be4-9f7f-11ed-bfe3-dac502259ad0.png

而实际渲染过程,我们只能把射线平均分成N个小区间,每个区间随机采样一个点,对采样得到的点的颜色进行某种加权求和:

79d6a290-9f7f-11ed-bfe3-dac502259ad0.png

神经辐射场的两项优化点

Positional encoding

类似Transformer的做法,把坐标和视角用更高维度的表示作为网络输入,来解决渲染图像比较糊的问题:

79e7de2a-9f7f-11ed-bfe3-dac502259ad0.png

Hierachical volume sampling

79f73cf8-9f7f-11ed-bfe3-dac502259ad0.png

Architecture

7a0404f6-9f7f-11ed-bfe3-dac502259ad0.png

私货

无论从方法的开创性,还是发表后两年多的影响力来看。在笔者心目中,ECCV 2020的Best Paper没给NeRF,不得不说是一个遗憾。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    2990

    浏览量

    113837
  • 神经网络
    +关注

    关注

    42

    文章

    4827

    浏览量

    106799
  • RGB
    RGB
    +关注

    关注

    4

    文章

    820

    浏览量

    61522

原文标题:都2023年了,我不允许你还不懂NeRF

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    中国车联网行业加速渗透:一场“车联万物”的出行革命

    当汽车不再是孤立的机械载体,而是接入互联网的智能终端,一场出行变革正悄然发生。近日,前瞻产业研究院发布《2018 - 2025年中国车联网行业渗透率与用户规模统计情况及预测》(称“报告”),透过
    的头像 发表于 12-04 11:22 209次阅读

    无引导线的左转场景,自动驾驶如何规划轨迹?

    场景,想要很好地处理好无引导线左转是个非常大的挑战。但想要让自动驾驶汽车满足所有的出行需求,这一场景必须解决,那在无引导线的左转场景
    的头像 发表于 09-18 09:12 438次阅读
    无引导线的左转<b class='flag-5'>场景</b><b class='flag-5'>下</b>,自动驾驶如何规划轨迹?

    从开发工程师视角看TTS语音合成芯片

    功能机,有着诸多跨越性优势。 、TTS 语音合成芯片vs传统播报芯片 ()内容灵活性 传统播报芯片如同老式唱片,内容固化。在产品生产时就已将固定语音内容烧录进去,后续很难更改。若产品应用
    的头像 发表于 08-13 14:52 643次阅读

    电压放大器驱动合成射流的涡结构演化与掺混增强机制研究

    速度的作用向下游运动,相互融合形成射流。合成射流已被应用于众多流动控制领域,包括掺混增强、传热增强、流动分离控制等。本实验通过粒子图像测速(PIV)技术从瞬时流动结构演化的角度对合成
    的头像 发表于 08-08 15:47 454次阅读
    电压放大器驱动<b class='flag-5'>合成</b>射流的涡结构演化与掺混增强机制<b class='flag-5'>研究</b>

    2025零售快闪店场景,如何选择更可靠的SDWAN服务商?

    ##零售快闪店场景,如何选择更可靠的SDWAN服务商?在快节奏的零售战场,快闪店如同一场精心策划的闪电战——品牌在黄金地段突然出现,制造话题,引爆消费,又在热潮未退时悄然离。然而,
    的头像 发表于 08-04 17:32 1841次阅读
    2025零售快闪店<b class='flag-5'>场景</b><b class='flag-5'>下</b>,如何选择更可靠的SDWAN服务商?

    3Dfindit 提供的数字立方体模型为研究目的可视化提供了支持

    作为学习项目的部分,罗伊特林根教育大学的学生们在比辛根集中营纪念地的博物馆中使用 3Dfindit 动画立方体模型进行了学习。作为历史教学研讨会的部分,学生们研究了巴登-符腾堡州
    发表于 08-01 14:36

    火车车号图像识别系统如何应对不同光照条件的识别问题?

    光谱成像技术的应用 先进的系统采用多光谱成像技术,能够在不同光照条件捕捉车号信息。高动态范围(HDR)摄像头的应用,可同时获取同一场景的多种曝光图像,确保在强光直射或夜间低照度环境
    的头像 发表于 07-15 11:37 531次阅读
    火车车号<b class='flag-5'>图像</b>识别系统如何应对不同光照条件<b class='flag-5'>下</b>的识别问题?

    航天科普|一场救援中的通信革命-卫星通信(下篇)

    当福来哥在云南雨崩的原始森林迷路,手机信号完全消失时,他背包里的卫星手机成为救命稻草—条包含坐标的求救短信穿透密林树冠,直达3.6万公里高空的天通卫星,小时后救援队精准抵达。这一场景背后,是一场
    的头像 发表于 07-01 17:03 1594次阅读
    航天科普|<b class='flag-5'>一场</b>救援中的通信革命-卫星通信(下篇)

    HarmonyOS NEXT意图框架习惯推荐一场景说明

    、概述 意图框架是HarmonyOS系统级的意图标准体系。将应用和元服务的业务功能智慧分发给不同的系统入口,以“音乐播放”为例,HarmonyOS将业务分发给“小艺建议”,提供了桌面大流量曝光
    发表于 06-18 15:06

    LLSM流媒体传输模块 高动态图像带宽稳定技术突破

    高清实时视频的能力。旦控制系统设定带宽上限为500K,那么在多种场景,尤其是高动态图像环境,带宽的波动始终会控制在这个范围内。我们在
    的头像 发表于 05-27 17:58 906次阅读
    LLSM流媒体传输模块  高动态<b class='flag-5'>图像</b>带宽稳定技术突破

    你以为的安全,真的安全吗?——拟态安全,一场关于认知的博弈

    黑客的日常工作就像一场精心策划的“入室盗窃”。首先“踩点”——扫描目标系统的端口、分析网络流量、研究系统架构找出漏洞,但如果黑客发现系统会“变脸”,今天Windows,明天变成Linux,刚研究
    的头像 发表于 04-14 10:45 393次阅读
    你以为的安全,真的安全吗?——拟态安全,<b class='flag-5'>一场</b>关于认知的博弈

    普渡机器人核心技术全面升级

    随着智能技术向更多元场景渗透,多类型机器人(如清洁、配送等)在同一场景的协同作业需求日益增长。然而,复杂环境中的地图复用、电梯调度、路径冲突及人机交互等问题,成为制约效率与用户体验的关键挑战。
    的头像 发表于 03-27 16:17 805次阅读

    敏捷合成器的技术原理和应用场景

    敏捷合成器,作为种高性能的信号发生器,其技术原理和应用场景值得深入探讨。技术原理敏捷合成器的技术原理主要基于先进的频率合成技术和数字信号处
    发表于 02-20 15:25

    DS878 数字合成器适合哪些应用场景

    DS878 数字合成器适合哪些应用场景?DS878 高速啁啾直接数字合成器是款由EUVIS推出的高性能直接数字合成器,DS878高速啁啾直
    发表于 02-10 09:20

    SSTF中脉冲前倾的仿真

    用透镜聚焦以获得在空间和时间域中尺寸最小的焦点。虽然在某些应用中这种影响是不必要的,但在某些光学领域,如非线性频率转换或太赫兹生成,它可能是有好处的。 2 场景 2.1场景:系统配置 2.2
    发表于 12-31 09:04