0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NeurIPS 2023 | 清华ETH提出首个二值化光谱重建算法

智能感知与物联网技术研究所 来源:未知 2023-12-03 20:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

wKgaomVsc56ANMSQAAC3ITqhUNk915.png论文链接:https://arxiv.org/abs/2305.10299

代码链接1:

https://github.com/caiyuanhao1998/BiSCI

代码链接2:

https://github.com/caiyuanhao1998/MSTwKgaomVsc56ADjR6AAFs8X4VRDo646.png

▲ 图1 BiSRNet 与当前最先进的二值网络的性能对比

目前所有的代码,预训练模型和测试结果均已开源在我们开发的一个二值化光谱压缩重建工具包 BiSCI 内,该工具包支持八类最主要的二值网络,欢迎大家来使用。同时,我们还将 BiSRNet 嵌入到了我们之前开发的光谱重建工具箱 MST 当中。目前 MST 工具包已支持超过 12 类深度学习算法,并包含各种配套的可视化函数,欢迎大家来对比。

wKgaomVsc56AHhoZAAAl6LOgh3c585.png光谱压缩重建任务介绍

相比于常规的三通道 RGB 图像,高光谱图像包含几十上百个波段,从而捕获了关于成像场景更丰富的信息。也正因为这一重要特性,高光谱图像被广泛地应用于医疗,地形勘探,农业等领域。如图 2 所示,在医院进行检查时,如果只看常规的 RGB 图像可能很难诊断病因,但是如果采用高光谱图像捕获并在特定波长下渲染的话,就可以看清楚各类血管,骨骼结构等,从而辅助医生诊断。同样的原理也可应用在遥感地形勘探和农业病虫害检测。

wKgaomVsc5-AO7A6AAZHNQUitzI972.png

▲图2 高光谱图像的应用

然而高光谱图像并容易获取,传统的成像设备采用光谱仪对成像场景进行逐波段的扫描,费时费力,难以捕捉运动场景。近些年,科学家们专门设计了单曝光压缩成像(Snapshot Compressive Imaging,SCI)系统来解决这一问题。其光路结构如图 3 所示。

该系统首先通过一个编码孔径掩膜对成像场景的各光谱通道进行调制,然后通过一个三棱镜进行色散后在相机上捕获到一个二维的快照估计图(compressive measurement)。通过这个光路系统,我们便可将三维的光谱立方块压缩成一个二维的图像。而光谱压缩重建的任务便是从这个二维的压缩估计图上恢复出三维的高光谱数据。

wKgaomVsc5-ABFdEAARU9M4SX2I257.png

▲图3 单曝光压缩成像系统

当前的主流方法是采用的是全精度模型如 CNN 或者 Transformer 来学一个从压缩估计图到三维光谱立方块的映射。几个比较经典算法有我们之前的工作 MST,MST++,CST,DAUHST,HDNet 等(这些方法全部都开源在我们的工具箱 MST 当中)。

这类方法虽然取得了很好的重建效果,但却难以部署到移动端设备(如智能手机、相机、无人机等)上,因为移动端设备的内存空间,计算资源和电力均有限,无法运转全精度模型。另一方面,全精度模型的一些计算单元如深度展开算子和多头自注意力机制等相对复杂,移动端设备无法支持。为了推动光谱重建算法的实际应用,本文做了如下贡献:

(1)提出了光谱压缩重建领域内首个基于二值神经网络(Binarized Neural Network,BNN)的算法——二值化光谱重分布网络(Binarized Spectral-Redistribution Network,BiSRNet)。

(2)设计了一个新的二值化卷积单元——二值化光谱重分布卷积(Binarized Spectral-Redistribution Convolution,BiSR-Conv)。该卷积单元可以调整光谱表征的强度和分布,同时在反向传播中更好地逼近二值化符号(Sign)函数,从而让求得的梯度更加准确。

(3)制作了四个二值化卷积模块来解决特征图形变过程中的维度不匹配问题,从而让全精度信息能流通整个模型的每一层卷积单元以弥补二值卷积造成的信息损失。

(4)我们的 BiSRNet 显著地超越了当前最先进的二值化算法,甚至取得了能与全精度 CNN 比肩的效果,然而我们的 BiSRNet 算法却只需要极低的存储空间(约 0.06 %)和计算代价(约 1 %)。

wKgaomVsc5-AfHKrAAAtJ0fTuoM470.png

本文方法

2.1 基础模型

一般来说,用于二值化的全精度模型应该是比较轻量的且它的计算单元可以再移动端设备上运行。然而,现存的 CNN 或 Transformer 模型均不满足这一要求。为此,我们重新设计了一个简单,轻量,易于部署的基础模型(Base Model)。

受到之前工作 MST,MST++,CST,DAUHST 的启发,我们设计的基础模型也采用一个 U 形结构,如图 4 所示。

wKgaomVsc5-AP5IkAASFDtpAqCk484.png

▲图4 基础模型的网络结构

在这个基础模型中,采用的所有计算单元都可以被移动端设备支持,同时也不涉及计算复杂度高的操作。

2.2 二值化光谱重分布卷积单元

二值化光谱重分布卷积的细节如图 4(c)所示。将输入的全精度激活信号记为 。我们注意到,受到特定成像波长的限制,高光谱信号沿着光谱维度有着不同的强度与分布。为了适应光谱图像的这一特性,我们提议在二值化激活之前,按通道对高光谱图像表示进行重分布:

wKgaomVsc5-AKqqgAAAQUCI-D0c210.png

其中的 表示重分布后的激活。 表示可学习参数。然后 经过一个符号函数后被量化到 1 位的激活

wKgaomVsc6CAY4mGAAAmhlDOkGU686.png

如图 5(b)和(c)所示,由于符号函数是不可导的,之前的方法大都采用一个分段线性函数 Clip(x)或者二次函数 Quad(x)来在反向传播中拟合符号函数。

wKgaomVsc6CACZJrAAFMLlcBEqs399.png

▲图 5 符号函数与各类逼近函数的对比图

Clip(x)与 Quad(x)的具体表达式如下:

wKgaomVsc6CAZ6o-AABAxK7AE-k034.png

然而分段线性函数知识一个粗略的估计,它与符号函数之间依旧有着很大的误差。图 5 中的阴影部分面积就表示这个误差的大小,Clip(x)的误差是 1。此外,一旦激活或者权重的值落在了 [-1,1] 之外,他们就不会再被更新。尽管分段二次函数是一个更精确的逼近(误差为 2/3),上述的两个问题依旧存在。为此,我们设计了一个可缩放的双曲正切函数来在反向传播中拟合符号函数:

wKgaomVsc6GAOTt-AAAvB_4yjbk974.png

其中 是一个可学习的参数,自适应地调整 Tanh()与 Sign()之间的距离。我们证明当 时,Tanh()→ Sign()如下:

wKgaomVsc6GAYSWWAABmZOuOrgM511.png

我们仿照之前的二值化算法,定义然后我们可以得到:

wKgaomVsc6GAeJM2AAAd6rj5uxc468.png

我们计算图 5(d)中的阴影面积:

wKgaomVsc6GAHxBPAABm9UvZ2Cg495.png

由此可见,当 足够大时,Tanh()可以任意地逼近 Sign()。同时,我们的 Tanh()既不是分段函数,也不会因为 x 落在 [-1,1] 之外而无法更新。

更进一步,我们比较三个逼近函数的一阶导数。如图 5 下边一行所示取值范围均为 ,这着本质的区别。而我们以通过改变参数 来调整它的取值范围 和形状,从而更加灵活地逼

在二值化卷积层当中,32 位的权重 也被二值化到一位的权重

wKgaomVsc6GAaEVrAAAgEOvSUNc118.png

其中的 表示取均值。由此,计算繁重的全精度卷积操作便可由纯逻辑异或非运算(XNOR)与位计数(bit-count)操作替换如下:

wKgaomVsc6GAVa4vAAAoaSWeh8I209.png

因为全精度信息 的取值范围与二值卷积的输出 差别较大,直接引入残差连接将两者相加容易导致 的信息被淹没掉,所以先采用一个 RPReLU 激活函数来重塑 的取值范围:

wKgaomVsc6GAcfHtAAA0Ol_z078790.png

然后再引入残差链接:

wKgaomVsc6KAQmKUAAAc1nmtwfE996.png

通过我们的设计,全精度信息流就不会被二值卷积给阻断,从而能够顺畅地流过我们设计的 BiSR-Conv 单元,如图 4 (c) 中的红色箭头所示。

wKgaomVsc6KALu6jAAPXzkRMOgw342.png

▲图6 本文卷积二值卷积块与普通二值卷积块在处理特征图维度变化时的对比

全精度信息流在二值化算法中非常重要,因为它在一定程度上弥补了量化导致的信息损失。然而在特征图的上下采样过程中,由于维度发生了变化,难以直接引入残差链接以补充全精度信息,如图 6 中每个子图的左半部分所示。蓝色箭头表示二值信号,红色箭头表示全精度信息流。普通的二值卷积模块会在特征度维度改变的同时阻断全精度信息流的传递。然而我们的二值卷积模块通过采用分割合并的技巧,让全精度信息流不被阻断,从而在整个二值模型中流通。

wKgaomVsc5-AfHKrAAAtJ0fTuoM470.png

实验结果

3.1 量化指标

wKgaomVsc6KAQcy9AAau48xfLoQ304.png

▲表1 BiSRNet 与 SOTA BNN,传统方法,全精度CNN方法的量化指标对比 表 1 展示了我们的 BiSRNet 与 SOTA BNN,传统方法,全精度 CNN 方法的量化指标对比。可以看到,我们的 BiSRNet 显著超越了当前最先进的 BNN 算法 BTM 2.55 dB。同时超越了所有的 64 位传统算法,增幅超过了 4.49 dB。值得注意的是,我们的 BiSRNet 取得了能与全精度 CNN 方法比肩的性能,比如超过了 1.23 dB,然而却只占用了 0.06 % 的存储空间和 1 % 计算代价。

3.2 视觉对比

wKgaomVsc6KAQvF7AAZ04FQhqmw396.png▲图7 BiSRNet 与其他 BNN 方法在仿真数据及上的视觉对比wKgaomVsc6KAclbJAAVJ0W-RZIU240.png‍‍图8 BiSRNet 与其他 BNN 方法在真实数据集上的视觉对比

wKgaomVsc6OAfjN5AAAr2pbNr48215.png

总结

本文首次探索了压缩量化在光谱压缩重建领域的应用,提出了该领域首个二值化卷积神经网络 BiSRNet,在量化指标和视觉结果上都显著地超越了当前最先进的二值化模型。代码,预训练权重,重建结果均开源在:https://github.com/caiyuanhao1998/BiSCI ·


原文标题:NeurIPS 2023 | 清华ETH提出首个二值化光谱重建算法

文章出处:【微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 物联网
    +关注

    关注

    2950

    文章

    48130

    浏览量

    418513

原文标题:NeurIPS 2023 | 清华ETH提出首个二值化光谱重建算法

文章出处:【微信号:tyutcsplab,微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    清华大学体育锻炼数字案例:基于蓝牙物联网的学生运动健康管理

    消耗、跑圈成绩的个人报告。这些数据最终汇入学生的体育档案,成为其体育成绩评定的重要组成部分。 成效与价值 该项目的实施为清华大学体育教育带来了显著的数字变革。该系统实现了从“凭经验”到“靠数据”的转变
    发表于 04-15 17:31

    PID控制的算法

    语言实现 PID算法的离散上一节中,我论述了PID算法的基本形式,并对其控制过程的实现有了一个简要的说明,通过上一节的总结,基本已经可以明白PID控制的过程。这一节中先继续上一节内
    发表于 01-23 08:18

    光谱成像:分析波长,可视细微的色彩、材质差异和异物

    在机器视觉系统成像过程中,光源起着重要作用,合适的光源方案可以极大降低图像处理算法的复杂度,提高系统的稳定性、精度和速度。近年来,各领域利用高光谱成像技术进行检测的市场规模不断扩大,对高光谱相机
    的头像 发表于 12-26 17:02 715次阅读
    高<b class='flag-5'>光谱</b>成像:分析波长,可视<b class='flag-5'>化</b>细微的色彩、材质差异和异物

    AQ24ETH - 02HTG双向TVS极管:汽车电子ESD防护新选择

    AQ24ETH - 02HTG双向TVS极管:汽车电子ESD防护新选择 在汽车电子领域,静电放电(ESD)对敏感电子设备的威胁不容小觑。为了有效保护汽车电子系统,一款高性能的ESD防护器件至关重要
    的头像 发表于 12-15 16:25 920次阅读

    地平线五篇论文入选NeurIPS 2025与AAAI 2026

    近日,两大顶级学术会议录用结果相继揭晓,地平线凭借在机器人算法领域的深度钻研,共有5篇论文从全球数万份投稿中脱颖而出,分别入选NeurIPS 2025与AAAI 2026。
    的头像 发表于 11-27 11:39 1380次阅读
    地平线五篇论文入选<b class='flag-5'>NeurIPS</b> 2025与AAAI 2026

    使用Otsu阈值算法将灰度图像

    Otsu 算法是由日本学者OTSU于1979年提出的一种对图像进行的高效算法,又称“最大类
    发表于 10-28 06:49

    思必驰与上海交大联合实验室五篇论文入选NeurIPS 2025

    近日,机器学习与计算神经科学领域全球顶级学术顶级会议NeurIPS 2025公布论文录用结果,思必驰-上海交大联合实验室共有5篇论文被收录。NeurIPS(Conference on Neural
    的头像 发表于 10-23 15:24 1102次阅读
    思必驰与上海交大联合实验室五篇论文入选<b class='flag-5'>NeurIPS</b> 2025

    全球首款!国产光谱成像芯片实现亚埃米级快照

    电子发烧友网报道(文 / 吴子鹏)日前,清华大学电子工程系方璐教授团队宣布,成功研制出全球首款亚埃米级快照光谱成像芯片 “玉衡”。这一成果不仅标志着中国在智能光子技术领域取得重大突破,也为高精度成像
    的头像 发表于 10-17 09:20 9472次阅读

    什么是快照式光谱成像相机?

    相比,快照式技术具有以下优势: 实时性:无需机械扫描,可快速捕捉动态目标(如高速运动物体、活体组织) 无运动伪影:避免因扫描过程中的运动导致的图像模糊 高效率:单次成像即可获得完整数据立方体(空间×光谱、快照式光谱成像相机
    的头像 发表于 09-12 11:35 856次阅读
    什么是快照式<b class='flag-5'>光谱</b>成像相机?

    PPEC电源DIY套件:图形算法编程,解锁电力电子底层算法实践

    智能设计平台,为用户提供了一个接触和操作底层算法的便捷途径。 用户无需进行复杂的代码编写,可以一键套用工程模版,也可以通过图形界面自定义控制算法,就能够轻松在实验室有限的环境中制
    发表于 08-14 11:30

    光谱与高光谱工业相机的区别

    光谱相机可应用于自动检测、质量管理、回收分类、医疗诊断等多个领域
    的头像 发表于 08-08 16:28 1199次阅读
    多<b class='flag-5'>光谱</b>与高<b class='flag-5'>光谱</b>工业相机的区别

    机载高光谱系统与机器学习算法结合实践丨双利合谱机载高光谱相机在小麦监测应用

    板校正、大气校正和 NDVI 计算来增强植被与背景的区分度。在 FVC 提取方面,对比了像素分法、DPK-means 算法和支持向量机(SVM)分类,最终,研究通过误差分析(EF、RMSE)、拟合度(R²)和误差分布图评估不同方法的表现,验证 DPK-means
    的头像 发表于 07-24 16:36 890次阅读
    机载高<b class='flag-5'>光谱</b>系统与机器学习<b class='flag-5'>算法</b>结合实践丨双利合谱机载高<b class='flag-5'>光谱</b>相机在小麦监测应用

    太阳光模拟器性能的影响参数:光谱匹配度、光谱覆盖率及光谱偏离率

    A⁺级匹配度时,各波段辐照度占比与标准光谱的偏差可控制在 10% 以内,反之,低匹配度将导致测试结果出现系统性偏差。 光谱覆盖率SPC:量化光谱完整性的指标AM1.5G 标准
    发表于 07-21 15:35

    航天宏图全栈式3DGS实景三维重建系统解决方案

    表达的核心技术,通过相机、传感器等设备获取物理空间数据,并结合计算机视觉与图形学算法,将维图像转换为三维模型。目前,主流的三维重建方法包括倾斜摄影(多视角立体重建)、激光扫描和神经辐
    的头像 发表于 06-27 09:28 1979次阅读
    航天宏图全栈式3DGS实景三维<b class='flag-5'>重建</b>系统解决方案

    清华大学携手华为打造业内首个园区网络智能体

    清华大学响应国家教育新基建战略,正在加速推进网络管理平台升级:为满足在线教育、协同创新及智慧校园的发展需求,为清华大学跻身世界一流大学创造基础条件,清华大学携手华为打造业内首个园区网络
    的头像 发表于 05-07 09:51 982次阅读