0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

可用于水下形成清晰图像的机器学习算法,高度还原拍照颜色与亮度

牵手一起梦 来源:大数据文摘微信公众号 作者:大萌、夏雅薇 2020-01-17 13:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

你有过水下拍摄照片的经历吗?你是否注意到水下拍摄的图片总是有些模糊甚至失真?这是由于光的衰减和反向散射效应导致水下能见度较低。

为了解决这个问题,哈尔滨工程大学的科研人员设计了一种机器学习算法用于生成逼真的水下图像,以及一种基于生成的图像进行训练从而实现自然色恢复和除雾的算法。团队表示该算法在图片处理质量和数量上都与顶尖技术水平相当,该算法每秒在单个显卡上处理的帧数可达125帧。

图:图像增强前后的水下目标探测结果。(A)真实的水下照片和(B)基于模型输出的真实照片。红色框内为扇贝,蓝色框内为海参,绿色框内为海胆。

团队表示大多数水下图像增强算法(例如调节白平衡算法)都不是基于物理成像模型构建的,因此算法的泛化能力较差。而该技术采用的方法是首先利用生成对抗网络(GAN)来生成一组特定调查地点的图像,再将这组图像输入给第二个算法,U-Net。其中GAN是一种由生成器构成的AI模型,用于使鉴别器在分类过程中将合成样本归类为真实样本。

团队运用3733个带标签的图像以及对应的深度地图训练GAN,图像主要包括扇贝、海参、海胆及其他水产养殖生物。他们还获得了包括NY Depth在内的公开数据集,该数据集总共包含数千张水下照片。

训练完成后,研究人员将双模型方法的结果与基线模型方法的结果进行对比。结果表明,该方法优势体现在两方面,一方面是颜色还原均匀,另一方面是可以在不破坏原始输入图像的底层结构的情况下很好地还原绿色色调的图像。通常情况下,该方法还能够在保持“适当的”亮度和对比度的同时还原颜色,这是其他图像增强方法所做不到的。

不过研究团队基于受损图片重建图像的方法并非首创。剑桥咨询公司的AI系统DeepRay用10万个静止图片来训练GAN网络,用来消除由不透明玻璃板导致的图片失真。开源的DeOldify计划采用了包括GAN的一系列AI模型来对旧照片和胶卷进行着色和还原。

此外,微软亚洲研究中心的科学家在去年九月详细介绍了一个用于给视频自动着色的端到端系统。去年英伟达的研究人员构建了一个框架,该框架仅基于一个带注释的着色视频帧就能推断颜色。并且谷歌的AI团队在去年六月推出了一种无需人工监督即可对灰度视频进行着色的算法。

责任编辑:gt

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    42075

    浏览量

    303112
  • 机器学习
    +关注

    关注

    67

    文章

    8570

    浏览量

    137431
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    水下机器人测试:为深海“探路者”铸就的极限生存考验

    水下机器人测试是指对遥控水下机器人(ROV)、自主水下机器人(AUV)或混合式水下机器人在研发、定型或交付前,通过一系列模拟与真实环境试验,全面验证其结构可靠性、运动性能、感知能力、通
    的头像 发表于 04-14 14:45 328次阅读
    <b class='flag-5'>水下机器</b>人测试:为深海“探路者”铸就的极限生存考验

    索尼FCB-EV9500L+CM2001M赋能水下机器

    传输与成像难题。 核心硬件组合:精准适配水下场景的视觉核心 FCB-EV9500L:严酷水下环境的高清成像利器 索尼FCB-EV9500L专为严苛场景设计,拥有1/1.8英寸STARVIS™ CMOS Sensor图像传感器,4
    的头像 发表于 04-08 16:22 290次阅读

    BLDC芯片(MDF101A)丨高精度、低噪音、高效率的水下推进控制方案

    BLDC芯片(MDF101A)丨高精度、低噪音、高效率的水下推进控制方案 高精度、低噪音、高效率的水下推进器 一、方案概述 本文所探讨的水下推进器针对应用于个人手持
    发表于 04-07 15:56

    算法工程师需要具备哪些技能?

    (PCA)、异常检测等。强化学习:Q-learning、Policy Gradient等(适用于游戏AI、机器人控制)。 深度学习神经网络基础:前向传播、反向传播、激活函数等。CNN:
    发表于 02-27 10:53

    激光雷达助力泳池水下机器人建图+定位全覆盖

    激光雷达助力泳池水下机器人建图+定位全覆盖
    的头像 发表于 02-25 14:24 427次阅读
    激光雷达助力泳池<b class='flag-5'>水下机器</b>人建图+定位全覆盖

    穿孔机顶头检测仪 机器视觉深度学习

    ,能适用恶劣工况,在粉尘、高温、氧化皮等恶劣环境中均可正常工作。 测量原理 利用顶头与周围的物质(水、空气、导盘等)红外辐射能量的差异,用热成像相机拍摄出清晰的图片,再通过深度学习短时间内深度优化,判断
    发表于 12-22 14:33

    用于暂态波形存储的数据压缩算法需要考虑哪些因素?

    还原精度与关键特征保留:确保数据 “可用” 暂态波形的核心价值是支撑故障分析(如电压暂降原因定位、谐波源追溯),压缩算法需优先保障 关键信息不丢失 ,而非单纯追求高压缩比。 还原误差
    的头像 发表于 11-05 15:02 509次阅读

    亿光闪光灯LED:高亮度与高显色性的摄影光源技术突破

    在摄影摄像领域,光线条件往往复杂多变,优质的光源对于捕捉清晰、色彩还原准确的画面至关重要。亿光闪光灯LED凭借高亮度与高显色性的摄影光源技术突破,在该领域占据了重要地位。高亮度确保在低
    的头像 发表于 10-28 14:25 1477次阅读
    亿光闪光灯LED:高<b class='flag-5'>亮度</b>与高显色性的摄影光源技术突破

    基于FPGA的CLAHE图像增强算法设计

    CLAHE图像增强算法又称为对比度有限的自适应直方图均衡算法,其算法原理是通过有限的调整图像局部对比度来增强有效信号和抑制噪声信号。
    的头像 发表于 10-15 10:14 900次阅读
    基于FPGA的CLAHE<b class='flag-5'>图像</b>增强<b class='flag-5'>算法</b>设计

    机器视觉检测PIN针

    角度,凸显Pin针轮廓、高度差异及表面缺陷(如划痕、异物)。精密运动平台(可选):用于多角度成像或定位被测连接器。核心检测算法:定位与计数: 模板匹配或Blob分析快速定位连接器及所有Pin针,确保数量
    发表于 09-26 15:09

    PID控制算法学习笔记资料

    用于新手学习PID控制算法
    发表于 08-12 16:22 7次下载

    FPGA在机器学习中的具体应用

    ,越来越多地被应用于机器学习任务中。本文将探讨 FPGA 在机器学习中的应用,特别是在加速神经网络推理、优化
    的头像 发表于 07-16 15:34 3182次阅读

    【嘉楠堪智K230开发板试用体验】K230机器视觉相关功能体验

    K230开发板摄像头及AI功能测评 摄像头作为机器视觉应用的基础,能够给机器学习模型提供输入,提供输入的质量直接影响机器学习模型的效果。 K
    发表于 07-08 17:25

    超声波水下测距换能器:探索水下世界的“千里眼”

    工程的质量和安全。 (二)海洋资源勘探 在海洋资源勘探领域,超声波水下测距换能器可以用于测量海底地形、探测沉船和水下矿产资源等。通过精确的测距,科学家们可以绘制出详细的海底地图,为海洋资源的开发和利用
    发表于 06-26 10:43

    肇观电子推出W系列水下机器人视觉模组

    在此背景下,肇观电子推出全球首创W系列水下机器人视觉模组,以光学视觉革命突破水下感知瓶颈!
    的头像 发表于 06-17 14:58 1881次阅读
    肇观电子推出W系列<b class='flag-5'>水下机器</b>人视觉模组