0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Google Pixel3在相机算法的升级路上越战越勇

电子工程师 来源:lq 2018-12-03 10:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

想要提高拍照效果,想必对于多数手机厂商而言,给手机塞进更多的摄像头似乎成了当前主流做法,例如“普通摄像头+景深摄像头”、“黑白+彩色摄像头”、“广角+长焦摄像头”……不过,偏偏有这么一家企业反其道而行,从发布 Pixel 系列以来,就一直坚持单摄像头,并强调在相机成像算法上的提升。

不久前的一篇《胜过 iPhone XS?Google Pixel 的“夜视功能”是怎样炼成的》文章中,我们介绍了 Google 新款手机 Pixel3 系列的夜景拍摄功能(Night Sight)。果然,读者们对于如何利用机器学习解决弱光条件下的拍摄难点持有很大兴趣。近日,Google Pixel3 在相机算法的升级路上越战越勇,对“人像模型”(Portrait Mode)拍摄功能进行了大幅升级。相比上一代的 Pixel2,Pixel3 的人像模式可为用户提供专业的外景图像拍摄,并通过模糊背景来加强主体对象的清晰度。

去年,Google 团队描述了相位检测自动对焦(PDAF)的技术,该技术使用了传统的非学习立体算法,并通过单个摄像头计算景深。如今,在最新推出的 Pixel 上,Google 将采用机器学习改进景深捕捉,以获取更好的人像效果。

如上图所示,上一代的人像模式主要通过神经网络决定人与背景成像像素,并使用从 PDAF 导出的景深信息来增强这两层人物的分割掩码(segmentationmask)。这意味着能够实现相应的背景虚化效果,更接近于专业相机的效果。

PDAF 通过捕捉场景的两个略微不同的视角进行工作,如下图所示。在两个视角之间翻转,我们看到人是静止的,而背景是水平移动的,这种效果成为视差(parallax)。因为视差是点距相机的距离与两个视点之间距离的函数,我们可以通过将一个视角中的每个点与另一个视角中的对应点进行匹配来估计景深。

图注:左、中的两个 PDAF 图像看起来非常相似,但在右图中,可以看到它们之间的视差

不过,通过立体算法在 PDAF 中找到这些对应关系极具挑战性,因为场景中的点几乎不在视图之间移动。此外,所有的立体声技术都存在孔径问题(Aperture Problem)。也就是说,机器通过小光圈观察场景,无法找到与立体基线平行的线的对应关系,即连接两个摄像头的线。换言之,当观察上图中的水平线(或纵向拍摄的垂直线)时,一个视角相对于另一个视角的任意可能的位移都看起来大致相同。结果,在上一代的人像模式中,以上提到的所有因素都有可能导致景深捕捉错误,产生令人不快的虚假图像。

如何改善景深捕捉?

Pixel3 采用的人像模式,通过利用立体算法产生的视差来修复这些误差。例如,远离焦距平面的点看起来不如较近的点那么清晰锐利,利用了“背景离焦”模式。此外,即使在平面屏幕上观看图像,也能通过物体的大致大小准确判断物体有多远,利用了“语义”模式。

如果构建一种能将以上不同的模式组合起来的算法是非常困难的,但我们可以通过机器学习进行构建,并更好地利用 PDAF 的“视差”。具体来讲,训练一个用 TensorFlow 编写的卷积神经网络,可以将 PDAF 作为输入并进行景深预测。这种新式改进的基于机器学习的景深捕捉方法被应用在了 Pixel3 的人像模式中。

图注:CNN 将 PDAF 图像作为输入,并输出景深图像。该网络使用“编码-解码”架构

如何训练神经网络?

为了训练网络,开发人员需要大量的 PDFA 图像和对应的高质量景深图,并且保证训练数据与用户使用智能手机拍摄的照片内容类似。为了实现这一目标,我们构建了自己的定制“Frankenphone”装备,其中包括五台 Pixel3 手机,以及基于 WiFi 的解决方案,使其能够同时捕捉来自所有手机的图片(在~2 毫秒的容差范围内)。通过这个设备,我们使用来自运动和多视图立体的结构从照片计算出高质量的景深。

图注:左:用于收集训练数据的自定义装备;中:一个捕获五个图像翻转的示例;右:真实景深,低保真点

该装备收集的数据适用于训练网络,主要基于以下五点因素:

五个视点确保在多个方向上存在视差,因此不存在孔径问题;

摄像头的位置要确保图像中的某一点在至少一张图像中是可见的,并一一对应;

基线,即相机之间的距离要比 PDAF 的基线大得多,从而产生更准确的景深捕捉;

摄像头同步确保可以计算上述动态场景的景深;

该装备具有便捷性,确保可捕捉野外照片,模拟用户使用智能手机拍摄的情况。

然而,即使从该装备捕获的数据是理想状态,预测场景中物体的绝对深度仍然极具挑战性,因为取决于镜头特性、焦距等因素,给定的 PDAF 对可以对应一系列不同的景深图像。为了解释这一点,我们改为捕捉场景中物体的相对景深,这足以产生令人满意的人像模式结果。

值得一提的是,这个基于机器学习模式的景深捕捉模型目前主要应用于 Pixel3 手机上。此外,通过使用 TensorFlow Lite 用于在移动和嵌入式设备上运行机器学习模型的跨平台解决方案,可以将得到的景深信息与分割掩码神经网络进行结合。

看到这里,不知道习惯了使用 iOS 系统手机的你,是不是正蠢蠢欲动回归在性能、价位日益提升的 Android 手机呢?

据最新消息称,Google 决定开放自己的相机算法授权给其他 Android 品牌使用,此前 Google 就开源了 Pixel2 系列的相机虚化算法。欢迎留言。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4827

    浏览量

    106797
  • 摄像头
    +关注

    关注

    61

    文章

    5058

    浏览量

    102444
  • AI算法
    +关注

    关注

    0

    文章

    270

    浏览量

    13056

原文标题:三摄正普及,四摄在路上?谷歌逆天AI算法,只做单摄虚化

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Google Pixel 10上“听诊”蓝牙信道?开源安卓应用实测揭秘

    的应用开发工具箱注入精准距离估算能力。开发者首次能够通过Nordic Semiconductor的开源应用,搭载nRF54L系列设备的Pixel 10智能手机上评估并运用蓝牙信道探测技术。 本次更新
    发表于 11-30 21:09

    nordic NRF54蓝牙设备Google Pixel 10上“听诊”蓝牙信道示例

    说明如何使用 nRF Connect SDK 中的蓝牙信道探测反射器示例程序(运行于 nRF54L15 SoC),配合搭载 Android 16 系统蓝牙信道探测发起器及算法实现的 Google Pixel
    发表于 11-26 17:44

    当乐鑫科技ESP32-S3遇到摄像头,秒变AI相机

    跨越算法到硬件的鸿沟,启明云端不断凭借完整的AI硬件解决方案帮助各个企业实现了AI创意落地。这次“AI梦想实现家”又抓住了谁的灵感让它成真了?AI与相机的碰撞能擦出怎样的火花?这款新版AI相机给出
    的头像 发表于 10-21 18:05 331次阅读
    当乐鑫科技ESP32-S<b class='flag-5'>3</b>遇到摄像头,秒变AI<b class='flag-5'>相机</b>

    【awinic inside】艾为芯助力Google Pixel10系列:点亮影像与显示的全新境界

    北京时间8月21日,Google正式揭开了新一年硬件产品线的全新篇章,发布了备受瞩目的Pixel10系列智能手机。Pixel10搭载TensorG5芯片,改采用台积电3纳米制程。整体而
    的头像 发表于 08-28 18:43 477次阅读
    【awinic inside】艾为芯助力<b class='flag-5'>Google</b> <b class='flag-5'>Pixel</b>10系列:点亮影像与显示的全新境界

    Zivid3D相机安装使用教程

    Zivid3D相机小巧便携,重量轻,分辨率高,速度快,适合高反光透明物体。本文介绍Zivid 3D相机的操作流程,帮助用户掌握其功能。从硬件连接、软件安装到参数设置,重点涵盖点云生成、
    的头像 发表于 08-26 15:34 432次阅读
    Zivid<b class='flag-5'>3</b>D<b class='flag-5'>相机</b>安装使用教程

    3D工业相机价格是?这种3D工业相机性价比最高

    3D 工业相机市场,一场价格与质量的博弈已然展开。企业选择时面临着艰难困境,国际品牌筑起高高的价格壁垒,国产品牌又深陷低价低质的怪圈。我们该如何为打破这一局面?
    的头像 发表于 07-29 11:25 713次阅读
    <b class='flag-5'>3</b>D工业<b class='flag-5'>相机</b>价格是?这种<b class='flag-5'>3</b>D工业<b class='flag-5'>相机</b>性价比最高

    Google Fast Pair服务简介

    Elliptic Curve Diffie–Hellman key Exchange算法改良后生成的)。 关于initial pairing和Subsequent pairingSPEC中的原文和翻译如下
    发表于 06-29 19:28

    shimetapi:开源RGB+EVS视觉融合相机事件相机工具链与算法

    事件相机的原始数据流,执行高级的计算机视觉算法,以提升数据质量、提取有用信息或进行三维理解。 包含的模块: 降噪 (Denoise): 去除事件流中的噪声,提高信号质量。 插值 (Inter
    的头像 发表于 06-26 13:52 464次阅读

    迁移科技推出全新3D智能相机

    工业视觉领域迎来里程碑式突破!迁移科技正式发布全系升级3D智能相机,将强悍算力直接嵌入相机内部,替代传统 “相机 + 工控机 + 显卡”
    的头像 发表于 05-29 13:58 720次阅读

    2025年3D工业相机选型及推荐

    3D工业相机的选型
    的头像 发表于 05-21 16:49 1133次阅读
    2025年<b class='flag-5'>3</b>D工业<b class='flag-5'>相机</b>选型及推荐

    Gemini API集成Google图像生成模型Imagen 3

    开发者现在可以通过 Gemini API 访问 Google 最先进的图像生成模型 Imagen 3。该模型最初仅对付费用户开放,不久后也将面向免费用户推出。
    的头像 发表于 05-14 16:53 945次阅读

    滨松光子的相机研发史:ORCA系列与qCMOS的诞生(下)

      自1971年,滨松光子开始研发相机以来(追溯1971,滨松光子的相机研发史(上)),滨松光子的世界里,时间就像是一条长长的路,而他们研发的相机,就像是
    的头像 发表于 03-17 06:23 626次阅读
    滨松光子的<b class='flag-5'>相机</b>研发史:ORCA系列与qCMOS的诞生(下)

    东风本田300万辆CR-V越战越勇

    中国车市依然处在动荡中。 新能源时代的洗礼下,传统车企,尤其是合资车企开始走向衰落,一批批曾经风靡市场的品牌和车型被汰换掉,留下来且还能与新势力一争高下着的属实已经不多见了。 东风本田旗下
    的头像 发表于 01-17 12:28 1407次阅读

    广和通推出多功能AI红外相机解决方案

    近日,广和通推出多功能AI红外相机解决方案,融合AI算法、AI模型、传感器,助力户外打猎、森林防火、国土资源监管、电网监拍等领域智能化升级
    的头像 发表于 01-15 14:24 946次阅读

    康谋方案 | 多源相机数据采集与算法集成测试方案

    如何满足不同应用场景下对图像采集和算法测试的多样化需求?本文为您带来多源相机数据采集与算法集成测试方案,通过BRICKplus/BRICK2与ADTF的结合,轻松实现多源相机快速集成和
    的头像 发表于 12-11 09:59 4054次阅读
    康谋方案 | 多源<b class='flag-5'>相机</b>数据采集与<b class='flag-5'>算法</b>集成测试方案