0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌正式推出ARCore 1.7版本,为其添加了前置摄像头AR自拍能力以及动画效果支持

jmiy_worldofai 来源:lp 2019-03-14 15:27 次阅读

ARCore 是谷歌于去年 2 月份正式推出的 增强现实(AR)软件开发工具包,给开发者提供了一个开发 AR APP 的平台。不到一个月前,谷歌正式推出ARCore 1.7 版本,为其添加了前置摄像头 AR 自拍能力以及动画效果支持;而日前,谷歌又为其引入了机器学习技术,使其实时自拍 AR 的逼真效果更进一步,该技术相关的文章发布在谷歌 AI 的官方博客上。

增强现实(AR)通过将数字内容与信息叠加到物质世界的真实场景中,来让人类实现超越现实的感官体验。例如,谷歌地图的 AR 功能,能够在现实场景中叠加方向信息来为你指路。借助于Pixel 相机中的 Playground 模式,你可以使用 AR 从不同的视角看世界。并且通过借助于最新发布的「YouTube Stories」以及ARCore 全新的面部增强(Augmented Faces)API,你可以在自拍上添加动画面具、眼镜、帽子、皮肤等特效。

实现这种 AR 功能的关键挑战之一,就是以合适的方式将虚拟内容锚定到现实世界:这一过程需要一套能够追踪到每一次微笑、皱眉或假笑的高动态表面几何结构的独特的感知技术。

ARCore 的3D 网格以及它能实现的一些特效

为此,我们引入了机器学习(ML)技术来推断近似的 3D 表面几何结构,并且仅需要用到一个单摄像头输入而无需使用专用的深度传感器。这种方法利用面向移动 CPU 界面推断或其可用的全新移动 GPU 功能的TensorFlow Lite,实现了逼真的实时 AR 效果。与「 YouTube Stories」 全新的创作者特效所利用的技术一样,这项技术已通过最新的 ARCore SDK和ML Kit Face Contour Detection API向广泛的开发者社区开放。

用于自拍 AR 的机器学习工作流

我们的机器学习工作流由两个协同工作的实时深度神经网络模型组成:一个是探测器,它在整张图像上运行并计算出面部位置;另一个是通用的 3D 网格模型,它在探测器计算出来的面部位置上运行,并通过回归预测近似的表面几何结构。精确地裁剪面部能够极大地减少对一般的数据增强的要求,例如由旋转、平移和比例变换组成的仿射变换(affine transformations)等,同时让网络将大部分性能投入于预测坐标来提高其准确性——这对于锚定合适的虚拟内容至关重要。

裁剪完所关注的位置后,该网格网络一次仅应用于一个单帧,并利用加窗平滑(windowed smoothing)来减少面部处于静态时的噪音,同时避免在大幅移动期间出现的延迟。

针对 3D 网格,我们采用了迁移学习,并训练了一个具有多个目标的网络:该网络能够同时地基于合成、渲染的数据预测 3D 网格坐标以及基于类似于MLKit所提供的带有注释的、现实世界的数据预测 2D 语义轮廓。最终的网络为我们提供了基于合成数据乃至现实世界数据的合理的 3D 网格预测。所有模型都在源自于地理学多样化的数据集的数据上进行训练,并接着在平衡、多样化的测试集上进行定性和定量性能的测试。

3D 网格网络接收经裁剪的视频帧作为输入。由于它不依赖于额外的深度输入,因而也可以应用于预先录制的视频。该模型不仅输出 3D 点的位置,还输出在输入中存在并合理对齐的面部概率。一种常见的替代方法就是为每个地标预测出 2D 热图,但这种方法并不适用于深度预测,并且对于如此多的数据点来说,使用这种方法耗费的计算成本非常高。

通过迭代自展和精炼预测,我们进一步提高了模型的准确性和鲁棒性,同时也将数据集发展成为愈加具有挑战性的实例,如鬼脸,拍摄角度倾斜以及面部遮挡等。此外,数据集增强技术也扩展了可用的 ground truth 数据,并开发出了对摄像头瑕疵等人工产品问题或极端光照条件具有弹力的模型。

数据集扩展和改善路径

专为硬件定制的界面

我们使用 TensorFlow Lite 进行设备内置的神经网络推理。新推出的 GPU 后端加速能够有效提升性能,并显著降低功耗。此外,我们还设计了具有不同性能和效率特性的一系列模型架构,来覆盖到更加广泛的消费级硬件。较简单网络之间的最重要的区别就在于残差块(Residual Block)设计和可接受的输入分辨率(最简单模型中的输入分辨率为 128×128 像素,而最复杂模型中的输入分辨率为 256×256)。同时,我们还改变了层数以及子采样率(输入分辨率随网络深度的减少而减少的速度)。

每一帧的推断时间:CPU vs. GPU

这一系列的优化的结果就是:使用更简单的模型带来了实质性的加速,同时也将 AR 特效质量的降低幅度最小化。

这些成果最终则能够通过以下方式,让用户在 YouTube、ARCore 以及其他客户端体验到更加逼真的自拍 AR 效果:

通过环境映射模拟光反射,来实现眼镜的逼真渲染;

通过将虚拟的目标阴影投射到面部网格上,来实现了自然光照效果;

对面部遮挡进行建模,来隐藏面部后面的虚拟目标部分,如下所示的虚拟眼镜案例。

另外,我们还通过以下方式实现了逼真的妆容效果:

对应用到嘴唇上的镜面反射进行建模;

利用亮度感知材料来实现面部着色。

案例对比:5 个目标在不同光线下的真实化妆效果以及 AR 化妆效果

我们很高兴将这项新技术分享给创作者、用户以及开发者。感兴趣的读者可以通过下载最新的 ARCore SDK (下载地址:https://developers.googleblog.com/2019/02/new-ui-tools-and-richer-creative-canvas.html)来将这项技术用起来。未来,我们还计划将这项技术广泛应用到更多的谷歌产品线中。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 探测器
    +关注

    关注

    14

    文章

    2431

    浏览量

    72037
  • 神经网络
    +关注

    关注

    42

    文章

    4562

    浏览量

    98646
  • 机器学习
    +关注

    关注

    66

    文章

    8095

    浏览量

    130519

原文标题:通过引入 ML,谷歌 ARCore 实时自拍 AR 的逼真效果更进一步

文章出处:【微信号:worldofai,微信公众号:worldofai】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    安卓主板的摄像头旋转、前置、后置摄像头镜像如何设置?

    摄像头
    广州向成电子科技有限公司
    发布于 :2023年07月07日 21:04:42

    摄像头的主要结构和组件

    ,此外它在自动曝光/增益/白平衡/色彩/噪点控制/伽玛校正以及动态缩放边缘抗锯齿算法方面都有独到之处,图像转换速度也非常快。据了解,保证摄像头基础画质和产品稳定,极速紧跟中星微步伐,已推出
    发表于 04-14 11:38

    OPPO将推自拍新利器U2S 5.5吋屏前置500万+大光圈

    版本,一键美颜3.0能够提供更加真实的美颜效果。 据介绍此次,U2S选择了一颗最好的800万像素摄,并且配备了ISP图像传感器,据称成像效果可媲美iPhone 5。 根据OPPO产品
    发表于 05-30 22:11

    【转载分享】USB摄像头采集图像

    `如果你有USB摄像头,就是随便的那种。平时QQ视频的就可以了(笔记上自带的摄像头,也可以),那你就可以用LabVIEW进行图像采集了。注意:由于LabVIEW8.6是个神奇的版本
    发表于 03-02 11:36

    labview无法打开电脑笔记摄像头

    labview 的VAS,VBAI,VMD都安装了的为什么还是无法查看到笔记自带的摄像头,USB摄像头也不行,电脑是WIN10版本的。
    发表于 05-09 13:52

    ESM6802支持Qt摄像头应用

    版本。使用Qt的multimedia模块可以方便快捷的进行摄像头应用的开发,本文使用Qt源码中提供的camera例程进行展示,例程代码可从Qt源码中获取或者向我们工程师索要。  我们使用的摄像头
    发表于 10-20 10:33

    USB摄像头怎么调图像效果

    有没有做USB摄像头的,会调图像效果的?
    发表于 11-14 16:38

    如何快速 MCU 添加人脸识别摄像头

    - 1000 的十进制数表示。摄像头支持图像输出功能,主要用于开发人员设置摄像头和对准方向时的调试辅助。它的分辨率 320 x 240,还不足以用作安防监视器。如果需要流媒体视频,
    发表于 08-01 10:10

    回收vivo摄像头高价收购vivo摄像头

    ``回收vivo摄像头 前后大小像,深圳帝欧电子135-3012-2202,QQ:8798-21252专业高价回收回收帝欧电子高价收购vivo手机后置摄像头!帝欧高价上门求购vivo手机前置
    发表于 04-21 17:16

    Jacinto7处理器摄像头接入和ISP的处理能力

    的处理能力和极具竞争力的成本,ADAS技术实现提供了极具竞争力的平台。 在ADAS的应用中,摄像头作为感知模块,越来越多地摄像头被部署在应用中,感知
    发表于 11-03 06:05

    Scope AR通过谷歌ARCore功能,将Remote AR进一步应用到移动AR领域

    Scope AR通过利用谷歌最近发布的ARCore功能,决定将其远程协助企业应用程序Remote AR进一步应用到移动AR领域。 虽然之前
    发表于 05-16 10:14 1626次阅读

    谷歌推出支持多人AR体验的ARcore

    AR云基于ARCore的运动跟踪功能,简单来说,通过寻找虚拟物体的特殊点并创建稀疏点云来起作用。
    的头像 发表于 05-16 15:42 4224次阅读

    谷歌ARCore:安卓上的AR平台,诺基亚8已获得支持

    谷歌ARCore是安卓上的AR平台,该平台支持iOS和安卓系统。此前HMD官方已经确认诺基亚8等手机将获得这一平台的支持,现在据外媒实测,诺
    发表于 08-16 17:03 792次阅读

    谷歌ARCore可以帮助开发者构建AR应用程序

    2018年10月17日,谷歌用于开发AR应用程序的工具ARCore已经新增了一系列的设备支持。这个工具可以帮助开发者构建AR应用程序,从而
    发表于 10-21 11:17 1265次阅读

    谷歌ARCore的Depth API用单个摄像头能创建深度图

    Android增强现实(AR)取得重大进步,近日谷歌正在为开发工具包ARCore添加Depth API,这项新功能仅用单个摄像头就可以创建深
    的头像 发表于 12-11 16:21 3623次阅读