0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌推出ARCore,手机上体验宇宙大爆炸,实现AR效果

jmiy_worldofai 来源:杨湘祁 作者:电子发烧友 2019-03-11 08:38 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

谷歌艺术与文化推出新作品,手机上体验宇宙大爆炸,并可以作为背景进行自拍。而谷歌博客解释了如何使用ARCore和机器学习,只用一个手机摄像头就可以实现给自拍加AR特效的工作原理

谷歌与欧洲研究机构CERN合作创建了一个增强现实应用程序,可以让用户通过手机体验宇宙大爆炸Big Bang,感受上帝创世纪时候的宏伟壮阔。

应用程序将带给你一场360度的奇幻旅程,从宇宙诞生开始,到第一颗恒星诞生,直到我们的太阳系,以及地球的出现。

更有意思的是,你还可以以大爆炸作为背景,进行自拍!可以说是超炫酷了。各大应用商店搜索Google Arts & Culture下载。

如果你使用的是Android手机,你需要确认一下是否装了ARCore。

ARCore是谷歌推出的搭建增强现实(Augmented Reality,简称 AR)应用程序的软件平台,类似苹果的ARKit,它可以利用云软件和设备硬件的进步,将数字对象放到现实世界中。

用ARCore实现AR效果

增强现实,是一种实时地计算摄影机影像的位置及角度并加上相应图像的技术,这种技术的目标是在屏幕上把虚拟世界套在现实世界并进行互动。

这种技术最早于1990年提出。随着随身电子产品运算能力的提升,增强现实的用途越来越广。比如下面这个动图,通过AR设备你可以看到实际并不存在的蓝色光圈。

AR已经被广泛应用于自拍、短视频、直播app中,可以实现一些好玩的效果。而其中最关键的挑战在于将虚拟内容适当地锚定到现实世界中。这个过程需要一套独特的感知技术,能够跟踪每个微笑,皱眉或傻笑背后的高动态表面几何。

所以今天我们就为大家介绍一下,开发者如何借助最新版本ARCore的全新Augmented Faces API,使机器学习(ML)来推断近似的3D表面几何形状,从而只需要一个摄像机输入,无需专用的深度传感器就可以实现给自拍添加动画特效,比如添加眼镜、3D帽子等物品。

3D网格及其实现的一些效果

这种方法提供了实时速度的AR效果,使用TensorFlow Lite进行移动CPU推理或其可用的新移动GPU功能。

此技术与YouTube Stories的新creator effect效果相同,并且通过最新的ARCore SDK版本和ML Kit Face Contour Detection API,可供更广泛的开发人员社区使用。

自拍AR的ML pipeline

我们的ML pipeline由两个一起工作的实时深度神经网络模型组成。一个探测器,在整个图像上运行,并计算面部位置;一个通用3D网格模型,在这些位置上运行并通过回归预测近似表面几何。

精确地裁剪面部可以大大减少对共同数据增强的需求,例如由旋转,平移和比例变化组成的仿射变换。

它允许网络将其大部分容量用于坐标预测准确度,这对于实现虚拟内容的正确锚定至关重要。

一旦需要的位置被裁剪,网格网络每次仅应用于单个帧,使用窗口平滑以便在面部静止时减少噪声,同时避免在快速移动时滞后。

3D网格

对于我们的3D网格,我们采用了传递学习并训练了一个具有多个目标的网络。

网络同时预测合成、渲染数据上的3D网格坐标,以及类似于MLKit提供的带注释的真实世界数据的2D语义轮廓。

由此产生的网络不仅在合成上,而且在现实世界数据上为我们提供了合理的3D网格预测。

所有模型都接受来自地理上不同数据集的数据培训,随后在平衡,多样化的测试集上进行测试,以获得定性和定量性能。

3D网格网络接收裁剪的视频帧作为输入。它不依赖于额外的深度输入,因此它也可以应用于预先录制的视频。

该模型输出3D点的位置,以及在输入中存在并合理对齐的面部概率。一种常见的替代方法是预测每个地标的2D热图,但它不适合深度预测,并且对于这么多点具有高计算成本。

通过迭代引导和细化预测来进一步提高模型的准确性和鲁棒性。这样我们就可以将我们的数据集增长到越来越具有挑战性的案例,例如鬼脸,斜角和遮挡。

数据集增强技术还扩展了可用的地面实况数据,开发了模型对相机缺陷或极端光照条件等工件的弹性。

数据集扩展和改进pipeline

我们使用TensorFlow Lite进行设备上的神经网络推理。新推出的GPU后端加速可在可用的情况下提升性能,并显着降低功耗。

此外,为了涵盖广泛的消费类硬件,我们设计了各种具有不同性能和效率特性的模型架构。

较轻的网络最重要的区别是残余块布局和可接受的输入分辨率(最轻的模型中为128x128像素,而最复杂的模型中为256x256)。

我们还改变了层数和子采样率(输入分辨率随网络深度减小的速度)。

每帧的推理时间:CPU与GPU

这些优化的结果是使用较轻型号的显着加速,AR效果质量的降低最小。

比较最复杂(左)和最轻的模型(右)。

在轻型模型上,时间一致性以及唇部和眼睛跟踪略微降低

这些努力的最终结果是通过以下方式为用户体验在YouTube,ARCore和其他客户中提供令人信服的,逼真的自拍AR效果:

通过环境映射模拟光反射,实现眼镜的逼真渲染

通过将虚拟对象阴影投射到面网格上来实现自然光照

对面部遮挡建模以隐藏面部后面的虚拟对象部分,例如虚拟眼镜,如下图所示

YouTube Stories基于3D网格的逼真虚拟眼镜

此外,我们通过以下方式实现高度逼真的妆效:

建模在嘴唇和嘴唇上应用的镜面反射

通过使用亮度感知材料进行面部绘画

案例研究将不同光照条件下5个主题的真实化妆与AR妆容进行比较。

未来,谷歌计划将此技术扩展到更多谷歌产品中。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 手机
    +关注

    关注

    36

    文章

    6980

    浏览量

    160650
  • 谷歌
    +关注

    关注

    27

    文章

    6244

    浏览量

    110243
  • Ar
    Ar
    +关注

    关注

    25

    文章

    5236

    浏览量

    175455

原文标题:138亿年在手中!谷歌用手机体验宇宙大爆炸,还教你用机器学习实现AR自拍特效

文章出处:【微信号:worldofai,微信公众号:worldofai】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何在Google Pixel 10智能手机上评估信道探测功能

    今年早些时候发布的Android 16系统首次引入了支持蓝牙信道探测的公共API,实现了智能手机的精准测距功能。然而直到近期,市面上仍未出现支持蓝牙6.0及信道探测技术的手机硬件。这一局面在2025
    的头像 发表于 11-25 16:10 2108次阅读
    如何在Google Pixel 10智能<b class='flag-5'>手机上</b>评估信道探测功能

    芯原与谷歌联合推出开源Coral NPU IP

    芯原股份近日宣布与谷歌联合推出面向始终在线、超低能耗端侧大语言模型应用的Coral NPU IP。
    的头像 发表于 11-13 11:24 281次阅读
    芯原与<b class='flag-5'>谷歌</b>联合<b class='flag-5'>推出</b>开源Coral NPU IP

    对话K计划系列,第五期主题:《三体》,星辰大海,K计划未来探索(总结:唐石平)

    对话主题:《三体》,星辰大海,K计划未来探索 1、从地球文明的技术大爆炸看知识共建共享 2、从宇宙社会学公理看商机共创共赢 3、责任的阶梯,K计划的社会价值及意义 4、人类文明终将驶入星辰大海,K计划未来在哪里?
    的头像 发表于 09-18 08:46 143次阅读
    对话K计划系列,第五期主题:《三体》,星辰大海,K计划未来探索(总结:唐石平)

    对话K计划系列,第五期主题:《三体》,星辰大海,K计划未来探索(嘉宾:何红星)

    对话主题:《三体》,星辰大海,K计划未来探索 1、从地球文明的技术大爆炸看知识共建共享 2、从宇宙社会学公理看商机共创共赢 3、责任的阶梯,K计划的社会价值及意义 4、人类文明终将驶入星辰大海,K计划未来在哪里?
    的头像 发表于 09-18 08:44 197次阅读
    对话K计划系列,第五期主题:《三体》,星辰大海,K计划未来探索(嘉宾:何红星)

    对话K计划系列,第五期主题:《三体》,星辰大海,K计划未来探索(嘉宾:李平)

    对话主题:《三体》,星辰大海,K计划未来探索 1、从地球文明的技术大爆炸看知识共建共享 2、从宇宙社会学公理看商机共创共赢 3、责任的阶梯,K计划的社会价值及意义 4、人类文明终将驶入星辰大海,K计划未来在哪里?
    的头像 发表于 09-18 08:40 214次阅读
    对话K计划系列,第五期主题:《三体》,星辰大海,K计划未来探索(嘉宾:李平)

    数字孪生 × 爆炸动画 × 三维拆解

    在三维场景中实现模型零件爆炸效果是一种常见且非常实用的视觉技术,广泛应用于产品设计演示、机械运动模拟、建筑可视化等多个领域。
    的头像 发表于 05-19 15:11 495次阅读
    数字孪生 × <b class='flag-5'>爆炸</b>动画 × 三维拆解

    谷歌I/O 2025大会前透露:Android 16接入Gemini,智能手机、XR设备升级

    ”直播活动,提前预告Android 16将迎来全新的升级,包括全新的设计语言、将通过Gemini实现跨设备融合、推出新的安全功能保障设备。并在接下来几个月的时间里,深度融入智能手机、智能手表、智能汽车
    的头像 发表于 05-18 00:03 7192次阅读
    <b class='flag-5'>谷歌</b>I/O 2025大会前透露:Android 16接入Gemini,智能<b class='flag-5'>手机</b>、XR设备升级

    从安防到元宇宙:RK3588如何重塑视觉感知边界?

    定义图像处理的精度与效率。 应用场景深度解析: 智能安防:在智慧园区部署中,单板可同时接入32路1080P摄像头,通过AI算法实现人脸识别、异常行为检测,并实时压缩传输至云端,带宽占用降低40%。 AR
    发表于 04-07 16:11

    谷歌“减法”新动作:砍掉耳机按键唤醒朗读功能

    电子发烧友网报道(文/莫婷婷)近期,谷歌宣布将对耳机上的 Google Assistant语音助手功能进行调整,取消通过触控唤醒助理“自动朗读未读通知”的功能。谷歌表示,要想完成该功能可以通过语音
    的头像 发表于 02-22 22:56 2881次阅读
    <b class='flag-5'>谷歌</b>“减法”新动作:砍掉耳机按键唤醒朗读功能

    歌尔光学推出全新AR全彩光波导显示模组

    在近日于美国举行的SPIE(国际光学工程学会)AR | VR | MR大会上,歌尔股份的控股子公司——歌尔光学科技有限公司,凭借其在AR光学领域的深厚积累,成功推出了一款采用表面浮雕刻蚀光栅工艺
    的头像 发表于 02-11 10:06 1682次阅读

    三星电子与谷歌合作研发AR眼镜

    近日,三星电子在美国加州圣何塞成功举办了年度“Galaxy Unpacked”发布会,会上不仅推出了备受瞩目的新旗舰“Galaxy S25”系列手机,还展示了与谷歌联合开发的Project Moohan头显设备。
    的头像 发表于 01-24 14:23 1326次阅读

    三星电子与谷歌联手研发AR眼镜

    近日,三星电子在美国加州圣何塞成功举办了其一年一度的“Galaxy Unpacked”发布会。会上,三星电子不仅推出了备受期待的新旗舰“Galaxy S25”系列手机,还展示了与谷歌共同研发
    的头像 发表于 01-24 10:22 1202次阅读

    谷歌量子芯片实现计算领域重大突破

    近日,全球科技巨头谷歌宣布,其新一代芯片在量子计算领域取得了前所未有的重大突破。据悉,谷歌成功地在短短五分钟内解决了一个传统计算机需要耗费比宇宙历史还要漫长的时间才能处理的复杂计算难题。 作为
    的头像 发表于 12-13 11:10 1139次阅读

    谷歌量子芯片Willow实现重大突破

    任务。这一任务对于当前世界上最快的超级计算机而言,将需要耗费“10的25次方”年才能完成,这一时间远超宇宙的年龄。谷歌的这一突破无疑引发了科技界的广泛关注,被视为量子计算向实用化迈出的关键一步。 尽管量子计算目前仍处于早期发展阶
    的头像 发表于 12-12 09:59 876次阅读

    谷歌Find My技术 谷歌Find My Device网络适用的产品

    谷歌Find My Device‌是谷歌推出的一款智能设备定位应用,旨在帮助用户快速定位并查找身边的智能设备,如手机、平板电脑、耳机等。该应用提供了多种功能,包括远程控制和锁定功能,如
    的头像 发表于 12-10 11:07 974次阅读