0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌的研究人员开发了可以智能抓拍自拍的新应用PhotoBooth

nlfO_thejiangme 来源:lp 2019-04-22 14:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

照一张美美的自拍照一直是一个技术活!如果要和小伙伴们一起拍出一张漂亮的自拍那更是需要耐心加技术才能搞定,你需要握好手机准备好拍照、看着相机并摆好pose,更重要的是要保证所有的小伙伴都在镜头内没有眨眼跑偏!一瞬间要行云流水地完成这些动作对于不经常自拍小伙伴们还是有点挑战的。

那么,现在都9102年的AI时代了,智能相机能不能帮我们拍出好看的自拍呢?让我们来看看谷歌给出的答案。其实在去年年底,谷歌推出了一款名为Clips的应用就给智能相机打下了坚实的基础。Clips可以在移动端分析拍摄的质量,并从一小段视频中找出用户最美的瞬间。基于这样的技术,谷歌的研究人员开发了可以智能抓拍自拍的新应用PhotoBooth。

这个应用将会为你捕捉最美的瞬间,无论是单人、情侣还是多人的小伙伴们,他都会找到最合适的姿势角度和快门为你记录下最美的时刻。在进入软件后它能自动识别其中人脸的表情和眼睛,在大家都睁眼并且表情很棒的时候帮你按下快门。这一针对自拍的技术专门对前置摄像头进行了优化,此外科研人员在逐一解决了三个挑战才使得这一技术变为现实。为了实现Photobooth,

首先需要解决如何识别人群中众多主体的表情是否到位;

随后需要确定曝光时间已记录最佳的图像结果;

最后还需要为提供视觉辅助元素UI帮助用户调整姿势和表情以便相机可以拍摄下最好的你!

为优质内容建模

为了拍下最美的瞬间,那么理解什么是美什么是好的姿势和表情就尤为重要了。在自拍中相机需要识别是不是所有的人都在看镜头、或者当情侣在接吻时抓拍下浪漫一刻。为了实现对优质内容的理解和抓拍,Photobooth利用了两个自拍模型来实现,分别用于检测面部表情和亲吻的动作。

通过和摄影师合作,研究人员提取出了五种高频表情用于触发相机记录:微笑、吐舌、嘟嘴/自拍脸、鼓脸颊和惊奇的表情,这些是人们在自拍时最常用的表情。随后利用神经网络训练分类模型来对这些表情实现分类。而对于亲吻,则在Clips中已有的图像内容模型的基础上进行微调。最后通过MobileNets实现以便高效高帧率的进行处理,网络的输出将用于评价每一帧的质量,并用于快门控制算法。

快门控制

当按下Photobooth快门的时候前面的质量评价算法就开始给每一帧的质量打分了。首先需要利用滤波器来处理闭眼、运动模糊或者表情识别错误等。算法会对表情的置信度评分进行短暂的分析,并使得机器学习模型的输出较为稳定和鲁棒。随后每一帧将进行更加细粒度的分析同时输出整体帧的评分。评分包含了表情的质量或者亲吻的分数。针对亲吻场景,算法将对整张图像进行处理并直接生成评分。对于面部表情识别模型来说,会对每个个体的表情进行识别,并利用了注意力机制对视图中所有的个体表情进行迭代识别,同为每张脸赋予一定的权值。这一权值十分重要,可以对照片中不同部分的主体进行突出和强调。在此基础上计算出了用于评价帧质量的全局质量分数。

最终,基于注意力分数的加权表情评分和亲吻评分将用于触发相机快门。为了在最佳时刻进行记录,算法将会进行一定时刻的观察,并在帧评分超过历史峰值后按下快门。

智能指示器

人们在利用前视摄像头拍照的时候,需要与算法进行交互才能调整自己的表情获取最佳姿势。算法同时提供了一个质量评分指示器来帮助用户理解算法的输出。下图中可以看到屏幕上方的小白条指示了当前算法输出的评分,主要包括了一下四种情况:视野中没有清晰人脸;人没有看相机;看了相机但是表情不到位;表情到位,开拍!为了让指示器更便于理解,研发人员让它在上面的四种情况中依次变换,同时加入了对评分质量的平滑避免白条变化过快让用户无所适从。最终,当指示器的长度达到了高质量的水平相机就自动为你记下完美时刻了。

会拍照的才是好手机!相机越来越智能,朋友圈也会越来越美丽。随着计算机视觉技术的进步,像这样贴近生活的实用技术将越来越多的出现在我们生活中。优秀技术解决生活中的小痛点的微创新将会不断引领技术的落地,为人们带去更加便捷的生活。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 指示器
    +关注

    关注

    0

    文章

    260

    浏览量

    39421
  • 摄像头
    +关注

    关注

    61

    文章

    5134

    浏览量

    103660
  • 自动识别
    +关注

    关注

    3

    文章

    241

    浏览量

    23995

原文标题:9102年了,自拍这件事除了美颜修图,谷歌智能相机还想要抓取你的自然表情

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    谷歌发布Gemini for Science

    2026年5月20日,谷歌I/O开发者大会上,谷歌正式推出Gemini for Science——一款专门面向科研场景的AI模型。这不是又一个能帮你查文献的聊天机器人,而是谷歌试图让A
    的头像 发表于 05-21 10:42 1172次阅读

    爱立信研究人员斩获IEEE无线通信领域权威奖项

    三位爱立信研究人员因在推动4G和5G无线通信发展方面的贡献,荣获了享有盛誉的电气电子工程师学会(IEEE)的表彰,高级专家Erik Dahlman、Stefan Parkvall和首席研究
    的头像 发表于 05-16 09:37 444次阅读

    NVIDIA开放模型助力构建下一代数字健康智能

    NVIDIA Nemotron 系列开放模型和 NVIDIA NeMo 库正在为临床医生、研究人员开发者提供开放权重和方法,使他们能够在自有的基础设施上构建和部署定制化的数字健康智能体。
    的头像 发表于 03-25 09:46 575次阅读

    开发智能体调试与预览---真机测试

    1、开发者可在智能体调试与预览区域,点击真机测试图标-点击【白名单】跳转至智能体白名单配置页面。 2、勾选用于测试的群组,点击屏幕左侧【编排】返回智能体编排页面进行真机测试发布。若无可
    发表于 02-09 15:37

    谷歌评论卡,碰一碰即可完成谷歌评论 #谷歌评论卡 #NFC标签 #nfc卡

    谷歌
    深圳市融智兴科技有限公司
    发布于 :2026年01月15日 17:02:00

    每年10亿美元,苹果与谷歌官宣合作,Gemini大模型注入Siri

    电子发烧友网报道 当地时间1月12日,苹果官宣将与谷歌联手,为苹果的人工智能功能提供支持,其中包括今年晚些时候对Siri的一次重大升级。谷歌在其官方博客上表示,苹果已与谷歌达成一项多年
    的头像 发表于 01-13 14:59 6016次阅读

    LoRa 人员定位技术的测距原理与算法研究浅析

    如果您想进一步了解人员定位的其他案例,欢迎关注、评论留言~也可搜索lbs智能定位。
    的头像 发表于 11-20 16:45 1524次阅读

    研究人员复兴针孔相机技术以推动下一代红外成像发展

    研究人员运用具有数百年历史的针孔成像原理,开发出一种无需透镜的高性能中红外成像系统。这种新型相机能够在大范围距离内和弱光条件下拍摄极其清晰的照片,使其在传统相机难以应对的场景中发挥重要作用。 研究
    的头像 发表于 11-17 07:40 412次阅读

    万字长文AI智能体:17种体架构详细实现

    数据科学AI智能体领域发展迅猛,但许多资源仍然过于抽象和理论化。创建此项目的目的是为开发者、研究人员和AI爱好者提供一条结构化、实用且深入的学习路径,以掌握构建智能系统的艺术。
    的头像 发表于 11-07 13:16 856次阅读
    万字长文AI<b class='flag-5'>智能</b>体:17种体架构详细实现

    利用 Banana Pi BPI-CM5 Pro(ARMSoM CM5 SoM) 加速保护科学

    从中获得有意义的信息。而这正是深度学习改变游戏规则的地方。 深度学习模型和人工智能加速硬件释放了PAM真正的可扩展潜力,使科学家能够在合理的时间内分析数TB的记录。迁移学习意味着研究人员可以使用自己
    发表于 10-27 09:18

    谷歌AI模型点亮开发无限可能

    在 2025 年的 Google 谷歌开发者大会上,AI 不是一门“技术”,更是一股彻底改变开发范式的“力量”,助力开发者们在海外市场更上一层楼。AI 已经不仅仅是生成几行代码,它正在
    的头像 发表于 08-29 09:29 1372次阅读

    大小鼠糖水偏好实验系统

    、各区域热点图并导出保存JPG 通过大小鼠糖水实验系统套装收集的数据可以揭示多种生物学和心理学现象。例如,研究人员可以通过比较不同浓度糖水的摄入情况来研究味觉感知的阈值。此外,该实验还
    发表于 08-14 13:40

    无刷直流电机双闭环串级控制系统仿真研究

    以来伴随着永磁材料技术、计算机及控制技术等支撑技术的快速发展及微电机制造工艺水平的不断提高,永磁无刷直流电动机在高性能中、小伺服驱动领域获得广泛应用并日趋占据主导地位吗。一直以来,研究人员都比较关注利用
    发表于 07-07 18:36

    NVIDIA助力研究人员开发用于搜救任务的无人地面车辆

    NVIDIA 和 Bridge to Türkiye Fund 通过提供学术资助,在土耳其全国推动针对灾害响应的创新研究及工程教育的发展。
    的头像 发表于 07-04 15:01 1238次阅读

    (ST大赛三等奖作品)超声波自拍神器实例项目

    (ST大赛三等奖作品)超声波自拍神器电路图:
    发表于 05-28 21:04