0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌的研究人员开发了可以智能抓拍自拍的新应用PhotoBooth

nlfO_thejiangme 来源:lp 2019-04-22 14:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

照一张美美的自拍照一直是一个技术活!如果要和小伙伴们一起拍出一张漂亮的自拍那更是需要耐心加技术才能搞定,你需要握好手机准备好拍照、看着相机并摆好pose,更重要的是要保证所有的小伙伴都在镜头内没有眨眼跑偏!一瞬间要行云流水地完成这些动作对于不经常自拍小伙伴们还是有点挑战的。

那么,现在都9102年的AI时代了,智能相机能不能帮我们拍出好看的自拍呢?让我们来看看谷歌给出的答案。其实在去年年底,谷歌推出了一款名为Clips的应用就给智能相机打下了坚实的基础。Clips可以在移动端分析拍摄的质量,并从一小段视频中找出用户最美的瞬间。基于这样的技术,谷歌的研究人员开发了可以智能抓拍自拍的新应用PhotoBooth。

这个应用将会为你捕捉最美的瞬间,无论是单人、情侣还是多人的小伙伴们,他都会找到最合适的姿势角度和快门为你记录下最美的时刻。在进入软件后它能自动识别其中人脸的表情和眼睛,在大家都睁眼并且表情很棒的时候帮你按下快门。这一针对自拍的技术专门对前置摄像头进行了优化,此外科研人员在逐一解决了三个挑战才使得这一技术变为现实。为了实现Photobooth,

首先需要解决如何识别人群中众多主体的表情是否到位;

随后需要确定曝光时间已记录最佳的图像结果;

最后还需要为提供视觉辅助元素UI帮助用户调整姿势和表情以便相机可以拍摄下最好的你!

为优质内容建模

为了拍下最美的瞬间,那么理解什么是美什么是好的姿势和表情就尤为重要了。在自拍中相机需要识别是不是所有的人都在看镜头、或者当情侣在接吻时抓拍下浪漫一刻。为了实现对优质内容的理解和抓拍,Photobooth利用了两个自拍模型来实现,分别用于检测面部表情和亲吻的动作。

通过和摄影师合作,研究人员提取出了五种高频表情用于触发相机记录:微笑、吐舌、嘟嘴/自拍脸、鼓脸颊和惊奇的表情,这些是人们在自拍时最常用的表情。随后利用神经网络训练分类模型来对这些表情实现分类。而对于亲吻,则在Clips中已有的图像内容模型的基础上进行微调。最后通过MobileNets实现以便高效高帧率的进行处理,网络的输出将用于评价每一帧的质量,并用于快门控制算法。

快门控制

当按下Photobooth快门的时候前面的质量评价算法就开始给每一帧的质量打分了。首先需要利用滤波器来处理闭眼、运动模糊或者表情识别错误等。算法会对表情的置信度评分进行短暂的分析,并使得机器学习模型的输出较为稳定和鲁棒。随后每一帧将进行更加细粒度的分析同时输出整体帧的评分。评分包含了表情的质量或者亲吻的分数。针对亲吻场景,算法将对整张图像进行处理并直接生成评分。对于面部表情识别模型来说,会对每个个体的表情进行识别,并利用了注意力机制对视图中所有的个体表情进行迭代识别,同为每张脸赋予一定的权值。这一权值十分重要,可以对照片中不同部分的主体进行突出和强调。在此基础上计算出了用于评价帧质量的全局质量分数。

最终,基于注意力分数的加权表情评分和亲吻评分将用于触发相机快门。为了在最佳时刻进行记录,算法将会进行一定时刻的观察,并在帧评分超过历史峰值后按下快门。

智能指示器

人们在利用前视摄像头拍照的时候,需要与算法进行交互才能调整自己的表情获取最佳姿势。算法同时提供了一个质量评分指示器来帮助用户理解算法的输出。下图中可以看到屏幕上方的小白条指示了当前算法输出的评分,主要包括了一下四种情况:视野中没有清晰人脸;人没有看相机;看了相机但是表情不到位;表情到位,开拍!为了让指示器更便于理解,研发人员让它在上面的四种情况中依次变换,同时加入了对评分质量的平滑避免白条变化过快让用户无所适从。最终,当指示器的长度达到了高质量的水平相机就自动为你记下完美时刻了。

会拍照的才是好手机!相机越来越智能,朋友圈也会越来越美丽。随着计算机视觉技术的进步,像这样贴近生活的实用技术将越来越多的出现在我们生活中。优秀技术解决生活中的小痛点的微创新将会不断引领技术的落地,为人们带去更加便捷的生活。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 指示器
    +关注

    关注

    0

    文章

    256

    浏览量

    39167
  • 摄像头
    +关注

    关注

    61

    文章

    5058

    浏览量

    102449
  • 自动识别
    +关注

    关注

    3

    文章

    232

    浏览量

    23846

原文标题:9102年了,自拍这件事除了美颜修图,谷歌智能相机还想要抓取你的自然表情

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    研究人员复兴针孔相机技术以推动下一代红外成像发展

    研究人员运用具有数百年历史的针孔成像原理,开发出一种无需透镜的高性能中红外成像系统。这种新型相机能够在大范围距离内和弱光条件下拍摄极其清晰的照片,使其在传统相机难以应对的场景中发挥重要作用。 研究
    的头像 发表于 11-17 07:40 59次阅读

    万字长文AI智能体:17种体架构详细实现

    数据科学AI智能体领域发展迅猛,但许多资源仍然过于抽象和理论化。创建此项目的目的是为开发者、研究人员和AI爱好者提供一条结构化、实用且深入的学习路径,以掌握构建智能系统的艺术。
    的头像 发表于 11-07 13:16 301次阅读
    万字长文AI<b class='flag-5'>智能</b>体:17种体架构详细实现

    谷歌AI模型点亮开发无限可能

    在 2025 年的 Google 谷歌开发者大会上,AI 不是一门“技术”,更是一股彻底改变开发范式的“力量”,助力开发者们在海外市场更上一层楼。AI 已经不仅仅是生成几行代码,它正在
    的头像 发表于 08-29 09:29 860次阅读

    无刷直流电机双闭环串级控制系统仿真研究

    以来伴随着永磁材料技术、计算机及控制技术等支撑技术的快速发展及微电机制造工艺水平的不断提高,永磁无刷直流电动机在高性能中、小伺服驱动领域获得广泛应用并日趋占据主导地位吗。一直以来,研究人员都比较关注利用
    发表于 07-07 18:36

    NVIDIA助力研究人员开发用于搜救任务的无人地面车辆

    NVIDIA 和 Bridge to Türkiye Fund 通过提供学术资助,在土耳其全国推动针对灾害响应的创新研究及工程教育的发展。
    的头像 发表于 07-04 15:01 806次阅读

    (ST大赛三等奖作品)超声波自拍神器实例项目

    (ST大赛三等奖作品)超声波自拍神器电路图:
    发表于 05-28 21:04

    研究人员开发出基于NVIDIA技术的AI模型用于检测疟疾

    疟疾曾一度在委内瑞拉销声匿迹,但如今正卷土重来。研究人员已经训练出一个模型来帮助检测这种传染病。
    的头像 发表于 04-25 09:58 736次阅读

    英伟达GTC2025亮点:NVIDIA、Alphabet 和谷歌携手开启代理式与物理AI的未来

    应用、加速物理 AI 进展,并实现医疗、制造及能源等行业的变革。 Alphabet 旗下的工程师和研究人员正与 NVIDIA 技术团队紧密合作,利用 AI 和仿真技术开发具有抓取能力的机器人、重塑药物研发
    的头像 发表于 03-21 15:10 1766次阅读
    英伟达GTC2025亮点:NVIDIA、Alphabet 和<b class='flag-5'>谷歌</b>携手开启代理式与物理AI的未来

    智能电动轮椅控制系统的研究与设计

    本文介绍了智能轮椅、自动避障算法以及电机调速系统的国内外发展现状,并 研究了用户对智能轮椅的实际需求,分析了国内应用市场上智能轮椅存在的不足, 设计了一款具有自动避障和坡度
    发表于 03-07 15:17

    新品发布 | 华江信息智能运动抓拍摄像机“智拍”震撼来袭!

    ●官宣●智能运动抓拍摄像机--智拍SmartShoot重磅上市!重磅上市!重磅上市!适用于不同运动场馆智拍SmartShoot不仅满足多种类型运动场馆运动抓拍需求,更重要的是它可以为场
    的头像 发表于 02-06 20:22 875次阅读
    新品发布 | 华江信息<b class='flag-5'>智能</b>运动<b class='flag-5'>抓拍</b>摄像机“智拍”震撼来袭!

    谷歌加速AI部门整合:AI Studio团队并入DeepMind

    旗下,此举旨在更好地整合人工智能部门,以提升各大项目的推进效率。 AI Studio团队在谷歌内部扮演着举足轻重的角色,主要负责打造谷歌旗下的AI开发工具。这些工具包括Gemini D
    的头像 发表于 01-13 14:40 1139次阅读

    基于Arm Neoverse平台的处理器革新生成式AI体验

    Llama 是一个专为开发者、研究人员和企业打造的开源大语言模型 (LLM) 库,旨在推动生成式 AI 的创新、实验及可靠地扩展。
    的头像 发表于 01-03 15:31 1156次阅读
    基于Arm Neoverse平台的处理器革新生成式AI体验

    【「具身智能机器人系统」阅读体验】+初品的体验

    的快速发展,相关人才的需求也在不断增加,通过阅读该书可以帮助大家系统性地了解和分析当前具身智能机器人系统的发展现状和前沿研究,为未来的研究开发
    发表于 12-20 19:17

    电阻点焊热量智能控制技术研究进展

    。为了克服这些问题,研究人员开始探索电阻点焊的热量智能控制技术,通过智能化手段提高焊接质量和效率,降低生产成本。 ### 电阻点焊的基本原理 电阻点焊是利用电流通过
    的头像 发表于 12-18 10:02 822次阅读
    电阻点焊热量<b class='flag-5'>智能</b>控制技术<b class='flag-5'>研究</b>进展

    研究人员利用激光束开创量子计算新局面

    演示设备 威特沃特斯兰德大学(Wits)的物理学家利用激光束和日常显示技术开发出了一种创新的计算系统,标志着在寻求更强大的量子计算解决方案方面取得了重大飞跃。 该大学结构光实验室的研究人员取得的这一
    的头像 发表于 12-18 06:24 580次阅读
    <b class='flag-5'>研究人员</b>利用激光束开创量子计算新局面