0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI识别亲吻动作,也搞起浪漫来

Hf1h_BigDataDig 来源:YXQ 2019-07-10 15:44 次阅读

7月6日,这可能是一年中最适合亲吻的日子——国际接吻日(International Kissing Day)。

这个节日最早起源于英国。1991年这个节日得到了联合国的承认,也希望让更多人知道,亲吻的美好,这也是人类表达爱意最自然的一种方式。

那么,人工智能可以通过训练了解亲吻吗?

来自Netflix的一位高级数据科学家就对“kiss”镜头情有独钟,并且通过上百部电影接吻情节的定位,成功训练出了可以准确识别电影亲吻桥段的AI模型——模型的独创性在于可以区别亲吻与性行为。

大千世界,无所不能,AI也能检测到"kiss"?

让AI区别kiss和sex

作为爱情片的代表情节,“亲吻”一直是很多观众最爱反复观看的镜头。不管是《人鬼情未了》中Swayze和Demi Moore的经典接吻桥段,还是《泰坦尼克号》中Rose和Jack的临别一吻,都造就了经典中的经典。

而在电影观看过程中,寻找kiss镜头,就成为了不少娱乐视频场景下的一个真实需求。

这项基于人工智能识别接吻的研究由出自Netflix高级数据科学家Amir Ziai之手——此时他正在斯坦福大学攻读人工智能研究生学位。

Ziai在上世纪好莱坞电影中挑选了100部有代表性的作品,并为电影片段手动标注“亲吻”或“非亲吻”标签,用静态画面和声音片段来训练深度学习算法,以实现对亲吻场景的画面和声音的识别。

为了避免任何人得到错误的印象,目前还不能确定亲吻识别算法能否用于性爱场景。Ziai说到,“在我的训练集中,我尽量避免出现性爱场景,这样就能确保我的模型不会混淆接吻和性爱。”

Ziai目前的雇主Netflix并没有参与到斯坦福大学的这个项目上,但该项目在arXiv中有详细记载;另外,即使Ziai还没去调研这项研究在Netflix上的应用,但是不难想象,Netflix或其他公司(如YouTube,Facebook,Instagram和TikTok等处理大量流媒体或存储视频的公司)可能会对这一技术的商业应用场景感兴趣。

该图是1990年的电影《人鬼情未了》中Swayze和Demi Moore的经典接吻桥段,数据科学家便是用了近百部类似的电影桥段来训练AI模型识别亲吻的行为。

感兴趣的读者可以阅读论文原文,附上地址:

https://arxiv.org/pdf/1906.01843.pdf

“双管齐下”:不仅视频识别,还有kiss的音频识别

应用于接吻场景视觉识别最成功的深度学习模型是ResNet-18,这是一种图像分类算法,且该算法经来自ImageNet数据库超过一百万张图像的预训练;而为了识别接吻场景的声音,研究人员采用了名为VGGish的深度学习模型,通过每个以秒分段的场景的后960毫秒音频训练。这种双管齐下对接吻的图像和音频同时处理的AI方法使得训练出的模型获得了惊人的F1分(算法精度和准度的加权平均值,度量模型的一种指标)——0.95。

ResNet-18模型结构图

在模型结构中,采用"shortcut connection”方式,也就是上图中的弧线来减少卷积网络传播过程中的计算和参数量,感兴趣的读者可以研究下,VGGish是是产生音频数据集的工具,一般用于音频分类。

github网址如下:

https://github.com/tensorflow/models/tree/master/research/audioset

不过在面对电影场景中一些棘手的片段或某些拍摄机视角时,该模型还是略显吃力。例如,远景或广角的接吻镜头会使算法产生混淆,因为此类视频片段中包含了太多背景画面。此外,一些快节奏的视频片段和不同时包含两个演员的镜头对模型来讲也都是极大的挑战。

电影《Titanic》中Jack和Rose在邮轮甲板上拥吻图片

深度学习是一个“黑盒子”,我们很难弄清楚深度学习模型实现预测时所使用的的具体数据模式。为了尝试理解AI的逻辑,人们通常采用的一种方法是使用显著地形图来可视化分析过程中受到AI关注最多的数据。在好莱坞影片识别接吻场景的项目中,深度学习模型似乎更加关注与演员面部相关的图像像素点。

Ziai表示,即使是在少量有限的实验中也可以看出,人工智能更依赖视觉特征而不是音频特征来识别接吻场景。他发现“精心挑选的数据集”对于训练接吻检测系统有很大帮助,这类数据可以让该系统利用更多的上下文信息来检测接吻,而不仅仅是通过静态图像。

AI“kiss”之原理

AI模型是如何习得这种能力呢?

和初吻尚在的人类学习基本亲吻知识的途径一样,AI模型基于已经成熟的深度学习算法,观看各式各样的好莱坞明星上演的浪漫拥吻片段,通过这种大量的训练来识别影片中人物的面部表情和定位嘴唇,数据科学家说明了AI系统如何能够更深入地了解最亲密的人类活动的原理。

让AI识别kiss有什么用?

早在2019年4月,谷歌宣布其智能手机Pixel已更新其Photobooth功能,这项功能可以在你面部表情发生变化的时候自动拍照,比如说微笑、亲吻、嘟嘴、伸舌头等等,该功能可是使智能手机从手机拍摄的视频中识别出接吻画面。

具体来说,当你按下Photobooth功能的拍摄按键之后,手机的AI就会自动分析你的脸部表情。根据不同状态,手机会自动判定「最佳时刻」,并将这一刻记录下来。同样,Ziai研发的应用端视频接吻识别技术使我们看到了视频内容自动分类,用户个性化视频推荐,甚至视频在线内容审核的未来。

Pixel手机Photobooth功能拍摄的静态图片

OpenAI的策略和传播主管Jack Clark在他的文章《Import AI newsletter》中重点强调了这项研究的意义:“现代计算机视觉技术已经使得开发特定的'感知和响应类'软件变得相当容易,诸如识别定性或非结构化的东西,识别电影中的接吻场景就是一个极佳的例子,但此类AI对个人软件的应用能力明显被低估。”

AI“kiss”之未来

好莱坞影片数据集和计算资源由斯坦福大学计算机科学助理教授Kayvon Fatahalian的实验室提供。

目前,这个用100部好莱坞影片(如《安娜·卡列尼娜》(1935),《人鬼情未了》(1990)和《007:大战皇家赌场》(2006)等)训练的AI模型在面对更大规模的影片时性能尚不清楚。但Ziai表示,在经超过80个影片进行训练后,该模型只看到了“边际改善”。

另一个值得关注的问题是这种AI模型在检测来自社交媒体的不同类型接吻场景视频时否能达到相似的准确度。这是个极大的挑战,可能需要模型对更多的视频数据集进行额外训练,而且训练集中不能仅包含那些出现在电影银幕上诸如Patrick Swayze和Demi Moore的好莱坞明星。尽管如此,从一些非常初步的测试中能看出,这种基于AI的接吻测技术会有很好的的应用前景。

“未来研究将尽量使用更多样化的数据集,以确保模型不会对于某种类型的电影过拟合,”Ziai说道,“不过有趣的是,该模型在我所选的YouTube视频上性能表现得相当好。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26329

    浏览量

    263933
  • 深度学习
    +关注

    关注

    73

    文章

    5219

    浏览量

    119859

原文标题:Netflix一位数据科学家剪出了上百部爱情片,想教AI认识“亲吻” | 国际接吻日

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    开发者手机 AI - 目标识别 demo

    功能简介 该应用是在Openharmony 4.0系统上开发的一个目标识别AI应用,旨在从上到下打通Openharmony AI子系统,展示Openharmony系统的AI能力,并为
    发表于 04-11 16:14

    蔚来AI底盘新识别颠簸点超3100万个

    蔚来AI底盘新识别颠簸点超3100万个
    的头像 发表于 04-01 10:16 213次阅读
    蔚来<b class='flag-5'>AI</b>底盘新<b class='flag-5'>识别</b>颠簸点超3100万个

    AI电动车进电梯监测识别摄像机

    AI人脸识别
    博瓦(武汉)科技有限公司
    发布于 :2024年03月13日 11:08:12

    什么是AI视频识别分析

    视频AI识别分析是指利用人工智能技术对视频数据进行智能化检测、分析和提取有用信息的过程。通过视频AI分析,可以自动化地识别、检测和理解视频中的对象、
    的头像 发表于 12-02 08:26 868次阅读
    什么是<b class='flag-5'>AI</b>视频<b class='flag-5'>识别</b>分析

    帕克西脸部动作追踪在各个领域的应用与影响

    帕克西脸部动作追踪采用先进的AI技术,能够实时捕捉和跟踪用户的面部动作和表情。无论是喜怒哀乐,都可以被精确地捕捉并表达出来。这项技术不仅具有高精度的识别能力,还能够处理头部及面部微表情
    的头像 发表于 11-28 10:49 122次阅读
    帕克西脸部<b class='flag-5'>动作</b>追踪在各个领域的应用与影响

    AI视觉识别有哪些工业应用

    AI视觉识别涵盖多种应用,如人脸识别、目标检测和识别、图像分割、行为识别、视频分析等。本篇就简单介绍一下
    的头像 发表于 11-27 18:05 465次阅读
    <b class='flag-5'>AI</b>视觉<b class='flag-5'>识别</b>有哪些工业应用

    成都华江信息AI人脸识别原理浅析# 人脸识别

    AI边缘计算
    成都华江信息
    发布于 :2023年11月24日 16:35:54

    【KV260视觉入门套件试用体验】Vitis AI Library体验之OCR识别

    辅助信息提高识别正确率,是OCR最重要的课题,ICR(Intelligent Character Recognition)的名词因此而产生。衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别
    发表于 10-16 23:25

    怎么通过OPENMV识别物体的颜色?

    怎么通过OPENMV识别物体的颜色
    发表于 10-12 08:05

    【KV260视觉入门套件试用体验】基于Vitis AI的ADAS目标识别

    更加常见,经过改进的新型传感器技术在为系统布署创造新的机会与策略。 二、环境搭建 Vitis AI 库有两种安装方法。一种是通过配置 PetaLinux 重构系统,另一种则是在线安装 Vitis
    发表于 09-27 23:21

    【KV260视觉入门套件试用体验】六、VITis AI车牌检测&amp;车牌识别

    。下图显示了车牌检测的结果。 将图片中的车牌进行了框选,同事标准位置。 4.2、车牌识别 cd ~/Vitis-AI/examples/vai_library/samples/platenum
    发表于 09-26 16:28

    AI智能呼叫中心

    可以自动识别和响应来电,通过分析用户的语音、文字和情绪等信息,并给出针对性的应答,与传统的人工处理相比,AI智能呼叫中心能够实现24/7不间断的服务,大幅提高了处理效率和用户满意度。二、个性化服务AI
    发表于 09-20 17:53

    【KV260视觉入门套件试用体验】3.PL端视频采集与AI识别测试测试

    上PL端的视频采集与AI人脸处理。从测试视频编效果干,MIPI视频缺少ISA图像色差纠偏,图像色彩明显失真,MIPI视频对真人人脸识别效率大与图片中人脸识别的准确度,通过给出一个简单
    发表于 09-18 01:51

    基于LSM6DSOX的FSM状态机的腕部动作识别

    本文档中的腕部动作识别是基于布局0实现的。腕部动作识别类型• FSM #1 – (左手)静止/坐着/走路等场景下的抬腕亮屏动作• FSM #
    发表于 09-06 08:03

    基于LSM6DSOX的FSM状态机的腕部动作识别

    电子发烧友网站提供《基于LSM6DSOX的FSM状态机的腕部动作识别.pdf》资料免费下载
    发表于 07-31 10:23 0次下载
    基于LSM6DSOX的FSM状态机的腕部<b class='flag-5'>动作</b><b class='flag-5'>识别</b>