0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI识别亲吻动作,也搞起浪漫来

Hf1h_BigDataDig 来源:YXQ 2019-07-10 15:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

7月6日,这可能是一年中最适合亲吻的日子——国际接吻日(International Kissing Day)。

这个节日最早起源于英国。1991年这个节日得到了联合国的承认,也希望让更多人知道,亲吻的美好,这也是人类表达爱意最自然的一种方式。

那么,人工智能可以通过训练了解亲吻吗?

来自Netflix的一位高级数据科学家就对“kiss”镜头情有独钟,并且通过上百部电影接吻情节的定位,成功训练出了可以准确识别电影亲吻桥段的AI模型——模型的独创性在于可以区别亲吻与性行为。

大千世界,无所不能,AI也能检测到"kiss"?

让AI区别kiss和sex

作为爱情片的代表情节,“亲吻”一直是很多观众最爱反复观看的镜头。不管是《人鬼情未了》中Swayze和Demi Moore的经典接吻桥段,还是《泰坦尼克号》中Rose和Jack的临别一吻,都造就了经典中的经典。

而在电影观看过程中,寻找kiss镜头,就成为了不少娱乐视频场景下的一个真实需求。

这项基于人工智能识别接吻的研究由出自Netflix高级数据科学家Amir Ziai之手——此时他正在斯坦福大学攻读人工智能研究生学位。

Ziai在上世纪好莱坞电影中挑选了100部有代表性的作品,并为电影片段手动标注“亲吻”或“非亲吻”标签,用静态画面和声音片段来训练深度学习算法,以实现对亲吻场景的画面和声音的识别。

为了避免任何人得到错误的印象,目前还不能确定亲吻识别算法能否用于***场景。Ziai说到,“在我的训练集中,我尽量避免出现***场景,这样就能确保我的模型不会混淆接吻和***。”

Ziai目前的雇主Netflix并没有参与到斯坦福大学的这个项目上,但该项目在arXiv中有详细记载;另外,即使Ziai还没去调研这项研究在Netflix上的应用,但是不难想象,Netflix或其他公司(如YouTube,Facebook,Instagram和TikTok等处理大量流媒体或存储视频的公司)可能会对这一技术的商业应用场景感兴趣。

该图是1990年的电影《人鬼情未了》中Swayze和Demi Moore的经典接吻桥段,数据科学家便是用了近百部类似的电影桥段来训练AI模型识别亲吻的行为。

感兴趣的读者可以阅读论文原文,附上地址:

https://arxiv.org/pdf/1906.01843.pdf

“双管齐下”:不仅视频识别,还有kiss的音频识别

应用于接吻场景视觉识别最成功的深度学习模型是ResNet-18,这是一种图像分类算法,且该算法经来自ImageNet数据库超过一百万张图像的预训练;而为了识别接吻场景的声音,研究人员采用了名为VGGish的深度学习模型,通过每个以秒分段的场景的后960毫秒音频训练。这种双管齐下对接吻的图像和音频同时处理的AI方法使得训练出的模型获得了惊人的F1分(算法精度和准度的加权平均值,度量模型的一种指标)——0.95。

ResNet-18模型结构图

在模型结构中,采用"shortcut connection”方式,也就是上图中的弧线来减少卷积网络传播过程中的计算和参数量,感兴趣的读者可以研究下,VGGish是是产生音频数据集的工具,一般用于音频分类。

github网址如下:

https://github.com/tensorflow/models/tree/master/research/audioset

不过在面对电影场景中一些棘手的片段或某些拍摄机视角时,该模型还是略显吃力。例如,远景或广角的接吻镜头会使算法产生混淆,因为此类视频片段中包含了太多背景画面。此外,一些快节奏的视频片段和不同时包含两个演员的镜头对模型来讲也都是极大的挑战。

电影《Titanic》中Jack和Rose在邮轮甲板上拥吻图片

深度学习是一个“黑盒子”,我们很难弄清楚深度学习模型实现预测时所使用的的具体数据模式。为了尝试理解AI的逻辑,人们通常采用的一种方法是使用显著地形图来可视化分析过程中受到AI关注最多的数据。在好莱坞影片识别接吻场景的项目中,深度学习模型似乎更加关注与演员面部相关的图像像素点。

Ziai表示,即使是在少量有限的实验中也可以看出,人工智能更依赖视觉特征而不是音频特征来识别接吻场景。他发现“精心挑选的数据集”对于训练接吻检测系统有很大帮助,这类数据可以让该系统利用更多的上下文信息来检测接吻,而不仅仅是通过静态图像。

AI“kiss”之原理

AI模型是如何习得这种能力呢?

和初吻尚在的人类学习基本亲吻知识的途径一样,AI模型基于已经成熟的深度学习算法,观看各式各样的好莱坞明星上演的浪漫拥吻片段,通过这种大量的训练来识别影片中人物的面部表情和定位嘴唇,数据科学家说明了AI系统如何能够更深入地了解最亲密的人类活动的原理。

让AI识别kiss有什么用?

早在2019年4月,谷歌宣布其智能手机Pixel已更新其Photobooth功能,这项功能可以在你面部表情发生变化的时候自动拍照,比如说微笑、亲吻、嘟嘴、伸舌头等等,该功能可是使智能手机从手机拍摄的视频中识别出接吻画面。

具体来说,当你按下Photobooth功能的拍摄按键之后,手机的AI就会自动分析你的脸部表情。根据不同状态,手机会自动判定「最佳时刻」,并将这一刻记录下来。同样,Ziai研发的应用端视频接吻识别技术使我们看到了视频内容自动分类,用户个性化视频推荐,甚至视频在线内容审核的未来。

Pixel手机Photobooth功能拍摄的静态图片

OpenAI的策略和传播主管Jack Clark在他的文章《Import AI newsletter》中重点强调了这项研究的意义:“现代计算机视觉技术已经使得开发特定的'感知和响应类'软件变得相当容易,诸如识别定性或非结构化的东西,识别电影中的接吻场景就是一个极佳的例子,但此类AI对个人软件的应用能力明显被低估。”

AI“kiss”之未来

好莱坞影片数据集和计算资源由斯坦福大学计算机科学助理教授Kayvon Fatahalian的实验室提供。

目前,这个用100部好莱坞影片(如《安娜·卡列尼娜》(1935),《人鬼情未了》(1990)和《007:大战皇家赌场》(2006)等)训练的AI模型在面对更大规模的影片时性能尚不清楚。但Ziai表示,在经超过80个影片进行训练后,该模型只看到了“边际改善”。

另一个值得关注的问题是这种AI模型在检测来自社交媒体的不同类型接吻场景视频时否能达到相似的准确度。这是个极大的挑战,可能需要模型对更多的视频数据集进行额外训练,而且训练集中不能仅包含那些出现在电影银幕上诸如Patrick Swayze和Demi Moore的好莱坞明星。尽管如此,从一些非常初步的测试中能看出,这种基于AI的接吻测技术会有很好的的应用前景。

“未来研究将尽量使用更多样化的数据集,以确保模型不会对于某种类型的电影过拟合,”Ziai说道,“不过有趣的是,该模型在我所选的YouTube视频上性能表现得相当好。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38177

    浏览量

    296937
  • 深度学习
    +关注

    关注

    73

    文章

    5591

    浏览量

    123921

原文标题:Netflix一位数据科学家剪出了上百部爱情片,想教AI认识“亲吻” | 国际接吻日

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    VS680 HDMI AI分析解决方案 #目标识别 #视频翻译 #AI #芯片

    AI
    深蕾半导体
    发布于 :2025年11月12日 10:29:33

    【飞凌OK-MX9596-C开发板试用】③云端AI拍照识别

    。 本篇基于此,开发云端AI拍照识别。 简单来说,就是拍照,并调用云端AI工具,进行图像文本识别,再将识别的文本的文本显示出来。 这里的云端
    发表于 11-01 22:12

    【「AI芯片:科技探索与AGI愿景」阅读体验】+具身智能芯片

    、步态识别和跌倒检测等,可以通过检测门的打开、关闭预防犯罪。 三、具身智能系统与芯片 具身智能汇集了跨学科领域的技术。是为一台进行AI运算的计算机提供了有形或可见的形式,即机上感知
    发表于 09-18 11:45

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    和灵感与诺贝尔奖和重大科学发现 科学发现中,直觉是重要的起点。是基于经验情感及知识的模式识别和类比能力,而不是基于逻辑和推理。 灵感通常是新的、有创意的想法或者突破性的思维,是突然的、意外的提示。 直觉
    发表于 09-17 11:45

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件到AI湿件

    想到,除了研究大脑的抽象数学模型外,能否抛弃传统的芯片实现方式,以化学物质和生物组件、材料及相关现象构建人工神经网络或提取其功能来用于AI处理,甚至直接用生物体实现AI功能,这就是
    发表于 09-06 19:12

    RK3576助力智慧安防:8路高清采集与AI识别

    在智慧城市和数字化园区的建设过程中,安防监控系统正从“被动记录”走向“主动识别与分析”。随着AI算法的成熟和高清视频处理能力的提升,市场对多路视频采集、实时拼接、智能识别的需求日益增强。 米尔电子
    发表于 08-22 17:41

    工地要增加AI识别功能?高性能边缘计算设备解决方案助力

    今年4月,广州市住建局就发布了《广州市住房和城乡建设局关于房屋建筑工程领域考勤设备优化升级的通知》,最新提出了要“增加AI识别功能模块。为实现人员实名登记、实时考勤和自动监测数据互相比对验证”,自
    的头像 发表于 08-05 10:18 816次阅读
    工地要增加<b class='flag-5'>AI</b><b class='flag-5'>识别</b>功能?高性能边缘计算设备解决方案<b class='flag-5'>来</b>助力

    AI视觉识别收银称:水果生鲜店的“智能店员”

    在水果生鲜店中,采用AI视觉识别收银称不仅提升了顾客的购物体验,为商家带来了诸多便利和效益。本文将详细介绍这一技术的好处。一、提升收银效率传统的收银方式需要人工逐一识别商品并进行称重
    的头像 发表于 06-07 10:19 503次阅读
    <b class='flag-5'>AI</b>视觉<b class='flag-5'>识别</b>收银称:水果生鲜店的“智能店员”

    工地AI行为识别系统作用

    工地AI行为识别系统作用 工地AI行为识别系统是什么? 工地AI行为识别系统是一种基于人工智能技
    的头像 发表于 05-08 12:00 724次阅读

    景区AI行为识别系统作用

    景区AI行为识别系统作用 景区AI行为识别系统是什么? 景区AI行为识别系统是利用人工智能技术(
    的头像 发表于 05-07 15:32 672次阅读
    景区<b class='flag-5'>AI</b>行为<b class='flag-5'>识别</b>系统作用

    工厂园区AI行为识别系统作用

    工厂园区AI行为识别系统作用 工厂园区AI行为识别系统是什么? 工厂园区AI行为识别系统是基于人
    的头像 发表于 05-06 17:49 501次阅读

    AI泥石流智能监测摄像机:恶劣天气能精准识别

    ai泥石流识别摄像机画质真实清晰、智能识别速度快,距离远能耗低,智能预警和多平台推送,为相关部门提供宝贵的时间采取预防措施,提高灾害应对效率。
    的头像 发表于 03-06 17:49 764次阅读
    <b class='flag-5'>AI</b>泥石流智能监测摄像机:恶劣天气<b class='flag-5'>也</b>能精准<b class='flag-5'>识别</b>

    AI Agent 应用与项目实战》----- 学习如何开发视频应用

    AI助手”功能。 根据需求选择助手类型,例如应用助手、知识助手或对话助手。对于视频生成应用,可能需要结合应用助手和对话助手的功能。 完成助手的基础配置,包括动作意图、知识库和对话模型等。这里可以
    发表于 03-05 19:52

    安信可AI人脸识别方案

    作为神仙世界的高科技,"无接触式开锁",人脸识别技术被广泛应用在现代生活中,安信可也有AI人脸识别方案!
    的头像 发表于 02-25 14:39 739次阅读
    安信可<b class='flag-5'>AI</b>人脸<b class='flag-5'>识别</b>方案

    HarmonyOS NEXT 应用开发练习:AI智能对话框

    支持用户点击按钮触发特定动作。我们将使用ChatUI框架,我们可以根据需求自行扩展或寻找类似的库实现。 二、代码实现 首先,确保我们已经安装了ChatUI框架并进行扩展以支持图片
    发表于 01-03 11:29