0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

训练机器识别何为“接吻”镜头,因此也被戏称为“吻戏鉴定师”

jmiy_worldofai 来源:未知 作者:李倩 2018-08-10 15:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

29岁的吉恒杉坐在电脑前,手指轻轻点击鼠标,将屏幕上成百上千幅内容各异的画面标注成两类——“接吻”和“非接吻”。作为优酷的一名人工智能标注员,他正在训练机器识别何为“接吻”镜头,因此也被戏称为“吻戏鉴定师”。

打开视频网站,不少片花、集锦以及进度条里的剧情提要,都离不开“吻戏鉴定师”的功劳。爱情是影视剧永恒的主题,吻戏往往出现在剧情的高潮。机器对海量视频素材进行扫描,将吻戏等片段快速抓取出来,供小编们加工创作。

人工智能和视频黑科技的应用,不仅提升了用户观看体验,更催生出众多炫酷的新就业岗位:吻戏鉴定师、明星标注师、射门投篮视频分析员……既对娱乐、体育感兴趣又精通技术的“程序猿”,成为视频网站最紧缺的人才,也折射出新经济、数字经济崛起带来的就业新变化。

“刚开始我和女朋友说,我的工作是训练计算机识别出吻戏镜头,她听完觉得特别不可思议,谁能给钱让你干这个呢?”

吉恒杉2016年毕业于北京航空航天大学,硕士学的是计算机视觉,通俗地讲,这个专业的目的是“教电脑看懂世界”。毕业后,他先在一家互联网公司做程序员,去年9月加入阿里巴巴技术团队,成为优酷的一名高级算法工程师,主要工作是教计算机识别接吻等场景,也被称为“吻戏鉴定师”。

“这个岗位正好和我的专业吻合,给大家传递快乐和幸福,又能以工作的名义看网剧,我特别喜欢。”谈起自己的工作,吉恒杉一脸笑容。他平时爱看网剧,最喜欢《军师联盟》,是吴秀波的铁粉。

十年来,我国网络视频内容消费用户达到近6亿。“身边越来越多的人用手机和电脑看网剧、电影和体育比赛,每次上下班坐地铁,都能看到有人拿着手机、带着耳塞看视频。”吉恒杉发现,大家的需求不再是简单地看剧,还想看更精彩有趣的片段、集锦,更主动地找到自己最想看的明星或者场景。

要想实现搜索和智能编辑,就得训练机器从海量的素材中找出相应的场景,并打上标签,就像从茫茫海洋中挑出螃蟹和海龟。男女主角的“吻戏”传递出美好和幸福,一般是剧情发展的高潮,因此成为剧集中最常见的标签,如何教机器识别接吻成了吉恒杉和同事们首要的难题。

这项看上去高冷的人工智能黑科技,在最初的环节真的需要不少“人工”。吉恒杉从图片库和视频中截出数千幅图片,从中一张一张标注出“接吻”的画面。这个过程叫做“数据标注”。

“一天要标注几百张接吻的图像,最多时标注上千张,盯着电脑屏幕看一天,最后都有点麻木了。”吉恒杉说,通常数据标注得越准确、数量越多,模型的效果就越好。自然,机器识别的效果就会更好。

机器毕竟不是人,对有些复杂情况也无法识别。比如,为了拍出唯美画面,“接吻”这个姿态也千差万别,有的深情对视,而有的若即若离,团队里的“吻戏鉴定师”们不得不打印出角度各异的“接吻”画面贴在墙上,一群人激烈讨论到底怎么才算“接吻”。

“吻戏鉴定师”是个技术活,需要根据机器的反应进行繁琐的后期调试。机器学习了上千幅图片中的特征,这时再给机器任意一张“接吻”的画面,它就能认出来了。截止目前,吉恒杉和同事们已经为2万多条“吻戏”打上了标签。

有阿里巴巴的技术实力加持,目前,5分钟时长的视频全链路处理可在10秒内完成。比如剧集《三生三世十里桃花》,每一集50分钟的视频被切割成3000帧图片,机器只需要5秒就能挑出来杨幂和赵又廷的吻戏。

吉恒杉所在的团队目前有8个人。随着业务的快速拓展,“吻戏鉴定师”们也开始接触和研究其他场景,比如哭戏、打戏,接下来还要鉴定体育比赛中的射门、扑球、投篮、庆祝等画面,以便网站小编制作比赛精彩集锦。他们不光要看图片,还要时常“探班”,到比赛或节目现场去观察和体会每个场景、动作的细小差别。

别看这份工作上看去轻松有趣,但其中的辛苦只有做过才知道。盯着电脑屏幕一整天,吉恒杉和同事们最轻松的时刻是下班后去健身房,或者去公司的“太空舱”按摩,享受片刻闲暇。即便是休息,他脑子里想的还是如何教机器“鉴别”更多的明星和场景。

这几年娱乐圈出现了一些新现象,比如,现在的明星长得越来越像,如何训练机器识别古力娜扎和迪丽热巴,如何分辨TFBOYS的三小只,需要不断试错和反复进行模型训练。区分“明星脸”、“网红脸”、“双胞胎”,成了吉恒杉和同事们面临的新挑战。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1821

    文章

    50370

    浏览量

    267082
  • 计算机视觉
    +关注

    关注

    9

    文章

    1716

    浏览量

    47735

原文标题:吻戏鉴定师:高冷IT男标注上千幅图片 训练机器识别“接吻”

文章出处:【微信号:worldofai,微信公众号:worldofai】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    何为红外波段的视觉应用选择合适的工业镜头

    (大于1100nm)波长的光在Si基材质中的透过率较高,故在晶圆检测设备中,短波红外及近红外的光源广泛应用。与之相匹配的,镜头需要提高红外光的透过率,才能得到更好
    的头像 发表于 04-24 17:46 114次阅读
    如<b class='flag-5'>何为</b>红外波段的视觉应用选择合适的工业<b class='flag-5'>镜头</b>

    机器视觉镜头如何发现深海沉船

    。 通常情况下,其他广角镜头需要将摄像机放置在远离拍摄对象的位置,这样拍摄出来的视频会比较模糊,细节较少。视频的边缘可能会弯曲,这种光学效应被称为 \"桶形失真\"。 当你在恶劣的水下
    发表于 02-11 16:03

    MAX14617:USB主机充电器识别与适配器仿真器的卓越之选

    MAX14617:USB主机充电器识别与适配器仿真器的卓越之选 在当今的电子设备中,USB充电和数据传输功能至关重要。为了满足不同设备的充电需求,提高充电效率和兼容性,Maxim推出了一款优秀的产品
    的头像 发表于 02-09 16:55 477次阅读

    MAX14602:高性能USB主机充电器识别与适配器仿真器

    MAX14600–MAX14605/MAX14618:高性能USB主机充电器识别与适配器仿真器 在当今的电子设备中,USB接口不仅用于数据传输,还承担着充电的重要功能。为了实现高效、兼容的充电
    的头像 发表于 02-09 16:50 246次阅读

    MAX14604:USB主机充电器识别与适配器仿真器的卓越之选

    MAX14600–MAX14605/MAX14618:USB主机充电器识别与适配器仿真器的卓越之选 在当今数字化时代,USB设备的使用无处不在,而高效、智能的USB充电技术愈发重要
    的头像 发表于 02-09 16:45 219次阅读

    MAX14600:USB主机充电器识别与适配器仿真器的卓越之选

    MAX14600–MAX14605/MAX14618:USB主机充电器识别与适配器仿真器的卓越之选 在电子设备飞速发展的今天,USB充电技术在不断革新。对于电子工程而言,选择一款性能优异的USB
    的头像 发表于 02-09 16:45 328次阅读

    何为盘点机器人选配(集成)条码识别模块?

    在现代仓储管理和物流行业中,条码识别技术已成为不可或缺的一部分。随着科技的不断进步,盘点机器人逐渐崭露头角,成为提升工作效率和准确性的关键工具。本文将深入探讨如何为盘点机器人选配(集成
    的头像 发表于 12-18 15:47 370次阅读
    如<b class='flag-5'>何为</b>盘点<b class='flag-5'>机器</b>人选配(集成)条码<b class='flag-5'>识别</b>模块?

    远心镜头的应用领域有哪些?

    远心镜头主要用在哪些行业?在机器视觉和工业检测领域,经常会听到“远心镜头”这个词。很多人第一反应是:这和普通镜头有什么区别?其实远心镜头的核
    的头像 发表于 12-01 15:32 560次阅读
    远心<b class='flag-5'>镜头</b>的应用领域有哪些?

    沙姆镜头的工作原理及使用技巧

    沙姆镜头的工作原理基于沙姆定律,即当镜头平面、成像平面和摄物体平面相交于一条直线时,可以扩展焦平面,使不在同一平面的物体能清晰成像。在实际应用中,沙姆
    的头像 发表于 10-28 17:34 1246次阅读
    沙姆<b class='flag-5'>镜头</b>的工作原理及使用技巧

    何为100Tops机器人“退烧”?世强芯片热管理方案,释放100%算力!

    。而过热会导致性能下降、寿命缩短甚至故障。因此,下一代机器人的突破,不只在算法,更在于如何为它们高效“降温”。
    的头像 发表于 10-27 18:21 1191次阅读
    如<b class='flag-5'>何为</b>100Tops<b class='flag-5'>机器</b>人“退烧”?世强芯片热管理方案,释放100%算力!

    在Ubuntu20.04系统中训练神经网络模型的一些经验

    模型。 我们使用MNIST数据集,训练一个卷积神经网络(CNN)模型,用于手写数字识别。一旦模型训练并保存,就可以用于对新图像进行推理和预测。要使用生成的模型进行推理,可以按照以下步
    发表于 10-22 07:03

    沙姆镜头:倾斜对焦 让工业成像更精准

    (ScheimpflugPrinciple),即当镜头平面、成像平面和摄物体平面相交于一条直线时,可以扩展焦平面,使不在同一平面的物体能清晰成像。在机器视觉领域,
    的头像 发表于 09-12 17:02 1298次阅读
    沙姆<b class='flag-5'>镜头</b>:倾斜对焦 让工业成像更精准

    【Sipeed MaixCAM Pro开发板试用体验】 + 04 + 机器学习YOLO体验

    的查找数字的模型 前提条件是我拥有9个分别是汉字1-9的物块牌,从中任意拿走一个,通过对剩余物块牌的识别,可以快速的得到拿走的物块牌并进行屏幕显示。 相关演示见顶部和底部视频 3.离线训练平台搭建
    发表于 07-24 21:35

    何为工业相机匹配最佳的镜头

    场景;系统卡顿:镜头与相机、光源不匹配,拖慢处理速度。选型要精准匹配需求。在工业自动化、机器视觉、智能检测等领域,工业镜头作为工业相机的“眼睛”起着重要作用,选择
    的头像 发表于 06-16 17:33 1883次阅读
    如<b class='flag-5'>何为</b>工业相机匹配最佳的<b class='flag-5'>镜头</b>

    OCR识别训练完成后给的是空压缩包,为什么?

    OCR识别 一共弄了26张图片,都标注好了,点击开始训练,显示训练成功了,将压缩包发到邮箱了,下载下来后,压缩包里面是空的 OCR图片20几张图太少了。麻烦您多添加点,参考我们的o
    发表于 05-28 06:46