0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谁才是真正的C位 让AI告诉你

人工智能与大数据技术 来源:yxw 2019-06-20 17:34 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

C位是近年网络上一个比较热门的词,最早来源于DOTA等游戏领域,是核心位置(Carry位)的简称,代表的是能够在游戏前中期打钱发育并在游戏后期带领队伍力挽狂澜的角色。现在C位一词逐渐扩大到了娱乐圈乃至我们的生活中,在社交、表演、比赛以及各种日常活动场景中,只要当某一个人在人群中处于中心位置,即最重要的人,大家便称呼他是C位(Center位)。

在包含众多人像的照片中,由于每个人的穿着和动作各异,同时人与人之间存在各种交互信息,以及所处的场景不同,我们通过肉眼来确定C位的时候可能会出现各种偏差。在人工智能快速发展的今天,我们能否可以通过AI来自动找出C位呢?答案当然是肯定的。在这篇文章中,我们将介绍如何利用计算机视觉深度学习技术构建一个性能优异的C位检测器,从而快速准确地在一群人中发现真正站C位的那个最重要的人。

C位检测器前传

C位检测器的目标是检测出一群人中最重要的人。一般来说,C位检测器主要由两部分组成,第一部分是人脸/全身检测模型,通过该模型首先检测出照片中的所有人像;第二部分是人像重要性预测模型,通过该模型对检测出的每个人像计算重要性得分,重要性得分最高的人即为C位。

当前的人脸/全身检测模型的性能已经比较理想,而人像重要性预测模型还处在研究和探索阶段,所以下面我们的内容将主要围绕如何量化一群人中每个人的重要性展开。

最直接的人像重要性计算可以基于照片中人像所处的位置和面积进行设计,例如,离照片中心点越近则重要性越高,人像的面积越大则重要性越高等等。然而我们判断一个人是不是C位,除了利用照片中人像所处的位置和面积这类人像自身的几何信息外,还会根据照片上的各种信息综合判断:人像自身的外表信息(上图(a))、与其他人之间的关系信息(上图(b))以及所处的全局场景信息(上图(c))。

人与人之间的关系和人与场景之间的关系对C位的判断起到关键性作用。如果我们只利用人像的自身特征进行重要性计算,例如上图(a)中的红框女性,我们其实无法知道她是否是照片中最重要的人。但我们通过她与周围人之间和与整体场景之间的关系信息分析便可以得出她是C位的结论。

一个理想的人像重要性预测模型应根据上面提到的各方面信息进行联合计算。如何提取照片上丰富的多元化信息?如何对人与人之间和人与场景之间的关系建模,从而获取高层次的语义信息?如何最终根据照片上人像的多元化信息和高层次语义信息的特征进行重要性评估?这些都是摆在我们面前的问题,需要我们去一一解决。

一个出色的C位检测器

为了解决上节末提出的三个问题,我们实验室的小伙伴们攻坚克难,提出了一种全新而高效的人像重要性预测模型,构建了一个出色的C位检测器,相关工作发表在CVPR 2019。下面我们对其中的模型框架和建模思路进行一一介绍,希望给大家带来更多的启发和思考。

整个人像重要性预测模型分为三个模块,分别是特征表达模块、关系计算模块和重要性分类模块。特征表达模块能够有效地提取照片中每个人的自身特征和整张照片的全局场景特征。关系计算模块能够对人与人之间和人与场景之间的关系进行建模。重要性分类模块能够计算每个人像的重要性得分,从而最终识别出最重要的C位人选。完整的模型框架如下图所示。

特征表达模块针对上节末“如何提取照片上丰富的多元化信息?”这一问题进行设计。为了充分地获取人像自身丰富的特征表达,人像的外表信息和几何信息都会进行特征提取。深度卷积神经网络被用来实现提取流程,如下图所示。其中,外表信息被分为内在(绿框)和外在(蓝框)两部分,内在区域更多提取人像固有的外表信息,外在区域更多用于提取人像外表以及与周围环境的上下文信息,从而保证了人像信息的多元化。此外整张照片的全局场景信息(黄框)也会通过卷积神经网络实现特征提取。

关系计算模块针对上节末“如何对人与人之间和人与场景之间的关系建模,从而获取高层次的语义信息?”这一问题进行设计,是整个模型中最关键的模块。在该模块中,关系网络(Relation Networks)被用来对在特征表达模块中提取的人像特征和场景特征进行关系建模。关系网络能够在没有额外监督信息的前提下,自动学习人与人之间和人与场景之间的关系,从而提取更高层次的语义信息以表征人在场景中的重要性。具体会分别建立人与人之间的关系图和人与场景之间的关系图,通过多个并行的关系网络提取关系特征并连接,再与原有的人像特征相加,得到最终的特征表达。

重要性分类模块针对上节末“如何最终根据照片上人像的多元化信息以及高层次语义信息的特征进行重要性评估?”这一问题进行设计。通过对在关系计算模型中提取的每个人像的最终特征表达进行重要/不重要的二分类,将每个人像被分为重要这个类别的概率作为重要性得分,得分最高的人像就是模型认定的C位。

以上三个模块一起实现了端到端的人像重要性训练和预测。最后我们来看一看利用上述模型进行C位检测的可视化结果。红框代表的是模型检测出来的C位,绿框代表的是当前其他最好方法的检测结果,可以看出在充分考虑了照片中人与人之间和人与场景之间的关系信息后,在各种复杂场景下,AI均能够准确地检测出真正的C位。

C位检测可以自动快速地在人群中找出最重要的那个人。通过这篇文章,我们介绍了利用AI进行C位检测的一般流程和遇到的挑战,也进一步分享了一种优秀的C位检测器的构建思路与过程。其中的更多细节大家可以在arXiv上搜索《Learning to Learn Relation for Important People Detection in Still Images》进行查看。最后祝大家都能在各自的领域内不断进步,实现自我价值,站上属于自己的C位。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器视觉
    +关注

    关注

    163

    文章

    4739

    浏览量

    125180
  • 人工智能
    +关注

    关注

    1813

    文章

    49785

    浏览量

    261932
  • 深度学习
    +关注

    关注

    73

    文章

    5591

    浏览量

    123975

原文标题:谁才是真正的C位,让AI告诉你

文章出处:【微信号:TheBigData1024,微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    天数智算AI+HOME解决方案:重构家庭智能生态,家更懂你​

    当你下班回家,家门自动解锁,客厅灯光渐次亮起,电视同步播放追更的剧集,厨房飘出预约烹饪的饭菜香 —— 这样的智能生活场景,不再是科幻电影的想象。天数智算全新推出AI+HOME解决方案,以AI
    的头像 发表于 12-12 09:19 105次阅读
    天数智算<b class='flag-5'>AI</b>+HOME解决方案:重构家庭智能生态,<b class='flag-5'>让</b>家更懂你​

    天数智算AI+HOME解决方案:重构家庭智能生态,家更懂你​

    当你下班回家,家门自动解锁,客厅灯光渐次亮起,电视同步播放追更的剧集,厨房飘出预约烹饪的饭菜香 —— 这样的智能生活场景,不再是科幻电影的想象。天数智算全新推出AI+HOME解决方案,以AI
    的头像 发表于 12-12 09:18 287次阅读
    天数智算<b class='flag-5'>AI</b>+HOME解决方案:重构家庭智能生态,<b class='flag-5'>让</b>家更懂你​

    国内哪些生成式 AI 工具最容易上手?企业真正看重的是“能马上用起来”

    生成式 AI 工具在国内越来越多,但企业真正关心的问题并不是“的模型更大”“的 API 更多”,而是一个更现实的问题: 到底哪类工具最容易在公司里用起来? 过去一年里,无论是市场部
    的头像 发表于 12-08 10:55 164次阅读

    家更懂你!天数智算「AI HOME智能体」开启智慧家庭新体验

    对于追求品质生活的家庭而言,天数智算AI HOME智能体不仅是一台存储设备,更是一 “贴心的家庭管家”—— 它记住的喜好,守护的隐私,联动
    的头像 发表于 12-04 17:32 723次阅读
    <b class='flag-5'>让</b>家更懂你!天数智算「<b class='flag-5'>AI</b> HOME智能体」开启智慧家庭新体验

    【选型建议】选Mesh还是LoRa?才是的理想无线方案?

    技术,才是您项目真正需要的连接方案? 对比两者的网络架构、传输特性、功耗管理与应用适配性,一句话总结: “Mesh”适合近距互动, “LoRa”适合远距上报。 01、技术原理概述:两种“网”的不同思路 01无线 Mesh 自组网:节点互联、路径多样的“网状思
    的头像 发表于 11-19 17:51 585次阅读

    华为云Flexus AI智能体,每家企业都拥有开箱即用的AI超能力

    2024年,不谈AI的企业已被时代抛下。但真正试过的人都知道:大模型很强,落地很难。招不到AI工程师、搞不懂复杂参数、担心数据泄露、算力成本烧不起……这些痛点90%的企业在智能化门口
    的头像 发表于 11-17 17:07 701次阅读
    华为云Flexus <b class='flag-5'>AI</b>智能体,<b class='flag-5'>让</b>每家企业都拥有开箱即用的<b class='flag-5'>AI</b>超能力

    科技云报到:找到真场景,抓住真需求,这样的具身智能才是AI

    科技云报到:找到真场景,抓住真需求,这样的具身智能才是AI
    的头像 发表于 10-10 14:49 4343次阅读

    KM告诉 人工监测VS在线监测 才是效率王者?#在线监测

    在线监测
    KM预测性维护专家
    发布于 :2025年08月15日 10:06:36

    AI的未来,属于那些既能写代码,又能焊电路的“双栖人才”

    自己的边缘智能盒子。不是在“用AI”,是“AI用起来”。这就是AI工程师
    发表于 07-30 16:15

    淘宝 vs 京东电商 API 接口,才是数据王者?

    API进行客观比较,帮助您判断才是真正的“数据王者”。 1.API功能覆盖范围 API的功能范围决定了开发者能获取的数据类型。淘宝API通过阿里巴巴开放平台提供,覆盖商品、订单、用户、物流等多个模块。例如,商品API支持搜索、
    的头像 发表于 07-08 15:51 667次阅读
    淘宝 vs 京东电商 API 接口,<b class='flag-5'>谁</b><b class='flag-5'>才是</b>数据王者?

    声纹解锁个性化!启明云端硅思物语AI平台设备“认准的声音”

    的设备能“听声识人”吗?>小明对着设备问:“猜猜我是?”>设备秒答:“是启明云端的程序员小明!”>换人提问,设备立刻回应:“是小美,小明的女朋友!”——这不是科幻电影,而是
    的头像 发表于 06-17 18:02 1210次阅读
    声纹解锁个性化!启明云端硅思物语<b class='flag-5'>AI</b>平台<b class='flag-5'>让</b>设备“认准<b class='flag-5'>你</b>的声音”

    最讨厌AI的人选了特朗普

    魔幻的“川普美国”,只是果,选了特朗普,才是
    的头像 发表于 04-22 16:42 1101次阅读
    最讨厌<b class='flag-5'>AI</b>的人选了特朗普

    首创开源架构,天玑AI开发套件端侧AI模型接入得心应手

    科正将AI能力体系化并赋能终端生态。 大会上,联发科定义了“智能体化用户体验”的五大特征:主动及时、知懂你、互动协作、学习进化和专属隐私信息守护。这五大特征需要跨越从芯片、模型、应用、终端乃至整个
    发表于 04-13 19:52

    AnyDesk vs. Raspberry Pi Connect,才是“远程霸主”?

    在树莓派的世界里,远程控制就像是一场魔法对决,而今天,我们的主角是两远程控制界的“魔法师”——AnyDesk和RaspberryPiConnect。它们都声称自己是远程控制的最佳选择,那么,才是
    的头像 发表于 03-25 09:24 652次阅读
    AnyDesk vs. Raspberry Pi Connect,<b class='flag-5'>谁</b><b class='flag-5'>才是</b>“远程霸主”?

    AI全能助手 三星Galaxy S25系列生活更高效便捷

    生成式AI技术为智能手机开启全新的进化路径。如何更高效地管理行程,如何更快速地获取信息,如何设备真正理解用户的需求,成为广大用户对智能手机新的期待。三星Galaxy S25系列凭借全面升级
    的头像 发表于 03-24 16:05 876次阅读