0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌教你用"注意力"提升产品体验

CVer 来源:新智元 2023-06-27 14:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

【导读】让用户在体验过程中关注主要部分,得先抓住用户的眼球。

人每时每刻都在接收海量的信息,例如每秒进入视网膜的数据量就达到了10的10次方比特,但人类会选择性地关注一些任务相关或感兴趣的区域以进一步处理,比如记忆、理解和采取行动等。

如何将人类的注意力进行建模,即显著性模型(saliency model)在神经科学、心理学、人机交互(HCI)和计算机视觉等领域开始得到广泛关注。

预测「哪些区域可能吸引注意力」的能力在图形、摄影、图像压缩和处理以及视觉质量测量等领域具有许多重要应用。

不过,使用机器学习和基于智能手机的凝视估计来加速眼动研究需要专门的硬件,每台成本高达三万美元,并不具备广泛推广的条件。

最近,谷歌的研究人员介绍了两篇相关领域的研究论文,分别发表在CVPR 2022和CVPR 2023上,主要研究了如何利用「人类注意力的预测模型」来实现更好的用户体验,例如用图像编辑操作以最大限度地减少视觉混乱、分心或伪影等问题,使用图像压缩来更快地加载网页或应用程序,并引导机器学习模型实现更直观的类人解释和模型性能。

这两篇论文主要关注图像编辑和图像压缩,并讨论了在具体应用场景下,对注意力建模的相关最新进展。

注意力引导的图像编辑

对人体注意力进行建模,通常需要把眼睛看到的图像作为输入,如自然图像或网页的屏幕截图等,并将预测的热力图作为输出。

预测得到的热力图会根据「眼球跟踪器」或「鼠标悬停/点击」等收集到的实时注意力近似值进行评估。

之前的模型大多利用手工制作的视觉线索特征,如颜色/亮度对比度、边缘和形状等,最近也有一些方法转向基于深度神经网络来自动学习判别特征,使用的模型包括卷积、递归神经网络以及视觉Transformer网络等。

谷歌在CVPR2022上发表的一篇论文中,利用深度显著性模型(deep saliency models)进行视觉逼真的编辑(visually realistic edits),可以显著改变观察者对不同图像区域的注意力。

c4709a24-14a8-11ee-962d-dac502259ad0.png

论文链接:https://openaccess.thecvf.com/content/CVPR2022/papers/Aberman_Deep_Saliency_Prior_for_Reducing_Visual_Distraction_CVPR_2022_paper.pdf

比如移除背景中分散注意力的物体可以降低照片中的杂乱程度,从而提高用户满意度;同样,在视频会议中,减少背景中的混乱度也可以增加对主要发言者的关注度。

为了探索哪些类型的编辑效果是可实现的,以及这些效果如何影响观众的注意力,研究人员开发了一个优化框架,以用于使用可区分的预测显著性模型来引导图像中的视觉注意力。

c49b203c-14a8-11ee-962d-dac502259ad0.png

给定输入图像和表示干扰物区域的二元遮罩,使用显著性预测模型对遮罩内的像素提供指导并编辑图像,降低遮罩区域内的显著性。

为了确保编辑后的图像自然且逼真,研究人员精心选择了四种图像编辑操作符,其中包括两个标准图像编辑操作(即重新着色和图像扭曲);以及及两个可学习的操作符,即多层卷积滤波器和生成模型(GAN)。

利用这些操作符,该框架可以产生各种强大的效果,包括重新着色、修复、伪装、对象编辑、插入以及面部属性编辑,并且所有这些效果都是由单个预训练的显着性模型驱动的,没有任何额外的监督或训练。

c4a70bf4-14a8-11ee-962d-dac502259ad0.png

减少视觉干扰的例子,由显著性模型与几个操作符引导,干扰物区域被标记在显著性图(红色边框)的顶部

需要注意的是,研究人员的目标不是与产生每种效果的专用方法竞争,只是演示如何通过嵌入在深度显著性模型中的知识来指导多个编辑操作。

个性化的显著性建模

之前的研究假定单个显著性模型即可完成对全部人群的预测任务,不过人类的注意力在个体之间是不同的:虽然对显著线索的检测是一致的,但具体的顺序、解释和注视分布可以有很大的区别,这一问题也提供了为个人或团体创建个性化用户体验的机会。

在CVPR2023的一篇论文中,谷歌的研究人员引入了一个用户感知的显著性模型,也是首个仅用单模型就可以完成预测某个用户、一组用户和通用人群注意力的框架。

c4bc6b5c-14a8-11ee-962d-dac502259ad0.png

论文链接:https://openaccess.thecvf.com/content/CVPR2023/papers/Chen_Learning_From_Unique_Perspectives_User-Aware_Saliency_Modeling_CVPR_2023_paper.pdf

该框架的核心是将每个参与者的视觉偏好与每个用户的注意力热力图和自适应用户遮罩进行组合,需要每个用户的注意力标注在训练过程中都是可用的,可用的数据集包括用于自然图像的OSIE移动的凝视数据集、网页的FiWI和WebSaliency数据集。

c4e4ee1a-14a8-11ee-962d-dac502259ad0.png

该模型并没有预测表示所有用户的注意力的单个显著性热力图,而是预测每个用户的注意力图以编码个体的注意力模式。

此外,该模型采用用户掩码(大小等于参与者数量的二进制向量)来指示当前样本中参与者的存在,使得模型可以选择一组参与者,并将偏好组合成单个热力图。

c517e1ee-14a8-11ee-962d-dac502259ad0.png

预测注意力与GT值,EML-Net是最先进模型的预测,对于两个参与者/组具有相同的预测;Ours提出的用户感知显著性模型的预测,可以正确预测每个参与者/组的独特偏好。第一个图像来自OSIE图像集,第二个图像来自FiWI。

以显著特征为中心的渐进式图像解码

除了图像编辑,人类注意力模型也可以改善用户的浏览体验。

在上网时,最让人感到不舒服的用户体验之一就是等待加载带有图像的网页,特别是在网速很慢的情况下,一种改善用户体验的方式是图像的渐进式解码,可以随着数据逐渐下载再解码,并显示越来越高分辨率的图像,直到全分辨率图像准备就绪。

渐进式解码通常按顺序进行(例如,从左到右、从上到下),使用预测注意力模型,就可以基于显著性对图像进行解码,从而可以首先发送显示最显著区域的细节所需的数据。

例如,在肖像中,用于面部的字节可以优先于用于失焦背景的字节,因此用户更早地感知到更好的图像质量,并体验到显著减少的等待时间。

基于这个想法,预测注意力模型可以帮助图像压缩和更快地加载具有图像的网页,改善大型图像和流媒体/VR应用的渲染。

结论

上面两篇论文展示了人类注意力的预测模型如何通过具体的应用场景实现令人愉快的用户体验,例如图像编辑操作,可以减少用户图像或照片中的混乱、分心或伪影,以及渐进式图像解码,可以大大减少用户在图像完全渲染时的感知等待时间。

文中提出的用户感知显著性模型可以进一步为个人用户或群体个性化上述应用程序,从而实现更丰富、更独特的体验。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6244

    浏览量

    110261
  • 神经网络
    +关注

    关注

    42

    文章

    4827

    浏览量

    106797
  • 图像
    +关注

    关注

    2

    文章

    1095

    浏览量

    42158

原文标题:CVPR 2023 | 谷歌教你用"注意力"提升产品体验

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Vishay Vitramon Touch "N" Tune™ MLCC套件技术分析

    Vishay / Vitramon Touch "N" Tune™ 套件是专为RF工程师设计的专用套件,用于利用高频多层陶瓷电容器 (MLCC) 进行电路调谐。电容器可临时接触
    的头像 发表于 11-09 17:46 1112次阅读

    "Access violation" 错误,复位位置,重新打印

    "Access violation" 错误
    的头像 发表于 11-08 07:16 193次阅读

    CXK控制变压器:船舶导航为何总"失灵"?

    在浩渺无垠的大海上,导航设备的精准度直接关系到船舶的安全。您是否曾为导航设备频繁出现数据漂移而困扰?雷达定位偏差扩大、电子海图轨迹抖动,这些现象背后往往隐藏着供电系统的"心跳失常&quot
    的头像 发表于 09-28 10:34 323次阅读
    CXK控制变压器:船舶导航为何总&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;失灵&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?

    光耦合器:电子世界的 &amp;quot;光桥梁&amp;quot;

    在现代电子设备的复杂电路中,信号的传输与隔离至关重要。就像城市交通中需要桥梁来跨越障碍、连接不同区域一样,电子电路里也需要一座 &quot;桥梁&quot; 来实现信号的安全、高效传输,同时避免
    的头像 发表于 08-22 16:58 790次阅读

    精密设备的&amp;amp;quot;电力保镖&amp;amp;quot;:优比施UPS如何守护数据与硬件安全?

    一、用户痛点:精密设备的&quot;断电恐惧症&quot;在数据中心、医疗实验室、工业控制等场景中,精密电子设备对电源的依赖已达到&quot;零容忍&quot;级别:数据安全危机:服务
    的头像 发表于 07-25 09:00 432次阅读
    精密设备的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;电力保镖&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;:优比施UPS如何守护数据与硬件安全?

    Modbus RTU通讯协议:瑞银电能表的&amp;quot;普通话&amp;quot;指南

    Modbus RTU协议就像工业设备间的&quot;普通话&quot;,让不同品牌的电能表、传感器等设备能够顺畅&quot;交流&quot;。
    的头像 发表于 07-18 18:30 1382次阅读
    Modbus RTU通讯协议:瑞银电能表的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;普通话&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;指南

    地热发电环网柜局放监测设备:清洁能源电网的&amp;amp;quot;安全卫士&amp;amp;quot;

    文章由山东华科信息技术有限公司提供在&quot;双碳&quot;目标驱动下,地热发电作为稳定基荷电源,其电网接入设备的可靠性至关重要。环网柜作为地热电站与主网连接的关键节点,其内部绝缘缺陷可能引发
    的头像 发表于 07-16 10:15 405次阅读
    地热发电环网柜局放监测设备:清洁能源电网的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;安全卫士&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    为什么GNSS/INS组合被誉为导航界的&amp;amp;quot;黄金搭档&amp;amp;quot;?

    在导航技术领域,GNSS(全球导航卫星系统)和INS(惯性导航系统)的结合,一直被业界誉为&quot;黄金搭档&quot;。它们优势互补,克服了单一系统的局限性,为高精度、高可靠性的导航提供了完美
    的头像 发表于 07-09 17:12 653次阅读
    为什么GNSS/INS组合被誉为导航界的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;黄金搭档&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?

    人形机器人为什么要定制? ——揭秘工业场景的&amp;quot;千面需求&amp;quot;

    核心洞察:标准化机器人难以破解工业场景的&quot;需求碎片化&quot;困局。富唯智能通过 &quot;五大模块柔性架构+零代码中枢&quot; ,为 人形机器人为什么要定制 提供了
    的头像 发表于 06-10 17:19 953次阅读
    人形机器人为什么要定制? ——揭秘工业场景的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;千面需求&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    仓储界的&amp;quot;速效救心丸&amp;quot;,Ethercat转PROFINET网关实战案例

    实战案例,Ethercat转PROFINET网关,仓储界的&quot;速效救心丸&quot;
    的头像 发表于 05-11 10:32 605次阅读
    仓储界的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;速效救心丸&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;,Ethercat转PROFINET网关实战案例

    电缆局部放电在线监测:守护电网安全的&amp;amp;quot;黑科技&amp;amp;quot;

    运行的命脉。而在这场与时间的赛跑中,电缆局部放电在线监测技术正扮演着&quot;安全卫士&quot;的角色,科技力量将隐患扼杀于萌芽状态。一、看不见的&quot;定时炸弹&
    的头像 发表于 04-14 18:12 718次阅读
    电缆局部放电在线监测:守护电网安全的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;黑科技&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    隧道管廊变压器局放在线监测:为地下&amp;amp;quot;电力心脏&amp;amp;quot;装上智能听诊器

    文章由山东华科信息技术有限公司提供在城市的地下脉络中,隧道管廊承载着电网的&quot;主动脉&quot;,而变压器堪称其中的&quot;动力心脏&quot;。这个封闭而潮湿的环境中,变
    的头像 发表于 04-09 16:37 685次阅读
    隧道管廊变压器局放在线监测:为地下&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;电力心脏&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;装上智能听诊器

    【硬核测评】凌华DAQE双雄争霸:工业数据采集界的&amp;amp;quot;速度与激情&amp;amp;quot;实战解析

    在汽车碰撞测试的惊险瞬间,半导体晶圆的微观世界,甚至是狂风呼啸的风力发电场,一场关于数据采集的&quot;军备竞赛&quot;正在上演。凌华科技推出的DAQE-2010与DAQE-2010(G)这对&quot;黄金搭档&
    的头像 发表于 03-26 15:07 731次阅读
    【硬核测评】凌华DAQE双雄争霸:工业数据采集界的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;速度与激情&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;实战解析

    合微电子携手中山古镇政府开启&amp;amp;quot;智光互联&amp;amp;quot;新纪元 共筑全球智能照明产业高地

    2025年3月18日,在第32届中国古镇国际灯饰博览会的聚光灯下,合微电子与中山市古镇镇政府签署战略合作协议,启动&quot;智光互联&quot;合作项目。作为国内物联网通信技术与芯片研发的领军
    的头像 发表于 03-19 09:47 894次阅读
    <b class='flag-5'>力</b>合微电子携手中山古镇政府开启&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;智光互联&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;新纪元 共筑全球智能照明产业高地

    创新驱动未来:大为锡膏为高精尖散热器技术注入&amp;amp;quot;强芯&amp;amp;quot;动力

    在人工智能、区块链、人形机器人、高性能计算等前沿技术飞速发展的今天,电子设备的&quot;体温管理&quot;正成为决定技术突破的关键门槛。当算以指数级增长时,散热器作为设备的&quot
    的头像 发表于 02-13 10:41 690次阅读
    创新驱动未来:大为锡膏为高精尖散热器技术注入&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;强芯&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;动力