如何充分利用各种用户反馈信息，来提升推荐系统的性能？-电子发烧友网

如何充分利用各种用户反馈信息，来提升推荐系统的性能？来自腾讯微信团队的谢若冰、凌程、王亚龙、王瑞、夏锋和林乐宇研究员对此进行了研究，并提出新的 Deep Feedback Network (DFN) 模型，性能相比基线取得显著提升。目前，该研究相关论文《Deep Feedback Network for Recommendation》已被 IJCAI-2020 会议接收。

在推荐系统中，用户的显式反馈、隐式反馈、正反馈和负反馈都能够反映用户对被推荐物品的偏好，这些反馈信息在推荐系统中十分有用。然而，现在的大规模深度推荐模型往往以点击为目标，只看重以用户点击行为为代表的隐式正反馈，而忽略了其它有效的用户反馈信息。腾讯微信的这项研究关注用户多种显式/隐式和正/负反馈信息，学习用户的无偏兴趣偏好。具体而言，该研究团队提出了 Deep Feedback Network (DFN) 模型，综合使用用户的隐式正反馈（点击行为）、隐式负反馈（曝光但未点击的行为）以及显式负反馈（点击不感兴趣按钮行为）等信息。DFN 模型使用 internal feedback interaction component，来抓住用户行为序列中的细粒度行为级别交互，然后通过 external feedback interaction component，使用精确但稀少的隐式正反馈和显式负反馈作为监督，从噪音较多的隐式负反馈中进一步抽取用户的正负反馈信息。在实验中，研究人员基于微信看一看的数据，进行了丰富的离线和在线实验，模型性能与 baseline 相比取得显著提升。一、模型背景与简介推荐系统在日常生活中被广泛使用，为用户获取信息与娱乐提供了极大的便利。推荐系统算法往往基于用户与系统的交互，这些交互行为可以大致分为以下两类：显式反馈与隐式反馈。

显式反馈从用户对物品的直接态度中获取，例如评论中的一星到五星，或者微信看一看系统中的「不感兴趣」按钮。这类反馈能够直接表达用户的正向以及负向偏好，但是此类反馈的数量往往不多。

隐式反馈从用户的行为中间接获得，例如用户的点击/不点击行为。这些信息在推荐系统中往往是海量的，但是这些信息有着较多噪声（用户点击的并不一定是他真正喜欢的）。另外，隐式反馈通常是以正反馈的形式出现，推荐中的隐式负反馈存在巨大噪声（未展现信息或者未点击信息未必表示用户不喜欢这些内容）。

在近期的深度推荐系统中，CTR 导向的目标受到极大关注。因此，模型不可避免地只关注和目标紧密相关的用户点击行为，忽略了其它用户行为中蕴含的丰富信息。仅考虑 CTR 导向目标的推荐模型往往会遇到以下两个问题：（1）CTR 导向目标只关注用户喜欢什么，没有关注用户不喜欢什么。这样，模型的推荐结果容易同质化和趋热化，损害用户体验。因此，负反馈信息是必要的。（2）用户除了被动地接受系统推荐的物品，有时也需要主动和即时的反馈机制。用户希望能够高效和准确地告知系统自己喜欢或者不喜欢什么。另外，用户的显式和隐式反馈之间也存在割裂（用户点击的并不一定是他真正喜欢的）。因此，显式反馈也是必要的。显式信息和隐式信息能够作为彼此的补充，相辅相成。已有工作使用用户的未点击/未曝光行为作为隐式负反馈，这样会引入极大的噪声。另外一些工作尝试使用用户的显式负反馈信息。这些信息固然精确，但是也往往比较稀疏。

图 1：微信看一看系统中的三种反馈，从左到右分别为隐式正反馈（点击行为）、隐式负反馈（曝光但未点击的行为）以及显式负反馈（点击不感兴趣按钮行为）。为了解决这些问题，综合使用用户多种显式/隐式和正/负反馈信息学习更好的无偏用户表示，该团队提出了 Deep Feedback Network (DFN) 模型。图 1 给出了在微信看一看场景中的三种用户反馈。DFN 通过 internal feedback interaction component 抓住用户行为序列中的细粒度行为级别交互，然后通过 external feedback interaction component，使用精确但稀少的隐式正反馈和显式负反馈作为监督，从噪音较多的隐式负反馈中进一步抽取用户的正负反馈信息。这些反馈特征会和其他用户/物品特征混合，并行使用 FM、Deep 和 Wide 层进行特征交互，最后进行 CTR 预估。该研究团队基于微信看一看推荐系统，设计了离线和线上实验，在多个指标上出现显著提升。这篇工作的主要贡献如下：

首次融合隐式正反馈（点击行为）、隐式负反馈（曝光但未点击的行为）、显式负反馈（点击不感兴趣按钮行为）和它们之间的交互信息进行用户行为建模；

提出全新的 Deep Feedback Network (DFN) 模型，能够学习到用户的无偏兴趣偏好；

模型在离线和在线任务上的性能都得到了显著提升，具有工业级实用价值。论文也提出了一个 feed 流中的显式负反馈预测任务。

二、模型结构 DFN 模型主要分为三个阶段：

首先，deep feedback interaction module 以用户的多种反馈行为作为输入，输出用户的反馈特征。

然后，Feature Interaction Module 进一步考虑用户的其它特征和物品特征，使用 FM、Deep 和 Wide 层进行特征交互。

最后，输出层使用 CTR 作为训练目标。

图 2 给出了 DFN 的整体结构。

图 2：DFN 的整体结构。 deep feedback interaction module 是该模型的主要创新点。它包括两个组成部分：Internal Feedback Interaction Component 和 External Feedback Interaction Component。图 3 给出了 deep feedback interaction module 的结构。

图 3：deep feedback interaction module 首先，在 Internal Feedback Interaction Component 中，用户的隐式正反馈、隐式负反馈和显式负反馈序列和 target item 一起，通过一个 transformer 层，得到在各个序列内部细粒度的 item-level 交互信息。然后经过 average 层得到三种反馈的特征表示，其中隐式正反馈特征中蕴含高质量的用户正向偏好，显式负反馈特征中蕴含高质量的用户负向偏好。第二步，在 External Feedback Interaction Component 中，隐式负反馈序列往往是三种行为中最多的行为，但也是噪声最大的行为。该研究把高质量的和 target item 交互后的隐式正反馈特征和显式负反馈特征看作一种高质量指导，从用户未点击序列中挖掘用户或许喜欢/不喜欢的物品，补充用户的正向负向偏好。研究人员使用一个 attention 层，得到两种用户弱正向/负向反馈特征。这两种弱反馈特征和第一步的三种反馈特征拼接后成为最终的用户反馈特征。第三步，在 Feature Interaction Module 中，研究人员使用 FM、Wide 和 Deep 层，对用户其它特征、物品特征和用户反馈特征等进行低阶/高阶特征交互。这个模块是为了充分利用各种特征辅助推荐，使得模型在真实工业级任务上达到最好的效果。使用 Wide 层主要是为了给潜在的特征工程留下接口。最后，研究人员基于 CTR loss 进行训练。除去传统的正例和未点击负例，该研究还增加了一项预测用户负反馈点击的 loss。由于在实际推荐系统中，用户给出主动显式负反馈的次数极少，显式负反馈中的负向信息也极其强烈，所以该研究单独在 loss 中强调了这一项，并且给予了较大的训练权重。

三、实验结果离线和线上实验均在微信看一看上进行，离线数据集包含千万级用户在百万级物品上的亿级行为。模型离线 CTR 预估结果如图 4：

图 4：CTR 预估结果。 DFN 模型取得了 SOTA 结果。研究者还通过图 5 给出了一个新的不感兴趣预估实验。由于用户点击不感兴趣按钮说明用户对于推荐结果很失望，这类推荐结果会极大损害用户体验，模型应该能够对这类反馈及时捕捉并响应，理想状态下应通过用户实时行为避免用户产生显式负反馈的结果。

图 5：dislike 预估结果。该研究还进行了控制变量实验。证明反馈模块的每一个组成部分都是有效的。

图 6：控制变量实验结果。最后，研究人员还给出了参数实验，探索不感兴趣 loss 的权重影响。

图 7：参数实验结果。四、总结在这篇论文中，作者初步研究了推荐系统中的多种显式/隐式和正/负反馈之间的协同合作机制。DFN 模型能够基于多种反馈信息即时学习用户的无偏正负向兴趣，在点击预估和不感兴趣预估等多个任务上均实现性能提升效果。直观而有效的模型也使得 DFN 能成功在工业级推荐系统中得到部署和验证。腾讯微信团队预测，用户的显式反馈特别是显式负反馈信息将会在未来推荐系统中起到更加重要的作用，在发掘推荐系统可解释性的同时提升用户体验。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

模型

模型

+关注

关注
1

文章
2704

浏览量
47681
DFN

DFN

+关注

关注
0

文章
11

浏览量
8472
数据集

数据集

+关注

关注
4

文章
1178

浏览量
24349

原文标题：如何实现更好的推荐结果？腾讯微信提出深度反馈网络

文章出处：【微信号：tyutcsplab，微信公众号：智能感知与物联网技术研究所】欢迎添加关注！文章转载请注明出处。

光学透镜设计理论分析阵列式光源系统设计

在照明系统设计中，接收面的均匀照明以及光能的充分利用一直是光源设计急需解决的问题。

发表于 02-28 10:55 •274次阅读

光学透镜设计理论分析阵列式光源<b class='flag-5'>系统</b>设计

如何充分利用单片机（MCU）的非易失性存储器呢？

如何充分利用单片机（MCU）的非易失性存储器单片机（MCU）的非易失性存储器（NVM）是存储数据和程序的重要组成部分。它可以保留数据，即使在断电或复位后也不会丢失。为了充分利用MCU的NVM，我们

发表于 12-15 10:10 •574次阅读

5G全连接工厂如何实现？

　5G全连接工厂是充分利用5G信息通信技术，实现产线级、车间级、工厂级等生产现场的互联互通，形成信息（IT）运营（OT）与工业互联网技术深度融合、数据充分利用、应用高效赋能的先进工厂，

发表于 12-02 10:58 •724次阅读

宏集Panorama SCADA如何充分利用企业运营数据，提高运营效益？#SCADA #工业自动化

物联网工业自动化

虹科工业物联网技术

发布于 :2023年11月06日 14:11:50

在MCU开发中如何充分利用各种类型的断点？

在MCU开发中如何充分利用各种类型的断点？

发表于 09-18 16:22 •382次阅读

在MCU开发中如何<b class='flag-5'>充分利用</b><b class='flag-5'>各种</b>类型的断点？

反馈深度是什么？什么是深度负反馈？

被视为一个评价系统性能的重要指标，反馈深度越深，整个系统在处理复杂问题时的性能也就更为优秀。在控制系统中，

发表于 09-17 17:14 •4314次阅读

Armv8.1-M性能监控用户指南

确定·验证、验证和测试·检查不同的IP块(如缓存)的利用情况·测量系统中的延迟M-Profile架构提供不同的功能来帮助用户执行此类任务，包括Armv8.1-M架构的主线变体中引入的性能

发表于 08-22 06:25

IBM Aspera Connect常见问题

IBM Aspera采用了一种不同的方法来应对全球广域网上大数据移动的挑战。Aspera没有优化或加速数据传输，而是使用突破性的传输技术消除了潜在的瓶颈，充分利用可用的网络带宽来最大限度地提高速度，并在没有理论限制的情况下快速扩

发表于 08-11 06:51

光学图像信息传递系统概述

正确的照明。 ▷ 成像系统：将被测物体成像在探测器上，并符合以下条件： ◎(横向)放大率恰当，充分利用探测器的有效敏感面积，形成被测物体的完整像(参见图 2); 图2. 光学图像信息处理系统(Imaging processin

发表于 08-09 06:55 •271次阅读

图形分析器用户指南

图形分析器是一个帮助OpenGL ES和Vulkan开发人员通过API级别的分析来充分利用其应用程序的工具。该工具允许您观察API调用参数和返回值，并与正在运行的目标应用程序交互，以调查单个API

发表于 08-09 06:08

如何充分利用各种类型的断点

在面向高可靠性应用开发MCU程序的过程中，工程师通常会遇到设定断点的问题，断点的合理使用对于更好地编程和MCU使用是一种挑战。借助新的工具，这些断点就可以发挥巨大的作用，成为开发工作中的利器。

发表于 07-24 14:29 •350次阅读

如何充分利用Emulation和FPGA效果才能翻倍呢？

随着芯片规模和系统代码越来越复杂庞大，产品的上市时间不断面临挑战。

发表于 07-19 17:10 •1211次阅读

xAI将充分利用“马斯克生态圈”

比如在最受关心的芯片方面，会和特斯拉合作。此前特斯拉自研了Dojo D1芯片、Dojo超算，可用于处理大规模训练推理等。但也不排除软件方面合作的可能，马斯克表示特斯拉的AI团队非常强大。

发表于 07-16 16:40 •427次阅读

工业多通道数据采集系统中Σ-Δ型ADC的信号调理

许多高端工业应用中，高性能数据采集系统(DAS)与各种传感器之间需要提供适当的接口电路。如果信号接口要求提供多通道、高精度的幅度和相位信息，这些工业应用可以

发表于 06-12 14:57 •579次阅读

充分利用16 GT/s PCIe第4代带宽

PCI Express Gen 4 的实施正在向 Gen 4 0.7 版本迈进。重要的是，不仅物理层提供 16 GT/s 的速率，而且整个协议栈也应该能够饱和完全分配的带宽。为了使整个带宽饱和，以下两个关键功能正在获得牵引力：

发表于 05-26 16:12 •1583次阅读