0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

解决长尾和冷启动问题的基本方法

深度学习自然语言处理 来源:圆圆的算法笔记 作者:圆圆的算法笔记 2022-09-05 14:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1什么是长尾问题

长尾问题一直是很多场景中最难优化的问题,特别是在推荐系统领域,长尾问题十分常见,却很难优化。在推荐系统中,长尾问题指的是,某些实体在训练数据中出现次数非常少,导致模型对这部分样本打分效果很差。典型的场景包括,新用户没有几条浏览行为,如何准确推荐用户感兴趣的内容;一些商品非常小众,用户反馈很少,如何对这些商品进行推荐等等。长尾在一个成熟的系统中往往服从二八定律,即20%的头部实体贡献了80%的数据,而剩余80%的实体只有20%的数据,实际场景中甚至比二八还要长尾。

长尾问题的难点主要体现在以下2点。首先,长尾实体的样本量太少,模型很难学习这部分样本的规律,例如用户的embedding、商品的embedding等,都是需要大量数据学习的。其次,头部样本在数量上占绝对优势,导致模型偏向拟合头部样本的规律,而尾部样本的规律和头部样本可能有较大差异,导致模型在尾部样本效果不好。

2如何解决长尾问题

那么,如何解决长尾问题呢?业内工作主要包括两种核心优化方法。第一种方法是基于meta-learning解决长尾问题。刚才我们说到,长尾用户或商品的数据量少,模型难学习,那么我们就让模型具备在少量样本上能学的比较好的能力就可以了。而meta-learning正是让模型实现上述能力的方法。我在之前的文章Meta-learning核心思想及近年顶会3个优化方向中对meta-learning的核心思路进行了详细介绍,感兴趣的同学可以进一步深入阅读。第二种方法是基于图学习解决长尾问题。长尾部分的由于数据少无法学到良好的embedding,在图学习中,可以利用丰富的邻居节点信息对长尾实体的信息进行补充,进而学到更好的embedding。

下面,我们分别来看看基于meta-learning的方法和基于图学习的方法解决长尾问题的典型工作。

3基于meta-learning的方法

基于meta-learning的长尾问题解决方法又可以分为两种思路,一种是利用meta-learning生成长尾用户或商品的良好embedding,另一种是利用meta-learning让模型获得在小样本上的快速学习能力。这里分别介绍两个思路的两篇经典文章。

第一篇文章是Improving ctr predictions via learning to learn id embeddings(SIGIR 2019)。这篇文章主要场景是广告的ctr预估,解决的问题是如何提升冷启动广告的预测效果。本文提出了基于meta-learning的冷启动广告embedding学习方法。首先将每个ad的ctr预测看成是meta-learning中一个独立的任务。然后学习一个embedding生成器,生成器的输入是广告的特征,输出embedding。整个过程利用meta-learning的思路进行学习,利用meta-learning中的support set和query set模拟一个冷启动广告生成embedding和使用embedding预测,进而优化embedding生成器。

b9d71712-2cd9-11ed-ba43-dac502259ad0.png

整个meta-learning的过程如下所示,在一个预训练好的模型基础上进行。随机选择一些广告,生成两个batch的数据。使用embedding生成器生成embedding后使用第一个batch计算loss,再利用这个loss更新一步生成器(内循环);然后使用更新后的生成器计算另一个batch上的loss(外循环),并更新最终参数。

b9ee5b16-2cd9-11ed-ba43-dac502259ad0.png

第二篇文章是MeLU: meta-learned user preference estimator for cold-start recommendation(KDD 2019)。这篇文章主要也是借助了meta-learning让模型具有快速学习能力,让模型能够在冷启动样本上,只看到少数几个item就能进行快速的更新参数。

ba01e0aa-2cd9-11ed-ba43-dac502259ad0.png

这篇文章重点解决的是user侧的冷启动问题,对于一个user的数据分成support set和query set,在support set内循环后在queryset评估效果并进行全局更新。embedding层不使用meta-learning,只在全连接层进行meta-learning。

ba18ba14-2cd9-11ed-ba43-dac502259ad0.png

4基于图学习的方法

基于图的学习方法通过图建立不同实体之间的关系,进而可以用其他实体的信息丰富长尾实体的信息,缓解由于长尾导致的样本不充分无法学习良好表示的问题。

Learning Graph Meta Embeddings for Cold-Start Ads in Click-Through Rate Prediction(SIGIR 2021)利用图学习解决新ad的embedding生成问题。对于新ad,使用属性特征和图学习生成一个合理的embedding。根据属性重合度构造新ad的相似邻居,并按照属性的重合度排序,得到最相似的几个ad。然后利用GAT进行new ad和其邻居的信息融合,再用全连接生成新ad的向量表示,作为id embedding。这个过程相当于根据属性找到与新ad最相似的旧ad,用旧ad的信息丰富新ad的embedding。在训练方法上,先用旧ad训练一个正常的ctr预估模型,然后固定ctr模型的参数,单独训练新ad表示生成部分的参数,利用meta-learning的方法更新模型参数。

ba3e8a78-2cd9-11ed-ba43-dac502259ad0.png

Graph Intention Network for Click-through Rate Prediction in Sponsored Search(SIGIR 2019)也是一篇比较有代表性的工作。CTR预估中经常需要对历史行为建模提升效果(比如用户历史点击过的商品),但是长尾用户的历史行为比较稀疏。因此这篇文章提出,利用点击行为构造商品和商品之间的图,利用这个图补充历史行为信息。通过商品-商品图,可以挖掘出和当前商品高度相关的其他商品,这些商品虽然没有直接的点击行为,但由于和点击过的商品高度相关,因此用户点击这些商品的概率可能也很高。通过这种基于图扩展信息的方法,解决长尾用户历史行为稀疏的问题。

ba529e64-2cd9-11ed-ba43-dac502259ad0.png

5总结

本文为大家介绍了解决长尾和冷启动问题的基本方法,主要包括meta-learning和图学习两个路线。Meta-learning更侧重于让模型具有在小样本上快速学习的能力;而图学习更侧重于挖掘和长尾实体相关的邻居,用邻居信息补充长尾实体的信息。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7314

    浏览量

    93963
  • 模型
    +关注

    关注

    1

    文章

    3648

    浏览量

    51710
  • 生成器
    +关注

    关注

    7

    文章

    322

    浏览量

    22502

原文标题:长尾预测效果不好怎么办?试试这两种思路

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    HarmonyOSAI编程智慧调优

    Beta1版本开始支持。 注意 当前支持对Launch冷启动问题和Frame卡顿丢帧问题进行智慧调优分析。 Profiler工具中已集成智慧调优能力,首次使用请先根据界面提示完成CodeGenie授权登陆
    发表于 09-01 15:15

    HarmonyOS AI辅助编程工具(CodeGenie)智慧调优

    Beta1版本开始支持。 注意 当前支持对Launch冷启动问题和Frame卡顿丢帧问题进行智慧调优分析。 Profiler工具中已集成智慧调优能力,首次使用请先根据界面提示完成CodeGenie授权登陆
    发表于 08-14 11:12

    无位置传感器无刷直流电机启动的新方法研究

    摘 要:针对无位置传感器无刷直流电机的启动问题,提出了对三段式闭环启动中的预定位,外加速过程的改进方法。在转子定位阶段采用基于空间电压矢量调制的短时脉冲来获得转子初始位置,精度可达15”。加速阶段
    发表于 07-10 16:37

    无位置传感器无刷直流电机闭环三段式启动策略

    摘 要:针对无位置传感器无刷直流电机(brshiess DC moor,BLDCM)启动问题,提出了一种转子初始位置精准预定位与加速过程中优化定位相结合的闭环三段式启动策略。在电机绕组中施加短时间
    发表于 07-09 14:26

    【HarmonyOS 5】鸿蒙中的UIAbility详解(三)

    详解系列的最终章。主要针对UIAbility的冷启动和热启动,对于want数据的处理。UIAbility的备份恢复,UIAbility的接续等高级功能的概念和使用讲解。 二、UIAbility启动模式
    的头像 发表于 06-14 22:32 479次阅读

    解析无感方波算法与平滑启动算法在小风扇驱动方案中的应用与优势--【其利天下】

    理及适应性等方面,以下是详细剖析:▲市面上小风扇一、启动问题单相无刷电机因定转子磁场特性,存在启动死点。当扇叶停在电磁转矩零点时,电机难以自行启动,需手动拨动。此外,
    的头像 发表于 06-13 18:02 491次阅读
    解析无感方波算法与平滑<b class='flag-5'>启动</b>算法在小风扇驱动方案中的应用与优势--【其利天下】

    鸿蒙5开发宝藏案例分享---冷启动优化案例分享

    程 ?非必要资源延迟加载 ?首屏数据本地缓存优先 优化后我们的应用冷启动速度提升300%+!这些宝藏案例都在官方性能优化文档中,强烈建议大家仔细研究。 最后送大家一句话 :性能优化不是玄学,用对工具+用对方法=用户体验飙升!遇到坑点欢迎在评论区交流讨论? **觉得有用记得
    发表于 06-12 17:22

    电机常见的噪音、振动问题及解决方法

    ,甚至引发安全隐患。本文将系统分析电机常见的噪音和振动问题,并提供切实可行的解决方法。   一、电机噪音问题及解决方法 电机噪音主要来源于电磁噪音、机械噪音和空气动力噪音三个方面。 1. 电磁噪音 电磁噪音是由于电机内部
    的头像 发表于 06-08 10:25 2357次阅读

    多个i.MXRT共享一颗Flash启动方法与实践(下)

    在 《多个i.MXRT共享一颗Flash启动方法与实践(上)》 一文里痞子衡给大家从理论上介绍一种多 i.MXRT 共享 Flash 启动方法,但是理论虽好,如果没有经过实践验证切
    的头像 发表于 06-05 10:04 1028次阅读
    多个i.MXRT共享一颗Flash<b class='flag-5'>启动</b>的<b class='flag-5'>方法</b>与实践(下)

    电机重启动的控制策略

    为了解决高压大容量变频器调速异步电机失电后的重启动问题,本文作者曾经采用过直流侧最小电流法、交流侧最小电流法等多种控制方法检测转子转速。在现场应用中,发现这些方法存在提取信号困难、数据量大以及稳定性
    发表于 05-27 16:23

    拯救你的树莓派!无法启动不用慌!

    当你的树莓派无法启动时,是不是很苦恼呢?别担心,今天我就来给大家分享一个超实用的解决方法。这篇文章提供了详细的解决方案,让你的树莓派重新焕发生机。无论是硬件问题还是软件故障,都能在这里找到对应
    的头像 发表于 03-25 09:34 6330次阅读
    拯救你的树莓派!无法<b class='flag-5'>启动</b>不用慌!

    启动可控硅测量好坏的方法

    一、引言 软启动器是一种用于控制电动机启动过程的电力电子设备,它通过逐步增加电动机的电压来实现平滑启动,从而减少对电网和电动机的冲击。可控硅作为软启动器的核心元件之一,其性能的好坏直接
    的头像 发表于 02-01 10:22 2814次阅读

    如果系统日志显示驱动问题,我该怎么办?

    如果系统日志显示驱动问题,您可以按照以下步骤进行排查和解决: 1.检查内核日志 使用 dmesg 命令查看内核日志,过滤出与驱动相关的错误信息:   sudo dmesg | grep -iE
    的头像 发表于 01-20 17:38 1191次阅读

    鸿蒙原生页面高性能解决方案上线OpenHarmony社区 助力打造高性能原生应用

    Nodepool、HMrouter和DataCache 三大解决方案,并上架OpenHarmony开源社区分,分别针对应用页面滑动、跳转、首页冷启动等关键性能场景提供高效易用的工具,助力伙伴和开发者打造
    发表于 01-02 18:00

    如何降低半导体制造无尘车间设备振动问题的影响?

    要降低无尘车间设备振动问题的影响,需要从设备选型与安装、振动监测与控制、车间环境管理等方面综合采取措施,以下是具体方法
    的头像 发表于 01-02 15:23 1753次阅读
    如何降低半导体制造无尘车间设备振<b class='flag-5'>动问</b>题的影响?