0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

京东:基于多类目MoE模型的电商搜索引擎

深度学习自然语言处理 来源:深度学习自然语言处理 2023-01-06 09:54 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

商品索引擎是电商平台满足用户购物需求的一个重要系统,它根据用户输入的搜索词,返回个性化的排序列表。商品一般会被归为某一大类下某个小类目,例如电子产品,在电子产品这个大类目下面还有更细粒度的类目(冰箱或者电视)。这种体系用于构造查询类别的层次结构。在不同的查询类别中,价格和品牌知名度等特征的分布差异很大。在CTR(点击率)/CVR(转化率)预估问题中,特征重要性在不同类目间也是不一样的。本文主要介绍专家混合模型(MoE)在京东搜索精排中的应用,以及结合实际场景对MoE模型进行的一系列改进。

Part1. 背景介绍

越来越多的人转向电子商务来满足他们的购物需求,这给搜索排名带来了新的挑战。电子商务搜索排名的一个关键输入是产品类别标签,店主通常被要求用特定的类别来标记他们的产品,以方便搜索索引。从这些产品类别中,可以构造查询类别的概念,通常是通过聚合在查询下正确检索到的最频繁出现的产品类别。目前大多数电子商务排名系统都没有为每个查询类别部署专用模型的工程资源,即使是主要的查询类别也是如此。但是作为人工编目员,自然的策略是首先确定查询最可能属于的类别,然后检索该类别中的项目。不同类别的特性对于产品排名的重要性可能不同。直观地说,根据用户购买反馈判断,不同类别的单独排名策略应该能够提高整体产品搜索相关性。
  京东电商平台有一套完整的以树形结构组织的多层级类目结构。下图是一个两层级类目结构的示意图,不同的Top-Categories 之间,用户的购物行为会有比较明显的差异,例如:当用户搜索食品相关商品时,可能选择销量高的;而当搜索服饰相关商品时,可能会更关注风格、品牌等信息。相反同一个Top-Categories下的Sub-Categories之间,用户的购物行为一般比较接近。

01a6ab4c-8d5c-11ed-bfe3-dac502259ad0.png

此外,对于一些小类目的商品,在训练集样本量上和大类目相比差距悬殊,在模型训练过程中会被大类目商品的样本所影响和主导。针对类目差异和小类目学习这两个问题,本文提出了一种多类目MoE(Mixture of Experts)模型。

Part2. 多类目MoE模型

MoE模型

MoE 主要包括两个核心部分:门网络(gating network)和专家网络(expert network)。门网络的输出作为对应的专家网络的权重,用于对专家网络的输出进行加权求和。MoE 模型的输出可以写成下面的公式:

其中,N表示专家网络的个数,G表示门网络,Q表示专家网络。

Top-K gating MoE模型

模型会根据门网络的输出,选择最大的K个权重所对应的专家网络进行激活,然后只对选中的K个专家网络的输出进行加权求和。计算公式如下:

在Top_k MoE模型中,如果一个专家网络对应的权重值不在最高的K个集合里,那么经过softmax函数之后权重会变为0。从而在模型训练中这些专家网络不会被激活,能降低模型的计算复杂度。

多类目MoE的模型

针对上述提到的类目差异和小类目学习两个问题,本文在Top_K MoE 的基础上加入了两种改进方法,提出了多类目MoE的模型结构,如下图:

01b7c71a-8d5c-11ed-bfe3-dac502259ad0.png

(1)Hierarchical Soft Constraint(HSC)网络

针对小类目样本学习问题,本文的改进是增加一个与MoE门网络结构相同的HSC门网络(图种蓝色部分)。HSC门网络的输入是Top-Category,输出与MoE的门网络结构维度一致,代表了不同专家网络对于Top-Category 的重要程度。同时将激活的专家网络对应的权重和HSC门网络对应的权重的L2距离作为模型训练的一个损失项,加入到模型的训练过程中。
  具体来说,图2中的Top-Category和Sub-Category具有层次关系,Top-Category是父节点,Sub-Category是子节点。为了进一步强调不同门网络的功能,我们分别将它们称之为inference MoE gate(绿色部分)和constraint HSC gate(蓝色部分)。

a. Inference MoE Gate

将Sub-Category的嵌入向量,输入inference gate,其输出代表专家的权重。定义inference gate函数如下:

其中,是一个 q×N的可训练的权重矩阵,q表示embedding的维度,N表示expert的个数。
  为了节省计算,只在中保留前K个值,并将其余值设置为−∞。然后应用softmax函数从前K个中得到如下的概率分布:
,如果
,如果<

由于有K个大于0的值,为了节省计算,只激活这些对应的专家。模型的计算复杂度取决于单个专家的网络和K的取值。

b. Inference MoE Gate

在模型中,constraint gate和inference gate具有相同的结构。用表示constraint gate,表示inference gate,constraint gate的输入特征记为,是Top-Category的嵌入向量,定义inference gate和constraint gate之间的分层软约束(HSC)如下:



  通过上述HSC网络,可以让相同Top-Category下的所有Sub-Category所激活的专家网络尽量的接近。尤其对于样本量少的小类目,可以利用到相同Top-category下的其他类目信息,能一定程度上解决小样本学习难的问题。

(2)Adversarial Regularization

第二个改进是Adversarial Regularization。在Top_K门网络结构中,对于每条样本,专家网络都会分为激活的专家网络和没有激活的专家网络。Adversarial Regularization的目的是在训练过程中让不同专家网络尽量区别开,避免专家网络的预测结果相同。即鼓励激活的专家网络和没有被激活的专家网络给出的预测结果差异较大。Adversarial Regularization计算公式如下:
其中, 表示激活的专家网络集合, 表示没有被激活的专家网络集合。
  增加了HSC网络和Adversarial Regularization之后,模型的损失函数如下所示:

Part3. 实验结论

作者在Amazon和In-house两个数据集上分别评估了所提出模型的效果。表格中的Adv-MoE和HSC-MoE分别表示只有Adversarial Regularization和HSC loss的两个模型,Adv&HSC-MoE表示作者提出的最终多类目模型。
  作者首先在In-house数据集上测试了模型的整体效果、类目差异的效果以及在小样本类目上的提升效果。表3给出了各个模型在AUC和NDCG两个指标上结果。与DNN模型相比,本文提出的Adv&HSC-MoE模型在AUC指标上实现了0.96%的增益(NDCG为0.99%),具有较好的泛化性能。

01c91bdc-8d5c-11ed-bfe3-dac502259ad0.png

同时,作者也在amazon数据集上做了实验,下表显示改进后的Adv-MoE、HSC-MoE和Adv& HSC-MoE结果与In-house一致,验证了对抗正则化和分层软约束技术的一般适用性。

01d89fee-8d5c-11ed-bfe3-dac502259ad0.png

MoE模型门网络的输出代表了各个专家网络的权重,作者同样测试了不同类目下门网络的输出结果,以评估模型对于类目差异的学习效果。本文将门网络的输出结果使用T-SNE降维展示出来,以便观察不同类目的聚类效果。图5中蓝色表示日用百货类目,绿色表示电器类目,红色表示流行服饰类目。结果显示,本文的方法聚类效果更好,这表明对于相似的类目,本文提出的模型更倾向于选择相似的专家网络,差异大的类目,更倾向于选择不同的专家网络。

01ee71d4-8d5c-11ed-bfe3-dac502259ad0.png

Part4. 总结

本文提出的对抗性正则化和层次软约束技术是在产品搜索中开发类别感知排名模型的有效方法。它在行业规模的数据集上取得了显著的改进,主要体现在以下几个方面:(1)同一Top-Categories下的Sub-Categories可以共享相似的专家,从而克服了有限训练数据下的参数稀疏性;(2)对抗性正则化鼓励专家“独立思考”,从不同角度处理每个问题。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 网络
    +关注

    关注

    14

    文章

    8133

    浏览量

    93093
  • 模型
    +关注

    关注

    1

    文章

    3649

    浏览量

    51716
  • 数据集
    +关注

    关注

    4

    文章

    1230

    浏览量

    26047

原文标题:京东:基于多类目MoE模型的电商搜索引擎

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    ​​​​​​​京东API:开启物流新速度,订单配送快人一步!

    竞争日益激烈的今天,“速度”已成为用户体验的核心要素。京东凭借其强大的自建物流体系,始终引领着配送时效的标准。而面向开发者和合作伙伴开放的 京东API ,则如同为
    的头像 发表于 12-08 14:26 41次阅读
    ​​​​​​​<b class='flag-5'>京东</b>API:开启<b class='flag-5'>电</b><b class='flag-5'>商</b>物流新速度,订单配送快人一步!

    5分钟了解SEO优化服务器对网站加载速度的影响

    一个为SEO优化过的服务器,能显著提升网站性能,从而在搜索引擎排名中占据有利位置。
    的头像 发表于 12-02 10:27 111次阅读

    Temu跨境按关键字搜索Temu商品API的应用及接口请求示例

    Temu跨境按关键字搜索Temu商品API的应用及接口请求示例 Temu跨境按关键字搜索
    的头像 发表于 11-29 15:08 102次阅读

    苏宁搜索接口深析:全品类智能分轨如何解决 O2O 搜索痛点?

    本文深度解析苏宁全品类O2O搜索接口核心技术,涵盖智能分轨引擎、库存联动系统与高并发架构设计,解决品类参数识别、线上线下库存同步等
    的头像 发表于 10-28 16:20 681次阅读
    苏宁<b class='flag-5'>搜索</b>接口深析:全品类智能分轨如何解决 O2O <b class='flag-5'>电</b><b class='flag-5'>商</b>的<b class='flag-5'>搜索</b>痛点?

    根据标题获取商品链接评论接口的技术实现

    [调用评论API] F -- > G[数据清洗存储]   关键组件说明: 搜索引擎接口 :通过电平台开放API实现标题搜索 $$ text{API}_{search} = text{https://api.ecommerce.
    的头像 发表于 10-20 16:03 458次阅读
    根据标题获取商品链接评论接口的技术实现

    京东:利用商品管理API自动调整商品上下架状态,优化搜索排名

    京东:利用商品管理API自动调整商品上下架状态,优化搜索排名 在运营中,高效管理商品状态是提升销售的关键。京东作为领先的
    的头像 发表于 09-08 16:09 802次阅读
    <b class='flag-5'>京东</b>:利用商品管理API自动调整商品上下架状态,优化<b class='flag-5'>搜索</b>排名

     京东 API 接口对比同行,数据服务谁更胜一筹?

    ​ 在生态中,API 接口如同企业的“数据血脉”,其性能与服务质量直接影响开发效率与用户体验。京东、淘宝、拼多多等头部平台均开放了A
    的头像 发表于 07-09 15:17 493次阅读
     <b class='flag-5'>京东</b><b class='flag-5'>电</b><b class='flag-5'>商</b> API 接口对比同行,数据服务谁更胜一筹?

    淘宝 vs 京东 API 接口,谁才是数据王者?

      在当今数字化时代,API(应用程序编程接口)是企业获取和分析数据的关键工具。淘宝和京东作为中国两大巨头,其API接口的优劣直接影
    的头像 发表于 07-08 15:51 634次阅读
    淘宝 vs <b class='flag-5'>京东</b><b class='flag-5'>电</b><b class='flag-5'>商</b> API 接口,谁才是数据王者?

    京东 API 接口,订单管理高效解决方案!

    ​ 在当今高速发展的时代,京东作为领先的平台,其 API 接口为商家和开发者提供了强大的工具,帮助实现订单管理的高效化。本文将逐步解
    的头像 发表于 07-04 16:12 559次阅读
    <b class='flag-5'>京东</b><b class='flag-5'>电</b><b class='flag-5'>商</b> API 接口,订单管理高效解决方案!

    微软面临法国反垄断机构调查

    据媒体报道,微软目前正在接受法国反垄断机构的深入调查。此次调查的核心关注点在于,微软是否在搜索引擎联盟市场中滥用其市场支配地位。 知情人士透露,法国监管机构正在仔细评估微软的行为,特别是其是否向那些
    的头像 发表于 02-11 10:57 885次阅读

    OpenAI免费开放ChatGPT搜索功能

    近日,OpenAI宣布了一项重大决策:向所有用户免费开放ChatGPT搜索功能。这一举措无疑将为用户带来更加高效、智能的搜索体验。 与谷歌等传统搜索引擎的收录模式相比,ChatGPT搜索
    的头像 发表于 02-06 14:35 812次阅读

    LZO Data Compression,高性能LZO无损数据压缩加速器介绍,FPGA&amp;ASIC

    无损数据压缩2.可配置的数据块分段和搜索窗口大小[8KB,16KB,32KB]3.可配置的并行处理等级[搜索引擎的数量,1~32]4.可配置的字典深度[8K,16KB],字典RAM类型[BRAM
    发表于 01-24 23:53

    javascript:void(0) 是否影响SEO优化

    使用 javascript:void(0) 确实可能对SEO优化产生负面影响 。以下是关于 javascript:void(0) 对SEO影响的具体分析: 搜索引擎爬虫的理解问题 搜索引擎爬虫(如
    的头像 发表于 12-31 16:08 984次阅读

    HTTP 协议对于SEO优化的影响

    搜索引擎优化(SEO)是提高网站在搜索引擎中的可见性和排名的过程。HTTP协议作为互联网通信的基础,对SEO有着深远的影响。 1. HTTP状态码 HTTP状态码是服务器响应客户端请求的结果。这些
    的头像 发表于 12-30 09:29 984次阅读

    苹果为谷歌支付数十亿美元辩护,参与搜索案反垄断审判

    近日,苹果公司已正式要求参与谷歌即将在美国举行的在线搜索反垄断审判,此举旨在为其与谷歌之间的收入分成协议进行辩护。该协议使得谷歌成为Safari浏览器的默认搜索引擎,而谷歌每年因此向苹果支付数十
    的头像 发表于 12-26 10:41 716次阅读