0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

从架构演进和统一看搜索与推荐

innswaiter 来源:未知 作者:van 2022-06-28 20:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

搜索与推荐的区别

1. 场景需求不同

搜索的场景故名思义,就是用户提供想要寻找的内容的描述,系统返回给用户匹配到的结果,常见的场景如文字输入框的搜索,图片搜索,听音识曲,标签筛选等,看似很多场景,其实只是用户输入内容的形式不同。

推荐的场景我们常见的有各大App首页的个性化推荐(如猜你喜欢/每日歌曲推荐),选择页面的关联推荐(买了还买,看了还看,买了它的用户还买等等)等,推荐的场景更加的丰富,因为没有用户提供的内容的限制,场景更具多样性,推荐方法也多种多样,例如基于内容的推荐,基于用户行为的推荐,协同过滤等等。

各大互联网平台由于服务内容不同,平台成熟度的不同,对搜索和推荐的偏重程度也就不尽相同,但都是缺一不可。

例如对于房地产应用来说,用户目标明确,搜索服务会带来更大的购买力,但关联推荐会给用户带来更多的选择,同样也是不可缺少的。

对于短视频平台而言,由于用户较难通过文字或图片提供内容的描述,那么自然会偏重推荐服务。

对于电商在初期肯定是搜索服务带来了更多的购买率,当购买率到达瓶颈时,推荐带来的购买率就是突破瓶颈和继续发展的必要手段。

2. 输入输出不同


不论搜索还是推荐,实际上对于用户来说,都是一个提供服务的黑盒,它能够根据用户/物品/场景等信息,从候选物品的池子中选出与用户匹配的的物品列表。

不同的是对于搜索服务,还额外提供了用户对于自己诉求的描述信息(当然可能描述的并不准确)。

输入的区别天然的导致了用户对于结果的不同期待:

  • 个性化程度不同

    推荐系统更强调个性化,甚至更注重惊喜感。往往要在准确性和多样性之间作出权衡;搜索系统更强调相关性,如果搜索结果与用户的目标不符,用户的接受程度会很差,个性化对于搜索系统来说既没意义又有风险。

  • 排的更好与搜的更全

    对于推荐系统来说,排序更加重要,因为只有最开始的推荐结果吸引了用户,用户才可能向后浏览。

    对于搜索系统来说,召回更加重要,因为用户会主动向后浏览,以期望找到自己的目标,但如果最终没有找到,也就是搜的不全,就会有很差的用户体验。

  • 快速满足还是持续服务

    提到搜索系统,往往会提到马太效应,只有与用户搜索的结果更为匹配的物品才会被呈现给用户,让用户得到快速满足,那么满足需求的物品那么多,搜索的越准确,用户就越不会向后浏览,最终点击的热度就只会集中在少量的物品上。这也就是为什么广告最初诞生在搜索系统中的原因。

    提到推荐系统,往往会提到长尾效应,也就是让用户时刻保持新鲜感和惊喜感,考虑用户的长期兴趣,提高用户粘性,期望留住用户,并提供持续的服务,这也就是为什么刷短视频停不下来的原因。

  • 实时性与滞后性

    搜索的数据实时性要求是特别高的,数据常常要求秒级更新,例如一个商品已经没有货了就不应该被搜出来了。而推荐的数据很多是可以容忍天级更新的,由于推荐要考虑大量的用户行为信息,一定是具有一定滞后性的。

搜索与推荐的联系

1. 相同的本质

搜索与推荐本质上都是当前时代信息过载的产物,解决的根本思路都是通过匹配(召回)、排序为用户在过载的信息中挑选出用户想要的信息。只是根据业务场景的不同,在召回,排序阶段考虑的侧重点不同。

2. 搜索与推荐的协同作用

  • 推荐中的搜索

    推荐服务中基于内容的推荐实际上相当于一种无声的搜索,常常在实现时会采用搜索服务的中的倒排索引等技术,例如基于内容的推荐,常常是通过规则或推荐模型得到用户感兴趣的内容的标签,然后利用搜索服务的方法进行标签搜索和匹配即可得到最终的推荐列表。

  • 搜索中的推荐

    当搜索出来符合用户的数据量很多时,需要根据推荐服务中用户画像等结果帮助搜索服务匹配用户的需求。例如周一的晚上进行搜索得到的结果列表和周五的晚上进行搜索得到结果列表就会有所差异。

推荐与搜索常常在一个页面中协同为用户提供服务,例如搜索引擎搜索结果页面的关联推荐,电商软件搜索浏览页面的相关推荐等。

架构演进与架构统一

搜索架构的演进


一般而言,一个企业的搜索引擎,由于在初始阶段业务线不多,提供简单的搜索服务即可。随着业务的不断增多,对搜索需求的不断抽象和统一,逐渐可以发展为平台阶段,提供多数据源的写入与多业务的统一搜索能力,不同业务的不同需求可以灵活配置。

等到业务线不断增多,对接业务的工作占据了大部分的开发时间时,开发更加方便的运维与管理能力,帮入业务自助接入平台就能够进一步提高搜索功能开发的效率,此时搜索架构就进入到了运维更为便捷的云平台的阶段。

推荐架构的演进

对于推荐引擎,起步阶段一般会采用基于内容的推荐方法,由于数据不足,企业初期会基于业务侧提供的经验规则对物品和用户进行标注,然后通过在线匹配标签的方式进行推荐。继续发展,随着业务的不断丰富和迭代,会对推荐系统有更多的期望,当不断修改或增加经验规则却满足不了业务需求时,就需要一些基于模型的推荐方法以及个性化的推荐的服务了。再进一步,与搜索引擎一样,推荐引擎也需要对接多个业务线,向平台阶段发展,提供统一的公共服务,通过配置满足不同的业务线的需求。

架构统一

从上面的介绍和架构演进我们可以发现,推荐和搜索的架构有很多可以复用的地方,因而可以进行架构的统一。

  1. 流程上的统一:

    不论是搜索还是推荐,都会经历召回-排序-重排等流程,最终得到呈现给用户的物品列表,只不过流程中各个阶段的目标会不太相同。

  2. 数据与数据平台的复用:

    被搜索的物品和被推荐的物品是统一的,召回排序训练模型时所需要的埋点数据/用户行为数据等也是统一的,那么自然获取数据/处理数据的平台自然就是可以复用的。

  3. 算法与算法平台的复用:

    搜索和推荐发展到一定阶段,当简单的专家规则不再能够支撑复杂的搜索和推荐需求时,都会发展到基于模型进行召回排序的阶段,此时都需要根据用户数据/物品数据/埋点数据进行模型训练,只不过由于二者的训练目标不同,训练的模型的参数可能会不相同,但算法平台或者大家常说的机器学习/AI平台是可以复用的。

  4. A/B Test实验平台的复用:

    由于业务需求的不断变化,模型的不断更替,通过A/B Test平台能够通过分流的方式拿到真实的生产环境中的用户反馈,以帮助企业不断验证和优化搜索和推荐策略。

  5. 配置中心的复用:

    可以通过配置中心针对不同业务和服务配置不同的搜索和推荐策略,并且提供便捷的一键部署能力。

所以很多公司,在业务领域上搜索和推荐分属于不同的部门,但很多的公共的部分都有成熟的内部平台可以快速复用。

总结

本篇文章介绍了搜索和推荐的区别与联系,架构演进以及架构统一。我们都知道架构是因为需求的扩增而不断演进来的,例如从服务阶段发展到平台阶段,是因为要提高多业务的对接效率;从基于内容的推荐到复杂的融合在线用户画像和离线用户画像的个性化推荐,是因为简单基于规则或标签的推荐无法满足用户和业务侧的需求。

所以不要在一开始被过于复杂的架构绑住手脚,可以针对自身业务的需求进行搜索/推荐的简单架构设计,然后逐步演进和优化架构。

来源:thoughtworks

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    密封试验仪正负压测试区别,通俗拆解一看就会

    体现在测试压力的方向以及适用场景上,下面用通俗的语言详细拆解,新手也能一看就懂。先来说说负压测试,也常被称为真空测试,用句大白话概括就是“向内吸”。测试过程中,
    的头像 发表于 04-16 17:13 380次阅读
    密封试验仪正负压测试区别,通俗拆解<b class='flag-5'>一看</b>就会

    800V DC 架构革命: Blackwell 到 Rubin 的电力底座演进

    架构的广泛部署,正以前所未有的力量催生数据中心基础设施的底层范式转移。通用计算向“AI 工厂”的演进,标志着数据中心对电力、散热以及空间密度的需求突破了传统摩尔定律的线性增长轨迹。在 2026 年 3 月举行的 NVIDIA
    的头像 发表于 04-13 11:48 369次阅读
    800V DC <b class='flag-5'>架构</b>革命:<b class='flag-5'>从</b> Blackwell 到 Rubin 的电力底座<b class='flag-5'>演进</b>

    Agentic AI驱动架构升级,存储行业性能竞争走向系统协同

    如果说2025年是生成式AI大模型的“百家争鸣”,那2026年将成为AI应用将在各行各业落地的“部署元年”。存储需求逐步通用型向高性能、低延迟的eSSD等产品演进,不仅推动存储架构升级,也使得系统协同能力提升成为影响未来AI竞
    的头像 发表于 04-03 17:06 292次阅读
    Agentic AI驱动<b class='flag-5'>架构</b>升级,存储行业<b class='flag-5'>从</b>性能竞争走向系统协同

    什么是信号源频率合成技术:架构演进到频谱纯度控制

    信号,还是高速仪器的采样时钟,频率合成器的相位噪声、杂散抑制、跳频速度及频率分辨率,直接决定了系统性能的天花板。 技术演进来看,频率合成主要经历了直接模拟合成、锁相环合成与直接数字合成三条技术路径。 直接模拟合
    的头像 发表于 03-25 14:18 174次阅读
    什么是信号源频率合成技术:<b class='flag-5'>从</b><b class='flag-5'>架构</b><b class='flag-5'>演进</b>到频谱纯度控制

    无刷电动工具驱动方案选型指南:参数到量产,新手厂家一看就会

    新手厂家入局无刷电动工具行业,第个要攻克的核心难题,就是无刷电动工具驱动方案的选型。很多新手厂家都踩过同款致命坑:选了低价简配方案,样机刚测完就烧板,量产良率暴跌;只纸面虚标参数,选的方案和产品
    的头像 发表于 03-15 14:00 743次阅读
    无刷电动工具驱动方案选型指南:<b class='flag-5'>从</b>参数到量产,新手厂家<b class='flag-5'>一看</b>就会

    发热芯气密性检测仪操作步骤,一看就会-岳信仪器

    ,全程无需专业经验,一看就会。第步,前期准备,筑牢检测基础。先检查发热芯气密性检测仪外观,确认机身无破损、线路连接牢固,气路接口无松动、漏气痕迹。随后接通电源,
    的头像 发表于 03-11 11:48 166次阅读
    发热芯气密性检测仪操作步骤,<b class='flag-5'>一看</b>就会-岳信仪器

    云原生全球广域网架构深度科普:单点集中到全域互联

    用与资源分散部署在不同地域的虚拟私有云、线下数据中心等多个节点时,如何将这些分散的资源整合成个逻辑统一的整体,成为企业数字化进程中的核心命题。而云原生网络架构,正
    的头像 发表于 03-10 13:40 515次阅读
    云原生全球广域网<b class='flag-5'>架构</b>深度科普:<b class='flag-5'>从</b>单点集中到全域互联

    搅拌机气密性检测仪操作步骤,一看就会-岳信仪器

    搅拌机气密性检测仪的操作流程,简单易懂,一看就会。前期准备,筑牢检测基础。先检查搅拌机气密性检测仪外观,确保机身无破损、线路连接牢固,气源接口无松动。然后清理搅拌机检
    的头像 发表于 03-03 17:17 640次阅读
    搅拌机气密性检测仪操作步骤,<b class='flag-5'>一看</b>就会-岳信仪器

    为什么国产MCU的工程生态很难统一

    背景 国产 MCU 种类多、厂商众多,生态碎片化明显。 主要原因 厂商 SDK 不统一 :API、驱动结构差异大 开发工具闭源 :无法统一配置流程 工程模板缺失 :初始化步骤、外设配置不致 社区
    发表于 01-28 09:25

    隔离驱动供电方案的技术分析报告:分立架构到BTP1521P优选方案的演进

    传统分立器件与集成化隔离驱动供电方案的技术分析报告:分立架构到BTP1521P优选方案的演进 BASiC Semiconductor基本半导体级代理商倾佳电子(Changer Te
    的头像 发表于 01-16 09:35 809次阅读
    隔离驱动供电方案的技术分析报告:<b class='flag-5'>从</b>分立<b class='flag-5'>架构</b>到BTP1521P优选方案的<b class='flag-5'>演进</b>

    AI芯片技术演进的双轨路径:通用架构到领域专用的并行演进——指令集优化与电路级重构协同塑造智能计

    瓶颈,推动AI芯片架构向更高专用化程度演进体系结构角度,当前AI芯片的发展并非单路线的线性替代,而是沿着不同抽象层次并行展开的两条专
    的头像 发表于 01-15 14:37 409次阅读
    AI芯片技术<b class='flag-5'>演进</b>的双轨路径:<b class='flag-5'>从</b>通用<b class='flag-5'>架构</b>到领域专用的并行<b class='flag-5'>演进</b>——指令集优化与电路级重构协同塑造智能计

    一看就懂的硬件学习教程

    。像信号完整性,EMI,PS设计准会把你搞晕。别急,切要慢慢来。  1)总体思路。设计硬件电路,大的框架和架构要搞清楚,但要做到这点还真不容易。有些大框架也许自己的老板、老师已经想好,自己只是把
    发表于 01-08 08:16

    线性搜索与二分搜索介绍

    线性搜索(Linear Search):数组的第个元素开始,依次将当前元素与目标值进行比较,直到找到目标值或搜索完整个数组。 二分搜索
    发表于 12-01 07:36

    晶体管架构的演变过程

    芯片制程微米级进入2纳米时代,晶体管架构经历了 Planar FET 到 MBCFET的四次关键演变。这不仅仅是形状的变化,更是次次对物理极限的挑战。
    的头像 发表于 07-08 16:28 2516次阅读
    晶体管<b class='flag-5'>架构</b>的演变过程

    动态IP技术演进网络基石到智能连接时代的创新引擎

    在万物互联的智能时代,IP地址早已突破"网络身份证"的单属性,成为支撑数字化变革的核心基础设施。动态IP技术作为网络资源分配的底层逻辑,正经历着工具性功能向智能化服务的深刻转型。本文将从技术演进、应用创新与安全挑战三个维度,
    的头像 发表于 05-20 16:16 842次阅读