0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

电商归因模型技术方案的概念

数据分析与开发 来源:一个数据人的自留地 作者:一个数据人的自留 2021-09-30 14:32 次阅读

01

电商归因目的

对于电商平台来说,当流量进入时,我们需要引导其完成购买任务,以实现流量价值最大化,在互联网红利消耗殆尽之时,流量会越来越贵,我们需要精细化运营每一份流量。

我们在做各种banner活动、Feed流推荐优化、活动页等进行效果评估,无法知道该位置最终产生了多少收益,也就很难针对该位置进行有效的改进。

如果进行单因数AB测试进行改版的效果评估,那也会存在如下2个问题:

单因素变量控制并不容易做到完全可控,如果产品处在增长期,产品增长本身就是一个影响因子,很容易忽略此类因素的影响。

评估方式低效,如果 2 天内只控制 1 个坑位变动,那么评估 20 个坑位内容改变就需要 40 天时间,这样的效率任何企业都无法接受。

因此,我们希望用数据分析中归因的方式解决坑位运营中评估的问题。

我们引入电商坑位归因的概念,把每一笔的成交都归给转化路径中不同的坑位。根据坑位的曝光转化价值来评判坑位的好与坏。把宝贵的流量尽可能都引导到转化率更高的坑位,以此达到精细化运营的效果。当然有了这个坑位价值评判的机制后各个坑位的改版也能准确的评估,真正做到了数据驱动增长。

02

归因类型简介

首次触点模型:多个「待归因事件」对同一个「目标转化事件」作出贡献时,认为第一个「待归因事件」功劳为 100%。

末次触点归因:

多个「待归因事件」对同一个「目标转化事件」作出贡献时,认为最后一个「待归因事件」功劳为 100%。

线性归因:

多个「待归因事件」对同一个「目标转化事件」作出贡献时,认为每个「待归因事件」平均分配此次功劳。

位置归因:

多个「待归因事件」对同一个「目标转化事件」作出贡献时,认为第一个和最后一个「待归因事件」各占 40% 功劳,其余「待归因事件」平分剩余的 20% 功劳。

时间衰减归因:多个「待归因事件」对同一个「目标转化事件」作出贡献时,认为越靠近「目标转化事件」做出的贡献越大。

对于电商平台来说,末次触点归因是比较适合电商站内销售归因的。虽然用末次触点归因实现方案上比简单,但是直接将价值100%归因给购买或者转化之前最后一次接触的渠道,而完全不考虑整个过程中消费者到底接触过多少个触点。转化之前发生了太多的事情,该模型完全忽视了漏斗上层和中层部分的行为对转化的影响。

因此我们公司融合首次触点归因和末次触点归因,计算用户进入一级流量入口后再到完成的完整购物链接行为。一级流量流入的定义为:各个入口之间无法进行跳转,只能通过切换tab进行跳转或者返回初始位置后重新点击进入。这样我们就可以基于购物的完整链接的最外层进行销售归因,并且也能知道用户购物的完整路径,同时保证销售归因后各个入口坑位的销售额之和等于当日的销售额。

使用这种融合归因方式,也可能知道中间步骤的转化率。比如活动会场页和商品详情页的相关推荐,虽然对电商平台整体进行销售归因时,不会计算活动会场页各个模型的销售,也不会计算商品详情页的相关推荐。

但是由于我们记录了用户进入一级流量入口后的详细路径,因此我们单独研究活动会场页和商品详情页的效率时,也是可以计算得到各个模块的销售来进行对比分析。但是切记不能和一级流量入口的销售混合在一起看,这样会导致销售归因发生重复。

03

电商归因实现方案

对于电商归因我们进行了三个方面的归因,包括:曝光归因、点击归因、销售归因。即归因出所有的商品曝光来自哪里,所有的商品点击来自哪里,所有的销售来自哪里。这样就可以追踪各个流量入口的曝光链路归因指标。比如各个流量入口的商品曝光点击率、商品点击支付率、商品曝光价值等等核心监控指标来评价各个流量入口的效率。

电商归因准确的前提是埋点日志的完整性,因为我们是通过需要归因的事件往前找到用户的购买路径,这样的好出是大大减少计算量,也基本解决的归因的问题。因此用户行为日志的完整记录才能真实还原用户的购买路径,否则就可能导致归因出错,最终造成错误的评价数据。

首先需要在埋点体系中引入PageId的概念,PageId的作用是每当用户产生一次跳转行为进入一个新页面时,为这个页面赋予一个新的PageId;而当用户点击返回时,不会产生新的PageId。PageId是越靠近的当前时间的页面浏览的行为越大,且不会重复,类似于自增ID的实现逻辑。PageId的实现当然是写入埋点SDK当中,这样保证所有的埋点事件都带上PageId,并且也无需开发同步每次单独写逻辑。

然后根据埋点日志去还原用户的行为路径,全程都可以仅仅使用SQL逻辑就能计算完成。

首先要确定所有要归因的end事件(末端事件),包括商品曝光、商品点击、商品加购成功(加购后可以通过server的订单表判断用户是否完成了付款,也达到了销售的归因目的)。

然后在确定所有归因head事件(首端事件),即之前就定义的好的各个一级流量入口。

我们平台比较特殊,是工具类App同时拥有电商业务,这样一级流量入口会比较多,但是可以枚举完成的,不仅仅包括常规电商App的流量入口,还可以在各个工具页面嵌入电商入口,这样复杂性要强于一般的电商App。

我们的埋点日志都会记录用户发生各个行为的本地时间,用end事件时间去找最接近的这个时间的head事件,直接用SQL的left jon关联日志表就能完成计算。

这样在首尾2段时间内的所有埋点日志行为就是我们需要日志。

然后筛选出这些日志中的所有点击事件,过滤掉其他无效事件。

再对所有剩下的日志进行排序,按照本地时间排序,这样就得到了一条完整的用户有效行为的路径记录。

对于这部分数据我们就可以进行存储使用了,这部分数据为归因后用户完整链路记录数据。

再基于PageId过滤掉同个页面相同PageId的事件,保留本地时间最晚的那一条事件记录。

这样就得到了用户进入一级流量入口后真正进行末端事件的有效路劲。

这部分数据也需要存储记录,并且这个部分真正归因完成的用户行为路径,此时的得到各个一级流量入口就行归因得到此末端事件的来源。

通过这样计算后就了解各个一级流量入口的商品曝光点击情况,也能知道销售情况。

利用这些数据就能衡量各个流量入口的效率情况,也同样也可以中间承载页面的效率如何。

就能帮助产品运营更好的改善各个功能以及迭代各式各样的活动。

用户进行一次加购的路径还原

通过上述方法的计算,我们最终得到的用户加过链路步骤为:【1,2,9,10,11】,并且入口事件【1】就此次加购事件的归因来源。

另外再来举个商品详情页相关推荐的例子,下图所示的用户行为最终得到的链路步骤为:【1,2,9,10,11,12】,由于我们是完整保留用户的路径,因此我也只能这次加购事件不仅来源于1,也有一部分功能功能来于11,也就是商品详情页的推荐,因此我们也能计算出商品详情页的推荐效率如何,后续算法团队迭代模型时也能根据这个数据来衡量优化的好与坏。

04

总结

通过以上方案得到电商归因模型数据,可以大大提高运营同学的运营效率,不再是盲人过河实的凭感觉去优化各个坑位和活动,已经可以通过数据清晰公平的判断运营每一次迭代的结果。

但是仅仅根据坑位归因决定坑位价值,容易出现短期偏见,即追求短期利益,比如在一款内容产品中镶嵌一些游戏元素,可以让用户停留更久、数据表现更好。但从长期来看,这种行为破坏了整个产品的价值定位,因为内容产品原本提供的是内容并不是游戏,产品也不并是为了追求用户停留时长而是为了实现价值。这是两者都存在的短期偏见。

因此不能仅仅根据坑位归因后的销售转化价值来评价坑位,还需要综合考虑产品价值定位、战略发展等因素,才能围绕长期目标进行健康发展。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    2704

    浏览量

    47681
  • 电商
    +关注

    关注

    1

    文章

    445

    浏览量

    28140

原文标题:【干货】电商归因模型技术方案

文章出处:【微信号:DBDevs,微信公众号:数据分析与开发】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    EMC技术:基础概念到应用的解读?|深圳比创达电子.

    的EMC技术:基础概念到应用的解读的内容,希望大家看后有所帮助!深圳市比创达电子科技有限公司成立于2012年,总部位于深圳市龙岗区,成立至今一直专注于EMC电磁兼容领域,致力于为客户提供最高效最专业的EMC一站式解决方案,业务范
    发表于 03-11 11:59

    EMC技术:基础概念到应用的解读?

    EMC技术:基础概念到应用的解读?|深圳比创达电子
    的头像 发表于 03-11 11:55 148次阅读
    EMC<b class='flag-5'>技术</b>:基础<b class='flag-5'>概念</b>到应用的解读?

    模型的Scaling Law的概念和推导

    对于Decoder-only的模型,计算量(Flops), 模型参数量, 数据大小(token数),三者满足:。(推导见本文最后) 模型的最终性能主要与计算量,模型参数量和数据大
    的头像 发表于 11-29 14:28 1057次阅读
    大<b class='flag-5'>模型</b>的Scaling Law的<b class='flag-5'>概念</b>和推导

    基于检索的大语言模型简介

    简介章节讲的是比较基础的,主要介绍了本次要介绍的概念,即检索(Retrieval)和大语言模型(LLM)
    的头像 发表于 11-15 14:50 352次阅读
    基于检索的大语言<b class='flag-5'>模型</b>简介

    射频识别技术漫谈(1)——概念、分类

    射频识别技术漫谈(1)——概念、分类
    的头像 发表于 10-09 10:51 585次阅读

    软件无线的主要原理及技术

    本文主要介绍了软件无线概念、主要原理、关键技术及在生活中的广泛应用。它是以开放性、标准化、模块化、通用性、可扩展的硬件为平台,通过加载各种应用软件来实现不同用户,不同应用环境的不同需求,是以现代
    发表于 09-22 07:54

    课件3频率响应的概念

    课件3频率响应的概念
    发表于 09-20 08:22

    盘古模型概念是什么 盘古大模型的特点

    盘古模型概念是什么 盘古大模型的特点  盘古模型是指一个宏大的宇宙模型,涉及到物理学、天体物理学、宇宙学等多个学科领域。这个
    的头像 发表于 08-31 10:11 5253次阅读

    TrustZone Technology微控制器系统硬件设计概念用户指南

    TrustZone技术可用于实施PSA认证的信任根。 PSA认证计划是用于内置安全的通用行业框架和方法,使芯片制造、系统软件提供和原始设备制造能够使用经过验证的安全架构和相应的开
    发表于 08-09 07:25

    ai大模型和小模型的区别

    ai大模型和小模型的区别  人工智能领域中的模型分为两种,一种是大模型,另一种是小模型,两者在训练和应用中有着明显的区别。 本文将从定义、特
    的头像 发表于 08-08 17:30 5519次阅读

    商数据分析攻略,让你轻松搞定数据分析!

    核心业务分析主题的分析模型、BI商数据分析报表。从多业务系统数据整合、清洗、
    发表于 06-27 09:22

    ChatGPT背后的大模型技术

    模型普适性增强,一个模型可以适合多种任务和场景。在 AI2.0 中基础的大模型(foundation model)是核心技术
    的头像 发表于 05-29 11:16 919次阅读
    ChatGPT背后的大<b class='flag-5'>模型</b><b class='flag-5'>技术</b>

    语音识别技术概念及应用前景

    智能语音技术是人工智能应用最成熟的技术之一,并拥有交互的自然性,就是让智能设备听懂人类的语音。它是一门涉及数字信号处理、人工智能、语言学、数理统计学、声学、情感学及心理学等多学科交叉的科学。智能语音
    发表于 05-27 09:41

    边缘AI的模型压缩技术

    的重点是通过减少模型参数来简化模型,从而降低执行中的 RAM 要求和内存中的存储要求。延迟减少是指减少模型进行预测或推断结果所花费的时间。模型大小和延迟通常同时存在,大多数
    的头像 发表于 05-05 09:54 590次阅读
    边缘AI的<b class='flag-5'>模型</b>压缩<b class='flag-5'>技术</b>