0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

购物篮分析模型原理

数据分析与开发 来源:数据分析与开发 作者:数据分析与开发 2022-10-24 10:55 次阅读

要想做好数据分析必定要理解和熟悉掌握各类数据分析模型,但大部分文章只是给你罗列出了有哪几种数据分析模型及对应理论,并未用实例来辅助说明

很多时候这些模型都进了收藏夹吃灰,大家也没有深刻理解这种分析模型,等到下次要开始分析数据了,又是一脸懵,然后再去收藏夹里翻文章。

学东西在精不在多,今天就分享1个常用的数据分析模型——购物篮分析模型,并附上应用实例,希望能让大家真正掌握这个分析模型,并在之后分析数据时能自己把模型灵活用起来!

购物篮分析模型原理

据说上个世纪九十年代,沃尔玛的超市管理人‎‎员分析销售数据时发现了一‎‎个令人难于理解的现象,婴儿的纸尿裤和啤酒放通常会出现在一个订单里,经过数据分析发现,买尿不湿的家长以父亲居多,如果他们在买尿不湿的同时恰好看到了啤酒,就会有很大的概率购买,从而就能提高啤酒的销售量。

当然,这个案例现在已被证实是虚构的,但这个故事仍让可以给我们很大的启发,商品之间的关联关系是客观存在的,这种通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法,就叫做商品关联分析法,也叫作“购物篮分析”。

看到这,你可能会觉得这不是常识吗?为什么还是个数据分析模型。

其实不然。虽然这种现象你看过去是常识,但这种通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法,就叫做商品关联分析法,即购物篮分析模型。需要通过「支持度」、「置信度」、「提升度」三个指标判断商品之间的关联程度,常用于零售行业。

这个模型一般是用来找出顾客购买行为的模式:

①比如用户买了A商品,是否会对B商品产生什么影响?
②不同的用户是否具有不同的购买模式?
③哪些产品应该放在一起进行捆绑销售?

在分析案例前,先解释下这三个指标分别代表的意思和计算方法。

1 「支持度」

A商品和B商品同时被购买的概率,显然支持度越大,商品间关联性越强。

计算公式:同时购买A和B订单数 / 总购买订单数

今天共有10笔订单,其中同时购买可乐和薯片的次数是7次,那么可乐+薯片组合的支持度就是7/10=70%。

2 「置信度」

因为购买了A所以购买了B的概率,注意与支持度区分。

计算公式:同时购买A和B订单数 / 购买A的订单数

今天共有10笔订单,其中购买可乐的次数是4,同时购买可乐和薯片的次数是3,则其置信度是3/4=75%

3 「提升度」

先购买A对购买B的提升作用,用来判断商品组合方式是否具有实际价值,大于1说明该组合方式有效,小于1则说明无效。

计算公式:支持度 / ( (购买A次数/总购买订单数)*(购买B次数/总购买订单数) )

今天共有10笔订单,购买可乐的次数是8,购买薯片的次数是6,购买可乐+薯片的次数是6,那么提升度是0.6 /(0.8*0.6)>1,因此可乐+薯片的组合方式是有效的。

讲完购物篮模型的原理和计算公式,只能大概掌握一些皮毛,接下来就带你用实例来应用一下购物篮分析模型,加深印象。

案例分析

以我们最为熟悉的超市为例。

案例背景是A集团超市最近在准备周年大促,需要根据近3个月A集团超市旗下各门店商品销售明细,来确定哪些商品需要组合起来捆绑促销。

先不急着分析,先理清一下思路,要解决这个问题,我们需要从以下五个步骤进行思考。

第一步
确定使用工具、数据来源

使用工具:FineBI数据分析工具
数据来源:A集团超市商品销售总表(已脱敏处理)

2cf6016a-528a-11ed-a3b6-dac502259ad0.png▲A超市商品销售总表▲

第二步
计算指标

根据上述计算公式可知,我们需要计算:

①总购买订单数 ②同时购买A和B的订单数 ③分别购买A和B的订单数

接下来,我们就在FineBI的自助数据集中逐个计算。

①总购买订单数

要计算总购买订单数,首先我们要先勾选「单据编码」,添加分组汇总,设置汇总方式为「去重计数」,对单据编码个数求和,从而轻松计算出总购买订单数。

2d14a49e-528a-11ed-a3b6-dac502259ad0.png

②计算同时购买A和B订单数

要计算同时购买A和B的订单数,就需要复制一列相同的商品类别,将两列合并在一起,就可以分出比如A+A、A+B、B+A等的商品组合。

让表左右合并,而后选择并集合并,合并依据为单据编码。

2d58d0c4-528a-11ed-a3b6-dac502259ad0.png

将商品名称作为A商品,集团商品总表-商品名称作为B商品。显然,不需要类似 A+A 的组合,因此需要将该数据过滤掉,输入函数【商品名称!=集团商品销售总表-商品名称】即可。

③计算分别购买A和B的订单数

添加左右合并,并将合并结果命名为「购买A的次数」,B商品同理计算。

2d733e6e-528a-11ed-a3b6-dac502259ad0.png

第三步
计算支持度、置信度、提升度

得到上面三个指标后,我们就可以开始计算支持度、置信度、提升度了。

支持度=同时购买A和B订单数/总购买订单数,新增列。置信度,提升度同理,就不列举了。

2dd8e76e-528a-11ed-a3b6-dac502259ad0.png

第四步
数据分析

计算得到支持度、置信度、提升度的结果后,我们就可以开始进行数据分析了。

使用FineBI的自定义图表,分析商品间的关联程度,用颜色的深浅和具体计算数字来表示关联程度的高低。

2e305116-528a-11ed-a3b6-dac502259ad0.png▲商品关联分析▲ 2ea08954-528a-11ed-a3b6-dac502259ad0.png▲商品支持度分析▲ 2ec399d0-528a-11ed-a3b6-dac502259ad0.png▲商品置信度分析▲ 2fae5358-528a-11ed-a3b6-dac502259ad0.png▲商品提升度分析▲

第五步
得出分析结论

(1)微爽日用卫生巾和家之寓圆形夹晒架的支持度(同时购买概率)最高,为5.95。且购买家之寓圆形夹晒架后又购买微爽日用卫生巾的置信度较高,为0.27,大于平均置信度,因此两者被一起购买的概率很大,可放置在货架的相邻位置,刺激顾客购买欲。

(2)本地小白菜和香妃蜜瓜的置信度最高,为0.42。因此可将小白菜和香妃蜜瓜放在果蔬货架的相邻位置或捆绑销售。

(3)青葱和雪碧的提升度最高,为8.44。即购买雪碧后对购买青葱有较大的提升作用,但考虑到青葱和雪碧的购买量都较大,且都为常备品,基于实际情况来说,不适合捆绑销售。

(4)盐津铺子和嘉士利威化饼的提升度较高,为4.54,大于1。两个都为零食货柜商品,因此可考虑捆绑销售。

总结

经过上述五个步骤,我们可以得出初步的分析结论。当然,最后的零售促销方案还是得根据超市的实际情况来判断合不合适(例如分析结论中的青葱和雪碧),数据只能辅助我们的决策,而不能直接给予决策。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    2707

    浏览量

    47704
  • 数据分析
    +关注

    关注

    2

    文章

    1353

    浏览量

    33738

原文标题:数分必备:购物篮分析模型实例

文章出处:【微信号:DBDevs,微信公众号:数据分析与开发】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    126.126 购物篮分析与运用 #硬声创作季

    代码程序开发
    充八万
    发布于 :2023年07月20日 02:06:26

    轿车参数化分析模型的构造研究及应用

    轿车参数化分析模型的构造研究及应用概念设计阶段是车身结构设计中保证性能的重要阶段这个阶段留下的缺陷往往很难在后续的设计中弥补因而在车身开发中受到广泛重视目前国内外在这方面都展开了详细的研究尤其是国外
    发表于 04-16 13:40

    智能自助服务超市购物

    为解决超市购物结算等候时间过长的问题,提出一款智能购物车的方案:用户在超市购物后将商品条码信息扫描录入到购物车中,并存储,结算时通过蓝牙将所有购物
    发表于 11-16 22:47

    敏捷微桥智能wifi,购物新体验

    随着4G的正式推出,wifi接入的普及,顾客越来越依赖手机、平板等移动设备,随时随地在线成为常态,拥有移动终端的顾客不再需要“去购物”,他们随时随地都“在购物”。面对快速移动的顾客,传统零售业也
    发表于 04-24 11:32

    在线分享PCB和3D作品,赢京东购物

    的开关电源立即参与 奖品设置京东100元购物卡京东50元购物卡360随身Wifi评奖规则1、参照给出的至少完成2个作品设计方可参与评奖。2、必须上传工程文件(包含原理图和PCB图或者3D模型源文件,注意加密
    发表于 06-13 00:31

    高速互连SPICE仿真模型完成多类电路分析

    模型可以完成多种类型的电路分析,其中最为主要的有:  · 直流分析(DC Analysis):包括静态工作点、直流灵敏度、直流传输特性、直流特性扫描分析;  · 交流
    发表于 08-31 14:55

    用BI软件做财务分析,连分析模型都不用做

    用BI软件做的分析报表直观又好看,这是大家公认的,除了这个之外,用BI软件做财务分析分析模型都不用做,BI软件就能提供标准、系统化的财务分析
    发表于 10-19 14:59

    怎么实现基于GSM模块的移动购物系统的设计?

    在借鉴其他基于GSM的短信应用的基础上,设计了基于GSM的移动购物系统,对其构架、功能、接口和短信分解算法做了阐述和分析,通过测试得到了比较理想的结果。
    发表于 06-04 06:51

    Case-Control 关联分析模型

    一、Case-Control关联分析模型 (第一部分主要是在人类中)卡方检验举例逻辑回归逻辑混合模型 二、(动植物)数量性状关联分析模型加性
    发表于 07-23 07:03

    函数关系图模型分析概述

    文章目录概述函数关系图模型分析资源层->设备层设备层->驱动层总结概述今天看了《韦东山升级版全系列嵌入式视频之总线设备驱动模型》这一节的视频,看完之后感觉有一种似懂非懂的感觉,因此我
    发表于 12-23 06:27

    分析模型?自带分析模型的bi系统了解一下吗?

    个人做数据可视化就算了,但凡上升到部门级的、企业级的,都少不了搭建数据分析模型,但数据分析模型不是那么好搭建的,经验不足、考虑不周都将影响到后续的数据可视化
    发表于 05-17 10:03

    基于图论的化学分子数据挖掘研究

    近年来,人们提出了很多频繁图模式挖掘的算法。首先分析了贪婪搜索策略,然后对各种不同的图数据挖掘的方法进行比较。受购物篮分析的影响,基于ILP 方法引起了人们的
    发表于 09-14 15:58 25次下载

    电商平台用户再购物行为的预测研究分析

    不同的行为预测特征,基于可视化等方法对比分析了预测特征的重要性和特点,进行了属性筛选;然后,基于提出的预测特征设计使用了多种不同算法训练预测模型。实验硏究表明,多 lightgbm模型的融合方法能够达到很高的再
    发表于 06-17 14:21 6次下载

    Linux设备模型分析之(一):设备模型核心

    Linux设备模型分析
    发表于 10-28 11:19 0次下载

    Linux设备模型分析之(二):设备模型的基石

    Linux设备模型分析
    发表于 10-28 11:21 0次下载