0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

用python分析了李子柒的辣酱真的好吃吗?

lviY_AI_shequ 来源:数据不吹牛 2020-05-12 09:24 次阅读

最近收到不少留言,除了夸小Z脑洞奇清的,问最多的竟然是:

“我是偏运营/业务分析的,复杂的分析算法我不会,还有什么方法能够对评价类数据做更深入分析吗?”

刚开始我会昧着良心回复“词云啊!”

然鹅总是会被DISS“词云太简单了吧,有点low!”

我狰狞一笑,虽然这个问题有点像“我长的不帅也没钱,有没有什么办法能够追到白富美”。但从数据分析的角度来看,仍不失为一个好问题。

好在哪里呢?在回答之前,先瞧一个数据分析常见思维误区:

一些同学总是认为,分析不出来有价值的结果,是因为有两只拦路虎,一是数据量和维度不够,二是因为自己不会复杂的分析模型和算法。然后,也没有再去思考,如何基于现状更进一步地分析问题。

数据维度和算法的价值当然不言而喻,但总是把分析不出结果和价值的锅甩出去,这种归错于外的思维非常危险,它营造了一种“分析不出结果,我也没办法”的心安理得。

而“我不会高阶分析工具和方法,但基于现状,去思考或者询问有没有更好的分析方式”,虽然这种思维也有槽点,但本身算是一种在现阶段尝试去解决问题的思路。

So,我们循着后一种思路,以李子柒在天猫上卖的一款辣椒酱评价为例:

看看基于现有的“单薄”数据维度,怎样让分析再向前迈进一步。

01 明确目标

鲁迅曾经没说过:“明确分析目标,你的分析已经成功了一大半”。

做深入分析之前,面对这一堆评价数据,我们要明确,究竟想通过分析来解决什么问题?只有明确分析目标,才能把发散的思维聚焦起来。

为了给大家一个明确的分析锚点,假设我们是这款辣椒酱的产品负责人,要基于评价,更好的获悉消费者对产品的看法,从而为后续产品优化提供思路。

所以,我们的分析目标是“基于评价反馈,量化消费者感知,指导优化产品”。

注:这里给到的一个假设目标并不完美,主要是抛砖引玉,大家可以从不同的维度来提出目标假设,尝试不同分析方向。

是不是有那么一丢丢分析思路了?别急,目标还需要继续拆解

02 拆解目标

这些年来,最有价值的一个字,便是“拆”了:

在数据分析中也是同理。

我们在上一步已经确定了“基于评价优化产品”的目标,但这只是一个笼统模糊的目标。要让目标真正可落地,“拆”是必不可少的一步。

“拆”的艺术大体可以分为两步,第一步是换位思考。

评价来源于客户,客户对产品有哪些方面的感知呢?我们可以闭上眼睛,幻想自己购买了这款辣椒酱。

接着进入第二步,基于换位的逻辑拆解,这里可以按照模拟购物流程的逻辑来拆解:

首先,李子柒本身有非常强的IP光环,大家在选购时或多或少是慕名而来。所以,在购买决策时,到底有多大比例是冲着李子柒来的?

Next,在没收到货前,影响体验的肯定是物流,付款到收货用了几天?派送员态度怎么样,送货上门了吗?

收到货后,使用之前,体感最强的则是包装。外包装有没有破损?有没有变形?产品包装是精致还是粗糙?

接下来是产品体验,拿辣椒酱来说,日期是否新鲜?牛肉用户是否喜欢?到底好不好吃?

吃完之后,我们建立起了对产品的立体感知——性价比。我花钱买这个产品到底值不值?这个价位是贵了还是便宜?实惠不实惠?

品牌、物流、包装、产品(日期、口味)和性价比五大天王锋芒初现,我们下一步需要量化消费者对于每个方面的感知。

03 Python实现

对于评价的拆解和量化,这里介绍一种简单粗暴的方式,按标点把整条评论拆分成零散的模块,再设置一系列预置词来遍历。

注:再次强调我们这篇内容的主题是“如何基于最基础的技术,做进一步的分析,这里假设我们只会最基础的python语法和pandas。

有同学会问“为什么不用分词”!此问可谓正中我怀。不过,我把这个问题当作开放式思考题留给大家——如果用分词,如何实现同样的效果,以及有什么优缺点?

言归正传,我们先看看实战爬取的评论数据,一共1794条:

把每条评论按照标点拆分成短句,为了省事,用了简单的正则拆分:

我们发现,就算是比较长段的评论,也只是涉及到品牌、物流、包装、产品和性价比的部分方面,所以,我们依次去遍历匹配,看短句中有没有相关的内容,没有就跳过,有的话再判断具体情绪。

以物流为例,当短句中出现“物流”、“快递”、“配送”、“取货”等关键词,大体可以判定这个短句和物流相关。

接着,再在短句中寻找代表情绪的词汇,正面的像“快”、“不错”、“棒”、“满意”、“迅速”;负面的“慢”、“龟速”、“暴力”、“差”等。

在我们预设词的基础上进行两次遍历匹配,大体可以判断这句话是不是和物流相关,以及客户对物流的看法是正面还是负面:

为方便理解,用了灰常丑陋的语法来一对一实现判断。包装、产品和性价比等其他模块的判断,也是沿用上述逻辑,只是在预设词上有所差异,部分代码如下:

defjudge_comment(df,result): judges=pd.DataFrame(np.zeros(13*len(df)).reshape(len(df),13), columns=['品牌','物流正面','物流负面','包装正面','包装负面','原料正面', '原料负面','口感正面','口感负面','日期正面','日期负面', '性价比正面','性价比负面']) foriinrange(len(result)): words=result[i] forwordinwords: #李子柒的产品具有强IP属性,基本都是正面评价,这里不统计情绪,只统计提及次数 if'李子柒'inwordor'子柒'inwordor'小柒'inwordor'李子七'inword or'小七'inword: judges.iloc[i]['品牌']=1 #先判断是不是物流相关的 if'物流'inwordor'快递'inwordor'配送'inwordor'取货'inword: #再判断是正面还是负面情感 if'好'inwordor'不错'inwordor'棒'inwordor'满意'inwordor'迅速'inword: judges.iloc[i]['物流正面']=1 elif'慢'inwordor'龟速'inwordor'暴力'inwordor'差'inword: judges.iloc[i]['物流负面']=1 #判断是否包装相关 if'包装'inwordor'盒子'inwordor'袋子'inwordor'外观'inword: if'高端'inwordor'大气'inwordor'还行'inwordor'完整'inwordor'好'inwordor '严实'inwordor'紧'inword: judges.iloc[i]['包装正面']=1 elif'破'inwordor'破损'inwordor'瘪'inwordor'简陋'inword: judges.iloc[i]['包装负面']=1 #产品 #产品原料是牛肉为主,且评价大多会提到牛肉,因此我们把这个单独拎出来分析 if'肉'inword: if'大'inwordor'多'inwordor'足'inwordor'香'inwordor'才'inword: judges.iloc[i]['原料正面']=1 elif'小'inwordor'少'inwordor'没'inword: judges.iloc[i]['原料负面']=1 #口感的情绪 if'口味'inwordor'味道'inwordor'口感'inwordor'吃起来'inword: if'不错'inwordor'好'inwordor'棒'inwordor'鲜'inwordor '可以'inwordor'喜欢'inwordor'符合'inword: judges.iloc[i]['口感正面']=1 elif'不好'inwordor'不行'inwordor'不鲜'inwordor '太烂'inword: judges.iloc[i]['口感负面']=1 #口感方面,有些是不需要出现前置词,消费者直接评价好吃难吃的,例如: if'难吃'inwordor'不好吃'inword: judges.iloc[i]['口感负面']=1 elif'好吃'inwordor'香'inword: judges.iloc[i]['口感正面']=1 #日期是不是新鲜 if'日期'inwordor'时间'inwordor'保质期'inword: if'新鲜'inword: judges.iloc[i]['日期正面']=1 elif'久'inwordor'长'inword: judges.iloc[i]['日期负面']=1 elif'过期'inword: judges.iloc[i]['日期负面']=1 #性价比 if'划算'inwordor'便宜'inwordor'赚了'inwordor'囤货'inwordor'超值'inwordor '太值'inwordor'物美价廉'inwordor'实惠'inwordor'性价比高'inwordor'不贵'inword: judges.iloc[i]['性价比正面']=1 elif'贵'inwordor'不值'inwordor'亏了'inwordor'不划算'inwordor'不便宜'inword: judges.iloc[i]['性价比负面']=1 final_result=pd.concat([df,judges],axis=1) returnfinal_result

运行一下,结果毕现:

第一条评价,很明显的说快递暴力,对应“物流负面”计了一分。

第二条评价,全面夸赞,提到了品牌,和正面的物流、口感信息

第三条评价,粉丝表白,先说品牌,再夸口感。

看起来还不赖,下面我们对结果数据展开分析。

04 结果分析

我们先对结果做个汇总:

一共爬了1794条评论,评论中有提及到我们关注点的有1937次(之所以用次,是因为一条评论中可能涉及到多个方面)。粗略一瞥,口感和原料占比较高,画个图更细致的看看。

看来,辣椒酱的口感(好不好吃)是客户最最最关注的点,没有之一,占比高达57.98%,领先其他类别N个身位。

慢随其后的,是原料、品牌、性价比和包装,而物流和日期则鲜有提及,消费者貌似不太关注,或者说目前基本满足要求。

那不同类别正负面评价占比是怎么样的呢?

整体来看,主流评论以好评为主,其中口感、品牌(这个地方其实没有细分)、包装以正面评价占绝对主导。

原料和性价比,负面评价占比分别是14%和38%,而物流和日期由于本身占比太少,参考性不强。

作为一个分析师,我们从原料、性价比负面评价占比中看到了深挖的机会。

原料负面评价是单纯的在吐槽原材料吗?

初步筛选之后,发现事情并没有那么简单。

原料负面评价共出现了53次,但里面有24次给了口感正面的评价,甚至还有8次原料正面评价!罗生门吗?

这8次即正面又负面的原料评价,其实是揭了我们在预置词方面的不严谨,前面判断牛肉相关的短句,“小”就是负面,“大”就是正面,有些绝对。

而判断准确的原料差评中,虽然有一半说味道不错,但还是不留情面的吐槽了牛肉粒之小,之少,甚至还有因此觉得被骗。

如何让牛肉粒在体感上获取更多的好评,是应该在产品传播层做期望控制的宣导?还是在产品层增加牛肉的“肉感”?需要结合具体业务进一步探究。

性价比呢?

性价比相关负面评价共58次,负面情绪占性价比相关的38%。这些负面评价消费者大多数认为价格偏贵,不划算,还有一部分提到了通过直播渠道购买价格相对便宜,但日常价格难以接受。

坦白讲,这款辣酱的价格在线上确实属于高端价位,而价格体系是一个比较复杂的场景,这里暂不展开分析。

但是对于这部分认为性价比不符预期的客户,是应该因此反推产品价格,还是把他们打上“价格敏感的标签”,等大促活动唤醒收割,这是两条可以考虑并推进的道路。

物流和日期提及太少,不具备参考性,但为了不那么虎头蛇尾,我们还是顺手看一眼物流负面评价:

果然,物流是一项必备需求,基本满足预期的话消费者并不会主动提及,没达预期则大概率会雷霆震怒。而物流暴力、速度太慢是两个永恒的槽点。

至此,我们基于看起来简单的评价数据,用简单浅白的方式,做了细致的拆分,并通过拆分更进一步的量化和分析,向深渊,哦不,向深入迈进了那么一丢丢。

总结

文中涉及到的代码,主要是抛砖引玉,大家还可以结合实际,做更精细的梳理和判断。在整个分析过程中,去思考如何更深入的分析,如何明确分析方向,如何通过换位思考和流程拆解,把大目标拆成可以分析的小目标,并最终落地,则需要在实践中反复磨练,与君共勉!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模块
    +关注

    关注

    7

    文章

    2480

    浏览量

    46522
  • 算法
    +关注

    关注

    23

    文章

    4454

    浏览量

    90747
  • python
    +关注

    关注

    51

    文章

    4674

    浏览量

    83464

原文标题:我用python分析了李子柒的辣酱真的好吃吗?

文章出处:【微信号:AI_shequ,微信公众号:人工智能爱好者社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    python运行指定几行

    Python是一种高级编程语言,可以用于开发各种类型的应用程序,包括网站、桌面应用程序、数据分析和人工智能等。在Python中运行指定的几行代码十分简单,它不仅能够帮助程序员快速开发软件,也适用于
    的头像 发表于 11-29 15:04 372次阅读

    查看python安装路径的方法

    Python是一种高级编程语言,常用于开发Web应用、数据分析、人工智能等领域。在使用Python进行开发之前,我们需要先安装Python解释器,并了解
    的头像 发表于 11-29 14:54 1004次阅读

    Python2与Python3的差异

    Python2与Python3是两个不同的版本,它们在语法、功能和性能等方面存在一些差异。下面是对Python2和Python3的详尽、详实、细致的比较,分为以下几个方面: 语法差异
    的头像 发表于 11-23 16:48 347次阅读

    Python 不可变对象真的不可变吗

    在日常的学习和工作中,经常会遇到"不可变对象"的问题,但是随着接触Python这门语言的时间越来越多,遇到的坑越来越奇怪。我不禁产生了一个疑问:不可变对象真的不可变吗? 我们知道元组就是"不可变对象
    的头像 发表于 11-03 11:48 305次阅读
    <b class='flag-5'>Python</b> 不可变对象<b class='flag-5'>真的</b>不可变吗

    PyJNIus :让你在Python中轻松调用Java方法

    是你最好的选择。 1.准备 开始之前,你要确保Python和pip已经成功安装在电脑上,如果没有,可以访问这篇文章: 超详细Python安装指南 进行安装。 如果你用Python的目的是数据
    的头像 发表于 11-01 10:45 395次阅读

    py-spy:用于Python程序的性能监控、分析

    py-spy是用于Python程序的性能监控、分析器。它使你可以直观地看到Python程序花费的时间,而无需重新启动程序或以任何方式修改代码。 py-spy的开销非常低:为了最大化提高速度,它是
    的头像 发表于 11-01 10:13 374次阅读
    py-spy:用于<b class='flag-5'>Python</b>程序的性能监控、<b class='flag-5'>分析</b>器

    Python SDK包的使用

    之前,你要确保Python和pip已经成功安装在电脑上,如果没有,可以访问这篇文章: 超详细Python安装指南 进行安装。 (可选1) 如果你用Python的目的是数据分析,可以直接
    的头像 发表于 10-30 15:51 415次阅读
    <b class='flag-5'>Python</b> SDK包的使用

    Dynaconf 轻松实现 Python 动态配置管理

    1) **如果你用Python的目的是数据分析,可以直接安装Anaconda: Python数据分析与挖掘好帮手—Anaconda ,它内置了Pyt
    的头像 发表于 10-30 15:02 344次阅读

    PyJNIus:在Python中轻松调用Java方法

    是你最好的选择。 1.准备 开始之前,你要确保Python和pip已经成功安装在电脑上,如果没有,可以访问这篇文章: 超详细Python安装指南 进行安装。 如果你用Python的目的是数据
    的头像 发表于 10-30 11:32 279次阅读

    基于NS2仿真的IP网络性能分析与研究

    电子发烧友网站提供《基于NS2仿真的IP网络性能分析与研究.pdf》资料免费下载
    发表于 10-24 11:41 0次下载
    基于NS2仿<b class='flag-5'>真的</b>IP网络性能<b class='flag-5'>分析</b>与研究

    Camelot:Python超强大的PDF表格提取器

    安装指南 进行安装。 如果你用Python的目的是数据分析,可以直接安装Anaconda: Python数据分析与挖掘好帮手—A
    的头像 发表于 10-21 10:57 726次阅读
    Camelot:<b class='flag-5'>Python</b>超强大的PDF表格提取器

    Python in Excel,让你的数据分析直达专家级

    Python in Excel 可使用Python这门强大的编程语言来操作和分析数据,无需额外安装或设置便能提供 更多样式、更加智能的数据分析和数据可视化途径,助你秒变“数据
    的头像 发表于 10-18 16:20 203次阅读
    <b class='flag-5'>Python</b> in Excel,让你的数据<b class='flag-5'>分析</b>直达专家级

    Python编程实用指南

    介绍 Python 语言的基础知识,而且还通过项目实践教会读者如何应用这些知识和技能。本书的第一部分介绍基本的 Python 编程概念,第二部分介绍一些不同的任务,通过编写
    发表于 09-27 06:21

    python有什么用 如何用python创建数据库

    python有什么用 如何用python创建数据库 Python是一种高级编程语言,可以用于开发各种类型的应用程序和工具。它的广泛应用使它在编程领域中极为受欢迎。Python被用于数据
    的头像 发表于 08-28 16:41 777次阅读

    Python常用的几个命令介绍

    Python是一种功能强大的编程语言,广泛用于数据分析、人工智能和Web开发等领域。在使用Python时,需要掌握一些基本的命令,以便更好地管理和运行代码。下面将介绍Python常用的
    的头像 发表于 06-21 17:12 1849次阅读