0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

带大家一起用数据去解读其中最值得看的影片

电子工程师 来源:lq 2019-01-29 10:14 次阅读

前言

随着春节脚步的临近,想必各位读者都已经开始规划幸福的春节长假该如何度过。阖家团聚,探亲访友,与好久没见的好基友一起谈天说地,怼天怼地,想想都是让人感到幸福。

除此之外,每年的春节档电影都会如约而至与大家见面,春节档诞生了许多的经典电影,2019的春节档电影也是佳片云集,被称作“史上最强春节档”,今天我们就带大家一起用数据去解读其中最值得看的影片。

数据获取

本次我们的数据主要来源于猫眼,一部分是猫眼的实时预售票房数据:

这部分数据可以通过selenium去获取,代码如下:

driver = webdriver.Chrome()driver.maximize_window() driver.close() driver.switch_to_window(driver.window_handles[0]) url = 'https://piaofang.maoyan.com/dashboard?date=2019-02-05'js='window.open("'+url+'")'driver.execute_script(js)driver.close() driver.switch_to_window(driver.window_handles[0])

另一部分数据则来源于猫眼的观众评论,由于电影目前都还没有上映,观众评论给出的分数,表示了其对电影的期待值。需要注意的是,有许多观众在评论中并没有给出评分,会直接显示为0,在后续计算时需要排除,数据如下:

这部分数据的获取方法可以参照之前《3天破9亿!上万条评论解读《西虹市首富》是否值得一看》,我们就直接省略爬取代码。

预售票房

衡量一个电影关注度的重要方法就是去看首日的预售情况,我们此次选取八部春节档最主要的影片进行对比,代码如下:

p<-ggplot(data[order(data$sale,decreasing = T),][1:8,],          aes(x=reorder(name,sale),y=sale,fill=name))+  geom_bar(stat='identity',width = 0.5)+  geom_image(aes(x=name,y=0,image=image),size=0.08)+  geom_text(aes(x=name,y=2500,label=label_sale),size = 7,col='black',fontface='bold')+  ggtitle('春节档电影预售票房排名(万)') + theme_economist()+ scale_fill_tableau()+                  theme(axis.text.x = element_blank(),        axis.text.y = element_blank(),        plot.title = element_text(hjust=0.5,size=30),        panel.grid = element_blank(),        legend.position = 'none',        panel.background = element_blank(),        axis.title  = element_blank(),        axis.line = element_blank(),        axis.ticks = element_blank()  )+coord_flip()+ylim(0,6500)ggsave("春节档上映前预售排名.png", p, width = 10, height = 16)

看一下最终的结果:

目前预售排名前三位的都是喜剧题材,看来在春节的时候大家还是更加希望能够放松自己,看一下轻松题材的影评。但是预售票房并不能完全觉得最终的票房走势,可以参考之前上映后口碑崩塌的《地球最后的夜晚》和《爱情公寓》。

排名前两位的影片都有沈腾的参与,看来目前沈腾的票房认可度还是不错的,希望两部影片最终都会取得不错的结果。

从预售票房上看,《廉政风云》和《神探蒲松龄》都有比较大的扑街危险,考虑到港片近期略显低迷的表现,希望这两部影片能够带来一些惊喜。

上映前口碑

另外我们也看一下上映之前,观众对于影片的整体评价情况,这也会在一定程度上体现观众的期待值:

代码如下:

p<-ggplot(data[order(data$score,decreasing = T),][1:8,],          aes(x=reorder(name,score),y=score,fill=name))+  geom_bar(stat='identity',width = 0.5)+  geom_image(aes(x=name,y=0,image=image),size=0.08)+  geom_text(aes(x=name,y=2,label=label_score),size = 7,col='black',fontface='bold')+  ggtitle('春节档电影上映前评价') + theme_wsj()+ scale_fill_tableau()+                  theme(axis.text.x = element_blank(),        axis.text.y = element_blank(),        plot.title = element_text(hjust=0.5,size=30),        panel.grid = element_blank(),        legend.position = 'none',        panel.background = element_blank(),        axis.title  = element_blank(),        axis.line = element_blank(),        axis.ticks = element_blank()  )+coord_flip()+ylim(0,5)ggsave("春节档上映前评分排名.png", p, width = 8, height = 12)

看一下最终的结果:

《熊出没》出人意料的在评分中排在首位,这也一定程度上提高了作者对这部影片的期待值,虽然以作者的年龄,应该是不适合去看这部影片,《小猪佩奇》凭借此前的超强营销,成功引起了大家的主要,然而最终表现如何,还是需要上映后接受观众的检验。

同时我们看到成龙大哥领衔的《神探蒲松龄》在评分上要落后于其他影片,看来大家对于这类题材的影片持保留意见比较多一些,我们也期待上映后口碑是否能够实现翻盘。

影片看点

我们最后通过评论去挖掘上映前大家比较关注的点,主要采用jieba分词,需要注意的是,我们需要在分词前增加一些自定义词典,比如“黄景瑜”,如果不加这个自定义词典,就会被分为“黄景”,之后我们会根据词语出现频率筛选出重要的关键词:

def key_words(df): comment_str = ' '.join(df) words_list = [] jieba.load_userdict('spring_film_dict.txt') word_generator = jieba.cut(comment_str) # 返回的是一个迭代 f.close() # stopwords文本中词的格式是'一词一行' for word in word_generator: words_list.append(word) words_list = Counter([k for k in words_list if len(k)>1]) return list(dict(words_list.most_common(30)).keys())

最后我们在每个影片中选取了五个能够体现其看点的词语,并进行可视化:

我们选取一些比较有趣的看点组合,进行一下深刻(suixing)解读:

《神探蒲松龄》:大家都在期待成龙大哥的表演,虽然有很多人提前给其打上了“烂片”的标签,但是依然期待影片口碑的翻盘。同时大家也会认真关注影片特效,不知是否会致敬此前5毛钱“duang”的特效。

《飞驰人生》《疯狂的外星人》:感觉沈腾大有承包今年春节档的态势,预售排名前两位影片中,观众最关注的看点都是沈腾,期待沈腾春节霸屏同时也能收获不错的口碑。沈腾又是和外星人打交道,又是要体验飞驰的人生,喜欢沈腾的观众在春节档可以大饱眼福了。

《小猪佩奇过大年》:一部适合孩子观看的影片,也是一部宣传片获得极大讨论度的影片,希望不要步此前《地球最后的夜晚》上映后口碑崩盘的后尘。

《新喜剧之王》:显然大部分观众对这部影片的期待来自于星爷,有了此前经典版的《喜剧之王》珠玉在前,《新喜剧之王》不可避免地会被哪来与原作对比,我们期待能够简直有一部经典的影片出现。

最后提前祝愿大家新年愉快,体会与家人团聚的幸福同时也能看到精彩的影片!同时大家也可以在留言区与我们互动,分享自己春节档会选择去观看的影片。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6511

    浏览量

    87595
  • 代码
    +关注

    关注

    30

    文章

    4555

    浏览量

    66751

原文标题:数据解读2019春节档哪部电影最值得看?

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    35411是什么芯片?和mega16一起用

    有哪位大侠知道35411是什么芯片?和mega16一起用的。谢谢!
    发表于 05-07 14:56

    大家一起讨论音乐频谱

    我看到很多人做了音乐频谱,我想让大家一起讨论下音乐频谱,什么led好?是高亮的还是般的,
    发表于 11-29 14:37

    单片机一起用的24c02c模块是什么功能?

    这电路什么功能啊,跟单片机一起用
    发表于 05-22 14:03

    超声波和陀螺仪为什么一起用不好使啊

    的是arduino1280板 超声波和陀螺仪在一起用,串口不输出数值
    发表于 09-10 21:50

    怎样讲maxwell与 Simplorer联合在一起用

    怎样讲maxwell与 Simplorer联合在一起用
    发表于 11-16 21:02

    STM32F105使用CubeMX生成USB虚拟串口,USB的发送函数不能与USART1的发送函数一起用

    最近CubeMX 生成的USB虚拟串口的程序,发现个问题,USB的发送函数不能与USART1的发送函数一起用,主循环里面如果有USB和USART1的发送函数,串口助手只有USART1的可以收到
    发表于 01-28 07:40

    printf()串口输出与DMA串口输出为什么不能一起用

    关闭时,printf()输出的汉字就正常了,想问下,为什么这两种串口发送数据不能一起用。 不用回复了,我找到原因了,printf()没用好
    发表于 05-07 22:30

    大家一起记单词

    大家一起来用LAB记单词.网上找的文档,整理了下,LABVIEW分类读出来!
    发表于 02-02 14:41

    请问AT89C51单片机能和NE555定时器一起用吗?怎么个用法?

    请问AT89C51单片机能和NE555定时器一起用吗?怎么个用法?
    发表于 07-06 02:26

    请问RTC与LPUART一起用会出问题吗

    、LPTIMER、LPUART和比较器等。有工程师反应RTC与LPUART一起用时会出问题,其它这是因为模块的时钟没有配置好造成的。首先看下RTC的时钟配置如下:RTC_CR1寄存器的CKSEL位为RTC时钟
    发表于 02-24 06:07

    求解,W5500加MQTT使用时能不能和ADC外设一起用

    请问下W5500加MQTT使用时不能和ADC外设一起用吗?的是RT StudioWIZnet(2.0.0)Paho MQTT(1.1.0)stm32f103ve内核是4.0.3使用RTT配置的ADC和使用HAL库配置的ADC
    发表于 05-11 09:54

    ARM DS也是和DSTREAM调试器一起用

    ARM DS和DS-5有啥区别呀?ARM DS也是和DSTREAM调试器一起用吗?求大神解答
    发表于 08-10 14:52

    是否可以将ESP-NOW协议与ESP8266板一起用作其他ESP8266板之间的中继器?

    我需要在没有可用 WiFi 网络的山丘周围发送大约 500 米的温度数据。是否可以将 ESP-NOW 协议与 ESP8266 板一起用作其他 ESP8266 板之间的中继器?如果是这样,你能帮我写下发送器、中继器和接收器模块的
    发表于 02-22 06:28

    如何将IMXRT1170 (SDK 2.13) 与基于IW416的模块一起用于BLE?

    我们将 IMXRT1170 (SDK 2.13) 与基于 IW416 的模块一起用于 BLE 我没有在 edgefast 堆栈中找到正确的 API 来设置广告和连接期间的功率级别
    发表于 05-08 07:07

    带大家一起体验一下Vivado的ECO流程

    这里带大家一起体验一下Vivado 的ECO流程,以vivado自带的Example Design为例, 直接用TCL命令修改网表,在正常的寄存器路径之间加一级LUT。
    的头像 发表于 11-29 11:04 3920次阅读
    <b class='flag-5'>带大家</b><b class='flag-5'>一起</b>体验一下Vivado的ECO流程