0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

python获取历届春晚数据

张敏 来源:yiniuyun 作者:yiniuyun 2022-02-07 17:52 次阅读

不知道今年的春晚大家看了吗?小编表示没有看,而且是已经很多年没有完整的看过春晚了,关于看春晚的热情都是小时候的事了。如今,距离第一届春晚 1983 年,整整过去了 39年,看过那么多春晚,哪一年、哪些节目、哪些人你还留有深刻印象呢?接下来,通过 Python 数据分析。

在网上找了很久发现没有关于春晚完整的数据,都是不连贯的,节目单表是每一年春晚上表演的节目,包括:节目类型、节目名、演员名这几项数据。这里我们就使用Python 抓取这类表格数据,方法简单,几行代码就能搞定,简单的示例代码如下:

#! -*- encoding:utf-8 -*- import requests import random # 要访问的目标页面 targetUrl = "http://httpbin.org/ip" # 要访问的目标HTTPS页面 # targetUrl = "https://httpbin.org/ip" # 代理服务器(产品官网 www.16yun.cn) proxyHost = "t.16yun.cn" proxyPort = "31111" # 代理验证信息 proxyUser = "username" proxyPass = "password" proxyMeta = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % { "host" : proxyHost, "port" : proxyPort, "user" : proxyUser, "pass" : proxyPass, } # 设置 http和https访问都是用HTTP代理 proxies = { "http" : proxyMeta, "https" : proxyMeta, } # 设置IP切换头 tunnel = random.randint(1,10000) headers = {"Proxy-Tunnel": str(tunnel)} resp = requests.get(targetUrl, proxies=proxies, headers=headers) print resp.status_code print resp.text

抓取下来的数据都比较混乱,需要用 Python 清洗处理一下就可以分析,这些不是重点,重点是在获取数据的过程中,目标网站有封反爬策略比如封ip,所以在访问过程中我加了代理,代码部分主要是关于如何使用动态转发模式代理示例,在学习爬虫中对代理有疑问的可以看下这里https://www.16yun.cn/。在获取数据之后就可以直接进入分析环节,从中我们可以看到谁导演春晚次数最多?谁主持春晚次数最多?谁上春晚次数最多等数据。

若有收获,就点个赞吧

审核编辑:鄢孟繁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6512

    浏览量

    87609
  • python
    +关注

    关注

    51

    文章

    4677

    浏览量

    83473
收藏 人收藏

    评论

    相关推荐

    Python怎么读取STM32串口数据

    =ser.readlines()print(s) 可是什么都读取不了。如果用买的STM32开发板送的串口助手,能接收到数据。板子上烧录的printf输出程序。 请问各位大神,Python程序要怎么写才能读取串口数据呢?跪求大神解
    发表于 04-24 07:30

    今年春节,德施曼成“春晚御用”智能锁,亮相总台春晚直播间

    总台春晚,是每年春节期间的最大热点。今年除夕夜,高端智能锁品牌德施曼,不仅成为“春晚御用”智能锁,还将旗下的哨兵猫眼智能锁,卖到了总台春晚的直播间里。龙年春节,德施曼智能锁携手小红书《大家的
    的头像 发表于 02-09 10:39 150次阅读
    今年春节,德施曼成“<b class='flag-5'>春晚</b>御用”智能锁,亮相总台<b class='flag-5'>春晚</b>直播间

    如何使用Python PySNMP模块获取设备指标呢?

    PySNMP 是一个跨平台的纯Python SNMP 引擎实现。
    的头像 发表于 01-12 13:59 547次阅读

    python获取控制台输出内容

    Python中,获取控制台输出内容可以使用多种方法。无论是在开发过程中调试程序,还是在分析程序执行结果时,获取控制台输出内容都是非常有用的。 最常见的方法就是使用print函数来输出内容到控制台
    的头像 发表于 11-22 14:08 1012次阅读

    python去除list中重复的数据

    Python是一个强大的编程语言,提供了许多解决问题的方法和功能。其中一个常见的问题是如何去除列表中的重复数据。在本文中,我们将详细介绍Python中去除列表中重复数据的几种方法,包括
    的头像 发表于 11-21 15:49 369次阅读

    yfinance:获取数据Python第三方模块

    yfinance 是一个使用 Yahoo! 获取数据Python 第三方模块。它支持获取最细到1分钟级的历史数据及股票基本面
    的头像 发表于 10-21 14:32 1005次阅读

    Akshare:一个非常好用的开源A股数据获取模块

    Akshare是一个非常好用的开源A股数据获取模块,它是基于 Python 的财经数据接口库,目的是实现对A股、美股、期货等金融产品的基本面数据
    的头像 发表于 10-21 10:58 4022次阅读
    Akshare:一个非常好用的开源A股<b class='flag-5'>数据</b><b class='flag-5'>获取</b>模块

    新闻的获取与存储(2)#Python数据分析

    数据分析python
    未来加油dz
    发布于 :2023年09月02日 20:15:43

    新闻的获取与存储(1)#Python数据分析

    数据分析python
    未来加油dz
    发布于 :2023年09月02日 20:14:52

    python读取数据数据 python查询数据python数据库连接

    库,获取数据库中的数据,并对数据进行增删改查等操作。本文将详细介绍Python如何连接数据库、读
    的头像 发表于 08-28 17:09 1201次阅读

    python有什么用 如何用python创建数据

    python有什么用 如何用python创建数据Python是一种高级编程语言,可以用于开发各种类型的应用程序和工具。它的广泛应用使它在编程领域中极为受欢迎。
    的头像 发表于 08-28 16:41 789次阅读

    SQLite数据库与python的区别

    SQLite数据库与python的区别 SQLite是一种轻量级关系型数据库管理系统,是一个嵌入式的数据库引擎。Python是一种高级编程语
    的头像 发表于 08-28 16:41 537次阅读

    python数据挖掘案例

    python数据挖掘案例 Python数据挖掘在各个领域中应用非常广泛。它可以帮助我们从大量的数据中挖掘出有价值的信息,从而为决策和优化提供
    的头像 发表于 08-17 16:29 854次阅读

    python数据挖掘与机器学习

    python数据挖掘与机器学习 Python是一个非常流行的编程语言,被广泛用于数据挖掘和机器学习领域。在本篇文章中,我们将探讨Python
    的头像 发表于 08-17 16:29 889次阅读

    Python基于Flask+MySQL的车辆管理系统

    基于Python+Django+MySQL的车辆管理系统,采用Echart构建图表,支持一键切换颜色主题,通过连接数据获取车辆信息。
    发表于 06-07 15:21 416次阅读
    <b class='flag-5'>Python</b>基于Flask+MySQL的车辆管理系统