0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

python获取历届春晚数据

张敏 来源:yiniuyun 作者:yiniuyun 2022-02-07 17:52 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

不知道今年的春晚大家看了吗?小编表示没有看,而且是已经很多年没有完整的看过春晚了,关于看春晚的热情都是小时候的事了。如今,距离第一届春晚 1983 年,整整过去了 39年,看过那么多春晚,哪一年、哪些节目、哪些人你还留有深刻印象呢?接下来,通过 Python 数据分析。

在网上找了很久发现没有关于春晚完整的数据,都是不连贯的,节目单表是每一年春晚上表演的节目,包括:节目类型、节目名、演员名这几项数据。这里我们就使用Python 抓取这类表格数据,方法简单,几行代码就能搞定,简单的示例代码如下:

#! -*- encoding:utf-8 -*- import requests import random # 要访问的目标页面 targetUrl = "http://httpbin.org/ip" # 要访问的目标HTTPS页面 # targetUrl = "https://httpbin.org/ip" # 代理服务器(产品官网 www.16yun.cn) proxyHost = "t.16yun.cn" proxyPort = "31111" # 代理验证信息 proxyUser = "username" proxyPass = "password" proxyMeta = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % { "host" : proxyHost, "port" : proxyPort, "user" : proxyUser, "pass" : proxyPass, } # 设置 http和https访问都是用HTTP代理 proxies = { "http" : proxyMeta, "https" : proxyMeta, } # 设置IP切换头 tunnel = random.randint(1,10000) headers = {"Proxy-Tunnel": str(tunnel)} resp = requests.get(targetUrl, proxies=proxies, headers=headers) print resp.status_code print resp.text

抓取下来的数据都比较混乱,需要用 Python 清洗处理一下就可以分析,这些不是重点,重点是在获取数据的过程中,目标网站有封反爬策略比如封ip,所以在访问过程中我加了代理,代码部分主要是关于如何使用动态转发模式代理示例,在学习爬虫中对代理有疑问的可以看下这里https://www.16yun.cn/。在获取数据之后就可以直接进入分析环节,从中我们可以看到谁导演春晚次数最多?谁主持春晚次数最多?谁上春晚次数最多等数据。

若有收获,就点个赞吧

审核编辑:鄢孟繁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7314

    浏览量

    93968
  • python
    +关注

    关注

    57

    文章

    4857

    浏览量

    89571
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    房产数据平台安家go获取地区列表数据的API接口

    ​ 在房产数据平台“安家go”中,获取地区列表数据是一个常见需求,它允许开发者访问全国或特定区域的行政区划信息,如省、市、区县等。这对于构建房产搜索、数据分析或地图应用至关重要。本文将
    的头像 发表于 11-21 14:38 170次阅读
    房产<b class='flag-5'>数据</b>平台安家go<b class='flag-5'>获取</b>地区列表<b class='flag-5'>数据</b>的API接口

    京东商品详情 ID(即 SKU ID)获取商品详细信息参数

    ​ 利用京东商品详情 ID(即 SKU ID)获取商品详细信息,可通过京东开放平台官方 API 或非官方接口(逆向解析)实现。以下是两种方式的示例展示,包含代码实现与数据解析: 一、核心概念:京东
    的头像 发表于 11-11 10:47 282次阅读
    京东商品详情 ID(即 SKU ID)<b class='flag-5'>获取</b>商品详细信息参数

    微店API秘籍!轻松获取商品详情数据

    一、前言 微店商品详情API是微店开放平台提供的核心接口之一,支持通过商品ID获取商品的完整信息,包括标题、价格、库存、图片等关键数据。该接口广泛应用于电商系统开发、数据分析和供应链管理场景,相比
    的头像 发表于 11-05 10:30 264次阅读

    如何通过API获取拼多多商品详情数据

    ​  一、核心流程 认证准备 注册开放平台账号,获取client_id和client_secret 调用鉴权接口换取access_token,有效期通常为$24times60$分钟 构造请求
    的头像 发表于 10-27 15:53 741次阅读
    如何通过API<b class='flag-5'>获取</b>拼多多商品详情<b class='flag-5'>数据</b>?

    如何通过API获取1688商品类目数据:技术实现指南

    ​  一、接口概述 1688开放平台提供alibaba.category.get接口,支持开发者获取全量商品类目树。该接口采用RESTful架构,返回JSON格式数据,包含以下核心字段
    的头像 发表于 10-22 14:56 240次阅读
    如何通过API<b class='flag-5'>获取</b>1688商品类目<b class='flag-5'>数据</b>:技术实现指南

    如何使用 CYW20829 将获得的传感器数据发送到广播中?

    我计划使用外部传感器将原始数据输出到蓝牙模块的闪存中,然后通过蓝牙发送原始数据,与我个人笔记本电脑的蓝牙配对,并在我的个人电脑中获取这些原始数据。 我计划先用
    发表于 07-02 07:16

    跟老齐学Python:从入门到精通

    础的学习者介绍一门时下比较流行、并且用途比较广泛的编程语言,所以,本书读起来不晦涩,并且在其中穿插了很多貌似与Python 编程无关,但与学习者未来程序员职业生涯有关的内容。 获取完整文档资料可下载附件哦!!!! 如果内容有帮助可以关注、点赞、评论支持一下哦~
    发表于 06-03 16:10

    python入门圣经-高清电子书(建议下载)

    和Pygal 等强大的Python 库和工具介绍,以及列表、字典、if 语句、类、文件与异常、代码测试等内容; 第二部分将理论付诸实践,讲解如何开发三个项目,包括简单的Python 2D 游戏开发如何利用数据
    发表于 04-10 16:53

    树莓派遇上机器狗:科技界的“春晚明星”是怎样炼成的?

    机器人上春晚,这次穿上了东北花棉袄!每年春晚,总有一些节目让人眼前一亮,今年也不例外!UnitreeH1机器人化身“秧BOT”,身着东北花棉袄,扭起了“赛博秧歌”,吓坏了萌翻了全场观众。这已经不是
    的头像 发表于 03-25 09:25 904次阅读
    树莓派遇上机器狗:科技界的“<b class='flag-5'>春晚</b>明星”是怎样炼成的?

    爬虫数据获取实战指南:从入门到高效采集

    爬虫数据获取实战指南:从入门到高效采集     在数字化浪潮中,数据已成为驱动商业增长的核心引擎。无论是市场趋势洞察、竞品动态追踪,还是用户行为分析,爬虫技术都能助你快速捕获目标信息。然而,如何既
    的头像 发表于 03-24 14:08 1254次阅读

    TE HDC重载连接器助力蛇年春晚视觉盛宴

    今年的央视春晚看了么?“天地一体的演播空间”、“LED 立方体升降模块”、“如意造型的舞台”、“多维度协同控制”…… 蛇年春晚的科技浓度直线飙升。
    的头像 发表于 02-14 10:20 652次阅读

    使用Python实现xgboost教程

    使用Python实现XGBoost模型通常涉及以下几个步骤:数据准备、模型训练、模型评估和模型预测。以下是一个详细的教程,指导你如何在Python中使用XGBoost。 1. 安装XGBoost
    的头像 发表于 01-19 11:21 2213次阅读

    适用于MySQL和MariaDB的Python连接器:可靠的MySQL数据连接器和数据

    和 MariaDB 数据库服务器以及托管数据库服务,以对存储的数据执行创建、读取、更新和删除操作。该解决方案完全实现了 Python DB API 2.0 规范,并作为 Window
    的头像 发表于 01-17 12:18 844次阅读
    适用于MySQL和MariaDB的<b class='flag-5'>Python</b>连接器:可靠的MySQL<b class='flag-5'>数据</b>连接器和<b class='flag-5'>数据</b>库

    阿里云成为总台春晚云计算AI合作伙伴

    近日,中央广播电视总台宣布了一项重要合作,正式将阿里云确定为总台春晚云计算AI独家合作伙伴。这一合作标志着总台春晚在技术创新和数字化转型方面迈出了重要一步。 作为总台春晚史上的首次技术合作伙伴引入
    的头像 发表于 12-27 10:32 694次阅读

    阿里云携手总台春晚,开创云计算AI合作新篇章

    近日,中央广播电视总台传来了一则令人瞩目的消息。12月26日,总台正式对外宣布,阿里云已成功成为总台春晚云计算AI的独家合作伙伴。这一合作标志着总台春晚在技术创新方面迈出了重要一步,为全球华人观众
    的头像 发表于 12-27 10:13 877次阅读