0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

B站逐渐地成为了一个用来学习的“神器”

WpOh_rgznai100 来源:lq 2019-06-02 10:17 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

前言

很多人提到B站,首先想到的就会是二次元或者鬼畜,上个月,我们公众号也发表了一篇关于B站鬼畜视频的文章:《大数据解读B站火过蔡徐坤的“鬼畜“区巨头们》。

然而,实际上B站其实是个非常神奇的网站,里面的内容可谓是包罗万象,有趣的弹幕文化也能极大地提高大家的体验,B站也逐渐地成为了一个用来学习的“神器”。

近期B站获得了央视网的力挺,报道称B站已经成为了越来越多的年轻人的学习阵地,正所谓“我在B站看番,你却在B站学习” ,今天我们就来爬取B站上那些播放量、弹幕量排名靠前的编程类视频,一起去了解B站的另一面。

数据来源

我们此次的数据主要来源于B站搜索框中输入“编程”后的视频列表及相关信息:

B站一共提供了物种视频排序的方式,每种能够返回前1000个视频,我们分别爬取五种排序所得到的1000个视频之后对5000个视频进行排序,最终得到了2000多个编程类视频的信息

同时我们也增加了一些筛选条件,使得最终获取到的编程教学视频更具代表性:a.所属分类为科技类 b.视频时长大于60分钟,部分代码如下:

## 获得列表defget_list(i,j):attempts =0success =Falsewhileattempts < 5 and not success:try:    url = 'https://search.bilibili.com/all?keyword=%E7%BC%96%E7%A8%8B&from_source=banner_search&order={}&duration=4&tids_1=36&page={}'.format(i,j+1)     header = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win32; x32; rv:54.0) Gecko/20100101 Firefox/54.0',    'Connection': 'keep-alive'}    cookies ='v=3; iuuid=1A6E888B4A4B29B16FBA1299108DBE9CDCB327A9713C232B36E4DB4FF222CF03; webp=true; ci=1%2C%E5%8C%97%E4%BA%AC; __guid=26581345.3954606544145667000.1530879049181.8303; _lxsdk_cuid=1646f808301c8-0a4e19f5421593-5d4e211f-100200-1646f808302c8; _lxsdk=1A6E888B4A4B29B16FBA1299108DBE9CDCB327A9713C232B36E4DB4FF222CF03; monitor_count=1; _lxsdk_s=16472ee89ec-de2-f91-ed0%7C%7C5; __mta=189118996.1530879050545.1530936763555.1530937843742.18'    cookie = {}    for line in cookies.split(';'):        name, value = cookies.strip().split('=', 1)        cookie[name] = value         html = requests.get(url,cookies=cookie, headers=header).content        bsObj = BeautifulSoup(html.decode('utf-8'),"html.parser")        script = bsObj.find_all('script')[3].text        info = json.loads(script.replace('window.__INITIAL_STATE__=','').split(';(function()')[0])['allData']['video']    return info    except:        attempts = attempts+1    return []coding_all = []type = ['click','stow','dm']for i in type:    for j in range(50):        this_coding = get_list(i,j)        coding_all = coding_all+this_coding

最终,我们获取到了如下的视频信息列表:

数据分析

获取到数据之后,我们首先关注的是这些视频的主要内容,通过视频给出的标签,绘制整体内容总结的词云图:

可以看到,上面的词云除了编程语言,技术之外包含了许多类似于学习,教程这样的通用描述性词汇,我们需要进一步从中筛选出与编程语言、技术相关的词云,提高词云图的效果:

可以看到,经过筛选后的词云图效果要好很多,其中基本上囊括了现在比较火的编程语言,如JavaPython 以及数据结构、机器学习这些技术类的内容,下面我们来看一下各编程语言的播放量及弹幕量对比:

我们此次将linux也划分到语言类中,可以看到目前基本上就是处于Python、C语言、Java三组鼎力的态势,Python略微领先于其他两种语言,这也一定程度反映了当今的整体发展趋势。由此可见,B站的内容也是与时俱进,适合年轻人去学习了解编程整体发展趋势。

看完了语言类,我们再来看一下具体的技术类排行榜:

可以看到,前端、人工智能、数据框、爬虫这些大家比较关心以及公司有较大需求量的技术都出现在了榜单中,在B站如果能将自己所要从事领域的视频认真学习,也会有很大的提高,部分代码如下:

## 分组统计coding_tag = dataframe_explode(coding,'tag')coding_tag['tag'] = coding_tag['tag'].apply(str.lower)coding_tag['type'] = coding_tag['tag'].map({tag_dict['tag'][k]:tag_dict['type'][k]forkinrange(tag_dict.shape[0])})coding_tag = coding_tag.groupby(['title','pic','author','arcurl','tag','type'],as_index=False).agg({'play':'max','danmu':'max','favorites':'max','review':'max'})tag_count = coding_tag.groupby(['tag','type'],as_index=False).agg({'title':['count'],'play':['sum'],'danmu':['sum'],'favorites':['sum']})tag_count.columns = ['tag','type','num','play','danmu','favorites']## 绘制图片coding_stat = tag_count[tag_count['type']=='语言']coding_stat.sort_values('play',ascending=False,inplace=True)attr = coding_stat['tag'][0:10]v1 = coding_stat['play'][0:10]bar = Bar("语言类播放量TOP10")bar.add("播放数量", attr, v1, is_stack=True, xaxis_rotate=30,xaxis_label_textsize=18, xaxis_interval =0,is_splitline_show=False,label_text_size=12,is_label_show=True)bar.render('语言类播放量TOP10.html')

精品视频

分析完整体视频内容的分布情况,我们再来看下那些最为精品的视频,由于B站以弹幕文化为特色,我们就依据弹幕量来为大家精选出一些非常不错的视频,首先是所有编程类视频的TOP20:

我们下面分别看一下三足鼎立中的Python、Java、C语言分别弹幕量排名前十的视频信息:

写在最后

B站的阿婆主为为大家提供了特别多的编程学习资源,大家在学习知识的同时,也需要注意的就是相应的版权信息。上传视频一定要确认版权不存在问题之后再去上传,另外如果发现有存在侵权的问题,也要及时跟视频作者进行反馈,及时将侵权视频下架。

另外,希望大家能够多多支持技术类的视频和阿婆主,如果觉得不错就不要吝惜手中的硬币,让更多的技术类阿婆主有动力为大家提供更多更好的视频内容。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7315

    浏览量

    93990
  • 视频
    +关注

    关注

    6

    文章

    1999

    浏览量

    74649
  • 编程
    +关注

    关注

    90

    文章

    3708

    浏览量

    96768

原文标题:万万没想到,逛B站也能学编程了

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    迅为3568开发板从零学习Linux驱动开发:迅为一站式资料包如何让我效率翻倍

    迅为3568开发板从零学习Linux驱动开发:迅为一站式资料包如何让我效率翻倍
    的头像 发表于 11-05 11:16 186次阅读
    迅为3568开发板从零<b class='flag-5'>学习</b>Linux驱动开发:迅为<b class='flag-5'>一站</b>式资料包如何让我效率翻倍

    超声波气象:精准监测的技术新选择

    超声波气象:精准监测的技术新选择 柏峰【BF-CSQX】在气象监测技术持续升级的背景下,超声波气象凭借无机械损耗、高灵敏度、强环境适应性等核心特性,逐渐取代传统机械气象
    的头像 发表于 10-24 10:12 453次阅读
    超声波气象<b class='flag-5'>站</b>:精准监测的技术新选择

    自动驾驶中常提的“强化学习”是啥?

    下,就是智能体在环境里行动,它能观察到环境的些信息,并做出动作,然后环境会给出
    的头像 发表于 10-23 09:00 331次阅读
    自动驾驶中常提的“强化<b class='flag-5'>学习</b>”是<b class='flag-5'>个</b>啥?

    ETHERCAT从转PROFINET,网关全搞定

    ETHERCAT从转PROFINET,网关全搞定 在矿山深处,套崭新的自动化系统正悄然改变着设备保护的格局。面对井下复杂的工况和多品牌控制设备共存的现状,我们设计的这套保护系统
    的头像 发表于 10-22 10:03 204次阅读
    ETHERCAT从<b class='flag-5'>站</b>转PROFINET,<b class='flag-5'>一</b><b class='flag-5'>个</b>网关全搞定

    根据Datasheet里cyT2B5L有1024位otp,全部都能用来存储密钥吗?

    1)项目上有要求把密钥存在安全模块存储区域的要求 2)根据Datasheet里cyT2B5L有1024位otp,全部都能用来存储密钥吗?还是其中的192位能用来储存密钥。 3)有详细的说明文档或者例子能展开
    发表于 07-14 07:17

    绝绝子,连接神器CC\\-Link IE 转 Modbus TCP,让驱动器乖乖听话

    场跨服聊天。别急,今天咱们就来聊聊破局神器——耐达讯通信技术协议网关,看看它是如何让这场“跨服聊天”变成“心有灵犀”的。 网关如何担当“翻译官”? 协议网关的核心工作,就是担当高效的“翻译官”。它
    发表于 07-09 10:12

    嵌入式开发入门指南:从零开始学习嵌入式

    随着物联网、智能硬件的发展,嵌入式开发成为热门技能之。以下将为初学者提供份详细的嵌入式开发入门指南,涵盖学习路径、必备工具、推荐资源等内容。 1. 嵌入式系统的定义与应用嵌入式系统
    发表于 05-15 09:29

    在KiCad的PCB编辑其中,有实用的工具,可以用来清理布线与过孔

    在KiCad的PCB编辑其中,有实用的工具,可以用来清理布线与过孔。不仅可以移除没有使用的布线与过孔,还可以清理冗余的重叠导线。
    发表于 05-06 21:57

    如何成为名合格的KaihongOS北向应用开发工程师

    如何成为名合格的北向应用开发工程师 在快速发展的软件开发领域,北向应用开发工程师是专注于系统级应用开发的高需求职位。 以下是成为
    发表于 04-23 06:46

    工业机器人工作的建设意义

    和提高产品质量已成为企业发展的必然选择。智能化生产模式不仅能够降低生产成本,还能提高企业的市场竞争力,推动机械工业的进步发展。桐尔提供的工业机器人工作解决方案,能够帮助企业实现高效、灵活的生产模式,为企业带来显著的经济效益。
    发表于 03-17 14:49

    先辑半导体HPM6E00系列产品能用来做EtherCAT的主

    虽然明确说明了先辑半导体HPM6E00系列产品能用来做EtherCAT的从,但它可以用来做主吗,还是说必须用其他芯片做主
    发表于 03-16 10:16

    阿里国际“八先过海”计划助力B2B商家出海

    、简化商家的经营链路、保障商家的生意效果以及减免相关服务费用等。这些举措旨在帮助所有希望拓展海外市场的商家,能够更轻松地开启B2B业务,并在全球市场中占据席之地。 阿里国际表示,此次行动的核心在于平台的翻倍投入
    的头像 发表于 02-19 09:21 823次阅读

    用万用表测试的过程中,ADS4246参考电压为什么会逐渐下降了?

    目前正在使用TI的ADC,型号为ADS4246,其中有引脚VCM为ADC参考电压输出引脚,可以用来提供外部模拟的Bias电压。使用中发现电路板上电后,在VCM外部不接任何负载(除去耦电容
    发表于 12-27 07:23

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习应用的首选。然而,市场上的云原生机器学习平台种类繁多,功能各异,如何选择云原生机器
    的头像 发表于 12-25 11:54 701次阅读

    新手必看!搞清楚Modbus主和从,让你成为通信达人

    通常安装在现场,用于采集数据或控制过程设备。 主设备通常是高级控制器或者上位机,如个人计算机、PLC或SCADA系统的部分。它能够发送命令给从,读取从的数据,以及对从
    的头像 发表于 12-16 16:41 9997次阅读
    新手必看!搞清楚Modbus主<b class='flag-5'>站</b>和从<b class='flag-5'>站</b>,让你<b class='flag-5'>成为</b>通信达人