0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

B站逐渐地成为了一个用来学习的“神器”

WpOh_rgznai100 来源:lq 2019-06-02 10:17 次阅读

前言

很多人提到B站,首先想到的就会是二次元或者鬼畜,上个月,我们公众号也发表了一篇关于B站鬼畜视频的文章:《大数据解读B站火过蔡徐坤的“鬼畜“区巨头们》。

然而,实际上B站其实是个非常神奇的网站,里面的内容可谓是包罗万象,有趣的弹幕文化也能极大地提高大家的体验,B站也逐渐地成为了一个用来学习的“神器”。

近期B站获得了央视网的力挺,报道称B站已经成为了越来越多的年轻人的学习阵地,正所谓“我在B站看番,你却在B站学习” ,今天我们就来爬取B站上那些播放量、弹幕量排名靠前的编程类视频,一起去了解B站的另一面。

数据来源

我们此次的数据主要来源于B站搜索框中输入“编程”后的视频列表及相关信息

B站一共提供了物种视频排序的方式,每种能够返回前1000个视频,我们分别爬取五种排序所得到的1000个视频之后对5000个视频进行排序,最终得到了2000多个编程类视频的信息

同时我们也增加了一些筛选条件,使得最终获取到的编程教学视频更具代表性:a.所属分类为科技类 b.视频时长大于60分钟,部分代码如下:

## 获得列表defget_list(i,j):attempts =0success =Falsewhileattempts < 5 and not success:try:    url = 'https://search.bilibili.com/all?keyword=%E7%BC%96%E7%A8%8B&from_source=banner_search&order={}&duration=4&tids_1=36&page={}'.format(i,j+1)     header = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win32; x32; rv:54.0) Gecko/20100101 Firefox/54.0',    'Connection': 'keep-alive'}    cookies ='v=3; iuuid=1A6E888B4A4B29B16FBA1299108DBE9CDCB327A9713C232B36E4DB4FF222CF03; webp=true; ci=1%2C%E5%8C%97%E4%BA%AC; __guid=26581345.3954606544145667000.1530879049181.8303; _lxsdk_cuid=1646f808301c8-0a4e19f5421593-5d4e211f-100200-1646f808302c8; _lxsdk=1A6E888B4A4B29B16FBA1299108DBE9CDCB327A9713C232B36E4DB4FF222CF03; monitor_count=1; _lxsdk_s=16472ee89ec-de2-f91-ed0%7C%7C5; __mta=189118996.1530879050545.1530936763555.1530937843742.18'    cookie = {}    for line in cookies.split(';'):        name, value = cookies.strip().split('=', 1)        cookie[name] = value         html = requests.get(url,cookies=cookie, headers=header).content        bsObj = BeautifulSoup(html.decode('utf-8'),"html.parser")        script = bsObj.find_all('script')[3].text        info = json.loads(script.replace('window.__INITIAL_STATE__=','').split(';(function()')[0])['allData']['video']    return info    except:        attempts = attempts+1    return []coding_all = []type = ['click','stow','dm']for i in type:    for j in range(50):        this_coding = get_list(i,j)        coding_all = coding_all+this_coding

最终,我们获取到了如下的视频信息列表:

数据分析

获取到数据之后,我们首先关注的是这些视频的主要内容,通过视频给出的标签,绘制整体内容总结的词云图:

可以看到,上面的词云除了编程语言,技术之外包含了许多类似于学习,教程这样的通用描述性词汇,我们需要进一步从中筛选出与编程语言、技术相关的词云,提高词云图的效果:

可以看到,经过筛选后的词云图效果要好很多,其中基本上囊括了现在比较火的编程语言,如JavaPython 以及数据结构、机器学习这些技术类的内容,下面我们来看一下各编程语言的播放量及弹幕量对比:

我们此次将linux也划分到语言类中,可以看到目前基本上就是处于Python、C语言、Java三组鼎力的态势,Python略微领先于其他两种语言,这也一定程度反映了当今的整体发展趋势。由此可见,B站的内容也是与时俱进,适合年轻人去学习了解编程整体发展趋势。

看完了语言类,我们再来看一下具体的技术类排行榜:

可以看到,前端、人工智能、数据框、爬虫这些大家比较关心以及公司有较大需求量的技术都出现在了榜单中,在B站如果能将自己所要从事领域的视频认真学习,也会有很大的提高,部分代码如下:

## 分组统计coding_tag = dataframe_explode(coding,'tag')coding_tag['tag'] = coding_tag['tag'].apply(str.lower)coding_tag['type'] = coding_tag['tag'].map({tag_dict['tag'][k]:tag_dict['type'][k]forkinrange(tag_dict.shape[0])})coding_tag = coding_tag.groupby(['title','pic','author','arcurl','tag','type'],as_index=False).agg({'play':'max','danmu':'max','favorites':'max','review':'max'})tag_count = coding_tag.groupby(['tag','type'],as_index=False).agg({'title':['count'],'play':['sum'],'danmu':['sum'],'favorites':['sum']})tag_count.columns = ['tag','type','num','play','danmu','favorites']## 绘制图片coding_stat = tag_count[tag_count['type']=='语言']coding_stat.sort_values('play',ascending=False,inplace=True)attr = coding_stat['tag'][0:10]v1 = coding_stat['play'][0:10]bar = Bar("语言类播放量TOP10")bar.add("播放数量", attr, v1, is_stack=True, xaxis_rotate=30,xaxis_label_textsize=18, xaxis_interval =0,is_splitline_show=False,label_text_size=12,is_label_show=True)bar.render('语言类播放量TOP10.html')

精品视频

分析完整体视频内容的分布情况,我们再来看下那些最为精品的视频,由于B站以弹幕文化为特色,我们就依据弹幕量来为大家精选出一些非常不错的视频,首先是所有编程类视频的TOP20:

我们下面分别看一下三足鼎立中的Python、Java、C语言分别弹幕量排名前十的视频信息:

写在最后

B站的阿婆主为为大家提供了特别多的编程学习资源,大家在学习知识的同时,也需要注意的就是相应的版权信息。上传视频一定要确认版权不存在问题之后再去上传,另外如果发现有存在侵权的问题,也要及时跟视频作者进行反馈,及时将侵权视频下架。

另外,希望大家能够多多支持技术类的视频和阿婆主,如果觉得不错就不要吝惜手中的硬币,让更多的技术类阿婆主有动力为大家提供更多更好的视频内容。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6511

    浏览量

    87587
  • 视频
    +关注

    关注

    6

    文章

    1890

    浏览量

    71882
  • 编程
    +关注

    关注

    88

    文章

    3439

    浏览量

    92375

原文标题:万万没想到,逛B站也能学编程了

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    如何成为名嵌入式C语言高手?

    如何成为名嵌入式C语言高手? 嵌入式系统是当今科技领域的核心,而C语言则是嵌入式系统开发中最常用的编程语言之成为名嵌入式C语言高手
    发表于 04-07 16:03

    如何成为名嵌入式C语言高手?

    如何成为名嵌入式C语言高手? 嵌入式系统是当今科技领域的核心,而C语言则是嵌入式系统开发中最常用的编程语言之成为名嵌入式C语言高手
    发表于 03-25 14:12

    使用i2c从从读取两个字节时,为什么主只发送一个字节后就发送NACK呢?

    当我使用 i2c 从从读取两个字节时,有时会返回 RX_OVERFLOW。 我使用逻辑分析仪抓取总线波形,发现只接收到一个字节,主控器发出 NACK,之后返回错误代码
    发表于 03-05 07:42

    介绍一款基于java的渗透测试神器-CobaltStrike

    Cobalt Strike是一款基于java的渗透测试神器,常被业界人称为CS神器
    的头像 发表于 01-16 09:16 278次阅读
    介绍一款基于java的渗透测试<b class='flag-5'>神器</b>-CobaltStrike

    免费学习鸿蒙(HarmonyOS)开发,些地址分享

    课|应用开发视频教程学习|HarmonyOS应用开发官网 官网是些比较基础性的东西,学起来可能没那么好理解。下面再推荐B
    发表于 01-12 20:48

    共模电容:又款EMC滤波神器?|深圳比创达电子(上)

    的共模电容:又款EMC滤波神器(上)的内容,希望大家看后有所帮助!深圳市比创达电子科技有限公司成立于2012年,总部位于深圳市龙岗区,成立至今直专注于EMC电磁兼容领域,致力于为客户提供最高效最专业的EMC
    发表于 12-25 10:53

    OpenHarmony Meetup北京招募令

    OpenHarmony Meetup城市巡回北京火热来袭!! 日期:2023年11月25日14:00 地点:中国科学院软件园区五号楼B402 与OpenHarmony技术大咖近距离互动,分享技术
    发表于 11-20 14:54

    NNI:自动帮你做机器学习调参的神器

    NNI 自动机器学习调参,是微软开源的又一个神器,它能帮助你找到最好的神经网络架构或超参数,支持 各种训练环境 。 它常用的 使用场景 如下: 想要在自己的代码、模型中试验 不同的机器学习算法
    的头像 发表于 10-30 10:28 1787次阅读
    NNI:自动帮你做机器<b class='flag-5'>学习</b>调参的<b class='flag-5'>神器</b>

    OpenHarmony Meetup成都招募令

    OpenHarmony Meetup城市巡回成都火热招募中!! 日期:2023年10月27日14:00 地点:电子科技大学(沙河校区)学术交流中心楼104会议室 与OpenHarmony技术大咖
    发表于 10-23 14:29

    防丢神器 Airtag 国产版

    Airtag是什么? AirTag是苹果公司设计的款定位神器,它通过CR2032纽扣电池进行供电,即可实现长达1-2年的关键物品的定位、查找的功能。 按照苹果公司自己的话说—— 您“丢三落四这门
    发表于 08-24 14:56

    招募令!OpenHarmony Meetup 广州

    OpenHarmony的魅力 线下参与,先到先得,仅限20名额! 立即报名:https://url.elecfans.com/u/82b720faa7 报名截止时间8月23日24:00点 1、可获得惊喜开发者
    发表于 08-14 15:53

    创建边缘机器学习系统

    。图像识别是项相当复杂的机器学习任务,通常 需要比关键字识别更高的性能。 该指南也适用于想要为高端智能设备创建SoC的系统设计人员设备,比如智能手机。 具体来说,该指南解释道: •为什么要为这个
    发表于 08-02 11:02

    无所不知的神器构建

    电子发烧友网站提供《无所不知的神器构建.zip》资料免费下载
    发表于 07-04 11:22 0次下载
    无所不知的<b class='flag-5'>神器</b>构建

    如何使用Openweathermap和0.96英寸oled来制作小气象

    我是 ESP8266 的新手。我想通过使用 Openweathermap 和 0.96 英寸 oled 来尝试小气象。当我尝试编译代码时,出现此错误。怎么了? 调用使用属性错误声明的“HTTPClient::begin”:
    发表于 06-02 10:16

    KiCad拼版神器KiKit的安装与使用

    本帖最后由 jf_32603368 于 2023-5-22 19:07 编辑 今天介绍款KiCad的拼版神器:KiKit。KiCad没有自带的拼版工具,KiKit是款相当便捷的插件
    发表于 05-22 19:07