0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

用Python爬取拉勾网不同编程语言职位信息

jmiy_worldofai 来源:未知 作者:李倩 2018-09-29 16:51 次阅读

本文主要用Python爬取拉勾网不同编程语言职位信息,包括:Python岗、Java岗、C++岗、PHP岗、C#岗位(5岗);用R语言对影响薪资的因素进行分析。由于拉勾网的职位信息只显示30页,一页15个职位信息,如果单独爬取一个城市的岗位信息,只有几页是匹配的信息,信息量太小,分析没有说服力。因此,本文爬取拉勾网全国职位信息。主要三部分内容:

一、爬取拉勾网5岗职位信息--以Python岗为例

二、以Python岗位信息为例,分析影响薪资的因素

三、5岗之间薪水因素影响比较分析

一、爬取拉勾网5岗职位信息--以Python岗为例

我们抓取的信息包括Python岗位名称、公司名称、薪资、工作经验、学历、公司规模、公司福利。

抓取结果如下:

将抓取结果循环写入csv文件:

此外还抓取了Java岗、C++岗、PHP岗、C#岗位4岗的信息,代码和抓取Python岗位信息类似。

二、以Python岗位信息为例,分析影响薪资的因素

这里包括数据清洗部分和数据分析部分两部分内容。

数据清洗部分

在抓取过程中,由于将python字典循环写入csv文件,因此列名也被循环写在csv文件中。

考虑本文主要分析影响薪资的因素,这里去除Name和Company两列。

1.变量Salary

变量Salary一般都是范围值,用“-”连接,但是不排除有XXK以上,例如10k以上这种表示形式,或者其他形式,这里需要处理一下。

2.变量Education

3.变量Size

到此,数据清洗部分内容全部结束。

数据分析部分

1.工资与工作年限的关系

library(ggplot2)ggplot(newdata,aes(x=Experience,y=salary))+geom_boxplot(col="red")

符合大众的认知,从事python的应届毕业生起始工资平均值在5K左右,且薪资水平跨度最小,经验5-10年,工资水平跨度最大,主要可能是因为,有一部分转为技术管理岗位,工资较低的可能还在继续码代码,是不是对广大同胞们的警告啊.......

2.工资与学历的关系(专科,本科,研究生,不限)

ggplot(newdata,aes(x=Graduate,y=salary))+geom_boxplot(col="red")

这里是否能说明学历在一定程度上的重要性?学历本科的工资跨度比较大,因为工作经验的不同导致了薪资的差异。

3.工资与公司融资的关系

ggplot(newdata,aes(x=Rong,y=salary))+geom_boxplot(col="red")

对于这部分知识是盲点,但是可以看出融资公司(上市也是一种融资方式)比没有融资的公司平均工资要高出不少,这部分是不是可以是以后找工作的一个风向标。。。

4.工资与公司大小的关系

公司规模越大,平均的工资也越高。

5.工资与工作时间和学历的关系

这张图告诉我们,在大部分情况下,没(Ren)钱(Chou)就要多读书。不管是经验经验1年以下、经验3-5年、经验5-10年、经验不限的情况下,拥有硕士学历的平均收入都普遍高于本科,本科都高于大专。(这里完全没有歧视低学历之意)

6.公司福利的云图

现在公司的福利贴有“弹性工作,氛围好,团队,大牛,技术,五险一金”等标签来吸引求职者眼球。

三、5岗之间薪水因素影响比较分析

1.Python岗、Java岗、C++岗、PHP岗、C#岗位的平均薪水

抓取拉勾网职位信息,可以看出python和java的平均薪资较高,C#的平均工资最低。

由此也验证python近几年火热的态势,由于AI的火热,python的需求越来越大,传统的java也比较强势,薪资待遇较高。

2.相同工作经验不同职位信息薪水比较

对于不同工作经验,不同编程语言平均薪水还是有较大的差异。

3.相同学历信息不同职位信息薪水比较

通过硕士、本科、大专、不限四种比较,硕士的总体薪资高于本科。

4.同一职位不同学历信息薪水比较

总的看来,在每个职业,硕士学历的平均薪水高于本科,本科的平均薪水高于大专。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编程语言
    +关注

    关注

    9

    文章

    1878

    浏览量

    33062
  • python
    +关注

    关注

    51

    文章

    4674

    浏览量

    83458
  • 大数据
    +关注

    关注

    64

    文章

    8643

    浏览量

    136585

原文标题:Python or Java?大数据解读学什么语言最赚钱

文章出处:【微信号:worldofai,微信公众号:worldofai】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    采用xpath网站内容

    xpathmooc课程
    发表于 04-11 12:01

    基于Python3对携程网页上北京五星级酒店列表的

    Python3 携程网[1] 根据好评优先顺序,获取北京五星级酒店列表
    发表于 04-19 16:25

    拉勾职位信息取代码

    拉勾职位信息
    发表于 04-23 13:48

    基于Python实现一只小爬虫拉勾职位信息的方法

    通俗易懂的分析如何用Python实现一只小爬虫,拉勾职位
    发表于 05-17 06:54

    python音频文件的步骤

    python爬虫音频文件
    发表于 08-22 14:23

    Python豆瓣电影信息和存储数据库

    Python——豆瓣电影信息并存储数据库
    发表于 03-11 11:19

    Python为什么不是国内的主流编程语言呢?

    Python这么好用,为什么不是国内的主流编程语言呢?感觉还是C和java的比较多……然而自己只会Python……
    发表于 06-01 05:55

    Python与其他编程语言有何不同?

    品质使它与众不同。好了,关于Python与其他编程语言有何不同的内容介绍到这里就结束了,想了解更多关于Python信息,请继续关注我们。
    发表于 09-16 15:54

    0基础入门Python爬虫实战课

    ,爬虫功不可没。通过爬虫,可以从知乎、微博热门话题,筛选优质答案,分析用户偏好;从淘宝、京东商品、评论及销量数据,分析用户消费场景;从51job、智联招聘
    发表于 07-25 09:28

    Python爬虫简介与软件配置

    Python爬虫练习一、爬虫简介1. 介绍2. 软件配置二、南阳理工OJ题目三、学校信息
    发表于 01-11 06:32

    豆瓣电影Top250信息

    通过本案例[豆瓣电影Top250信息]锻炼除正则表达式之外两种信息解析方式:Xpath和PyQuery。
    发表于 03-23 15:47

    Python拉勾网数据采集与可视化

    本文是先采集拉勾网上面的数据,采集的是Python岗位的数据,然后用Python进行可视化。主要涉及的是爬虫&数据可视化的知识。
    的头像 发表于 03-13 14:18 3014次阅读
    <b class='flag-5'>Python</b><b class='flag-5'>拉勾</b>网数据采集与可视化

    为什么几百种编程语言偏偏Python炙手可热?

    来自美国的招聘网站 Dice 发布了一份重要数据结论,那便是“Python 的就业市场非常健康”!许多职位编程语言(如 Kotlin)都受制于行业的突发奇想和大型科技公司的决策,但
    的头像 发表于 03-21 09:37 2254次阅读

    2020年度编程语言再次花落Python

    近日,全球知名的编程语言流行度排行榜网站 TIOBE 公布了 1 月编程指数信息。C 第一,Java 第二,Python 第三,C++ 和
    的头像 发表于 01-12 11:32 1685次阅读

    Python编程语言属于什么语言

    Python编程语言属于高级编程语言中的一种。它是一种通用、面向对象、解释型编程
    的头像 发表于 11-22 14:31 638次阅读