0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

成为爬虫工程师需要哪些技能

工程师人生 来源:wv 作者:简书网 2019-09-18 11:30 次阅读

1、前段时间快要毕业,而我又不想找自己的老本行Java开发了,所以面了很多Python爬虫岗位。

因为我在南京上学,所以我一开始只是在南京投了简历,我一共面试了十几家企业,其中只有一家没有给我发offer,其他企业都愿意给到10K的薪资,不要拿南京的薪资水平和北上深的薪资水平比较,结合面试常问的问题类型说一说我的心得体会。

第一点:Python

因为面试的是Python爬虫岗位,面试官大多数会考察面试者的基础的Python知识,包括但不限于:

Python2.x与Python3.x的区别

Python的装饰器

Python的异步

Python的一些常用内置库,比如多线程之类的

第二点:数据结构与算法

数据结构与算法是对面试者尤其是校招生面试的一个很重要的点,当然小公司不会太在意这些,从目前的招聘情况来看对面试者的数据结构与算法的重视程度与企业的好坏成正比,那些从不问你数据结构的你就要当心他们是否把你当码农用的,当然以上情况不绝对,最终解释权归面试官所有。

第三点:Python爬虫

最重要也是最关键的一点当然是你的Python爬虫相关的知识与经验储备,这通常也是面试官考察的重点,包括但不限于:

你遇到过的反爬虫的策略有哪些?

你常用的反反爬虫的方案有哪些?

你用过多线程和异步吗?除此之外你还用过什么方法来提高爬虫效率?

有没有做过增量式抓取?

对Python爬虫框架是否有了解?

第四点:爬虫相关的项目经验

爬虫重在实践,除了理论知识之外,面试官也会十分注重爬虫相关的项目:

你做过哪些爬虫项目?如果有Github最好

你认为你做的最好的爬虫项目是哪个?其中解决了什么难题?有什么特别之处?

以上是我在面试过程中,会碰到的一些技术相关的问题的总结,当然面试中不光是技术这一点,但是对于做技术的,过了技术面基本上就是薪资问题了。

也许有人问我现在在哪家公司做爬虫开发?很抱歉,最终我放弃了南京的所有机会到了上海做我更喜欢的岗位:数据工程师

2、给你一点我的面经吧。

初级的:

网络基础:cookie,session,https,headers常用的字段,代理使用等等

python基础:这个网上搜到的面经都得会,加上异步,多进程,多线程等等

爬虫:xpath,requests如何处理https,常见的反爬措施,举例说一个最难的爬虫过程,scrapy使用中的细节,例如代理,cookie,传参等等。

数据库:数据库操作,并表之类的。

中级:

网络:几层网络层的细节,比如说说udp/tcp/smtp区别,说说10.x.x.x/127.x.x.x/192.x.x.x的区别,说说DNS,谈谈路由交换机的区别

python:多重继承,多态,单例用装饰器的实现,数组/生成器/列表解析效率等等稍深入的细节

爬虫:分布式爬虫的实现,给你一个任务你马上给出一个合理的架构,验证码的处理,增量数据爬取,写爬虫时有没写些辅助工具。

数据库:sql nosql的细节,性能上的。

加分项:数据挖掘,机器学习,自然语言处理,能写网站,熟练操作linux,github小星星

在学习python中有任何困难不懂的可以加入我的python交流学习qun :227-435-450,多多交流问题,互帮互助,群里有不错的学习教程和开发工具。学习python有任何问题(学习方法,学习效率,如何就业)。

3、首先说说Python吧

爬虫给人的感觉就是对于Python编程的知识要求并不高,确实,搞懂基本数据结构、语句,会写写函数好像就OK了。

自己业余玩玩爬点数据还OK,但是你是要找工作成功爬虫工程师的,扎实的编程基础可不是会写函数就够了的。Python的高级特性、面向对象编程、多线程、装饰器等等你至少需要了解一下吧。

现在很多爬虫工程师的面试,编程的基本功要求还是很高的。编程的功底,以及对语言的理解,从某种程度上可以看出你的学习能力、发展潜力。

爬虫技术

HTTP必须要有很深刻的理解,这是你纵横网络的立身之本;

BeautifulSoup、xpath这些都是基础操作了,一定要做到非常熟练;

Scrapy框架要会用,要能信手捏来写个分布式爬虫;

Webdriver、Selenium、PhantomJS至少也要会使用吧;

反爬虫的技巧,重中之重,能不能搞回来数据,能高多少数据回来,很大程度依赖于此。抓包、cookie分析、代理池搭建、字体加密、验证码处理等等,也都是常规操作了;

当然数据库也少不了啊。一般企业要求至少会一种SQL和一种noSQL。

了解布隆过滤器,会增量爬取。

加分项:

掌握Python web相关的一些东西,能够进行后端开发;

掌握数据分析或者数据挖掘的技能,能够搞个算法模型,做个分析和预测。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 工程师
    +关注

    关注

    59

    文章

    1553

    浏览量

    67496
  • python
    +关注

    关注

    51

    文章

    4674

    浏览量

    83464
收藏 人收藏

    评论

    相关推荐

    企业老工程师和高校老师有啥区别

    电子工程师硬件
    电子发烧友网官方
    发布于 :2024年02月28日 17:50:00

    如何搞崩一个硬件工程师心态?试试对ta说这几句

    硬件工程师
    扬兴科技
    发布于 :2024年02月20日 18:05:49

    优秀电源工程师需要哪些必备技能

    就带大家细数一下优秀电源工程师具备的那些技能。一、新手必备课程成为一名电源高手需要扎实的理论基础,涉及电路原理、语言编程和控制理论等多个学科领域。为了帮助大家更好地掌握电源开发相关的关
    发表于 01-29 11:29

    优秀电源工程师的必备技能大揭秘!

    就带大家细数一下优秀电源工程师具备的那些技能。新手必备课程成为一名电源高手需要扎实的理论基础,涉及电路原理、语言编程和控制理论等多个学科领域。为了帮助大家更好地掌握
    的头像 发表于 12-19 08:23 736次阅读
    优秀电源<b class='flag-5'>工程师</b>的必备<b class='flag-5'>技能</b>大揭秘!

    #人工智能 #FPGA 怎么成为一个合格的FPGA工程师

    fpga工程师
    明德扬助教小易老师
    发布于 :2023年12月18日 21:19:01

    硬件工程师需要了解主机厂的标准吗?

    公司最近购买了GMW14082-2010通用汽车的标准,要求硬件工程师进行阅读。我有点不清楚这个标准的作用对于我们来说有什么用,里面的内容需要全部都掌握吗?还是只要知道其中一些关键点就行?
    发表于 11-23 15:03

    FPGA工程师需要具备哪些技能

    需要具备一系列的技能,才能胜任日益复杂的设计工作。因此,本文将从设计思路、硬件语言、EDA工具、数字信号处理、通信协议、测试验证等多个方面,探讨FPGA工程师需要具备哪些
    发表于 11-09 11:03

    如何成为一名优秀的嵌入式工程师

    如何成为一名优秀的嵌入式工程师?嵌入式学习的第一步,首先是C语言。 1.理解内存管理:C语言不同于高级语言,它不会自动管理内存。因此,你需要理解并掌握如何使用malloc()、free()等函数
    发表于 11-07 15:36

    #FPGA 本科生也能成为FPGA研发工程师

    fpga工程师
    明德扬助教小易老师
    发布于 :2023年09月23日 08:05:36

    《电子工程师必备——电路板技能速成宝典》读后感

    理论知识,又能充分联系实际,贴近实际电子工程师工作的专业技术书籍。直到看了《电子工程师必备—电路板技能速成宝典》这本书,我终于找到了梦寐以求的那本书。 该书一共十三章,几乎涵盖了电子工程师
    发表于 09-16 08:16

    热门推荐:硬件工程师必备工具

    工程师在使用华秋DFM软件时,有哪些实用技能可以轻松掌握。 下图主要介绍在华秋DFM软件中,硬件工程师有哪些业务板块是适用的。 四、给硬件工程师提供的服务 1、PCB计价 一键DF
    发表于 06-21 10:15

    【书籍评测活动NO.15】电子工程师必备丛书系列——电路板技能速成宝典

    及检修方法、电路故障的20种检查方法、故障机理、职场面试题集、用于电路设计的各种知识及应用等。本书内容丰富,力求迅速培养读者的动手能力,提高技能操作水平,实现读者成为电子工程师的梦想。本书可作为培养
    发表于 06-07 16:21