在使用爬虫登录网站的时候,经常输入用户名和密码后会遇到验证码,简单一点的有字母验证码,复杂一点的有滑块验证码,点选文章和点选图片验证码。这些都是爬虫中的老大难问题,今天介绍一款通用验证码识别 SDK 对他们彻底说拜拜,它的名字是 ddddocr 带带弟弟 OCR 通用验证码识别 SDK 免费开源版。
安装
将自动安装符合自己电脑环境的最新 ddddocr。Python 环境需要小于等于 3.9。
pipinstallddddocr
使用
带带弟弟 OCR 可以识别三种验证码,小编就用这三种来实验一下。
滑块验证码
滑块验证码这里用的是豆瓣的滑块验证。下滑块是单独的透明背景图 hycdn.png。
背景图是带小滑块坑位的 background.jpg。
importddddocr
det=ddddocr.DdddOcr(det=False,ocr=False)
withopen('hycdn.png','rb')asf:
target_bytes=f.read()
withopen('background.jpg','rb')asf:
background_bytes=f.read()
res=det.slide_match(target_bytes,background_bytes,simple_target=True)
print(res)
识别结果
{'target_y':0,'target':[486,126,622,262]}
target 属性的前两个值正好和豆瓣验证滑块 url 中提交的 ans 差不多。
点选类验证码
点选类验证码用的是网易登录
det=ddddocr.DdddOcr(det=True)
withopen("eb.jpg",'rb')asf:
image=f.read()
poses=det.detection(image)
im=cv2.imread("eb.jpg")
forboxinposes:
x1,y1,x2,y2=box
im=cv2.rectangle(im,(x1,y1),(x2,y2),color=(0,0,255),thickness=2)
cv2.imwrite("result.jpg",im)
字母数字验证码
字母数字验证码的图片来自于 google 搜索
ocr=ddddocr.DdddOcr(old=True)
withopen("z1.jpg",'rb')asf:
image=f.read()
res=ocr.classification(image)
print(res)
识别结果
3n3d
8342
总结
ddddocr 让验证码变得如此简单与易用,,让不会用 opencv, pytorch, tensorflow 的小伙伴也能快速的破解网站的登录验证码。小伙伴们如果有其他好的 ocr 识别也可以在留言中分享出来。
审核编辑:汤梓红
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
开源
+关注
关注
3文章
4348浏览量
46446 -
python
+关注
关注
58文章
4885浏览量
90314 -
OCR
+关注
关注
0文章
176浏览量
17279
发布评论请先 登录
相关推荐
热点推荐
工业级OCR手持终端怎么选?国产OCR智能识别pda实测
工业环境专用OCR智能PDA怎么选?鸟鸟科技N70Socr具备IP67防尘防水+1.5米抗跌落,5000mAh可拆卸电池支持24小时轮班作业。专业OCR扫描头+斑马/霍尼二维码引擎双模组,285g人体工学设计,让高强度数据采集更
瑞芯微(EASY EAI)RV1126B OCR文字识别
1.OCR文字识别简介文字识别也是图像领域一个常见问题。然而,对于自然场景图像,首先要定位图像中的文字位置,然后才能进行文字的识别。所以一般包含两个步骤:文字检测:解决的问题是哪里有文
能识别身份证和护照OCR识别的手持终端设备
鸟鸟科技N70S身份证护照识别手持终端设备,集成身份证、护照OCR识别及生物核验功能,工业级IP67三防设计+高性能配置,支持多场景移动办公,续航持久、扫码精准,是执法、海关、医疗等行
手持扫码智能终端哪款好?2025高性价比扫码智能终端参数对比
本文详细解析手持扫码智能终端(工业级 PDA / 移动数据终端)核心功能、2025三款热门型号的手持扫码智能终端参数对比、续航 / 扫描 / OCR 识别等深度功能,覆盖物流仓储、快递
手持式身份证识别阅读器:移动的身份识别智能终端
鸟鸟N70S手持式居民身份证阅读器是一种专为移动办公与身份核验而设计的终端设备,集身份证识别、OCR、二维码扫描、人脸识别等功能于一体。广泛应用于公安执法、金融开户、医疗登记、展会安保
自动化测试如何绕过Cloudflare验证码?Python + Selenium 脚本实战指南!
01什么是Cloudflare验证码Cloudflare提供网络工具,并提供一套全面的安全功能,以保护网站免受各种在线威胁。Cloudflare验证码是一种用于区分人类用户和自动化机器人的功能。它是
星空开源MES(万界星空科技)——专业、通用、开源、免费的MES系统
星空开源MES(万界星空科技)——专业、通用、开源、免费的MES系统 源代码:免费开源MES h
如何利用OCR技术实现高效集装箱箱号识别?
在现代物流和海关监管领域,快速准确地识别集装箱箱号是提升通关效率、降低运营成本的关键。OCR(光学字符识别)技术的应用,为这一需求提供了智能化解决方案。通过结合高清成像设备和先进的算法,OCR
端侧OCR文字识别实现 -- Core Vision Kit ##HarmonyOS SDK AI##
,使用场景中就包括了“通用文字识别”,即我们前文中所说的ocr功能。
其整体流程概括为:
首先通过各种方法得到一张图片,例如拍照、从相册中选择、甚至你也可以通过canvas画布生成的图片或者通过组件
发表于 06-30 18:07
明治案例 | 150个/分钟!电阻【OCR识别】+【尺寸测量】一步到位
真实案例——看明治传感如何用一个视觉传感器,同时搞定电阻的尺寸测量和OCR识别,让质检效率翻倍,成本直降!场景需求希望在同一工位完成尺寸测量与OCR识别,减少设备占
OCR识别训练完成后给的是空压缩包,为什么?
OCR识别 一共弄了26张图片,都标注好了,点击开始训练,显示训练成功了,也将压缩包发到邮箱了,下载下来后,压缩包里面是空的
OCR图片20几张图太少了。麻烦您多添加点,参考我们的ocr
发表于 05-28 06:46
基于STM32的二维码识别源码+二维码解码库lib
基于STM32的二维码识别源码+二维码解码库lib项目实例下载!
纯分享帖,需要者可点击附件免费获取完整资料~~~【免责声明】本文系网络转载,版权归原作者所有。本文所用视频、图片、文
发表于 05-23 20:45
HarmonyOS5云服务技术分享--登录邮件功能整理
agconnect-services.json文件(参考官方集成文档)。
二、邮箱认证全流程实现
1. 注册邮箱账号
核心逻辑:验证邮箱有效性 → 发送验证码 → 创建用户
发表于 05-22 16:04
HarmonyOS5云服务技术分享--手机号登录教程
;requestPermissions\": [ {\"name\": \"ohos.permission.READ_SMS\"} // 如果需要自动读取短信验证码 ]`
三、核心
发表于 05-22 15:37
带带弟弟OCR通用验证码识别SDK免费开源版
评论