0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

带带弟弟OCR通用验证码识别SDK免费开源版

python爬虫知识分享 来源:python爬虫知识分享 作者:python爬虫知识分享 2022-03-30 17:26 次阅读

在使用爬虫登录网站的时候,经常输入用户名和密码后会遇到验证码,简单一点的有字母验证码,复杂一点的有滑块验证码,点选文章和点选图片验证码。这些都是爬虫中的老大难问题,今天介绍一款通用验证码识别 SDK 对他们彻底说拜拜,它的名字是 ddddocr 带带弟弟 OCR 通用验证码识别 SDK 免费开源版。

安装

将自动安装符合自己电脑环境的最新 ddddocr。Python 环境需要小于等于 3.9。

pipinstallddddocr

使用

带带弟弟 OCR 可以识别三种验证码,小编就用这三种来实验一下。

滑块验证码

滑块验证码这里用的是豆瓣的滑块验证。下滑块是单独的透明背景图 hycdn.png。

背景图是带小滑块坑位的 background.jpg。

importddddocr

det=ddddocr.DdddOcr(det=False,ocr=False)

withopen('hycdn.png','rb')asf:
target_bytes=f.read()

withopen('background.jpg','rb')asf:
background_bytes=f.read()

res=det.slide_match(target_bytes,background_bytes,simple_target=True)

print(res)

识别结果

{'target_y':0,'target':[486,126,622,262]}

target 属性的前两个值正好和豆瓣验证滑块 url 中提交的 ans 差不多。

点选类验证码

点选类验证码用的是网易登录

det=ddddocr.DdddOcr(det=True)

withopen("eb.jpg",'rb')asf:
image=f.read()

poses=det.detection(image)

im=cv2.imread("eb.jpg")

forboxinposes:
x1,y1,x2,y2=box
im=cv2.rectangle(im,(x1,y1),(x2,y2),color=(0,0,255),thickness=2)

cv2.imwrite("result.jpg",im)

字母数字验证码

字母数字验证码的图片来自于 google 搜索

ocr=ddddocr.DdddOcr(old=True)

withopen("z1.jpg",'rb')asf:
image=f.read()

res=ocr.classification(image)
print(res)

识别结果

3n3d
8342

总结

ddddocr 让验证码变得如此简单与易用,,让不会用 opencv, pytorch, tensorflow 的小伙伴也能快速的破解网站的登录验证码。小伙伴们如果有其他好的 ocr 识别也可以在留言中分享出来。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    2989

    浏览量

    41720
  • python
    +关注

    关注

    51

    文章

    4677

    浏览量

    83468
  • OCR
    OCR
    +关注

    关注

    0

    文章

    137

    浏览量

    16130
收藏 人收藏

    评论

    相关推荐

    验证码渗透最全总结

    简单测试方法,就是看到一个登录框,然后新建打开图片链接,在图片链接中就有机会看到两个参数值,一个是 width,一个是 length。这两个参数是计算图片验证码的长宽,如果长宽过高就会过度消耗的是服务器的 CPU 资源。
    的头像 发表于 01-05 11:33 312次阅读
    <b class='flag-5'>验证码</b>渗透最全总结

    UVVM(通用 VHDL 验证方法)

    UVVM(通用 VHDL 验证方法) 简介 UVVM(通用 VHDL 验证方法)是一种免费开源
    发表于 01-02 12:59

    鸿蒙原生应用/元服务开发-Serverless账户验证码的问题

    在应用/元服务早期使用过程中,-Serverless账户验证码的格式是[AGC][应用/元服务名称],如下图。 但是,在最近,[应用/元服务]名称直接变成了【default】,用户收到这种验证码后,心里存有疑虑的,这是哪里配置或者设置的问题吗?大家有遇到同样的问题吗?如何
    发表于 12-27 15:55

    开源VHDL验证方法 (OSVVM)

    电子发烧友网站提供《开源VHDL验证方法 (OSVVM).docx》资料免费下载
    发表于 12-26 09:57 0次下载

    OCR如何自动识别图片文字

    回复希望出一篇 OCR 相关的文章,今天尝试了一下 cnocr 和 tesseract 两个 Python 开源识别工具的效果,给大家分别讲讲两个工具的使用方法和对比效果。 1.准备 开始之前,你要确保
    的头像 发表于 10-31 16:45 435次阅读
    <b class='flag-5'>OCR</b>如何自动<b class='flag-5'>识别</b>图片文字

    关于两个Python开源识别工具的效果

    回复希望出一篇 OCR 相关的文章,今天尝试了一下 cnocr 和 tesseract 两个 Python 开源识别工具的效果,给大家分别讲讲两个工具的使用方法和对比效果。 1.准备 开始之前,你要确保
    的头像 发表于 10-17 11:36 271次阅读
    关于两个Python<b class='flag-5'>开源</b><b class='flag-5'>识别</b>工具的效果

    【KV260视觉入门套件试用体验】Vitis AI Library体验之OCR识别

    OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状
    发表于 10-16 23:25

    SpringBoot分布式验证码登录方案

    传统的项目大都是基于session交互的,前后端都在一个项目里面,比如传统的SSH项目或者一些JSP系统,当前端页面触发到获取验证码请求,可以将验证码里面的信息存在上下文中,所以登录的时候只需要 用户名、密码、验证码即可。
    的头像 发表于 10-12 17:34 420次阅读
    SpringBoot分布式<b class='flag-5'>验证码</b>登录方案

    Java 中验证码的使用

    今天我们讲一下在 Java 中验证码的使用。 验证码生成 本效果是利用easy-captcha工具包实现,首先需要添加相关依赖到pom.xml中,代码如下: com .github.whvcse
    的头像 发表于 09-25 11:11 460次阅读
    Java 中<b class='flag-5'>验证码</b>的使用

    验证码到底在验证啥?聊一聊验证码是怎么为难我们人类的

    在文章开头,老狐先给大家玩一个验证码的游戏,猜出图中验证码字母。
    的头像 发表于 08-12 10:25 1503次阅读
    <b class='flag-5'>验证码</b>到底在<b class='flag-5'>验证</b>啥?聊一聊<b class='flag-5'>验证码</b>是怎么为难我们人类的

    随手记录一个2分钟破解文章验证码

    老手跳过,新手看看就行,纯分享。刚在查询用node构造session登陆的时候,往下一划鼠标,弹了个验证码的框
    的头像 发表于 08-03 16:46 596次阅读
    随手记录一个2分钟破解文章<b class='flag-5'>验证码</b>

    手势识别功能开源案例

    电子发烧友网站提供《手势识别功能开源案例.zip》资料免费下载
    发表于 07-11 17:05 2次下载
    手势<b class='flag-5'>识别</b>功能<b class='flag-5'>开源</b>案例

    OpenHarmony端云一体化应用开发快速入门练习(中)登录认证

    的应用中集成SDK。 (二)注册 1.申请手机号码注册的验证码。 说明:在使用手机号码注册之前,需要先验证您的手机,确保该手机归您所有。 调用
    发表于 06-20 17:05

    Blynk通用遥控器开源分享

    电子发烧友网站提供《Blynk通用遥控器开源分享.zip》资料免费下载
    发表于 06-13 16:38 0次下载
    Blynk<b class='flag-5'>通用</b>遥控器<b class='flag-5'>开源</b>分享

    burpsuit验证码爆破教程

    填写验证码识别接口,这里有百度的可以用,但是有次数限制,需要修改为自己的token,不推荐,但是如果想使用,只需要在接口的大框框里右键--模板库--百度,点击,就会自动填充百度ocr的模板
    的头像 发表于 05-11 11:09 1145次阅读
    burpsuit<b class='flag-5'>验证码</b>爆破教程