0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Tesseract的安装测试使用

嵌入式DSP 来源:DSP工程师 2019-11-20 15:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

OCR开源项目很多,给大家一个链接,这个链接列出了现有的比较出名的OCR开源项目,链接如下:

https://en.wikipedia.org/wiki/Comparison_of_optical_character_recognition_software

从上面的排名可以看到,Tesseract是排在第一名的!所以下面就认真学习一下Tesseract。首先介绍一下Tesseract,然后安装,测试,了解其不足等等。

Tesseract的OCR引擎目前已作为开源项目发布在Google Project,

其项目主页在这里查看https://github.com/tesseract-ocr,

它支持中文OCR,并提供了一个命令行工具。python中对应的包是

pytesseract. 通过这个工具我们可以识别图片上的文字。

一 Tesseract的安装测试使用

首先下载Tesseract在Windows下的安装版。(因为在国外访问不了谷歌,所以别人***下载了下来,这里给大家百度网盘链接)

http://pan.baidu.com/s/1i56Uxlr

根据https://github.com/tesseract-ocr/tesseract/wiki,找到非官方的安装包,好像只看到64位的安装包http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe,下载后直接安装即可,但是要记得你的安装目录,我们等会配置环境变量要用。

如果不是做英文的图文识别,还需要下载其他语言的识别包https://github.com/tesseract-ocr/tesseract/wiki/Data-Files。

简体字识别包:https://raw.githubusercontent.com/tesseract-ocr/tessdata/4.00/chi_sim.traineddata

繁体字识别包:https://github.com/tesseract-ocr/tessdata/raw/4.0/chi_tra.traineddata

1.3 安装Tesseract

下载Tesseract-OCR引擎,注意要3.0以上才支持中文哦,按照提示安装就行。(此处附上windows 4.0的安装过程)

既然是要训练中文,记得勾选 additional language data

找到中文简体和中文繁体,按需勾选,然后点下一步

可以先不勾选,因为这样直接下载语言的包实在太慢。可以从网页上直接下载语言包,然后等程序安装好后,放入安装目录下tessdata目录下面

下载下来之后一路Next安装好,然后在开始菜单找到其控制台引导程序,如下图所示

1.4 测试英文字符识别

上面的安装包里自带了已经训练好的英文-拉丁文识别数据~所以我们先来测试一下英文字符的识别吧~识别图像如下:

1.4.1把上面的图片放到Tesseract的安装目录下,如下图所示:

1.4.2打开上面提到的控制台窗口,如下图所示:

1.4.3在窗口中输入命令:“tesseract.exe 0.jpg 1”,并回车,如下图所示:

01.jpg代表待识别的源文件,1代表输出文件名,默认输出格式是txt文件格式!

注意,上面的 lang之前是-l 而不是-1!

1.4.4让我们先查看一下01.jpg照片,如下图:

1.4.5在安装目录下生成了1.txt文件,识别结果如下图所示:

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4816

    浏览量

    98811
  • OCR
    OCR
    +关注

    关注

    0

    文章

    176

    浏览量

    17307

原文标题:深入学习使用ocr算法识别图片中文字的方法

文章出处:【微信号:ddongcloud,微信公众号:嵌入式DSP】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    百度文心衍生模型PaddleOCR登顶GitHub Star OCR全球第一

    3月30日,百度文心衍生模型PaddleOCR在GitHub上的Star数突破73.3K,超越谷歌Tesseract OCR,成为全球Star数最高的OCR项目。
    的头像 发表于 03-31 11:40 578次阅读

    ELF-RV1126B+VScode测试-1

    在VScode中测试ELF-RV1126B 通过ssh服务访问 PC端,VScode安装插件Remote – SSH,重启VScode。(注意:VScode中的Remote - SSH服务经常断开
    的头像 发表于 03-26 20:13 467次阅读
    ELF-RV1126B+VScode<b class='flag-5'>测试</b>-1

    机柜配线架的安装与维护指南

    。 一、安装前准备 环境检查:确保安装环境干燥、通风、无尘,且温度、湿度适宜,以避免对配线架造成损害。 工具准备:准备必要的安装工具,如螺丝刀、扳手、线缆测试仪等。 规划布局:根据机柜
    的头像 发表于 03-26 09:52 507次阅读

    开发必看,RK3576基于Ubuntu22.04安装 测试ROS2机器人系统

    本文介绍基于Ubuntu22.04安装ROS2机器人系统教程,并附带详细测试方法,基于触觉智能RK3576核心板方案,使用配套开发板PurplePiOH2演示。ROS、ROS2简介ROS
    的头像 发表于 03-13 17:48 537次阅读
    开发必看,RK3576基于Ubuntu22.04<b class='flag-5'>安装</b> <b class='flag-5'>测试</b>ROS2机器人系统

    Fluke 1670系列多功能安装测试仪在设备安装检验中的应用

    电气设备安装检验是指按照相关技术标准、规范和设计文件,对电气设备安装过程中的各个环节进行检查、测试和验证,以确保其符合安全、性能、可靠性和法规要求的一系列技术活动。检验贯穿于设备安装
    的头像 发表于 02-28 09:39 714次阅读
    Fluke 1670系列多功能<b class='flag-5'>安装</b><b class='flag-5'>测试</b>仪在设备<b class='flag-5'>安装</b>检验中的应用

    Beremiz 开源 PLC 从安装到运行全流程实操指南

    一、产品概述 Beremiz是一款开源的PLC(可编程逻辑控制器)开发软件,专为工业自动化控制系统的编程和调试而设计。它支持IEC 61131-3标准,为工程师和开发者提供强大的工具来创建、测试
    的头像 发表于 01-05 16:42 980次阅读
    Beremiz 开源 PLC 从<b class='flag-5'>安装</b>到运行全流程实操指南

    ODF配线架的安装步骤有哪些?

    ODF(光纤配线架)的安装步骤通常涵盖安装前准备、机架安装、光缆处理、光纤熔接与连接、盘纤与走线、测试验收以及标识管理等方面,以下是详细介绍: 一、
    的头像 发表于 01-04 11:57 703次阅读

    导轨水平安装安装面不平的解决方法

    水平安装微型导轨时,安装面不平整会导致导轨变形、运行卡滞甚至缩短寿命。
    的头像 发表于 12-16 17:57 1405次阅读
    导轨水平<b class='flag-5'>安装</b>中<b class='flag-5'>安装</b>面不平的解决方法

    AppTest邀请测试---邀请用户参与测试

    ,点击链接同样可以参与测试。 注意 AppTest邀请测试功能目前为受限开放,用户无法直接在应用市场搜索AppTest。若未安装AppTest客户端,用户通过以上方式获得测试资格后,可
    发表于 10-09 10:47

    AppTest邀请测试 -停止测试

    若您发现测试版本存在严重问题、或者已完成测试,可以在“版本列表”页面手动停止测试测试版本停止测试后,状态会立即变为“已失效”。
    发表于 09-19 10:12

    AppTest邀请测试 -邀请用户

    ,点击链接同样可以参与测试 注意 AppTest邀请测试功能目前为受限开放,用户无法直接在应用市场搜索AppTest。若未安装AppTest客户端,用户通过以上方式获得测试资格后,可点
    发表于 09-18 11:13

    AppTest邀请测试测试流程

    。 第二步:创建并发布测试版本 您需要将测试版本发布至AppTest客户端。测试版本正式上架后,测试用户即可安装AppTest客户端,获取应
    发表于 09-11 17:00

    屏蔽双绞线是如何安装

    屏蔽双绞线(STP、FTP、S/FTP等)的安装需严格遵循规范,以确保屏蔽层有效接地并发挥抗干扰作用。以下是详细的安装步骤及关键注意事项: 一、安装前准备 工具与材料 工具:屏蔽网线专用剥线钳、压线
    的头像 发表于 08-20 10:26 2226次阅读

    【经验分享】在Omni3576上编译Redis-8.0.2源码,并安装及性能测试

    本文首先介绍Redis是什么,然后介绍如何在Omni3576上编译Redis-8.0.2源码,以及从源码编译、安装Redis,最后介绍如何在Omni3576上运行Redis性能测试,并与树莓派5上的结果进行对比。一、Redis是什么维基百科的介绍是:Redi
    的头像 发表于 06-05 08:05 1172次阅读
    【经验分享】在Omni3576上编译Redis-8.0.2源码,并<b class='flag-5'>安装</b>及性能<b class='flag-5'>测试</b>

    【幸狐Omni3576边缘计算套件试用体验】Redis最新8.0.2版本源码安装及性能测试

    本文首先介绍Redis是什么,然后介绍如何在Omni3576上编译Redis-8.0.2源码,以及从源码编译、安装Redis,最后介绍如何在Omni3576上运行Redis性能测试,并与树莓派5上
    发表于 06-03 01:28