0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Tesseract的安装测试使用

嵌入式DSP 来源:DSP工程师 2019-11-20 15:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

OCR开源项目很多,给大家一个链接,这个链接列出了现有的比较出名的OCR开源项目,链接如下:

https://en.wikipedia.org/wiki/Comparison_of_optical_character_recognition_software

从上面的排名可以看到,Tesseract是排在第一名的!所以下面就认真学习一下Tesseract。首先介绍一下Tesseract,然后安装,测试,了解其不足等等。

Tesseract的OCR引擎目前已作为开源项目发布在Google Project,

其项目主页在这里查看https://github.com/tesseract-ocr,

它支持中文OCR,并提供了一个命令行工具。python中对应的包是

pytesseract. 通过这个工具我们可以识别图片上的文字。

一 Tesseract的安装测试使用

首先下载Tesseract在Windows下的安装版。(因为在国外访问不了谷歌,所以别人***下载了下来,这里给大家百度网盘链接)

http://pan.baidu.com/s/1i56Uxlr

根据https://github.com/tesseract-ocr/tesseract/wiki,找到非官方的安装包,好像只看到64位的安装包http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe,下载后直接安装即可,但是要记得你的安装目录,我们等会配置环境变量要用。

如果不是做英文的图文识别,还需要下载其他语言的识别包https://github.com/tesseract-ocr/tesseract/wiki/Data-Files。

简体字识别包:https://raw.githubusercontent.com/tesseract-ocr/tessdata/4.00/chi_sim.traineddata

繁体字识别包:https://github.com/tesseract-ocr/tessdata/raw/4.0/chi_tra.traineddata

1.3 安装Tesseract

下载Tesseract-OCR引擎,注意要3.0以上才支持中文哦,按照提示安装就行。(此处附上windows 4.0的安装过程)

既然是要训练中文,记得勾选 additional language data

找到中文简体和中文繁体,按需勾选,然后点下一步

可以先不勾选,因为这样直接下载语言的包实在太慢。可以从网页上直接下载语言包,然后等程序安装好后,放入安装目录下tessdata目录下面

下载下来之后一路Next安装好,然后在开始菜单找到其控制台引导程序,如下图所示

1.4 测试英文字符识别

上面的安装包里自带了已经训练好的英文-拉丁文识别数据~所以我们先来测试一下英文字符的识别吧~识别图像如下:

1.4.1把上面的图片放到Tesseract的安装目录下,如下图所示:

1.4.2打开上面提到的控制台窗口,如下图所示:

1.4.3在窗口中输入命令:“tesseract.exe 0.jpg 1”,并回车,如下图所示:

01.jpg代表待识别的源文件,1代表输出文件名,默认输出格式是txt文件格式!

注意,上面的 lang之前是-l 而不是-1!

1.4.4让我们先查看一下01.jpg照片,如下图:

1.4.5在安装目录下生成了1.txt文件,识别结果如下图所示:

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4760

    浏览量

    97144
  • OCR
    OCR
    +关注

    关注

    0

    文章

    170

    浏览量

    17052

原文标题:深入学习使用ocr算法识别图片中文字的方法

文章出处:【微信号:ddongcloud,微信公众号:嵌入式DSP】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AppTest邀请测试---邀请用户参与测试

    ,点击链接同样可以参与测试。 注意 AppTest邀请测试功能目前为受限开放,用户无法直接在应用市场搜索AppTest。若未安装AppTest客户端,用户通过以上方式获得测试资格后,可
    发表于 10-09 10:47

    AppTest邀请测试 -停止测试

    若您发现测试版本存在严重问题、或者已完成测试,可以在“版本列表”页面手动停止测试测试版本停止测试后,状态会立即变为“已失效”。
    发表于 09-19 10:12

    AppTest邀请测试 -邀请用户

    ,点击链接同样可以参与测试 注意 AppTest邀请测试功能目前为受限开放,用户无法直接在应用市场搜索AppTest。若未安装AppTest客户端,用户通过以上方式获得测试资格后,可点
    发表于 09-18 11:13

    AppTest邀请测试测试流程

    。 第二步:创建并发布测试版本 您需要将测试版本发布至AppTest客户端。测试版本正式上架后,测试用户即可安装AppTest客户端,获取应
    发表于 09-11 17:00

    屏蔽双绞线是如何安装

    屏蔽双绞线(STP、FTP、S/FTP等)的安装需严格遵循规范,以确保屏蔽层有效接地并发挥抗干扰作用。以下是详细的安装步骤及关键注意事项: 一、安装前准备 工具与材料 工具:屏蔽网线专用剥线钳、压线
    的头像 发表于 08-20 10:26 1078次阅读

    【经验分享】在Omni3576上编译Redis-8.0.2源码,并安装及性能测试

    本文首先介绍Redis是什么,然后介绍如何在Omni3576上编译Redis-8.0.2源码,以及从源码编译、安装Redis,最后介绍如何在Omni3576上运行Redis性能测试,并与树莓派5上的结果进行对比。一、Redis是什么维基百科的介绍是:Redi
    的头像 发表于 06-05 08:05 765次阅读
    【经验分享】在Omni3576上编译Redis-8.0.2源码,并<b class='flag-5'>安装</b>及性能<b class='flag-5'>测试</b>

    【幸狐Omni3576边缘计算套件试用体验】Redis最新8.0.2版本源码安装及性能测试

    本文首先介绍Redis是什么,然后介绍如何在Omni3576上编译Redis-8.0.2源码,以及从源码编译、安装Redis,最后介绍如何在Omni3576上运行Redis性能测试,并与树莓派5上
    发表于 06-03 01:28

    电磁兼容特种测试

    功率上的限制,无法在一般的标准测试场地进行电磁兼容测试,因此需要在特定的非标场地,包含设备的研发场地或者安装的现场进行EMC测试。如果某些设备尽管物理尺寸较小但是由于某些原因不能在实验
    的头像 发表于 05-21 15:07 435次阅读
    电磁兼容特种<b class='flag-5'>测试</b>

    QDAT非信令测试介绍

    高通WIFI6的IPQ系列芯片非信令测试常用的测试方法有两种:QRCT(射频调试工具)、QPSR(射频校准工具)。Chrent一、QPSR(射频校准工具)非信令测试首先设置一个校准频段,我这里设置
    的头像 发表于 05-07 17:32 1244次阅读
    QDAT非信令<b class='flag-5'>测试</b>介绍

    S7在win10安装步骤

    S7在win10安装步骤,经过多次测试,均成功。
    发表于 04-10 18:09 0次下载

    R030521761,rexroth直线模组如何安装调试

    直线模组的调试一般是指通电测试与精度测试,在确保电机及模组本体安装无问题后,可以通电进行运行测试,查看是否有异响和运转的不良情况,而精度测试
    的头像 发表于 02-15 11:08 575次阅读
    R030521761,rexroth直线模组如何<b class='flag-5'>安装</b>调试

    hyper 安装xp,hyper-v安装xp的好处

    :    1.运行旧版软件:许多旧版软件和应用程序可能只兼容WindowsXP,通过Hyper-V安装XP虚拟机可以继续使用这些软件,满足特定的业务需求。    2.兼容性测试:在开发和测试环境中,需要模拟
    的头像 发表于 02-08 11:23 611次阅读
    hyper <b class='flag-5'>安装</b>xp,hyper-v<b class='flag-5'>安装</b>xp的好处

    hyper 安装xp,hyper-v为什么要安装xp?

    旧版软件:许多旧版软件和应用程序可能只兼容Windows XP,通过Hyper-V安装XP虚拟机可以继续使用这些软件,满足特定的业务需求。 2. 兼容性测试:在开发和测试环境中,需要模拟旧版操作系统以
    的头像 发表于 02-07 13:38 689次阅读
    hyper <b class='flag-5'>安装</b>xp,hyper-v为什么要<b class='flag-5'>安装</b>xp?

    linux下服务器稳定性压⼒测试⼯具stress安装使⽤介绍

    linux 下服务器稳定性压⼒测试⼯具 stress 安装使⽤介绍 一、简介 1、stress⼯具是Linux下一款压⼒测试⼯具, 可以模拟系统⾼负载运⾏ , 同时可协助我们进⾏软件稳 定性相关
    的头像 发表于 01-15 09:25 1469次阅读
    linux下服务器稳定性压⼒<b class='flag-5'>测试</b>⼯具stress<b class='flag-5'>安装</b>使⽤介绍

    使用碳滑板电阻测试仪进行测试的步骤

    滑板、相应的夹具、清洁工具、校准标准电阻等。 清洁碳滑板 :用干净的布或专用清洁剂去除碳滑板表面的灰尘、油污、杂质等,保证表面干净、平整,以免影响测试结果。 安装夹具 :将夹具安装在碳滑板上,确保夹具与碳滑板接触良好
    的头像 发表于 01-08 09:18 682次阅读
    使用碳滑板电阻<b class='flag-5'>测试</b>仪进行<b class='flag-5'>测试</b>的步骤