0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OCR光学字符识别技术原理讲解

工程师 来源:未知 作者:姚远香 2019-03-02 13:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

OCR (光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题,ICR的名词也因此而产生。衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。

ocr识别的过程如下:

1、图像输入:要进行ocr识别,第一步便要采集所要识别的图像,可以是名片、身份证、护照、行驶证、驾驶证、公文、文档等等都可以,然后将图像输入到识别核心。

2、图像预处理:此过程包含二值化(将图像上的像素点灰度值设置为0或255,也就是将整个图像呈现出明显的只有黑和白的视觉效果)、去噪、倾斜度矫正等。

3、版面分析:将所要识别的文档分段、分行处理

4、字符切割:此时需要字符定位和字符切割,定位出字符串的边界,然后分别对字符串进行单个切割,单个分割出来的字符再做识别。

5、字符特征提取:提取字符特征,为后面的识别提供依据。

6、字符识别:将当前字符提取的特征向量与特征模板库进行模板粗分类和模板细匹配,识别出字符。

7、版面回复:将识别结果按照原来的版面排班,输出Word或pdf格式的文档。

8、后处理校正: 根据特定的语言上下文的关系,对识别结果进行较正的算法

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 字符识别
    +关注

    关注

    0

    文章

    18

    浏览量

    8899
  • OCR
    OCR
    +关注

    关注

    0

    文章

    170

    浏览量

    17052
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    ElfBoard技术贴|如何在【RK3588】ELF 2开发板上完成PPOC本地化部署

    PPOCR是由百度开发的一款开源深度学习OCR光学字符识别)模型,专注于文本检测、识别与理解任务,具备多场景、多语言的字符识别能力。该模型
    的头像 发表于 11-14 10:54 6780次阅读
    ElfBoard<b class='flag-5'>技术</b>贴|如何在【RK3588】ELF 2开发板上完成PPOC本地化部署

    药品包装压印字符识别检测难度大?PMS光度立体融合技术来破局!

    PMS光度立体图像融合检测系统破解了药品压印字符识别难题。该系统通过光源标定、多角度图像采集、缺陷增强和AI字符识别四个核心步骤,有效解决了药品包装上凹凸字符因高光过曝、暗区细节丢失和低对比度导致的
    的头像 发表于 09-06 10:51 668次阅读

    【嘉楠堪智K230开发板试用体验】+OCR实现

    OCR OCR(Optical Character Recognition,光学字符识别)是一种将图像中的文字内容转换为可编辑、可搜索文本的技术
    发表于 08-23 18:53

    如何利用OCR技术实现高效集装箱箱号识别

    在现代物流和海关监管领域,快速准确地识别集装箱箱号是提升通关效率、降低运营成本的关键。OCR光学字符识别技术的应用,为这一需求提供了智能
    的头像 发表于 08-12 10:48 554次阅读
    如何利用<b class='flag-5'>OCR</b><b class='flag-5'>技术</b>实现高效集装箱箱号<b class='flag-5'>识别</b>?

    端侧OCR文字识别实现 -- Core Vision Kit ##HarmonyOS SDK AI##

    获取图片url,把这个url和token再发给百度的ocr接口获取识别数据……或者图片转base64以后把这个base64发给接口,然而鸿蒙这里,目前我也不知道啥原因(可能是发送请求的数据长度有限
    发表于 06-30 18:07

    即插即用、缺陷同检,维视智造推出读码/字符检测视觉系统新品

    在当前的工业生产领域,产品读码和字符识别是实现生产自动化、提升效率,保障质量、满足严格的可追溯性要求的必要生产动作。但因产品特性、生产环境、生产流程、生产要求的千差万别,传统的产品读码和字符识别常常
    的头像 发表于 06-19 08:51 695次阅读
    即插即用、缺陷同检,维视智造推出读码/<b class='flag-5'>字符</b>检测视觉系统新品

    OCR技术如何实现铁路集装箱号的自动识别

    在铁路物流运输中,集装箱号的快速准确识别是提升效率的关键环节。通过先进的OCR光学字符识别技术,结合计算机视觉与深度学习方法,可以实现铁
    的头像 发表于 06-13 10:32 406次阅读

    OCR技术vs传统识别:哪种更适合火车集装箱识别

    在铁路物流领域,集装箱箱号识别是提升运输效率的关键环节。随着计算机视觉技术的发展,OCR识别与传统识别
    的头像 发表于 06-11 10:54 441次阅读

    集装箱箱号识别手持终端的核心技术解析

    融合识别引擎 先进的手持终端采用深度学习算法与传统OCR技术相结合的创新架构: - 通过海量集装箱图像训练的神经网络模型,能自动适应不同光照、角度和污损情况 - 优化的字符分割算法可有
    的头像 发表于 06-05 10:13 441次阅读

    OCR识别训练完成后给的是空压缩包,为什么?

    OCR识别 一共弄了26张图片,都标注好了,点击开始训练,显示训练成功了,也将压缩包发到邮箱了,下载下来后,压缩包里面是空的 OCR图片20几张图太少了。麻烦您多添加点,参考我们的ocr
    发表于 05-28 06:46

    大模型预标注和自动化标注在OCR标注场景的应用

    OCR,即光学字符识别,简单来说就是利用光学设备去捕获图像并识别文字,最终将图片中的文字转换为可编辑和可搜索的文本。在数字化时代,
    的头像 发表于 04-15 15:18 718次阅读

    手持终端集装箱识别系统的图像识别技术

    在港口、码头、物流园区等场景中,集装箱的高效管理一直是行业智能化升级的核心需求。基于先进的OCR光学字符识别)与AI技术,手持终端集装箱识别
    的头像 发表于 04-03 10:49 553次阅读

    阿普奇视觉控制器AK7在OCR识别场景中的应用

    在实际工业生产中,OCR光学字符识别技术的应用逐渐普及,在食品包装、新能源、汽车制造、3C电子等领域帮助企业完成产品编码、生产日期、批号等字符
    的头像 发表于 03-20 11:44 504次阅读
    阿普奇视觉控制器AK7在<b class='flag-5'>OCR</b><b class='flag-5'>识别</b>场景中的应用

    Litera Drafting:帮助改进发布文档的方式(十)

    产品介绍 contentCrawler是一种光学字符识别OCR)和文档压缩解决方案,可识别资源库中不可搜索的文档,并将其转换为大小可控、可进行文本搜索的PDF文件。 contentC
    的头像 发表于 01-06 10:57 603次阅读