0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于开放平台OCR上线印刷文字识别的介绍

讯飞开放平台 来源:djl 2019-09-27 09:51 次阅读

每当遇到以上情景,你是不是都希望有一个神奇的装置,哪儿需要扫哪里,迅速将文字转成计算机可编辑的数据?

说曹操曹操就到,讯飞开放平台印刷文字识别技术闪亮登场!作为OCR系列服务的新成员,带来处理大量非数据文本的神器。

1数字时代的刚需技术

大数据时代下,虽然我们每天在计算机上获取,编辑大量的文本,但计算机以外的各种文本一直在我们的工作和学习中占据重要位置。而将这些文本录入也一直耗费着大量的时间和人力。

如何高效处理海量非结构化数据,使它们能快速转化为计算机可处理的数据,方便进一步数据库采集、管理、分析和决策,已成为下阶段的行业大方向。作为处理图片文字数据的AI技术——OCR(optical character recognition 光学字符识别),正是一种有效的解决方案,在越来越多用户需求的真实场景中实践。

讯飞开放平台重磅推出的OCR系列产品,基于讯飞AI研究院独创的基于深度神经网络模型端到端文字识别系统,识别文字符号的数字影像,并将其转换为对应的电脑等设备可编辑的数字文本,最终达到识别的文字结果可编辑、可处理的目的,其中印刷文字识别技术面向的就是印刷字体的转化。

2印刷文字识别应用广泛

正如文章开头我们提到的,生活中有很多需要将印刷字体转换为设备可编辑的文本场景。而作为OCR家族的重要成员,印刷文字识别在这时候就大有作为,下面小编就带大家看一看——

1.资料/文档处理

工作或者科研学习中,要应对大量的会议材料、书刊杂志、电子资料(如PDF),印刷识别技术可以方便将这些资料的文字转化为可编辑和整理格式

2.卡证信息录入

在需要录入身份证、驾驶证、银行卡、营业执照等信息的场景下,印刷识别技术可以减轻手动录入的压力,更高效。

3.视频/图片内容审核

计算机可以处理电子字符,但对图片上和视频中的字体无法识别,通过印刷文本识别技术,可以将图片中的印刷字体以及视频中的字幕、弹幕、画面文字转换为计算机可处理的文本,增强审核能力。(图片、视频中的印刷字体可使用印刷文字识别技术)

4.书摘笔记

读书时,看到不错的金句和段落想要摘录或分享,印刷文字识别技术只需要随手一拍就能生成文本。

5.随手记录

在微信、微博等内容平台看到有价值的图片内容会随手保存Mark,或是用截屏把手机页面内容保存到相册,但这些图片信息散乱在手机各处,很难进行归纳、整理和检索

6.医疗、金融、图书档案管理行业电子化

医疗单据、票据、病例等资料电子化入库;金融企业证照、年报、财报、票据等纸质资料的结构化录入;图书档案的电子数据库的搭建,更新。都能通过印刷文字识别技术达到减少人力录入成本,提高效率的目的。

7.拍照翻译

在国外旅行时,遇到指示牌/路牌、餐馆菜单、商品标签、入境卡等多种场景量身定制。利用印刷文字识别+翻译,随手一拍,翻译内容即刻显示。

如4月20日上市的讯飞翻译机2.0,就带有2.4英寸的液晶显示屏和摄像头,支持中文与英、日、韩、法、西、德、俄、意、葡、泰、阿拉伯语的在线拍照互译,并支持中英离线拍照互译。

3讯飞印刷文字识别技术优势

我们为什么用OCR?因为可以快速将文字转为可在设备上编辑的数字文本。因此能够得到用户青睐的OCR小编认为应能够准确生成文本,所见即所得,同时对不同字体,不同环境,不同颜色形状的文本准确识别。

产品优势

准确率业界领先地位

印刷文字识别的识别率高达90%

复杂场景支持

支持扫描体以及复杂自然场景下的文字识别,对方向有旋转的文字,支持文字与水平轴小于±15°夹角偏转。

识别不同语言

目前支持识别中文、英文、中英文混合的文字内容的识别。

在中文人工智能助手咪咕灵犀的翻译功能模块,接入讯飞开放平台的OCR与翻译能力,提供图片中文字的识别与翻译能力。

接入简单便捷

提供Restful API接口,可供开发者进行跨平台使用

以上,大家可以看到讯飞开放平台的印刷文字识别技术在准确率,识别能力方面表现出色,同时支持不同语言以及混合语言的识别。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1776

    文章

    43918

    浏览量

    230649
  • 文字识别
    +关注

    关注

    0

    文章

    16

    浏览量

    8598
收藏 人收藏

    评论

    相关推荐

    如何使用Python进行图像识别的自动学习自动训练?

    如何使用Python进行图像识别的自动学习自动训练? 使用Python进行图像识别的自动学习和自动训练需要掌握一些重要的概念和技术。在本文中,我们将介绍如何使用Python中的一些常用库和算法来实现
    的头像 发表于 01-12 16:06 221次阅读

    基于OpenVINO+OpenCV的OCR处理流程化实现

    预处理主要是基于OpenCV、场景文字检测与识别基于OpenVINO框架 + PaddleOCR模型完成。直接按图索骥即可得到最终结果。 OpenCV预处理主要是完成偏斜矫正、背景矫正等操作,然后使用场景文字检测模型+
    的头像 发表于 11-07 11:21 384次阅读
    基于OpenVINO+OpenCV的<b class='flag-5'>OCR</b>处理流程化实现

    OCR如何自动识别图片文字

    OCR 是光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字
    的头像 发表于 10-31 16:45 436次阅读
    <b class='flag-5'>OCR</b>如何自动<b class='flag-5'>识别</b>图片<b class='flag-5'>文字</b>

    easyocr:超级简单且强大的OCR文本识别工具

    今天给大家介绍一个超级简单且强大的OCR文本识别工具: easyocr . 这个模块支持70多种语言的即用型OCR,包括中文,日文,韩文和泰文等。 下面是这个模块的实战教程。 1.准备
    的头像 发表于 10-30 09:30 1480次阅读
    easyocr:超级简单且强大的<b class='flag-5'>OCR</b>文本<b class='flag-5'>识别</b>工具

    关于两个Python开源识别工具的效果

    OCR 是光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字
    的头像 发表于 10-17 11:36 272次阅读
    <b class='flag-5'>关于</b>两个Python开源<b class='flag-5'>识别</b>工具的效果

    【KV260视觉入门套件试用体验】Vitis AI Library体验之OCR识别

    翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文
    发表于 10-16 23:25

    【KV260视觉入门套件试用体验】七、VITis AI字符和文本检测(OCR&amp;Textmountain)

    视觉领域的重要问题,主要是识别和理解图像或视频中的文字信息。字符检测和识别OCR)技术最早在1929年由德国科学家Tausheck提出,定义为将
    发表于 09-26 16:31

    Tesseract的进阶用法和最佳实践

    OCR (Optical Character Recognition,光学字符识别)是一种将印刷体或手写体的字符、数字等转化为可被计算机识别的文本的技术。在现代社会中,
    的头像 发表于 09-20 11:00 619次阅读

    NuMaker Brick开放源码IoT平台介绍

    NuMaker Brick是一个开放源码 IoT平台, 包括传感器和模块的组合, 可以独立运作或按任何顺序排列。 可以通过 NuBrick App 对基于Android 的移动设备或平板计算机进行
    发表于 08-24 07:07

    面部表情识别的未来发展趋势

    面部表情识别作为一项复杂的技术,未来将会面临更多的挑战和机遇。本文将探讨面部表情识别的未来发展趋势,包括技术进步、应用拓展、标准化和开放性等方面。 首先,面部表情识别的技术将会不断进步
    的头像 发表于 08-09 16:16 359次阅读

    面部表情识别的伦理问题

    面部表情识别是一项涉及隐私和伦理的技术,其在应用过程中可能会引发一系列伦理问题。本文将探讨面部表情识别的伦理问题,包括隐私保护、种族和性别偏见、情绪识别准确率等方面。 首先,面部表情识别的
    的头像 发表于 08-04 18:20 603次阅读

    AI提取图片里包含的文字信息-解决文字无法复制的痛点

    这个文字识别接口里不仅仅有通用文字识别功能,还支持很多其他功能:比如身份证、驾驶证、保险单、手写文本、火车票,行驶证.......等等功能。还支持用户自定义
    的头像 发表于 07-07 09:37 1036次阅读
    AI提取图片里包含的<b class='flag-5'>文字</b>信息-解决<b class='flag-5'>文字</b>无法复制的痛点

    一个典型的身份证识别算法流程

    光学字符识别 Optical Character Recognition(OCR) 其目标是对图像中的字符进行分析识别,将其转换为文本格式的字符序列。 利用模式识别和数字图像处
    发表于 07-05 11:50 326次阅读
    一个典型的身份证<b class='flag-5'>识别</b>算法流程

    企业智能化应用场景,华为云文字识别 OCR 值得一试

    。想象一下,如果我们能够快速地提取出图片中的文本信息,并将其转化为结构化的数据,那么我们就能够实现很多智能化的应用场景,提升我们的业务效率和用户体验。这就是我为什么推荐华为云文字识别 OCR 的原因。
    的头像 发表于 07-04 14:43 397次阅读

    AI模型开放平台ModelMatrix上线,40+模型开箱即用

    作为国内人工智能行业的龙头企业,科大讯飞在语音识别、自然语言理解、图像识别等领域有着深厚的技术积累,致力于持续推动人工智能产业生态的繁荣。其中,讯飞开放平台目前已
    的头像 发表于 06-02 15:57 915次阅读
    AI模型<b class='flag-5'>开放</b><b class='flag-5'>平台</b>ModelMatrix<b class='flag-5'>上线</b>,40+模型开箱即用