0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于开放平台OCR上线印刷文字识别的介绍

讯飞开放平台 来源:djl 2019-09-27 09:51 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

每当遇到以上情景,你是不是都希望有一个神奇的装置,哪儿需要扫哪里,迅速将文字转成计算机可编辑的数据?

说曹操曹操就到,讯飞开放平台印刷文字识别技术闪亮登场!作为OCR系列服务的新成员,带来处理大量非数据文本的神器。

1数字时代的刚需技术

大数据时代下,虽然我们每天在计算机上获取,编辑大量的文本,但计算机以外的各种文本一直在我们的工作和学习中占据重要位置。而将这些文本录入也一直耗费着大量的时间和人力。

如何高效处理海量非结构化数据,使它们能快速转化为计算机可处理的数据,方便进一步数据库采集、管理、分析和决策,已成为下阶段的行业大方向。作为处理图片文字数据的AI技术——OCR(optical character recognition 光学字符识别),正是一种有效的解决方案,在越来越多用户需求的真实场景中实践。

讯飞开放平台重磅推出的OCR系列产品,基于讯飞AI研究院独创的基于深度神经网络模型端到端文字识别系统,识别文字符号的数字影像,并将其转换为对应的电脑等设备可编辑的数字文本,最终达到识别的文字结果可编辑、可处理的目的,其中印刷文字识别技术面向的就是印刷字体的转化。

2印刷文字识别应用广泛

正如文章开头我们提到的,生活中有很多需要将印刷字体转换为设备可编辑的文本场景。而作为OCR家族的重要成员,印刷文字识别在这时候就大有作为,下面小编就带大家看一看——

1.资料/文档处理

工作或者科研学习中,要应对大量的会议材料、书刊杂志、电子资料(如PDF),印刷识别技术可以方便将这些资料的文字转化为可编辑和整理格式

2.卡证信息录入

在需要录入身份证、驾驶证、银行卡、营业执照等信息的场景下,印刷识别技术可以减轻手动录入的压力,更高效。

3.视频/图片内容审核

计算机可以处理电子字符,但对图片上和视频中的字体无法识别,通过印刷文本识别技术,可以将图片中的印刷字体以及视频中的字幕、弹幕、画面文字转换为计算机可处理的文本,增强审核能力。(图片、视频中的印刷字体可使用印刷文字识别技术)

4.书摘笔记

读书时,看到不错的金句和段落想要摘录或分享,印刷文字识别技术只需要随手一拍就能生成文本。

5.随手记录

在微信、微博等内容平台看到有价值的图片内容会随手保存Mark,或是用截屏把手机页面内容保存到相册,但这些图片信息散乱在手机各处,很难进行归纳、整理和检索

6.医疗、金融、图书档案管理行业电子化

医疗单据、票据、病例等资料电子化入库;金融企业证照、年报、财报、票据等纸质资料的结构化录入;图书档案的电子数据库的搭建,更新。都能通过印刷文字识别技术达到减少人力录入成本,提高效率的目的。

7.拍照翻译

在国外旅行时,遇到指示牌/路牌、餐馆菜单、商品标签、入境卡等多种场景量身定制。利用印刷文字识别+翻译,随手一拍,翻译内容即刻显示。

如4月20日上市的讯飞翻译机2.0,就带有2.4英寸的液晶显示屏和摄像头,支持中文与英、日、韩、法、西、德、俄、意、葡、泰、阿拉伯语的在线拍照互译,并支持中英离线拍照互译。

3讯飞印刷文字识别技术优势

我们为什么用OCR?因为可以快速将文字转为可在设备上编辑的数字文本。因此能够得到用户青睐的OCR小编认为应能够准确生成文本,所见即所得,同时对不同字体,不同环境,不同颜色形状的文本准确识别。

产品优势

准确率业界领先地位

印刷文字识别的识别率高达90%

复杂场景支持

支持扫描体以及复杂自然场景下的文字识别,对方向有旋转的文字,支持文字与水平轴小于±15°夹角偏转。

识别不同语言

目前支持识别中文、英文、中英文混合的文字内容的识别。

在中文人工智能助手咪咕灵犀的翻译功能模块,接入讯飞开放平台的OCR与翻译能力,提供图片中文字的识别与翻译能力。

接入简单便捷

提供Restful API接口,可供开发者进行跨平台使用

以上,大家可以看到讯飞开放平台的印刷文字识别技术在准确率,识别能力方面表现出色,同时支持不同语言以及混合语言的识别。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261507
  • 文字识别
    +关注

    关注

    0

    文章

    18

    浏览量

    8895
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【EASY EAI Orin Nano开发板试用体验】PP-OCRV5文字识别实例搭建与移植

    rec文件): 生成了RKNN格式文件之后,后面的工作就只是调用文件进行识别了,关于调用PaddleOCR 3.0大模型进行文字识别的例程,我这里用的是野火鲁班猫的例程: 注意
    发表于 08-18 16:57

    如何利用OCR技术实现高效集装箱箱号识别

    能够实现全天候、高精度的箱号自动识别。 1. 高清图像采集:识别的基础 传统摄像设备受限于分辨率和环境光线,往往难以获取清晰的箱号图像。现代OCR系统采用工业级高清相机,具备高动态范围(HDR)和低照度增强能力,即使在强光、雨雾
    的头像 发表于 08-12 10:48 551次阅读
    如何利用<b class='flag-5'>OCR</b>技术实现高效集装箱箱号<b class='flag-5'>识别</b>?

    ocr识别时数据集上传压缩包,上传成功,但不显示图片,图片数量仍显示0,为什么?

    ocr识别时数据集上传压缩包,上传成功,但不显示图片,图片数量仍显示0
    发表于 07-23 08:11

    高德开放平台SDK鸿蒙版的技术优势

    高德开放平台SDK鸿蒙版自2024年3月上线以来,已成功赋能首汽约车、顺丰、江苏银行、成都银行等超千家应用,帮助开发者高效构建LBS服务。
    的头像 发表于 07-14 17:01 1192次阅读

    端侧OCR文字识别实现 -- Core Vision Kit ##HarmonyOS SDK AI##

    ,使用场景中就包括了“通用文字识别”,即我们前文中所说的ocr功能。 其整体流程概括为: 首先通过各种方法得到一张图片,例如拍照、从相册中选择、甚至你也可以通过canvas画布生成的图片或者通过组件
    发表于 06-30 18:07

    OCR技术如何实现铁路集装箱号的自动识别

    在铁路物流运输中,集装箱号的快速准确识别是提升效率的关键环节。通过先进的OCR(光学字符识别)技术,结合计算机视觉与深度学习方法,可以实现铁路集装箱号的高效、可靠识别。 一、
    的头像 发表于 06-13 10:32 403次阅读

    明治案例 | 150个/分钟!电阻【OCR识别】+【尺寸测量】一步到位

    真实案例——看明治传感如何用一个视觉传感器,同时搞定电阻的尺寸测量和OCR识别,让质检效率翻倍,成本直降!场景需求希望在同一工位完成尺寸测量与OCR识别,减少设备占
    的头像 发表于 06-10 07:33 567次阅读
    明治案例 | 150个/分钟!电阻【<b class='flag-5'>OCR</b><b class='flag-5'>识别</b>】+【尺寸测量】一步到位

    OCR识别训练完成后给的是空压缩包,为什么?

    OCR识别 一共弄了26张图片,都标注好了,点击开始训练,显示训练成功了,也将压缩包发到邮箱了,下载下来后,压缩包里面是空的 OCR图片20几张图太少了。麻烦您多添加点,参考我们的ocr
    发表于 05-28 06:46

    rfid技术是如何应用在集装箱自动识别的呢?

    在现代集装箱物流管理中,快速、准确地识别集装箱号码是提升港口、堆场和海关运作效率的关键。随着技术的发展,RFID(射频识别)技术与OCR视觉识别相结合,为集装箱自动
    的头像 发表于 04-18 10:13 650次阅读
    rfid技术是如何应用在集装箱自动<b class='flag-5'>识别的</b>呢?

    大模型预标注和自动化标注在OCR标注场景的应用

    OCR,即光学字符识别,简单来说就是利用光学设备去捕获图像并识别文字,最终将图片中的文字转换为可编辑和可搜索的文本。在数字化时代,
    的头像 发表于 04-15 15:18 716次阅读

    阿普奇视觉控制器AK7在OCR识别场景中的应用

    影响产品口碑有着重要作用。随着一些复杂字符组合出现,印刷工艺调整,字符印刷材质变更,为了保证字符识别的准确率,行业内采用更多新的机器视觉技术以完成对产品字符高精度、高效率、高稳定的实时检测。 在最新的
    的头像 发表于 03-20 11:44 501次阅读
    阿普奇视觉控制器AK7在<b class='flag-5'>OCR</b><b class='flag-5'>识别</b>场景中的应用

    讯飞开放平台支持DeepSeek

    今天,DeepSeek全系大模型正式上线讯飞开放平台(包括DeepSeek-V3和DeepSeek-R1),支持公有云API调用、一键部署专属模型!
    的头像 发表于 02-11 09:27 1884次阅读

    讯飞开放平台上线DeepSeek大模型

    作为首批“人工智能国家队”,讯飞开放平台致力于为全球开发者提供领先的人工智能技术与解决方案,依托讯飞研究院源头技术创新和能力星云计划的行业共建,讯飞开放平台已发布806项AI技术和方案
    的头像 发表于 02-10 14:20 1654次阅读

    讯维KVM坐席管理协作系统:OCR功能及优势介绍

    框选识别的场景中。讯维首次将OCR智能文字识别功能加入全新KVM坐席管理协作系统中,解决手动记录文字效率低下的问题,提供坐席人员的工作效率。
    的头像 发表于 01-22 10:02 919次阅读