0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浅析HarmonyOS基于AI的通用文字识别技术

DRXU_gh_019562b 来源:HarmonyOS开发者 作者:HarmonyOS开发者 2021-08-20 10:42 次阅读

在资讯大爆炸的时代,我们经常面临文件、图片找不到的情况,HarmonyOS基于AI的通用文字识别技术,可以有效帮助我们解决这些难题。

基于AI的通用文字识别,将OCR技术和AI分词技术集成,可以对图像信息进行文字检测、识别和关键信息提取,并根据分析结果提供翻译、搜索等相关服务。

通用文字识别的核心技术是OCR【Optical Character Recognition,光学字符识别】,OCR是一种通过拍照、扫描等光学输入方式,把各种票据、卡证、表格、报刊、书籍等印刷品文字转化为图像信息,再利用文字识别技术将图像信息转化为计算机等设备可以使用的字符信息的技术。

AI分词是对于一段输入文本,自动进行分词,同时提供不同的分词粒度。

接下来我们将通过一个“AI文字识别”Demo,为你展示如何三步完成AI应用的开发,心动不如行动,复制下方链接,抢先体验吧~HarmonyOS应用开发在线体验:https://playground.harmonyos.com/#/cn/onlineDemo

AI文字识别Demo

如下视频所示,点击在线体验链,进入 “AI文字识别”Demo后,会看到图片列表中已经收录不同图片,接着在输入框中输入关键词,点击识别搜索后,会弹出一个提示框,点击提示框的“下一步”,搜索结果列表就会展示与关键词相关的图片。

只需输入关键词,就可以匹配得到我们想要的图片,再也不用惧怕茫茫图海中找不到图的窘境了。如此方便高效的AI应用,只需三步就能完成,接下来我们将我大家揭秘是此AI应用如何通过三步完成的 。

第一步,图片文字识别

如图1所示,通过调用API:ITextDetector.detect(),对图片上的文字进行识别。具体实现是在代码21行的textDetector,此处传入了需要识别的Image( “有奖征文”图)和一个 text组件,text组件将保存Image识别的结果,然后通过22行的sendResult将文字识别结果发送到主线程。更多API详情请点击下方官网链接。

ITextDetector.detect()官网介绍:

https://developer.harmonyos.com/cn/docs/documentation/doc-references/itextdetector-0000001054200044

第二步,智能分词

如图2所示,通过调用API:NluClient.getWordSegment(),将输入的内容根据不同的词语粒度,自动分割为数个关键词。如:在搜索框中输入“有奖征文”,系统会将关键词分成“有奖”和“征文”。具体实现是在代码13行getWordSegment,参数requestData为输入的关键词,然后通过14行的sendResult发送分词结果。更多API详情请点击下方官网链接。

NluClient.getWordSegment()官网介绍:

https://developer.harmonyos.com/cn/docs/documentation/doc-references/nluclient-0000001054518788

第三步,匹配图片

如图3所示,最后一步很简单,就是将分词后的“有奖征文”和图片识别的文字匹配,具体实现是将代码第4行的list(关键词集合)与第5行的imageInfos(图片文字识别结果集合)进行匹配,如果满足匹配条件,就会获取匹配的图片并展示在搜索结果中。至此,就通过了简单的三步完成一个使用AI能力进行图片搜索的应用。

AI能力概述

了解完通用文字识别和分词的AI能力,是不是感觉AI原来离我们这么近,使用起来也这么简单呢?其实除了这两项AI能力以外(如图4所示),HarmonyOS还支持文档检测校正、文字图像超分、IM类意图识别、语音识别、语音播报等13类AI能力,开箱即用,开发者可以灵活、便捷地选择AI能力,使应用变得更加智能。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像信息
    +关注

    关注

    0

    文章

    5

    浏览量

    6736
  • AI
    AI
    +关注

    关注

    87

    文章

    26430

    浏览量

    264035
  • 文字识别
    +关注

    关注

    0

    文章

    16

    浏览量

    8596
  • OCR
    OCR
    +关注

    关注

    0

    文章

    137

    浏览量

    16124
  • HarmonyOS
    +关注

    关注

    79

    文章

    1814

    浏览量

    29257

原文标题:萌新也能开发AI应用?立即在线体验

文章出处:【微信号:gh_019562b5fb4b,微信公众号:gh_019562b5fb4b】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    开发者手机 AI - 目标识别 demo

    功能简介 该应用是在Openharmony 4.0系统上开发的一个目标识别AI应用,旨在从上到下打通Openharmony AI子系统,展示Openharmony系统的AI能力,并为
    发表于 04-11 16:14

    HarmonyOS开发技术全面分析

    的快速连接、能力互助、资源共享,匹配合适的设备、提供流畅的全场景体验。 ⚫ 对应用开发者而言, HarmonyOS 采用了多种分布式技术,使得应用程序的开发实现与不同终端设备的形态差异无关,降低了开发
    发表于 02-21 16:31

    持续构建行业影响力|HarmonyOS SDK荣膺年度“技术卓越”奖项

    技术卓越”奖项。 通过关键能力底层化,通用能力全局化,HarmonyOS SDK 提供了应用框架、应用服务、系统、媒体、图形、AI 六大领域、80 多个 Kit 丰富完备的开放能
    发表于 01-12 09:33

    什么是AI视频识别分析

    视频AI识别分析是指利用人工智能技术对视频数据进行智能化检测、分析和提取有用信息的过程。通过视频AI分析,可以自动化地识别、检测和理解视频中
    的头像 发表于 12-02 08:26 868次阅读
    什么是<b class='flag-5'>AI</b>视频<b class='flag-5'>识别</b>分析

    成都华江信息AI人脸识别原理浅析# 人脸识别

    AI边缘计算
    成都华江信息
    发布于 :2023年11月24日 16:35:54

    【KV260视觉入门套件试用体验】Vitis AI Library体验之OCR识别

    翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供
    发表于 10-16 23:25

    【KV260视觉入门套件试用体验】七、VITis AI字符和文本检测(OCR&amp;Textmountain)

    视觉领域的重要问题,主要是识别和理解图像或视频中的文字信息。字符检测和识别(OCR)技术最早在1929年由德国科学家Tausheck提出,定义为将印刷体的字符从纸质文档中
    发表于 09-26 16:31

    【KV260视觉入门套件试用体验】六、VITis AI车牌检测&amp;车牌识别

    视觉技术实现的自动识别车辆牌照号码的过程。该技术通过图像采集、车牌检测、字符分割和字符识别等步骤,实现对车牌号码的自动获取与识别。车牌
    发表于 09-26 16:28

    OpenVINO场景文字检测与文字识别教程

    OpenVINO是英特尔推出的深度学习模型部署框架,当前最新版本是OpenVINO2023版本。OpenVINO2023自带各种常见视觉任务支持的预训练模型库Model Zoo,其中支持场景文字检测
    的头像 发表于 09-24 15:31 725次阅读
    OpenVINO场景<b class='flag-5'>文字</b>检测与<b class='flag-5'>文字</b><b class='flag-5'>识别</b>教程

    AI智能呼叫中心

    可以自动识别和响应来电,通过分析用户的语音、文字和情绪等信息,并给出针对性的应答,与传统的人工处理相比,AI智能呼叫中心能够实现24/7不间断的服务,大幅提高了处理效率和用户满意度。二、个性化服务
    发表于 09-20 17:53

    使用LabVIEW 实现物体识别、图像分割、文字识别、人脸识别等深度视觉

    LabVIEW可以实现深度学习嘛,今天我们一起来看看使用LabVIEW 实现物体识别、图像分割、文字识别、人脸识别等深度视觉
    的头像 发表于 08-11 16:02 905次阅读
    使用LabVIEW 实现物体<b class='flag-5'>识别</b>、图像分割、<b class='flag-5'>文字</b><b class='flag-5'>识别</b>、人脸<b class='flag-5'>识别</b>等深度视觉

    华为发布HarmonyOS 4:AI升级与新技术引领行业趋势

    亲 爱的朋友,欢迎收看河套IT WALK总第91期。 华为发布HarmonyOS 4:AI升级与新技术引领行业趋势 8月4日,华为发布了HarmonyOS 4,这是一个功能强大的操作系
    的头像 发表于 08-07 19:10 374次阅读
    华为发布<b class='flag-5'>HarmonyOS</b> 4:<b class='flag-5'>AI</b>升级与新<b class='flag-5'>技术</b>引领行业趋势

    AI像自来水一样简单,华为云通用AI解决方案体验

    前言 通用AI是一种能够像人类一样进行思考、学习和推理的人工智能系统。与特定领域的人工智能不同,通用AI可以处理各种类型的任务,包括自然语言处理、图像
    的头像 发表于 07-07 16:27 219次阅读
    让<b class='flag-5'>AI</b>像自来水一样简单,华为云<b class='flag-5'>通用</b><b class='flag-5'>AI</b>解决方案体验

    AI提取图片里包含的文字信息-解决文字无法复制的痛点

    这个文字识别接口里不仅仅有通用文字识别功能,还支持很多其他功能:比如身份证、驾驶证、保险单、手写文本、火车票,行驶证.......等等功能。
    的头像 发表于 07-07 09:37 1029次阅读
    <b class='flag-5'>AI</b>提取图片里包含的<b class='flag-5'>文字</b>信息-解决<b class='flag-5'>文字</b>无法复制的痛点

    图片文字识别:揭开数字世界的神秘面纱

    随着数字化时代的到来,我们生活中的大部分数据都以图片的形式存在。然而,这些图片中蕴含的信息往往比文字更丰富,如何从这些图片中提取有价值的信息,是数字世界中一个十分重要的问题。这时,图片文字识别
    的头像 发表于 05-11 18:20 410次阅读