0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浅析HarmonyOS基于AI的通用文字识别技术

DRXU_gh_019562b 来源:HarmonyOS开发者 作者:HarmonyOS开发者 2021-08-20 10:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在资讯大爆炸的时代,我们经常面临文件、图片找不到的情况,HarmonyOS基于AI的通用文字识别技术,可以有效帮助我们解决这些难题。

基于AI的通用文字识别,将OCR技术和AI分词技术集成,可以对图像信息进行文字检测、识别和关键信息提取,并根据分析结果提供翻译、搜索等相关服务。

通用文字识别的核心技术是OCR【Optical Character Recognition,光学字符识别】,OCR是一种通过拍照、扫描等光学输入方式,把各种票据、卡证、表格、报刊、书籍等印刷品文字转化为图像信息,再利用文字识别技术将图像信息转化为计算机等设备可以使用的字符信息的技术。

AI分词是对于一段输入文本,自动进行分词,同时提供不同的分词粒度。

接下来我们将通过一个“AI文字识别”Demo,为你展示如何三步完成AI应用的开发,心动不如行动,复制下方链接,抢先体验吧~HarmonyOS应用开发在线体验:https://playground.harmonyos.com/#/cn/onlineDemo

AI文字识别Demo

如下视频所示,点击在线体验链,进入 “AI文字识别”Demo后,会看到图片列表中已经收录不同图片,接着在输入框中输入关键词,点击识别搜索后,会弹出一个提示框,点击提示框的“下一步”,搜索结果列表就会展示与关键词相关的图片。

只需输入关键词,就可以匹配得到我们想要的图片,再也不用惧怕茫茫图海中找不到图的窘境了。如此方便高效的AI应用,只需三步就能完成,接下来我们将我大家揭秘是此AI应用如何通过三步完成的 。

第一步,图片文字识别

如图1所示,通过调用API:ITextDetector.detect(),对图片上的文字进行识别。具体实现是在代码21行的textDetector,此处传入了需要识别的Image( “有奖征文”图)和一个 text组件,text组件将保存Image识别的结果,然后通过22行的sendResult将文字识别结果发送到主线程。更多API详情请点击下方官网链接。

ITextDetector.detect()官网介绍:

https://developer.harmonyos.com/cn/docs/documentation/doc-references/itextdetector-0000001054200044

第二步,智能分词

如图2所示,通过调用API:NluClient.getWordSegment(),将输入的内容根据不同的词语粒度,自动分割为数个关键词。如:在搜索框中输入“有奖征文”,系统会将关键词分成“有奖”和“征文”。具体实现是在代码13行getWordSegment,参数requestData为输入的关键词,然后通过14行的sendResult发送分词结果。更多API详情请点击下方官网链接。

NluClient.getWordSegment()官网介绍:

https://developer.harmonyos.com/cn/docs/documentation/doc-references/nluclient-0000001054518788

第三步,匹配图片

如图3所示,最后一步很简单,就是将分词后的“有奖征文”和图片识别的文字匹配,具体实现是将代码第4行的list(关键词集合)与第5行的imageInfos(图片文字识别结果集合)进行匹配,如果满足匹配条件,就会获取匹配的图片并展示在搜索结果中。至此,就通过了简单的三步完成一个使用AI能力进行图片搜索的应用。

AI能力概述

了解完通用文字识别和分词的AI能力,是不是感觉AI原来离我们这么近,使用起来也这么简单呢?其实除了这两项AI能力以外(如图4所示),HarmonyOS还支持文档检测校正、文字图像超分、IM类意图识别、语音识别、语音播报等13类AI能力,开箱即用,开发者可以灵活、便捷地选择AI能力,使应用变得更加智能。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像信息
    +关注

    关注

    0

    文章

    7

    浏览量

    6937
  • AI
    AI
    +关注

    关注

    91

    文章

    42376

    浏览量

    303360
  • 文字识别
    +关注

    关注

    0

    文章

    19

    浏览量

    8920
  • OCR
    OCR
    +关注

    关注

    0

    文章

    177

    浏览量

    17320
  • HarmonyOS
    +关注

    关注

    80

    文章

    2157

    浏览量

    36525

原文标题:萌新也能开发AI应用?立即在线体验

文章出处:【微信号:gh_019562b5fb4b,微信公众号:gh_019562b5fb4b】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    浅析AI COMPUTING领域的热管理关键技术路径

    如何在有限的空间内高效散热,保障AI集群稳定、可靠、高效运行,已成为推动产业持续进阶的基石。安富利始终关注前沿技术趋势与客户实际需求,本文将结合全球热管理领导者宝德(BOYD)的技术与方案,
    的头像 发表于 05-11 10:08 426次阅读
    <b class='flag-5'>浅析</b><b class='flag-5'>AI</b> COMPUTING领域的热管理关键<b class='flag-5'>技术</b>路径

    使用NORDIC AI的好处

    运动/手势识别、可穿戴健康监测、预测性维护、楼宇与工业传感网络本地分析、声音/关键词/图像识别等,都有官方明确提到的典型用例。[Unlock Edge AI 博客; Nordic Edge
    发表于 01-31 23:16

    瑞芯微(EASY EAI)RV1126B OCR文字识别

    1.OCR文字识别简介文字识别也是图像领域一个常见问题。然而,对于自然场景图像,首先要定位图像中的文字位置,然后才能进行
    的头像 发表于 01-12 10:19 7689次阅读
    瑞芯微(EASY EAI)RV1126B OCR<b class='flag-5'>文字</b><b class='flag-5'>识别</b>

    【飞凌OK-MX9596-C开发板试用】③云端AI拍照识别

    ://cloud.baidu.com/ 可以看到功能丰富,有语音技术文字识别、人脸识别、自然语言处理(翻译)等。 注册账号后 创建应用——>
    发表于 11-01 22:12

    QCon·上海站HarmonyOS开发者技术分论坛:共探鸿蒙开发新机遇

    当前,AI 技术重构开发逻辑、多设备协同成为技术主流,鸿蒙开发能力正迎来从“能用好用”到“实用便捷”的关键跃迁。10月24日,2025年QCon全球软件开发大会上海站HarmonyOS
    的头像 发表于 10-24 15:59 1065次阅读
    QCon·上海站<b class='flag-5'>HarmonyOS</b>开发者<b class='flag-5'>技术</b>分论坛:共探鸿蒙开发新机遇

    RK3576助力智慧安防:8路高清采集与AI识别

    在智慧城市和数字化园区的建设过程中,安防监控系统正从“被动记录”走向“主动识别与分析”。随着AI算法的成熟和高清视频处理能力的提升,市场对多路视频采集、实时拼接、智能识别的需求日益增强。 米尔电子
    发表于 08-22 17:41

    【EASY EAI Orin Nano开发板试用体验】PP-OCRV5文字识别实例搭建与移植

    【EASY EAI Orin Nano开发板试用体验】PP-OCRV5文字识别实例搭建与移植 PP-OCRV5是PP-OCR新一代文字识别解决方案, 该方案聚焦于多场景、多
    发表于 08-18 16:57

    HarmonyOSAI编程DevEco AI辅助编程工具

    DevEco AI辅助编程工具(CodeGenie)基于BitFun Platform AI能力平台,为开发者提供高效的应用与服务AI编程支持,支持智能知识问答、代码生成、页面生成、万能卡片生成
    发表于 08-18 14:54

    HarmonyOS AI辅助编程工具(CodeGenie)概述

    DevEco AI辅助编程工具(CodeGenie)基于BitFun Platform AI能力平台,为开发者提供高效的应用与服务AI编程支持,支持智能知识问答,同时支持ArkTS代码生成和万能卡片
    发表于 08-11 14:31

    HarmonyOS AI辅助编程工具(CodeGenie)代码智能解读

    本功能从DevEco CodeGenie 5.1.0 Beta版本开始支持。 CodeGenie提供智能AI能力对框选的代码片段进行逐条解释,总结代码段含义,帮助开发者提升阅读代码的速度和效率
    发表于 07-17 17:02

    HarmonyOS AI辅助编程工具(CodeGenie)报错分析

    解决方案。 3.CodeGenie分析后,点击编辑区Shift+Ctrl+Y,接受AI提供的修复方案;点击Shift+Ctrl+N拒绝。或右侧对话窗口中Accept All/Reject All按钮,快速接受/拒绝所有修改。 以上材料主要参考引用HarmonyOS官方文档
    发表于 07-11 17:48

    HarmonyOS AI辅助编程工具(CodeGenie)UI生成

    UI Generator基于BitFun Platform AI能力平台,用于快速生成可编译、可运行的HarmonyOS UI工程,支持基于已有UI布局文件(XML),快速生成
    发表于 07-10 11:51

    端侧OCR文字识别实现 -- Core Vision Kit ##HarmonyOS SDK AI##

    ,使用场景中就包括了“通用文字识别”,即我们前文中所说的ocr功能。 其整体流程概括为: 首先通过各种方法得到一张图片,例如拍照、从相册中选择、甚至你也可以通过canvas画布生成的图片或者通过组件
    发表于 06-30 18:07

    同步电机失步浅析

    纯分享帖,需要者可点击附件免费获取完整资料~~~*附件:同步电机失步浅析.pdf【免责声明】本文系网络转载,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,删除内容!
    发表于 06-20 17:42

    鸿蒙5开发宝藏案例分享---AI辅助图文内容高效编创

    图片自动抠图 图片文字智能识别 HDR Vivid高清渲染 无缝接续编辑 编辑内容实时同步多设备 分布式文件系统自动同步素材 三、关键功能实现详解 1. AI图片处理(OCR+抠图) // 开启图片智能分析
    发表于 06-12 11:40