0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为什么赛灵思技术成为开发OCR解决方案的不二之选?

YCqV_FPGA_EETre 来源:FPGA开发圈 作者:Softnautics 2020-10-26 09:53 次阅读

作者:Softnautics 市场营销总监Prasant Agarwal

解决方案总监 Ranganathan SK

文本是人类最具智慧、最有影响力的创造之一。文本中所蕴含的丰富、精确的高级语义可以帮助我们理解周遭世界,并用于构建可部署在真实环境中的自主运行解决方案。因此,自然环境下的自动文本读取,也称为场景文本检测/识别或 Photo OCR(Optical Character Recognition,光学字符识别),已成为计算机视觉领域中关注度和重要性日益提高的研究课题。

随着人类语言书写形式的演进,已经发展出数千种独特的字体系。再加上大小写(大写/小写/全大全小/小型大写)、斜体(意大利体/罗马体)、缩放体(横向缩放)、粗细、指定大小(显示/文本)、波痕体、衬线(总体分为衬线体和无衬线体),这一数量可以扩充到数百万,使得文本识别成为机器学习领域中一个振奋人心的专业学科。

为什么赛灵思技术成为开发 OCR 解决方案的不二之选?

如今,赛灵思丰富多样的强大平台已为 70% 的新开发提供支持,引领着基于 FPGA 系统的设计发展趋势。Softnautics 之所以选择赛灵思技术来实现这个解决方案,是因为它同时集成了 Vitis AI 堆栈和强大的硬件功能。

赛灵思 Vitis 是一款免费、开源的开发平台,可将硬件模块封装成软件可调用功能,同时与标准的开发环境、工具和开源库兼容。它能够根据软件和算法自动适配赛灵思硬件,无需具备 VHDL 或 Verilog 专业知识。

选择正确的赛灵思平台

综合全面且丰富多样的赛灵思工具集和生态系统使原型设计成为高度可预测的过程,这有助于加快解决方案的开发速度,从而将总体开发时间缩短高达 70%。

Softnautics 选择赛灵思 Ultrascale+ 平台是因为它提供了最优秀的应用处理和 FPGA 加速功能。此外,它还提供了优异的高层次综合(HLS)功能。与此前的平台相比,系统级单位功耗性能提高了 4 倍。它支持赛灵思 Vitis AI,后者为使用加速库构建 AI 推断提供了广泛功能。

Softnautics 采用了赛灵思 Vitis AI 堆栈并运用该软件提供加速,开发出混合应用,同时实现了 LSTM 功能,通过将 TensorFlow-lite 移植/迁移到 ARM 进行有效的序列预测。它使用 N2Cube 软件在处理侧(PS)运行。图像预处理/后处理通过 Vivado 使用 HLS 实现,而 Vitis 的作用是使用连接文本提议网络(CTPN)完成推断。最终,Softnautics 将该解决方案用于视频流水线中的实时场景文本检测,并使用可靠的数据集对模型进行改进。

场景文本检测

目前已有多种实现方案可供使用,新的实现方案也在研究中。在自然场景进行文本检测和识别时,仍然可能会遇到一系列的艰巨挑战。与文档中的脚本相比,自然场景下的检测和识别困难主要源于以下三大差异:

语言、颜色、字体、大小、方向等造成的多样化和可变性 书写文本的背景色彩鲜艳 场景文本的纵横比和布局可能会有很大的不同

这种解决方案广泛适用于要求对视频流进行实时文本检测的众多领域,具有较高的精确度和快速识别能力。部分典型应用领域如:
泊车验证 — 一些市镇按照城市规定正在使用移动 OCR 自动验证车辆是否按照市镇规定泊车。城市泊车检查员使用配备有 OCR 功能的移动设备扫描车辆牌照,并通过在线数据库查看是否允许该车辆泊车。 移动文档扫描 — 各种移动应用允许用户为文档拍照,然后将其转换成文本。与采用传统的文档扫描仪相比,这种 OCR 工作的难度更大,因为照片在图像角度、光照条件和文本质量方面往往无法预测。 数字资产管理 — 该软件有助于对图像、视频和动画等富媒体资产进行组织管理。DAM 系统的主要特征之一就是能搜索富媒体。通过在上传的图像和视频帧上运行 OCR,DAM 能让富媒体变得可搜索,并使用有意义的标签丰富它。

Softnautics 团队一直深耕基于赛灵思 FPGA 的解决方案,在赛灵思技术方面积累了丰富的经验,并深刻理解各种复杂性。因此,该公司仅用不到四个星期便推动这一解决方案从构思到概念验证的飞速进展。依托公司针对端到端解决方案构建的专业知识,您能够在赛灵思平台上借助最快速的概念实现服务,可视化您的构想,大幅加快上市进程。

原文标题:智能 OCR 解决方案使用 Xilinx Ultrascale+ 和 Vitis AI 进行开发

文章出处:【微信公众号:FPGA开发圈】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1593

    文章

    21211

    浏览量

    592196
  • 赛灵思
    +关注

    关注

    32

    文章

    1793

    浏览量

    130452
  • AI
    AI
    +关注

    关注

    87

    文章

    26153

    浏览量

    263716
  • OCR
    OCR
    +关注

    关注

    0

    文章

    137

    浏览量

    16104

原文标题:智能 OCR 解决方案使用 Xilinx Ultrascale+ 和 Vitis AI 进行开发

文章出处:【微信号:FPGA-EETrend,微信公众号:FPGA开发圈】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    有偿求助.芯片方案

    芯片电路图方案
    发表于 01-12 18:19

    AD9625的开发板AD-FMCADC3-EBZ能否与Virtex7直接连接?

    模数转换器AD9625的评估板AD-FMCADC3-EBZ能不能和的Virtex7系列FPGA开发板连接,我看到他们都具备JESD204B接口,物理接口上能直接连吗?还是说需要在
    发表于 12-08 08:25

    全球FPGA市场现状和发展前景展望

    中国快速发展的PLD市场,特别成立了两个专门的产品小组分别负责数字信号处理和低成本消费电子解决方案开发
    发表于 11-08 17:19

    【KV260视觉入门套件试用体验】Vitis AI Library体验OCR识别

    翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。如何除错或利用
    发表于 10-16 23:25

    【KV260视觉入门套件试用体验】Vitis AI 构建开发环境,并使用inspector检查模型

    、低成本的 AI 解决方案。 Vitis AI 可以做什么? Vitis AI 可以做很多事情,例如: 优化和编译深度学习模型,使其适应硬件平台的架构和性能。 提供丰富的 AI
    发表于 10-14 15:34

    【KV260视觉入门套件试用体验】七、VITis AI字符和文本检测(OCR&Textmountain)

    视觉领域的重要问题,主要是识别和理解图像或视频中的文字信息。字符检测和识别(OCR技术最早在1929年由德国科学家Tausheck提出,定义为将印刷体的字符从纸质文档中识别出来。随着OCR
    发表于 09-26 16:31

    【KV260视觉入门套件试用体验】三、缺陷检测

    。这些应用是完整、可量产的端到端解决方案,专门支持常 见的视觉用例。加速应用在可编程逻辑区域包含一个预优化的视觉流水线加速器。开发
    发表于 09-26 15:17

    儒卓力系统解决方案提高开发效率

      儒卓力系统解决方案(Rutronik System Solutions) 基础板集成到英飞凌ModusToolboxTM开发环境中,提高新应用的开发效率 英飞凌ModusToolboxTM
    的头像 发表于 09-08 14:19 369次阅读

    VisionFive 2单板计算机成功支持Docker容器解决方案

    家庭、智慧零售、智慧能源等设备、场景和行业。 昉科技扎根中国,放眼世界,矢志于成为全球RISC-V技术和生态的推动者和领导者。未来,昉科技将继续加强与供应商、分销商、软件
    发表于 09-08 11:45

    大模型时代的OCR,“CPU” 的味道更重了

    金磊 杨净 发自 凹非寺 量子位 | 公众号 QbitAI 经典技术 OCR (光学字符识别) ,在 大模型 时代下要“变味”了。 怎么说? 我们都知道OCR这个技术在日常生活中已经普
    的头像 发表于 07-08 14:25 279次阅读
    大模型时代的<b class='flag-5'>OCR</b>,“CPU” 的味道更重了

    ADAS和HMI开发是仿真解决方案的新应用领域

    仿真技术有望减少开发时间及成本并简化产品开发流程,它点燃了全球汽车仿真解决方案市场。
    发表于 06-28 15:04 291次阅读

    激光焊锡设备,不二

    激光焊接
    YS YYDS
    发布于 :2023年05月22日 16:14:00

    报名开启!开放原子开源大赛OpenHarmony创新来啦!

    及全场景OpenHarmony解决方案,促进万物互联产业的繁荣发展。本大赛面向所有OpenHarmony开发者,只要完成注册,认证即可报名参与OpenHarmony创新,获取OpenHarmony开源
    发表于 05-17 16:52

    开启新时代,承接新使命,开放原子开源大赛OpenHarmony创新正式启航!

    应用开发技术,打造竞技交流赛事,旨在提高开发者的动手实践能力以及运用新技术的创新创造能力。 通过本次大赛,期望达到以促用、以
    发表于 04-23 11:15