0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

应用的编程环境HALCON18.05

新机器视觉 来源:MrCode 作者:MrCode 2021-04-18 10:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

最近特无聊是吧,那在家学点做点科技类的小事业吧。

应用的编程环境HALCON18.05,这里讲一种常用套路

*表示程序注释

1.采图或者自己写下字母和数字,分成训练与识别两个部分;

2.阈值分割出字符;

3.创建手写体识别器;

4.训练该识别器;

5.执行识别;

具体过程如下:

**--------------------------------------

*(1) Training of the OCR ofhandwrite letter

* 关闭更新

dev_update_off()

* Set theimage path (make sure, that you have set HALCONIMAGES to the HALCON imagedirectory)

*

* Step 0:Preparations 文件路径

FontName:= 'E:/Halcon/OCR/handwirteC/'

*

* Step 1:Segmentation 读图与字符分割

dev_update_window('off')

dev_get_window(WindowHandle)

read_image(Image,FontName+ '/handword1.jpg')

aafcc4e6-9fbb-11eb-8b86-12bb97331649.jpg

有时间可以写各种字符,每个相同字符多写几次,越多越好,增加训练的精准度;

把这栏作为训练样本

ab2b518a-9fbb-11eb-8b86-12bb97331649.png

阈值分割出字符。注意:这里要用一次膨胀,把i与j这些字符的点与字符体连接在一起,构成一个整体字符;

ab447d04-9fbb-11eb-8b86-12bb97331649.jpg

threshold(ImageReduced, RawSegmentation, 0, 75)

* Connectthe i's and j's with their dots

* 将i与j的点与线连接起来,构成一个整体

dilation_circle(RawSegmentation, RegionDilation, 19)

dev_set_color('green')

dev_display(RegionDilation)

connection(RegionDilation, ConnectedRegions)

* Reduceeach connected component (character) to its original shape

intersection(ConnectedRegions, RegionDilation, RegionIntersection)

count_obj(ConnectedRegions, Number)

sort_region(RegionIntersection, FinalLetters, 'first_point', 'true', 'column')

*Displaysegments

*显示分割块

dev_clear_window()

dev_display(ImageReduced)

dev_set_color('green')

dev_set_line_width(2)

dev_set_shape('rectangle1')

dev_set_draw('margin')

dev_display(FinalLetters)

我们来检查一下各个字符的分割与排序情况,尤其是对于i,j这类字符有没有实现整体性

ab70ea9c-9fbb-11eb-8b86-12bb97331649.png

我们看到20个字母被分割成了21个,原因就是这个j 没有被构成一个整体。然后我们再次调整一下dialation参数到22,并且注意也被膨胀太多了把相邻字母也连进来了

dilation_circle(RawSegmentation, RegionDilation, 22)

这次很好,20个字母完整分割

ab942b2e-9fbb-11eb-8b86-12bb97331649.jpg

* Step2: Training filegeneration

* 把teacher信号自己手写进来,创建训练文件TrainingFileName,训练文件都是.trf格式的,可以在硬盘里查询到。

*这里我们用append的函数把teacher信号一个一个地与被训练字符联系起来。

TrainingNames:=['b','b','a','b','d','c','e','f','h','i','i','i','d','c','e','e','g','j','i','h']

*训练文件TrainingFileName

TrainingFileName:= FontName + 'TrainingFile.trf'

sort_region(FinalLetters, SortedRegions, 'first_point', 'true', 'column')

shape_trans(SortedRegions, RegionTrans, 'rectangle1')

area_center(RegionTrans, Area, Row, Column)

MeanRow:= mean(Row)

dev_set_check('give_error')

for I :=0 to |TrainingNames| -1by 1

select_obj (SortedRegions, CharaterRegions,I+1)

append_ocr_trainf (CharaterRegions, Image,TrainingNames[I], TrainingFileName)

disp_message(WindowHandle, TrainingNames[I], 'image', MeanRow - 140, Column[I] - 6,'yellow', 'false')

endfor

abaa7744-9fbb-11eb-8b86-12bb97331649.png

可以查询一下训练文件

abb3d226-9fbb-11eb-8b86-12bb97331649.png

abbfb1d6-9fbb-11eb-8b86-12bb97331649.png

* Step3: Training 执行训练

CharNames:= uniq(sort(TrainingNames))

create_ocr_class_mlp(8, 10, 'constant', 'default', CharNames, 10, 'none', 10, 42, OCRHandle)

trainf_ocr_class_mlp(OCRHandle, TrainingFileName, 200, 1, 0.01, Error, ErrorLog)

*write_ocr_class_mlp产生一个.omc文件

write_ocr_class_mlp(OCRHandle, FontName+'Classifier')

clear_ocr_class_mlp(OCRHandle)

_________________________________

Do OCR执行识别

打开新的图片,建立被识别区域,步骤如下

abe85226-9fbb-11eb-8b86-12bb97331649.jpg

* Step 0: Preparations

FontName :='E:/Halcon/OCR/handwirteC/'

TrainingDocument:=FontName+'Classifier.omc'

*TrainingDocument:=FontName+'Class1.omc'

*

* Step 1: Segmentation

dev_update_window ('off')

dev_get_window (WindowHandle)

read_image (Image,FontName+'/handword1.jpg')

gen_rectangle1 (ROI_new, 2077.7,301.848, 2327.78, 2235.87)

reduce_domain (Image, ROI_new,ImageReducedNew)

binary_threshold (ImageReducedNew,Region_1, 'max_separability', 'dark', UsedThreshold1)

dilation_circle (Region_1,RegionDilation, 25.5)

dev_set_color ('green')

dev_display (RegionDilation)

connection (RegionDilation,ConnectedRegions)

intersection (ConnectedRegions,RegionDilation, RegionIntersection)

sort_region (RegionIntersection,Characters, 'character', 'true', 'row')

在这里,我们还是要查看一下膨胀的设置是否正确,尤其对于i,j类字符

ac0322ea-9fbb-11eb-8b86-12bb97331649.png

*Step 3 读取分类器

read_ocr_class_mlp(TrainingDocument, OCRHandle1)

*Classification

do_ocr_multi_class_mlp(Characters, Image, OCRHandle1, Class, Confidence)

* Step 4 Display results

area_center(Characters, Area, Row, Column)

dev_display(Image)

set_display_font(WindowHandle, 16, 'sans', 'true', 'false')

disp_message(WindowHandle, Class, 'image', Row - 146, Column + 8, 'blue', 'false')

*set_display_font(WindowHandle, 16, 'mono', 'true', 'false')

disp_message(WindowHandle, 'Classification result', 'window', 12, 12, 'black', 'true')

ac0e62a4-9fbb-11eb-8b86-12bb97331649.jpg

我们看到手写体的确不容易做好,这里与训练样本有关系,所以需要更大的样本量来优化识别器。

这里我们可以打开训练文件.trf,在不自己继续添加样本的情况下做一下无监督学习,把已有的字体做扭曲与各种变换的训练。

然后再次训练这个.trf文件,替换掉之前的训练文件。

ac4954d6-9fbb-11eb-8b86-12bb97331649.jpg

ac536cc8-9fbb-11eb-8b86-12bb97331649.jpg

ac5ced3e-9fbb-11eb-8b86-12bb97331649.jpg

训练完后,再次读取新的分类器,执行OCR, 这里重复代码

*Step 3 读取分类器

read_ocr_class_mlp(TrainingDocument, OCRHandle1)

*Classification

do_ocr_multi_class_mlp(Characters, Image, OCRHandle1, Class, Confidence)

* Step 4 Display results

area_center(Characters, Area, Row, Column)

dev_display(Image)

set_display_font(WindowHandle, 16, 'sans', 'true', 'false')

disp_message(WindowHandle, Class, 'image', Row - 146, Column + 8, 'blue', 'false')

*set_display_font(WindowHandle, 16, 'mono', 'true', 'false')

disp_message(WindowHandle, 'Classification result', 'window', 12, 12, 'black', 'true')

我们看到,新的识别器(上图)效果好于第一次的识别器(下图)

从 7/12提高到8/12

ac6fd28c-9fbb-11eb-8b86-12bb97331649.png

ac8f7632-9fbb-11eb-8b86-12bb97331649.png

最后有必要就可以写操作界面了, 这里不再赘述

ac9c8296-9fbb-11eb-8b86-12bb97331649.png

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编程
    +关注

    关注

    90

    文章

    3708

    浏览量

    96766
  • 阈值
    +关注

    关注

    0

    文章

    124

    浏览量

    18904
  • 识别器
    +关注

    关注

    0

    文章

    24

    浏览量

    7826

原文标题:在家做手写体识别器

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    一文了解Mojo编程语言

    Mojo 是一种由 Modular AI 公司开发的编程语言,旨在将 Python 的易用性与 C 语言的高性能相结合,特别适合人工智能(AI)、高性能计算(HPC)和系统级编程场景。以下是关于
    发表于 11-07 05:59

    编程逻辑控制器PLC是什么?如何实现上网通信?

    编程逻辑控制器(PLC)是一种专为工业环境设计的数字运算操作电子系统,其核心是通过可编程存储器存储逻辑运算、顺序控制、定时、计数和算术运算等指令,并通过数字或模拟输入/输出控制各类机械或生产过程
    的头像 发表于 09-22 17:27 616次阅读

    信捷XS STUDIO编程软件V2.3.2版本的全新功能

    XS Studio(V2.3.2)编程软件,是面向XS系列的编程组态软件,集成了PLC编程、可视化HMI、安全PLC、控制器实时核、现场总线及运动控制功能,提供了一套完整的包括配置、编程
    的头像 发表于 09-20 14:19 1510次阅读
    信捷XS STUDIO<b class='flag-5'>编程</b>软件V2.3.2版本的全新功能

    物联网平台应用环境监控:低代码零编程简化开发,组态应用

    传统环境监控系统开发常陷入两难困境,企业开发周期长、开发维护成本贵,基层运维人员不懂技术,遇到参数调整只能依赖IT团队。而物联网平台驱动的环境监控系统,以低代码零编程为核心,通过“可视化组态应用”将
    的头像 发表于 08-29 15:33 607次阅读

    多功能自动环境监测气象站

    环境监测
    pingao141378
    发布于 :2025年07月22日 17:49:09

    NVIDIA如何让灵巧机器人更加适应环境

    如今,机械臂被广泛应用于装配、包装、检测等众多领域。然而,它们仍需预先编程才能执行特定且往往是重复性的任务。为了满足在大多数环境中对适应性日益增长的需求,需要具备感知能力的机械臂,以便根据
    的头像 发表于 05-09 15:01 861次阅读
    NVIDIA如何让灵巧机器人更加适应<b class='flag-5'>环境</b>

    商汤科技与编程猫达成战略合作

    近日,商汤科技与青少年AI编程教育头部品牌编程猫正式达成战略合作。
    的头像 发表于 04-30 18:13 1508次阅读

    高低温循环装置应用解析:模拟不同温度环境

    -70℃至150℃环境下的长期储存、运输条件,验证其药效衰减周期和包装密封性。技术优势:通过PID控制算法实现±0.5℃精度,支持多阶段升降温编程),复现药品全生命
    的头像 发表于 04-17 15:27 677次阅读
    高低温循环装置应用解析:模拟不同温度<b class='flag-5'>环境</b>

    完整版—单片机编程思想(推荐下载!)

    单片机的编程思想,希望能帮助大家写出简明的代码 内容简介 以单片机裸环境为基础,为编程者定义了一个微操作系统(MOS)的编程环境,并面向应
    发表于 04-16 15:06

    ABB PLC编程手册

    ABB  PLC编程手册
    发表于 02-07 15:23 15次下载

    AN-1306:电源生产环境中ADP1050和ADP1051 EEPROM的编程与校准

    电子发烧友网站提供《AN-1306:电源生产环境中ADP1050和ADP1051 EEPROM的编程与校准.pdf》资料免费下载
    发表于 01-12 10:39 0次下载
    AN-1306:电源生产<b class='flag-5'>环境</b>中ADP1050和ADP1051 EEPROM的<b class='flag-5'>编程</b>与校准

    gitee 支持的编程语言有哪些

    Gitee(码云)是一个基于 Git 的代码托管和研发协作平台,类似于 GitHub 和 GitLab。它支持多种编程语言,允许开发者托管和管理代码,进行版本控制,以及协作开发。以下是一些
    的头像 发表于 01-06 09:50 1108次阅读

    C#通过Halcon实现3D点云重绘

    C# 通过 Halcon 实现 3D 点云重绘
    发表于 01-05 09:16 0次下载

    C#基于Halcon实现Basler相机采图

    C#基于Halcon实现Basler相机采图
    发表于 01-05 09:16 0次下载

    Triton编译器支持的编程语言

    Triton编译器支持的编程语言主要包括以下几种: 一、主要编程语言 Python :Triton编译器通过Python接口提供了对Triton语言和编译器的访问,使得用户可以在Python环境
    的头像 发表于 12-24 17:33 1469次阅读