0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

通过人工智能技术实现钢筋数量统计的整体方案

新机器视觉 来源:新机器视觉 2023-09-05 11:48 次阅读

AI数钢筋”——通过人工智能技术实现钢筋数量统计的整体方案解读。

导读

在社会智能化的发展趋势之下,越来越多的传统行业开始向着数字化的方向转型,而建筑行业也正经历着通过人工智能技术实现的改革。

钢筋是建筑业的重要材料,庞大的数量、工地现场环境复杂以及人工点验错漏等现实因素为钢筋点验工作制造了难度,那么如何才能快速且准确地完成对于整个建筑施工过程极为重要的钢筋点验工作环节呢?今天就带大家了解一下“AI数钢筋”——通过人工智能技术实现钢筋数量统计。

1问题背景

钢筋数量统计是钢材生产、销售过程及建筑施工过程中的重要环节。目前,工地现场是采用人工计数的方式对进场的车辆装载的钢筋进行计数,验收人员需要对车上的钢筋进行现场人工点根,在对钢筋进行打捆后,通过不同颜色的标记来区分钢筋是否计数,在确认数量后钢筋车才能完成进场卸货

这种人工计数的方式不仅浪费大量的时间和精力、效率低下,并且工人长时间高强度的工作使其视觉和大脑很容易出现疲劳,导致计数误差大大增加,人工计数已经不能满足钢筋生产厂家自动化生产和工地现场物料盘点精准性的需求,这种现状促使钢筋数量统计向着智能化方向发展。

所谓“AI数钢筋”就是,通过多目标检测机器视觉方法以实现钢筋数量智能统计,达到提高劳动效率和钢筋数量统计精确性的效果。目标检测算法通过与摄像头结合,可以实现自动钢筋计数,再结合人工修改少量误检的方式,可以智能、高效地完成钢筋计数任务。

2算法介绍

2.1 目标检测介绍

首先,让我们一起了解一下什么是“目标检测”。

目标检测是对图像分类任务的进一步加深,目标检测不仅要识别出图片中各种类别的目标,还要将目标的位置找出来用矩形框框住。

9af8e008-4b9d-11ee-a25d-92fbcf53809c.png

目标检测结果如上图所示,将需要检测的目标检测出来并用边界框框出来,同时在框子上面显示出该目标属于该分类的一个得分情况。

2.2目标检测算法的基本流程

目标检测实际上是要同时解决定位和识别两个问题。传统目标检测算法的基本流程是,首先给定待检测图片,对其进行候选框提取,候选框的提取是通过滑动窗口的方式进行的;再对每个窗口的局部信息进行特征提取;然后对候选区域提取出的特征进行分类判定,判断当前窗口中的对象是目标还是背景;最后采用非极大值抑制(Non-Maximum Suppression,NMS)方法进行筛选,去除重复窗口,找出最佳目标检测位置。

9b0b234e-4b9d-11ee-a25d-92fbcf53809c.png

2.3算法选择

本次钢筋计数任务,将选择单阶段目标检测YOLO系列算法来完成。YOLO系列算法是目前使用最多的目标检测算法,它最大的特点就是检测速度快,并且现在检测精度(即mAP)也逐步提高,因而成为时下最热门的目标检测算法之一。YOLO系列算法一共有5个版本,其中YOLO v1到v3是由同一个作者Joseph设计的,YOLO v4到v5则由其他作者设计,目前YOLO v1到YOLO v4已有相关论文和算法结构设计,而YOLO v5仅有算法结构设计,尚无论文发表,为此我们选择这一较新的YOLO v5算法作为本次钢筋计数算法研究的对象。

9b17f9a2-4b9d-11ee-a25d-92fbcf53809c.png

YOLO算法是将目标检测问题转化为回归问题,使用回归的思想,对给定输入图像,直接在图像的多个位置上回归出这个位置的目标边框以及目标类别。给定一个输入图像,将其划分为S*S的网格,如果某目标的中心落于网格中,则该网格负责预测该目标,对于每一个网格,预测B个边界框及边界框的置信度,包含边界框含有目标的可能性大小和边界框的准确性,此外对于每个网格还需预测在多个类别上的概率。在完成目标窗口的预测之后,根据阈值去除可能性比较低的目标窗口,最后NMS去除冗余窗口即可,整个过程非常简单,不需要中间的候选框生成网络,直接回归便完成了位置和类别的判定。下图是YOLO v5算法基本框架:

9b2adf04-4b9d-11ee-a25d-92fbcf53809c.jpg

由上图可知,YOLO v5主要由输入端、Backbone、Neck以及Prediction四部分组成。其中各部分含义分别为:

Backbone:在不同图像细粒度上聚合并形成图像特征的卷积神经网络

Neck:一系列混合和组合图像特征的网络层,并将图像特征传递到预测层。

Prediction(输出端):对图像特征进行预测,生成边界框和并预测类别。

YOLO v5各组成部分包括的基础组件有:

CBL:由Conv+BN+Leaky_relu激活函数组成

Res unit:借鉴ResNet网络中的残差结构,用来构建深层网络

CSP1_X:借鉴CSPNet网络结构,该模块由CBL模块、Res unint模块以及卷积层、Concate组成

CSP2_X:借鉴CSPNet网络结构,该模块由卷积层和X个Res unint模块Concate组成而成

Focus:首先将多个slice结果Concat起来,然后将其送入CBL模块中

SPP:采用1×1、5×5、9×9和13×13的最大池化方式,进行多尺度特征融合

YOLO v5各组成部分详细介绍

(1)输入端

YOLO v5使用Mosaic数据增强操作提升模型的训练速度和网络的精度;并提出了一种自适应锚框计算与自适应图片缩放方法。

Mosaic数据增强

Mosaic数据增强利用四张图片,并且按照随机缩放、随机裁剪和随机排布的方式对四张图片进行拼接,每一张图片都有其对应的框,将四张图片拼接之后就获得一张新的图片,同时也获得这张图片对应的框,然后我们将这样一张新的图片传入到神经网络当中去学习,相当于一下子传入四张图片进行学习了。该方法极大地丰富了检测物体的背景,且在标准化BN计算的时候一下子计算四张图片的数据,所以本身对batch size不是很依赖。

自适应锚框计算

在YOLO系列算法中,针对不同的数据集,都需要设定特定长宽的锚点框。在网络训练阶段,模型在初始阶段,模型在初始锚点框的基础上输出对应的预测框,计算其与GT框之间的差距,并执行反向更新操作,从而更新整个网络的参数,因此设定初始锚点框是比较关键的一环。在YOLO v3和YOLO v4中,训练不同的数据集,都是通过单独的程序运行来获得初始锚点框。而在YOLO v5中将此功能嵌入到代码中,每次训练时,根据数据集的名称自适应的计算出最佳的锚点框,用户可以根据自己的需求将功能关闭或者打开,指令为:

9b5c8e6e-4b9d-11ee-a25d-92fbcf53809c.png

自适应图片缩放

在目标检测算法中,不同的图片长宽都不相同,因此常用的方式是将原始图片统一缩放到一个标准尺寸,再送入检测网络中。而原始的缩放方法存在着一些问题,由于在实际的使用中的很多图片的长宽比不同,因此缩放填充之后,两端的黑边大小都不相同,然而如果填充的过多,则会存在大量的信息冗余,从而影响整个算法的推理速度。为了进一步提升YOLO v5的推理速度,该算法提出一种方法能够自适应的添加最少的黑边到缩放之后的图片中。具体的实现步骤如下所述:

① 根据原始图片大小以及输入到网络的图片大小计算缩放比例

9b6d1432-4b9d-11ee-a25d-92fbcf53809c.png

②根据原始图片大小与缩放比例计算缩放后的图片大小

9b8be38a-4b9d-11ee-a25d-92fbcf53809c.png

③计算黑边填充数值

9b9cb23c-4b9d-11ee-a25d-92fbcf53809c.png

其中,416表示YOLO v5网络所要求的图片宽度,312表示缩放后图片的宽度。首先执行相减操作来获得需要填充的黑边长度104;然后对该数值执行取余操作,即104%32=8,使用32是因为整个YOLOv5网络执行了5次下采样操作。最后对该数值除以2,也就是将填充的区域分散到两边。这样将416*416大小的图片缩小到416*320大小,因而极大地提升了算法的推理速度。

(2)Backone 网络

Focus结构

Focus对图片进行切片操作,具体操作是在一张图片中每隔一个像素拿到一个值,类似于邻近下采样,这样就拿到了四张图片,四张图片互补,长的差不多,但是没有信息丢失,因此将W、H信息就集中到通道空间,输入通道扩充了4倍,即拼接起来的图片相对于原先的RGB三通道模式变成了12个通道,最后将得到的新图片再经过卷积操作,最终得到了没有信息丢失情况下的二倍下采样特征图。如下图所示,原始输入图片大小为608*608*3,经过Slice与Concat操作之后输出一个304*304*12的特征映射;接着经过一个通道个数为32的Conv层,输出一个304*304*32大小的特征映射。

9bb151a6-4b9d-11ee-a25d-92fbcf53809c.png

CSP结构

CSPNet主要是将feature map拆成两个部分,一部分进行卷积操作,另一部分和上一部分卷积操作的结果进行concate。在分类问题中,使用CSPNet可以降低计算量,但是准确率提升很小;在目标检测问题中,使用CSPNet作为Backbone带来的提升比较大,可以有效增强CNN的学习能力,同时也降低了计算量。YOLO v5设计了两种CSP结构,CSP1_X结构应用于Backbone网络中,CSP2_X结构应用于Neck网络中。

(3)Neck网络

在YOLO v4中开始使用FPN-PAN。其结构如下图所示,FPN层自顶向下传达强语义特征,而PAN塔自底向上传达定位特征。

9bd46376-4b9d-11ee-a25d-92fbcf53809c.png

YOLO v5的Neck仍采用了FPN+PAN结构,但是在它的基础上做了一些改进操作,YOLO v4的Neck结构中,采用的都是普通的卷积操作,而YOLO v5的Neck中,采用CSPNet设计的CSP2结构,从而加强了网络特征融合能力。

(4)输出端

YOLO v5采用CIOU_LOSS 作为bounding box 的损失函数,分类分支采用的loss是BCE,conf分支也是BCE。

YOLO v5中最有亮点的改变是对正样本的定义。在YOLO v3中,其正样本区域也就是anchor匹配策略非常粗暴:保证每个gt bbox一定有一个唯一的anchor进行对应,匹配规则就是IOU最大,并且某个gt一定不可能在三个预测层的某几层上同时进行匹配。然而,我们从FCOS等论文中了解到,增加高质量的正样本anchor能够加速模型收敛并提高召回。因此,YOLO v5对此做出了改进,提出匹配规则:

采用shape匹配规则,分别将ground truth的宽高与anchor的宽高求比值,如果宽高比例小于设定阈值,则说明该GT和anchor匹配,将该anchor认定为正样本。否则,该anchor被滤掉,不参与bbox与分类计算。

将GT的中心最邻近网格也作为正样本anchor的参考点。因此,bbox的xy回归分支的取值范围不再是0-1,而是-0.5-1.5(0.5是网格中心偏移),因为跨网格预测了

YOLO v5算法目前根据网络大小分为5n、5s、5m、5l、5x,具体参数量大小、单帧、检测速度和mAP如下图所示。

9bea0fa0-4b9d-11ee-a25d-92fbcf53809c.png

3训练模型

3.1 数据集选择

我们选择公开钢筋计数数据集进行模型训练,可以从以下网址中获取数据集进行测试。https://www.datafountain.cn/competitions/332/datasets

在上述数据集中,钢筋数据来自现场手机采集。钢筋车辆进库时,使用手机拍摄成捆钢筋的截面(一般保证较小倾角,尽量垂直于钢筋截面拍摄)。数据会包含直径从12mm-32mm等不同规格的钢筋图片。数据集中用于训练的图像集合共250张,用于测试的图像集合共200张。

由于选择的数据集规模较小且仅有一类检测目标(钢筋),为降低模型训练难度,防止模型出现过拟合,所以算法模型选择较小的yolov5s模型。如果选择不同的数据集,也可根据所选数据集的实际情况来选择算法模型。

3.2模型训练

首先在以下网址获取YOLO v5算法的源码:https://github.com/ultralytics/yolov5
其中所包含的项目文件有:

data:主要是存放一些超参数的配置文件以及官方提供测试的图片。

models:里面主要是一些网络构建的配置文件和函数,其中包含了该项目的五个不同的版本,分别为是5n、5s、5m、5l、5x。

utils:存放的是工具类的函数,里面有loss函数,metrics函数,plots函数等等。

weights:放置训练好的权重参数。

detect.py:利用训练好的权重参数进行目标检测,可以进行图像、视频和摄像头的检测。

train.py:训练自己的数据集的函数。

test.py:测试训练的结果的函数。

requirements.txt:yolov5项目的环境依赖包

YOLO v5各组成部分详细介绍

接下来就要进行模型训练的具体操作,训练主要包括环境搭建、数据集准备及修改数据集配置、修改模型配置参数、下载预训练模型、开始训练以及模型测试这几个步骤。接下来依次对上述步骤展开介绍。

(1)环境搭建

我们需要创建一个虚拟环境,打开conda powershell prompt创建一个用于训练的虚拟环境:

condacreate-nyolov5python==3.8

然后激活虚拟环境安装所需模块(注意安装之前需要切换工作路径至yolov5文件夹)

python-mpipinstall-rrequirements.txt-ihttp://pypi.douban.com/simple/--trusted-host=pypi.douban.com/simple

如果没有安装cuda默认安装pytorch-cpu版,如果有gpu可以安装pytorch-gpu版。

(2)数据集准备及修改数据集配置

首先将下载好的数据集分类并按如下方式存储:

9c02aef2-4b9d-11ee-a25d-92fbcf53809c.png

然后对数据集配置进行修改,修改data目录下的相应的yaml文件。找到目录下的coco.yaml文件,将该文件复制一份,将复制的文件重命名。

9c0cd0bc-4b9d-11ee-a25d-92fbcf53809c.png

打开这个文件夹修改其中的参数,修改结果如下图所示:

9c255786-4b9d-11ee-a25d-92fbcf53809c.png

其中第一个框的位置填写训练集测试集和验证集的目录地址,第二个框的位置填写检测目标类别数,第三个框填写待检测类别。

(3)修改模型配置参数

由于我们最后选择yolov5s这个模型训练,并且使用官方yolov5s.pt预训练权重参数进行训练,所以需要修改模型配置文件。和上述修改data目录下的yaml文件一样,最好将yolov5s.yaml文件复制一份,然后将其重命名。

9c43d440-4b9d-11ee-a25d-92fbcf53809c.png

然后对重命名文件进行修改,修改第一行检测目标类别数。

9c54a3e2-4b9d-11ee-a25d-92fbcf53809c.png

(4)下载预训练模型

我们需要在官网下载所需预训练模型,即在预训练模型地址(https://github.com/ultralytics/)中选择所需要的模型下载即可,这里我们选择下载yolov5s.pt。

9c6502aa-4b9d-11ee-a25d-92fbcf53809c.png

模型下载完成后,将模型文件xx.pt复制到yolov5文件夹下。

(5)开始训练

在Yolov5文件夹下打开终端输入以下命令:

Pythontrain.py--weightsyolov5s.pt--datadata/gangjin.yaml--workers1--batch-size8

9c771efe-4b9d-11ee-a25d-92fbcf53809c.png

至此,模型训练正式开始。

(6)模型测试

在模型训练完成后,将runs/exp/weights下的模型(best.pt)复制到yolov5文件夹下。

然后开始进行模型测试:

pythondetect.py--weightsbest.pt--source../datasets/gangjin/images/val--save-txt

其中,--weights best.pt是训练好的模型路径,--source:是测试的数据路径。测试结果保存在runs/detect/exp文件夹下。

4测试结果及问题分析

4.1 测试结果

本算法的输入为较为清晰的成捆钢筋图片,

算法的输出结果为result.txt文件与预测结果图,其中result.txt文件中会显示图片中每个检测框的位置、类别及置信度,并给出检测框的总个数,从而实现了钢筋自动计数。

从以上测试结果可以看出,YOLO v5算法对于该场景中的钢筋计数具有很好的准确性,并且有较大的置信度。
对更多的图片场景进行钢筋计数,并将输入的实际位置与识别出的效果图进行对比,观察YOLO v5算法对于该场景的计数效果。

从以上测试结果可以看出,YOLO v5算法对于该场景中的钢筋计数同样具有很好的准确性以及较大的置信度。

4.2问题分析

当然YOLO v5算法并非十全十美,它在钢筋检测中也存在一定的问题:

算法存在误判,将其他物体误判为钢筋头:

重复检测,一个钢筋头被多个检测框标注:

5总结

以上就是对于数钢筋问题的介绍,主要从问题背景、算法介绍和训练模型三部分展开。首先简述了数钢筋问题的基本背景,然后介绍了目标检测算法的算法流程和选取的YOLO v5算法的基本知识,最后介绍了模型训练步骤,并选取一定的数据集,采用YOLO v5算法对输入的图像进行目标检测及计数。

审核编辑:彭菁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    2706

    浏览量

    47697
  • 目标检测
    +关注

    关注

    0

    文章

    185

    浏览量

    15455
  • 数据集
    +关注

    关注

    4

    文章

    1179

    浏览量

    24356
  • 人工智能技术

    关注

    2

    文章

    187

    浏览量

    10464

原文标题:

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    人工智能是什么?

    ` 人工智能是什么?什么是人工智能人工智能是未来发展的必然趋势吗?以后人工智能技术真的能达到电影里机器人的智能水平吗?如果
    发表于 09-16 15:40

    人工智能技术—AI

      人工智能技术的概念从出来到现在已经有很多年的历史了,其实所谓的人工智能技术本身就是一种模拟人类大脑的思考方式的一种技术,它的英文简称是AI技术,在西方国家,
    发表于 10-21 12:03

    百度人工智能大神离职,人工智能的出路在哪?

    被打上人工智能的标签,一派欣欣向荣之景仿佛在宣示,这是人工智能技术发展的最好时代,但是,在市场火热的背后,我们需要理性的思考。 目前,人工智能行业内存在很大的水分,很多企业随大流进入这个领域是因为
    发表于 03-23 17:00

    【下载】《人工智能标准化白皮书(2018版)》

    人工智能标准化白皮书(2018版)》,白皮书通过梳理人工智能技术、应用和产业演进情况,分析人工智能技术热点、行业动态和未来趋势,从支撑
    发表于 02-02 18:00

    人工智能就业前景

    薪酬涨幅不再处于高位,平均涨幅在5%左右,但以人工智能、大数据为代表的新兴技术岗位薪资出现明显上升,无论薪资基数、薪资涨幅还是发展空间、均高出其他职位!2016年到2017年,人工智能岗位数量
    发表于 03-29 15:46

    电销机器人成为2018人工智能最热产业之一

    会给我们的生活带来什么?1、智能医疗人工智能走进医疗方向已经是正在进行的动作了,尤其是在医学影像方面,人工智能的工作效率不但相比人类医生有了急速的提升,更是在病理诊断中表现的尤为突出。通过人工
    发表于 05-21 15:54

    人工智能技术及算法设计指南

    手把手教你设计人工智能芯片及系统(全阶设计教程+AI芯片FPGA实现+开发板)详情链接:http://url.elecfans.com/u/c422a4bd15人工智能各种技术与算法
    发表于 02-12 14:07

    2019年人工智能技术峰会落幕,大咖演讲PPT火热出炉!

    `2019年6月28日,由<电子发烧友>主办,深圳市机器人协会、深圳市人工智能行业协会和华强智慧网联合主办的“2019年人工智能技术峰会”在深圳成功举行。本次峰会以“加速
    发表于 07-02 16:36

    路径规划用到的人工智能技术

    路径规划用到的人工智能技术人工智能编程语言/数据结构与算法三 人工智能基础原理四 智能信息获取(简称爬虫) 与数据分析1、发起请求3、解析内容4、保存数据二、Requests库介绍
    发表于 07-20 06:53

    目前人工智能教育研究最深入最经典的白皮书:德勤《全球人工智能发展白皮书2019》精选资料分享

    1、 人工智能正全方位商业化当前人工智能技术已步入全方位商业化阶段, 并对传统行业各参与方产生不同程度的影响, 改变了各行业的生态。这种变革主要体现在三个层次。第一层是企业变革:人工智能技术参与
    发表于 07-27 07:23

    嵌入式人工智能技术是什么?

    嵌入式人工智能技术是什么?
    发表于 12-27 07:03

    【开源硬件系列04期】AI人工智能技术带给EDA的机遇和挑战(文中含回放+课件)

    识别、自动驾驶、金融等领域获得了成功应用。如何将人工智能技术应用在芯片设计自动化(EDA)领域是近年来的热门话题。本次直播将从数据、算法、应用场景等方面讨论人工智能技术为EDA带来的新机遇,包括AI
    发表于 01-17 16:56

    《移动终端人工智能技术与应用开发》人工智能的发展与AI技术的进步

    人工智能的发展是随着人类生活需要,产业需求不断提升的,其中人工智能的发展很大程度上受到了计算机算力的影响,随着数据处理量的增大,人工智能算法对算力的要求逐年增加,而且没过两年算力上升一倍,因此往往
    发表于 02-17 11:00

    《移动终端人工智能技术与应用开发》+快速入门AI的捷径+书中案例实操

    的工作原理和13种主要的推理框架(其中较详细介绍的有8种)。第5章介绍了深度学习编译器。通过这些内容,读者可以理解移动终端人工智能技术的底层逻辑,掌握在移动终端进行人工智能推理的基本方法。 二
    发表于 02-19 20:24

    《移动终端人工智能技术与应用开发》+理论学习

    收到《移动终端人工智能技术与应用开发》有一段时间了,由于时间有限,加上工作原因,目前只看到第3章,前几章主要介绍人工智能和机器学习的基础知识,发展历程,分类等,重点说明了,在移动终端上如何实现
    发表于 02-27 23:28