如何使人工系统从图像或多维数据中“感知”-电子发烧友网

一、什么是计算机视觉

计算机视觉是一门研究如何使机器“看”的科学，更进一步的说，就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。这里所指的信息指Shannon定义的，可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提取信息，所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。

视觉是各个应用领域，如制造业、检验、文档分析、医疗诊断，和军事等领域中各种智能/自主系统中不可分割的一部分。由于它的重要性，一些先进国家，例如美国把对计算机视觉的研究列为对经济和科学有广泛影响的科学和工程中的重大基本问题，即所谓的重大挑战（grand challenge）。

计算机视觉的挑战是要为计算机和机器人开发具有与人类水平相当的视觉能力。机器视觉需要图象信号，纹理和颜色建模，几何处理和推理，以及物体建模。一个有能力的视觉系统应该把所有这些处理都紧密地集成在一起。

我们目前如果是在校学生，对于计算机视觉和机器学习的相关知识的学习是非常有用的，无论是对于自己的工作前景还是相关论文的撰写都是非常有用的，而且目前对于计算机的相关知识已经设计到了各个专业领域，其中包括医学领域（计算机视觉分析CT成像）、电学领域（使用matlab及相关领域画图）、人脸识别和车牌识别等等。而且有想要做交叉学科的对于计算机可以和任意领域及进行无障碍交叉。

由于我这个理工男的语文功底并不好，语言组织能力不强，所以我们今天就啰嗦到这里，总结一下就是计算机视觉及机器学习等和计算机相关的东西特别重要！

二、图片处理基础操作

首先我们来看一段简单的计算机视觉相关代码：

import cv2img=cv2.imread（‘path’）#path指图片相关路径cv2.imshow（‘Demo’，img）cv2.nameWindow（‘Demo’）cv2.waitKey（0）cv2.destroyAllWindows（）

这段代码就可以在计算机中显示出img的相关图像。接下来我们讲解一下每一步的相关操作。

图片处理：读入图像

相关函数：image=cv2.imread（文件名相关路径［显示控制参数］）

文件名：完整的路径。

其中参数包括：

cv.IMREAD_UNCHANGED ：表示和原图像一致

cv.IMREAD_GRAYSCALE ：表示将原图像转化为灰色图像。

cv.IMREAD_COLOR：表示将原图像转化为彩色图像。

例如：

cv2.imread（‘d:image.jpg’，cv.IMREAD_UNCHANGED）

图片处理：显示图像

相关函数：None=cv2.imshow（窗口名，图像名）例如：

cv2.imshow（“demo”，image）但是在OpenCV中我们图像显示还是要加上相关约束：

retval=cv2.waitKey（［delay］）如果没有这个限制，那么显示的图像就会一闪而过，就会发生错误。其中delay参数包括：dealy=0，无限等待图像显示，直到关闭。也是waitKey的默认数值。delay《0，等待键盘点击结束图像显示，也就是说当我们敲击键盘的时候，图像结束显示。delay》0，等待delay毫秒后结束图像显示。最后我们还需要显示

cv2.destroyAllWindows（）

把图像从内存中彻底删除。

图片处理：图像保存

相关函数：retval=cv2.imwrite（文件地址，文件名）

例如

cv2.imwrite（‘D:test.jpg’，img）

将img保存到了路径D： est.jpg

三、图像处理入门基础

图像成像原理介绍

首先我们第一个要深深深深的刻在脑子里的概念就是：

——图片是由像素点构成的生动一点表示就是这样：

这样就可以完美的展示出计算机图像的成像原理，就是用一个个有颜色的像素点拼接而成的。

图像分类

图像一般分为三类：

一、二值图像

二值图像表示的意思就是每一个像素点只由0和1构成，0表示黑色，1表示白色，而且这里的黑色和白色是纯黑和纯白。所以我们看到的图像也就是这个样子。

二、灰度图像

灰度图像就是一个8位的位图。什么意思呢？就是说00000001一直到11111111，这就是二进制表示。如果表示成我们常用的十进制就是0-255。其中0就表示纯黑色，255就表示纯白色，中间就是处于纯黑色到纯白色的相关颜色。

灰度图像一块像素点：

三、彩色图像（RGB）计算机中所有的颜色都可以由R（红色通道）、G（绿色通道）、B（蓝色通道）来组成，其中每一个通道都有0-255个像素颜色组成。比如说R=234，G=252，B=4就表示黄色。显示出来的也是黄色。所以说彩色图像由三个面构成，分别对应R，G，B。

所以说我们就可以知道复杂程度排序的话就是：彩色图像-灰度图像-二值图像。所以我们在进行人脸项目或者是车牌识别项目中最最最常用的操作就是将彩色图像转化为灰度图像，然后将灰度图像转为最简单的二值图像。

四、像素处理操作

读取像素

相关函数：返回值=图像（位置参数）我们先以灰度图像，返回灰度值：

p=img［88，142］print§

这里我们就可以返回图片坐标［88，142］处的灰度值。然后我们以彩色图像为例子：我们知道彩色图像由BGR三个通道的值构成。那么我们需要返回三个数值：

blue=img［78，125，0］green=img［78，125，1］red=img［78，125，2］print（blue，green，red）

这样我们就返回了这三个数值。

修改像素

直接暴力修改。对于灰度图像， img［88，99］=255对于彩色图像，img［88，99，0］=255img］［88，99，1］=255img［88，99，2］=255这里也可以写成img［88，99］=［255，255，255］等同于上方。改动多个像素点例如还是以彩色图像为例子：

i［100：150，100：150］=［255，255，255］

意思也就是将图像横坐标100到150和纵坐标100到150的这个区间全部用白色替代。

使用python中的numpy修改像素点

读取像素 相关函数：返回值=图像.item（位置参数）我们以灰度图像为例： o=img,item(88，142) print(o) 对于彩色图像我们还是： blue=img.item(88，142，0) green=img.item(88，142，1) red=img.item(88，142，2) 然后print(blue，green，red) 修改像素图像名.itemset（位置，新的数值）我们以灰度图像为例子： img.itemset((88，99)，255) 对于BGR图像： img.itemset((88，99，0)，255) img.itemset((88，99，1)，255) img.itemset((88，99，2)，255)

import cv2import numpy as np i=cv2.imread('path',cv2.IMREAD_UNCHANGED)print(i.item(100，100))i.itemset((100，100),255)print(i,item(100，100))

通过这段代码我们就可以看得出来像素的更改。对于彩色图像也是一样。

五、获取图像属性

形状

shape可以获取图像的形状，返回值包含行数、列数通道数的元组。灰度图像返回行数列数彩色图像返回行数、列数、通道数。

import cv2img1=cv2.imread('灰度图像')print(img1.shape)

像素数目

size可以获取图像的像素数目。灰度图像：行数列数彩色图像：行数列数*通道数

图像类型

dtype返回的是图像的数据类型

import cv2img=cv2.imread('图像名称')print(img.dtype)

六、图像ROI

ROI（region of interest）表示感兴趣区域

从被处理的图像中以方框、圆、椭圆或者不规则多边形等方式勾勒出需要处理的区域。
可以通过各种算子（operator）和函数来求ROI，并进行下一步操作。

import cv2import numpy as npa=cv2.imread('path')b=np.ones((101，101，3))b=a[220:400,250:350]a[0:101,0:101]=bcv2.imshow('o',a)cv2.waitKey()cv2.destroyAllWindows()

我们还可以将感兴趣的图像加入到别的图像当中。

七、通道的拆分与合并

拆分

import cv2img=cv2.imread('图像名')b = img[ : , : , 0 ]g = img[ : , : , 1 ]r = img[ : , : , 2 ] 我们在OpenCV中有专门拆分通道的函数： cv2.split(img)

import cv2import numpy as npa=cv2.imread("imagelenacolor.png")b,g,r=cv2.split(a)cv2.imshow("B",b)cv2.imshow("G",g)cv2.imshow("R",r)cv2.waitKey()cv2.destroyAllWindows()合并

import cv2import numpy as npa=cv2.imread("imagelenacolor.png")b,g,r=cv2.split(a)m=cv2.merge([b,g,r])cv2.imshow("merge",m)cv2.waitKey()cv2.destroyAllWindows() 审核编辑：郭婷

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器视觉

机器视觉

+关注

关注
161

文章
4044

浏览量
118368
人工智能

人工智能

+关注

关注
1776

文章
43871

浏览量
230627

原文标题：【光电智造】计算机视觉及其图像处理操作

文章出处：【微信号：今日光电，微信公众号：今日光电】欢迎添加关注！文章转载请注明出处。

未来已来，多传感器融合感知是自动驾驶破局的关键

的信息，将感知系统的感知维度扩展以实现多维度（多模态）感知目标的完整信息。如下图示例，芯片将摄像头图像

发表于 04-11 10:26

视频监控系统图像处理技术应用解析

的感知能力和智能程度将得到极大提升，采集的数据也将从非结构化数据转变为互相关联的结构化数据。在这场变革中，

发表于 09-23 15:00

基于SoPC的自感知运动图像采集系统设计

卡或硬盘中，而在SoPC系统直接实现SD卡的图像采集数据文件存储在国内还未见报道。　　另外还提出了一种新的适合在FPGA硬件实现的快速运动检

发表于 11-01 17:21

人工智能感知技术是安防机器人应用支撑技术之一

编码，与当前获得的面纹编码进行对比，发现匹配就实现了身份认证。异常行为识别主要是针对摄像机中获得的含有人的运动图像序列进行分析处理，包括运动检测、特征提取与处理和识别分类三个阶段。能在远距离或低视频质量

发表于 12-24 09:19

如何使内存中的图像数据通过u***的dma方式传输？

使用stm32f429的dcmi接口接摄像头，dma双缓冲读取图像数据，u***-hs上传数据（图像数据有10MB）。问题：如何

发表于 06-13 09:22

智能感知怎么助力机器视觉发展？

交通系统(ITS)、智能家居/楼宇、智能零售、虚拟实境(VR)/增强实境(AR)等等。全球图像传感器领袖安森美半导体传承40多年的成像经验，拥有2000多项成像专利，提供宽广的智能感知阵容，包括电子卷帘快门

发表于 08-01 07:11

全高级驾驶员的感知系统

道路安全从摩尔定律中受益良多，处理能力的提升以及 CMOS 图像传感器 (CIS) 和其他传感器技术的发展，让车辆制造商得以推出高级驾驶员感知系统

发表于 05-13 08:12

幽默或被人工智能验证和应用

幽默或被人工智能验证和应用幽默神秘飘忽，但同时还有逻辑严密的理性核心，适合人工智能处理。正在申请国际专利的技术PCT/CN2019/080348，一种基于知识库生成机器人幽默性格信息的方法及系

发表于 07-17 14:00

什么是人工智能、机器学习、深度学习和自然语言处理？

和人工智能革命——互联网将全球各种各样的计算机设备连接起来，使它们能够共享有价值的数据。人工智能使他们天生具有智能，他们可以在没有人类干预的情况下自己

发表于 03-22 11:19

【HarmonyOS IPC 试用连载】科普一下Hi3518EV300的ISP

、短帧的图像数据，通过智能算法进行融合，融合后数据位宽20bit，动态范围相较一代提升12dB，使图像获得暗、亮区域的完美整合，亮处不过曝、

发表于 05-02 23:43

通过深度学习提高和发展车辆感知

自动泊车辅助、自动紧急制动、车道保持辅助、驾驶员疲劳警报等。基于摄像头的感知功能在当今的车辆中至关重要。感知系统的功能与人体具有很强的相似性：摄像头

发表于 11-10 08:09

基于SoPC的自感知运动图像采集系统设计

基于SoPC的自感知运动图像采集系统设计　引言　　近年来，嵌入式图像采集技术得到快速发展，但由于嵌入式系统的处理、传输和存储

发表于 11-25 11:02 •837次阅读

多维数据集是什么

使用多维数据集向导，可以在 SQL Server 2005 中轻松定义简单的多维数据集。该向导可以帮助您为多维

发表于 02-24 10:48 •9314次阅读

计算机视觉是什么

。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。这里所指的信息指Shann

发表于 12-08 09:24 •2w次阅读

计算机视觉原理分析及其应用

。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。这里所指的信息指Shann

发表于 07-30 16:50 •8043次阅读

搜索历史

如何使人工系统从图像或多维数据中“感知”

评论

未来已来，多传感器融合感知是自动驾驶破局的关键

视频监控系统图像处理技术应用解析

基于SoPC的自感知运动图像采集系统设计

人工智能感知技术是安防机器人应用支撑技术之一

如何使内存中的图像数据通过u***的dma方式传输？

智能感知怎么助力机器视觉发展？

全高级驾驶员的感知系统

幽默或被人工智能验证和应用

什么是人工智能、机器学习、深度学习和自然语言处理？

【HarmonyOS IPC 试用连载】科普一下Hi3518EV300的ISP

通过深度学习提高和发展车辆感知

基于SoPC的自感知运动图像采集系统设计

多维数据集是什么

计算机视觉是什么

计算机视觉原理分析及其应用