计算机视觉、计算机图像学和图像处理详解-电子发烧友网

计算机视觉：Computer Vision

一门让计算机从图像中提取有用信息并加以分析的科学。这些信息后续可以用于辅助一些决策或者任务，比如医学图像分析、工程测量、自动驾驶、机器人学等等。

计算机图像学：Computer Graphics

通过使用数学模型和计算机算法来生成图像。

图像处理：Image Process

图像数字化：

空间采样、量化、与连通性策略是将图像做数字化表达过程中涉及到的重要概念。

量化：将每个像素点在色彩通道内的亮度按照区间从连续分布转化为离散分布的过程。

四连通与八连通：像素点计算领域的划分标准。

四连通：像素四条边相连的区域

八连通：比四连通多四个角。

距离：

欧式距离 (Euclidean) - 两点之间的直线距离

曼哈顿距离 (City Block) - 沿着方格线行走的两点间距（即仅水平和竖直四个方向移动）

切比雪夫距离距离 (Chess Board) - 沿着方格线及对角行走的两点间距（即水平、竖直、以及对角八个方向移动）

一张图片中往往有前景(foreground)和背景(background)：

确定前景和背景的连通性策略，通常有：

背景四连通、前景八连通

背景八连通、前景四连通

一般有递归算法、顺序标记法。

递归算法消耗性能大：遍历图像中所有的像素点，遇到未标记区域编号的点即递归用当前的区域编号标记与之相连的所有像素点。

顺序标记法：运用与像素区域连通性问题

图像数据的收集和处理：

借助语义化分割对 UI 图像进行处理，得到轮廓、结构、上下文等特征。

借助超级像素的方法来降低特征的数量，合并像素达到降低干扰因素的效果。

采用 OpenCV 进行测量、计算，然后用规则尝试提取有用的特征数据，结果并不理想，它更加擅长测量和计算：需要大量的阈值约束才能达到比较好的效果：

用机器视觉的模型和算法来解决。这边介绍 2 个模型：

MaskRCNN

2017年，Kaiming He等人提出了Mask R-CNN，是一种目标检测和实例分割的算法

Mask R-CNN（Mask Region-based Convolutional Neural Network）是一种用于目标检测和实例分割的深度学习模型，它是 Faster R-CNN 的扩展，同时可以生成目标的二进制掩码（mask），因此可以实现精确的实例分割。

1、骨干网络：Mask R-CNN通常使用骨干网络（如 ResNet）来提取图像特征。这些特征用于目标检测和分割任务。

2、区域建议网络（RPN）：RPN 用于生成候选区域，它是 Faster R-CNN 中的组件，用于确定可能包含目标的图像区域。

3、目标检测：Mask R-CNN 使用区域建议来检测图像中的目标对象，通常通过分类和回归来确定每个目标的位置和类别。

4、实例分割：除了目标检测，Mask R-CNN 还生成每个检测到的目标的精确二进制掩码。这允许对目标进行精确的像素级分割。

5、多任务学习：Mask R-CNN 采用多任务学习的方法，通过同时训练目标检测和实例分割任务，从而提高模型的性能。

6、ROI Pooling / ROI Align：用于从特征图中提取每个候选区域的特征，以供后续任务使用。

7、损失函数：Mask R-CNN 使用多个损失函数，包括分类损失、回归损失和分割损失，来训练模型。

Yolo V3

2016年，Joseph Redmon等人提出的 YOLO 是一种单阶段的目标检测算法，突破性地实现了实时目标检测。

实例分割（instance segmentation）是机器视觉研究中比较重要、复杂和具有挑战性的领域之一。在机器人，自动驾驶，监视等领域均有应用。

来源：大前端视野

审核编辑：汤梓红

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器人

机器人

+关注

关注
206

文章
27033

浏览量
201396
图像处理

图像处理

+关注

关注
26

文章
1224

浏览量
55823
计算机

计算机

+关注

关注
19

文章
6649

浏览量
84522

原文标题：计算机视觉、计算机图像学、图像处理等你会不会？

文章出处：【微信号：vision263com，微信公众号：新机器视觉】欢迎添加关注！文章转载请注明出处。

计算机图形图像处理最新应用分析

计算机图形图像处理最新应用分析图形图像处理是研究计算机除了图形图像的原理、方法和技术的科学。它是计算机

发表于 09-23 14:56

机器视觉与计算机视觉的关系简述

。计算机视觉是一门独立的学科，有着30年左右的历史，集图像处理、模式识别、人工智能技术为一体，着重服务于一幅或多幅图像的

发表于 05-13 14:57

图像处理与计算机视觉相关的书籍有哪些

图像处理与计算机视觉相关的书籍

发表于 05-20 13:58

用于计算机视觉训练的图像数据集介绍

用于计算机视觉训练的图像数据集

发表于 02-26 07:35

计算机视觉及其在焊接中的应用

简要阐述了计算机视觉的基本原理、系统结构和计算机视觉的基本处理方法，并着重讲解了在焊接自动化领域的应用情况。关键词：

发表于 07-18 10:19 •9次下载

基于OpenCV的计算机视觉技术实现

基于OpenCV的计算机视觉技术实现OpencV是用来实现计算机视觉相关技术的开放源码工作库，是计算机视

发表于 11-23 21:06 •0次下载

计算机视觉是什么

计算机视觉是一门研究如何使机器“看”的科学，更进一步的说，就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑

发表于 12-08 09:24 •2w次阅读

基于计算机视觉的自动搜索图像语义分割架构

在计算机视觉中，这适用于图像分类和密集图像预测。

发表于 01-17 17:31 •3098次阅读

计算机视觉就业怎么样

计算机视觉是指用机器模拟“视觉器官”，对目标进行识别、跟踪和测量等，并由计算机代替大脑完成进一步的图像处

发表于 04-04 16:06 •1.5w次阅读

基于计算机视觉的多维图像智能

利用摄像机和其他数据源，计算机视觉可以收集有关公司运营最重要方面的重要信息，这些信息包括构成流程主干的人员、产品、资产和文档的组合。当企业收集数字图像并应用深度学习算法，通过对机器眼睛“所见”的反应来准确识别和分类对象时，

发表于 08-04 10:39 •2773次阅读

用于计算机视觉训练的图像数据集

计算机视觉使计算机能够理解图像和视频的内容。计算机视觉的目标是使人类

发表于 12-31 09:33 •2063次阅读

用于计算机视觉训练的图像数据集

计算机视觉使计算机能够理解图像和视频的内容。计算机视觉的目标是使人类

发表于 02-12 16:13 •1162次阅读

机器学习和计算机视觉的前20个图像数据集

计算机视觉使计算机能够理解图像和视频的内容。计算机视觉的目标是使人类

发表于 01-28 07:40 •5次下载

人工智能计算机视觉方向是什么

“看”并作出决策。 计算机视觉是人工智能领域的一大分支，是以计算机和数字图像处理技术为手段，通过对视觉

发表于 08-15 16:06 •1191次阅读

计算机视觉：AI如何识别与理解图像

计算机视觉是人工智能领域的一个重要分支，它致力于让机器能够像人类一样理解和解释图像。随着深度学习和神经网络的发展，人们对于如何让AI识别和理解图像产生了浓厚的兴趣。本文将探讨

发表于 01-12 08:27 •636次阅读