0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

计算机视觉的概念、工作原理及行业用例

NVIDIA英伟达 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2022-04-29 14:00 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

计算机视觉是一个研究领域,旨在助力计算机使用复杂算法(可以是传统算法,也可以是基于深度学习的算法)来理解数字图像和视频并提取有用的信息。

什么是计算机视觉?

计算机视觉的主要目标是,先理解视频和静止图像的内容,然后从中收集有用的信息,以便解决越来越多的问题。作为人工智能 (AI) 和深度学习的子领域,计算机视觉可训练卷积神经网络(CNN),以便针对各种应用场合开发仿人类视觉功能。计算机视觉包括对 CNN 进行特定训练,以便利用图像和视频进行数据分割、分类和检测。

9d4da8d6-c6e0-11ec-bce3-dac502259ad0.png

卷积神经网络 (CNN) 能够针对多种应用场合执行分割、分类和检测:

分割:图像分割是指将像素归类为特定类别,如汽车、道路或行人。它广泛用于自动驾驶汽车应用(包括 NVIDIA DRIVE 软件堆栈),用于显示道路、汽车和人员。您可以将其想象成一种可视化技术,该技术能够使人们更容易理解计算机的工作。

分类:图像分类用于确定图像中的内容。例如,神经网络经过训练后能够识别狗或猫,或者许多其他东西,并且具有高精确度。

检测:通过图像检测,计算机可以定位对象的位置。在许多应用中,CNN 会在相关区域周围设置矩形边界框,将对象完全包含在内。检测器也可以接受训练,以便检测图像中汽车或人员的位置。

分割、分类和检测

分割 分类 检测
非常适合用于描述对象 是猫还是狗? 它存在于空间中的什么位置?
在自动驾驶汽车中使用 精确分类 识别关乎安全的事物

计算机视觉为何重要?

在体育、汽车、农业、零售、银行、施工和保险等行业,计算机视觉应用非常广泛。得益于目前机器用于识别物体的图像处理器 – 卷积神经网络 (CNN) ,各种由 AI 驱动的机器纷纷开始采用仿人眼技术来获得更多助力。CNN 已成为当今自动驾驶汽车、石油勘探和聚变能源研究领域的“眼睛”。它们还有助于在医学成像领域快速发现疾病并挽救生命。

数十年来,传统的计算机视觉和图像处理技术已经应用于众多应用和研究工作。然而,现代 AI 技术采用人工神经网络,能够实现更高的性能准确性;高性能计算依托 GPU 取得长足进步,实现超人的准确性,从而在运输、零售、制造、医疗健康和金融服务等行业广泛应用。

在将图像和视频分类为精细离散的类别和分类方面,如同医学计算机轴向断层扫描或 CAT 扫描中随时间推移而产生的微小变化,传统或基于 AI 的计算机视觉系统远胜于人类。在这个意义上,计算机视觉将人类有可能完成的任务自动化,但其准确性和速度要高得多。

当前和潜在的应用多种多样,因此计算机视觉技术和解决方案的增长预测相当惊人,这点不足为奇。一项市场调研表明,到 2023 年,该市场将以惊人的 47% 的年增长率增长,届时将在全球达到 250 亿美元。在整个计算机科学范畴内,计算机视觉是热门、活跃的研发领域之一。

计算机视觉的工作原理是什么?

计算机视觉分析图像,然后使用卷积神经网络 (CNN)创建其 “所见” 的数值表示。CNN 是一类人工神经网络,使用卷积层从输入中筛选出有用信息。卷积运算需要综合使用输入数据(特征图)与卷积内核(滤波器),以便生成转换后的特征图。卷积层滤波器可根据学习参数进行修改,以便为特定任务提取最有用的信息。卷积网络可根据任务自动调整,寻找最重要的特征。在执行一般的物体识别任务时,CNN 会过滤物体的形状信息;但在进行识别鸟的任务时,CNN 则会提取鸟的颜色信息。这是由于 CNN 认为,不同类的物体会具有不同的形状,而对于不同类型的鸟而言,其颜色可能要比形状的差异性更大。

9d71af88-c6e0-11ec-bce3-dac502259ad0.png

计算机视觉的行业用例

计算机视觉用例包括图像识别、图像分类、视频标记和虚拟助手。计算机视觉领域中更加流行和突出的用例包括:

医学。

医学图像处理需要快速提取重要的图像数据以便对患者进行正确诊断,包括快速检测肿瘤和动脉硬化。虽然计算机视觉本身无法提供诊断,但它是现代医疗诊断技术中宝贵的一部分,可以更大程度地弱化医生的想法,并且为医生提供越来越多的原本无法看到的信息。

自动驾驶汽车。

另一个非常活跃的计算机视觉调研领域,自动驾驶车辆可以完全由计算机视觉解决方案接管,或者其操作可以得到显著增强。目前已有的常用应用包括汽车中的早期警报系统。

行业用途。

制造业中有很多计算机视觉解决方案的当前和潜在用途,以支持制造流程。目前的用途包括质量控制,其中计算机视觉系统会检查部件和产品成品是否有缺陷。在农业领域,计算机视觉系统使用光学分拣去除食品中不需要的材质。

数据科学家和计算机视觉

Python机器学习 (ML) 领域的热门编程语言,许多数据科学家都熟悉其易用性及其大型库(其中大多数库都是免费和开源的)。数据科学家在 ML 系统中使用 Python 进行数据挖掘和数据分析,因为 Python 支持各种 ML 模型和算法。鉴于 ML 和计算机视觉之间的关系,数据科学家可以利用计算机视觉应用向各类企业的扩展,从图像和视频存储中提取重要信息,增强数据驱动的决策制定。

借助 GPU 加速卷积神经网络

在架构方面,CPU 仅由几个具有大缓存内存的核心组成,一次只可以处理几个软件线程。相比之下,GPU 由数百个核心组成,可以同时处理数千个线程。

9d8b3980-c6e0-11ec-bce3-dac502259ad0.jpg

由于神经网络由大量相同的神经元构建而成,因此本质上具有高度并行性。这种并行性自然地会映射到 GPU ,能够提供数据并行的算术架构,并且相比仅限 CPU 的训练,计算速度大幅增加。这种类型的架构对一系列图像数据执行类似的计算。GPU 的单指令多数据 (SIMD) 功能使其适合运行计算机视觉任务,这些任务通常涉及对整个图像进行类似的计算。具体而言,NVIDIA GPU 可显著加速计算机视觉操作,为其他工作释放 CPU 。此外,在同一台机器上可以使用多个 GPU ,创建能够并行运行多个计算机视觉算法的架构。

NVIDIA GPU 加速的深度学习框架

GPU 加速深度学习框架为 Python 等常用编程语言提供编程接口。其还具备轻松创建和探索自定义 CNN 和 DNN 的灵活性,同时能够实现实验和工业部署所需的超高速度。NVIDIA CUDA-X AI 能够加快 Caffe 、Microsoft Cognitive Toolkit (CNTK) 、TensorFlow 、Theano 和 Torch 等广泛使用的深度学习框架以及众多其他机器学习应用的运行速度。深度学习框架在 GPU 上的运行速度更快,并可以在单节点内的多个 GPU 间扩展。要将框架与 GPU 一起用于卷积神经网络的训练和推理过程,NVIDIA 分别提供 cuDNN 和 TensorRT 。cuDNN 和 TensorRT 可为卷积层、池化层、归一化和激活层等标准例程实现高度调整。

单击此处查看 NVCaffe 安装步骤和使用指南。可在此处找到卷积神经网络 C++/CUDA 快速实施。

为快速开发和部署视觉模型,NVIDIA 向视觉 AI 开发者提供 DeepStream SDK 。其中包含 TAO 工具包,可用于为计算机视觉领域创建准确高效的 AI 模型。

9da2bbdc-c6e0-11ec-bce3-dac502259ad0.png

NVIDIA GPU 加速的端到端数据科学

建立在 CUDA 基础上的 NVIDIA RAPIDS开源软件库套件使您能够完全在 GPU 上执行端到端数据科学和分析流程,同时仍然使用 Pandas 和 Scikit-Learn API 等熟悉的界面。

9dc12aa4-c6e0-11ec-bce3-dac502259ad0.png

原文标题:NVIDIA 大讲堂 | 什么是计算机视觉?

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109084
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134451
  • 计算机视觉
    +关注

    关注

    9

    文章

    1714

    浏览量

    47450

原文标题:NVIDIA 大讲堂 | 什么是计算机视觉?

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    使用代理式AI激活传统计算机视觉系统的三种方法

    当前的计算机视觉系统擅长于识别物理空间与流程中的事件,却难以诠释场景细节及其意义,也无法推理后续可能发生的情况。
    的头像 发表于 12-01 09:44 327次阅读

    STM32计算机视觉开发套件:B-CAMS-IMX摄像头模块技术解析

    STMicroelectronics用于 STM32开发板的B-CAMS-IMX摄像头模块提供强大的硬件集,可处理多种计算机视觉场景和。该模块具有高分辨率500万像素IMX335
    的头像 发表于 10-20 09:46 710次阅读
    STM32<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>开发套件:B-CAMS-IMX摄像头模块技术解析

    易控智驾荣获计算机视觉顶会CVPR 2025认可

    近日,2025年国际计算机视觉与模式识别顶级会议(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美国田纳西州纳什维尔召开。
    的头像 发表于 07-29 16:54 980次阅读

    工业计算机的重要性

    工业计算机对某些行业至关重要。我们将在下面详细解释这些行业中的工业计算机应用。1.制造与工业自动化工业级计算机非常适合制造工厂,特别是那些想
    的头像 发表于 07-28 16:07 398次阅读
    工业<b class='flag-5'>计算机</b>的重要性

    自动化计算机经过加固后有什么好处?

    让我们讨论一下部署坚固的自动化计算机的一些好处。1.温度范围宽自动化计算机经过工程设计,配备了支持宽温度范围的组件,使自动化计算解决方案能够在各种不同的极端环境中运行。自动化计算机能够
    的头像 发表于 07-21 16:44 419次阅读
    自动化<b class='flag-5'>计算机</b>经过加固后有什么好处?

    自动化计算机的功能与用途

    工业自动化是指利用自动化计算机来控制工业环境中的流程、机器人和机械,以制造产品或其部件。工业自动化的目的是提高生产率、增加灵活性,并提升制造过程的质量。工业自动化在汽车制造中体现得最为明显,其中许多
    的头像 发表于 07-15 16:32 527次阅读
    自动化<b class='flag-5'>计算机</b>的功能与用途

    工业计算机与商用计算机的区别有哪些

    工业计算机是一种专为工厂和工业环境设计的计算系统,具有高可靠性和稳定性,能够应对恶劣环境下的自动化、制造和机器人操作。其特点包括无风扇散热技术、无电缆连接和防尘防水设计,使其在各种工业自动化场景中
    的头像 发表于 07-10 16:36 516次阅读
    工业<b class='flag-5'>计算机</b>与商用<b class='flag-5'>计算机</b>的区别有哪些

    利用边缘计算和工业计算机实现智能视频分析

    IVA的好处、实际部署应用程序以及工业计算机如何实现这些解决方案。一、什么是智能视频分析(IVA)?智能视频分析(IVA)集成了复杂的计算机视觉,通常与卷积神经网
    的头像 发表于 05-16 14:37 631次阅读
    利用边缘<b class='flag-5'>计算</b>和工业<b class='flag-5'>计算机</b>实现智能视频分析

    Raspberry Pi 计算机流行的工业

    RaspberryPi电脑在工业应用中越来越受欢迎,越来越多的公司转向这款经济实惠但功能强大的单板电脑,以完成各种任务。在本文中,我们将深入探讨RaspberryPi电脑在现实世界中的工业,并
    的头像 发表于 03-25 09:46 468次阅读
    Raspberry Pi <b class='flag-5'>计算机</b>流行的工业<b class='flag-5'>用</b><b class='flag-5'>例</b>

    行业聚焦|深圳计算机协会走进杰和,共探AI算力新边界

    行业聚焦深圳计算机协会走进杰和2025年2月28日,深圳市计算机行业协会在杰和科技召开会长办公(扩大)会议及领导干部知识产权培训会。会议汇聚党支部、理事会、监事会及
    的头像 发表于 03-05 10:04 628次阅读
    <b class='flag-5'>行业</b>聚焦|深圳<b class='flag-5'>计算机</b>协会走进杰和,共探AI算力新边界

    Arm KleidiCV与OpenCV集成助力移动端计算机视觉性能优化

    生成式及多模态人工智能 (AI) 工作负载的广泛增长,推动了对计算机视觉 (CV) 技术日益高涨的需求。此类技术能够解释并分析源自现实世界的视觉信息,并可应用于人脸识别、照片分类、滤镜
    的头像 发表于 02-24 10:15 876次阅读

    Quantinuum“Reimei”量子计算机在RIKEN正式运行

    )成功安装并全面投入运行。 此次合作中,RIKEN为“Reimei”量子计算机提供了世界级的基础设施,包括为其量身定制的设计、准备及交付工作。这一里程碑式的成就不仅标志着Quantinuum在量子计算领域的持续突破,也预示着未来
    的头像 发表于 02-17 10:21 791次阅读

    AR和VR中的计算机视觉

    ):计算机视觉引领混合现实体验增强现实(AR)和虚拟现实(VR)正在彻底改变我们与外部世界的互动方式。即便是在引人入胜的沉浸式
    的头像 发表于 02-08 14:29 2125次阅读
    AR和VR中的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>

    荣誉时刻|杰和科技荣获深圳市计算机行业协会多个奖项

    2025年1月8日,深圳市计算机行业协会举办了2024年度会员大会暨高峰论坛。杰和科技应邀出席会议,与行业精英、专家代表等共同探讨2025年计算机
    的头像 发表于 02-05 17:48 798次阅读
    荣誉时刻|杰和科技荣获深圳市<b class='flag-5'>计算机</b><b class='flag-5'>行业</b>协会多个奖项

    云端超级计算机使用教程

    云端超级计算机是一种基于云计算的高性能计算服务,它将大量计算资源和存储资源集中在一起,通过网络向用户提供按需的计算服务。下面,AI部落小编为
    的头像 发表于 12-17 10:19 942次阅读