0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

计算机视觉的重要性及如何帮助解决问题

星星科技指导员 来源:NVIDIA 作者:NVIDIA 2022-04-06 16:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

这篇文章是为了帮助初学者开发社区,尤其是那些对计算机视觉和计算机科学不熟悉的人。NVIDIA 认识到,通过计算机视觉和人工智能解决并受益于世界的视觉计算挑战需要我们所有人。NVIDIA 很高兴与 人工智能中的黑人女性 合作,并将此帖子献给 人工智能中的黑人女性 。

计算机视觉在现实世界中的应用越来越广泛,其应用也越来越具有挑战性,并且正在改变其意义。计算机视觉已经以某种形式存在了几十年,它正在成为一个越来越常见的短语,遍布世界各地和各个行业:计算机视觉系统、计算机视觉软件、计算机视觉硬件、计算机视觉开发、计算机视觉管道、计算机视觉技术。

什么是计算机视觉?

无论从字面上还是比喻上看,计算机视觉的术语和领域都超出了人们的想象。在特定的非人工智能实例中,计算机视觉也被称为 vision AI 和传统图像处理,在制造业和工业用例中也被称为 machine vision 。

简言之,计算机视觉使包括笔记本电脑智能手机自动驾驶汽车、机器人无人机、卫星和 x 光机在内的设备能够感知、处理、分析和解释数字图像和视频中的数据。

换句话说,计算机视觉从根本上将图像数据或图像数据集作为输入,包括视频的静止图像和运动帧,无论是录制的还是来自实时摄像机的。计算机视觉使设备能够像人类视觉系统一样拥有和使用类似人类的视觉功能。在人类视觉中,你的眼睛实时地将你周围的物理世界感知为不同的光反射。

类似地,计算机视觉设备感知图像和视频的像素,检测模式并解释可用于进一步分析或决策的图像输入。从这个意义上说,计算机视觉“看到”就像人类视觉一样,并使用智能和计算能力来处理输入的视觉数据,以输出有意义的见解,就像机器人探测并避开其路径上的障碍物一样。

不同的计算机视觉任务模拟人类视觉系统,执行、自动化和增强与人类视觉系统类似的功能。

计算机视觉与其他形式的人工智能有何关联?

计算机视觉有助于教授和掌握视觉,就像对话人工智能在识别、翻译和描述文本(我们用来定义和描述周围物理世界的词语)的应用中,有助于通过语音教授和掌握声音的感觉。

同样,计算机视觉通过数字图像和视频帮助教授和掌握视觉。更广泛地说,术语 computer vision 还可用于描述设备传感器(通常为摄像头)在检测、跟踪和识别图像中的对象或图案的应用中如何感知和作为视觉系统工作。

多模态对话人工智能将对话人工智能的功能与多媒体会议应用中的计算机视觉相结合,例如 NVIDIA Maxine 。

计算机视觉还可以广泛用于描述其他类型的传感器,如光探测和测距( LiDAR )和无线电探测和测距(雷达)如何感知物理世界。在自动驾驶汽车中,计算机视觉用于描述激光雷达和雷达传感器如何工作,通常与摄像头一起工作,以识别和分类人、物体和碎片。

有哪些常见任务?

虽然计算机视觉任务涵盖了广泛的感知能力,而且列表还在不断增长,但最新的技术支持并帮助解决涉及检测、分类、分割和图像合成的用例。

检测任务定位并有时跟踪图像中存在的对象。例如,在数字病理医疗领域,检测可能涉及通过医学成像识别癌细胞。在机器人技术领域,软件开发人员正在使用目标检测来避开工厂地板上的障碍物。

分类技术确定视觉数据中存在的对象。例如,在制造业中,物体识别系统将不同类型的瓶子分类包装。在农业领域,农民们正在使用分类来识别作物中的杂草。

分割任务对属于某一类别的像素进行分类,可以按像素单独分类(语义图像分割),也可以将同一类别的多个对象类型指定为单个实例(实例图像分割)。例如,自动驾驶汽车将道路场景的一部分分割为可驾驶空间和非可驾驶空间。

图像合成技术通过变形现有数字图像以包含所需内容来创建合成数据。生成性对抗网络( GAN ),比如 EditGAN ,能够从文本描述和现有的风景和人物图像中生成合成视觉信息。使用合成数据来补充和模拟真实数据是物流领域一个新兴的计算机视觉用例,它将视觉 AI 用于智能库存控制等应用。

什么是不同类型的计算机视觉?

为了理解计算机视觉中的不同领域,理解计算机视觉任务所基于的技术是很重要的。大多数计算机视觉技术都是从一个模型或数学算法开始的,它执行特定的基本操作、任务或组合。虽然我们将传统的图像处理和基于人工智能的计算机视觉算法分别进行分类,但大多数计算机视觉系统依赖于一种组合,这取决于用例、复杂性和所需的性能。

传统的计算机视觉

传统的、基于非深度学习的计算机视觉可以指计算机视觉和图像处理技术。

在传统的计算机视觉中,一组特定的指令执行特定的任务,比如检测图像中的角点或边缘,以识别建筑物图像中的窗口。

另一方面,图像处理对图像执行特定操作,然后可以使用视觉算法对图像进行进一步处理。例如,您可能希望平滑或压缩图像的像素以供显示,或减小其整体大小。这可以比作弯曲进入眼睛的光线来调整焦点或视野。图像处理的其他示例包括调整、转换、重新缩放和扭曲输入图像。

基于人工智能的计算机视觉

基于人工智能的计算机视觉或视觉人工智能依赖于经过视觉数据训练的算法来完成特定任务,而不是像图像处理那样的编程、硬编码指令。

前面提到的检测、分类、分割和合成任务通常都是基于人工智能的计算机视觉算法,因为它们可以实现准确性和鲁棒性。在许多情况下,基于人工智能的计算机视觉算法可以在这两个性能指标方面优于传统算法。

基于人工智能的计算机视觉算法通过学习和适应视觉数据输入,更紧密地模拟人类视觉系统,使其在大多数情况下成为计算机视觉模型的首选。这就是说,基于人工智能的计算机视觉算法需要大量数据,数据的质量直接驱动模型输出的质量。但是,性能超过了成本。

基于人工智能的神经网络自学,这取决于算法的训练数据。基于人工智能的计算机视觉就像是从经验中学习,并根据上下文做出预测,而不是明确的方向。学习过程类似于当你的眼睛看到一个不熟悉的物体,大脑试图学习它是什么,并将其存储起来以备将来预测。

基于人工智能的计算机视觉中机器学习与深度学习的比较

机器学习计算机视觉是一种基于人工智能的计算机视觉。基于人工智能的基于机器学习的计算机视觉具有人工神经网络或层,类似于人脑中的神经网络或层,用于连接和传输有关摄取的视觉数据的信号。在机器学习中,计算机视觉神经网络具有独立且不同的层,明确定义层之间的连接,以及视觉数据传输的预定义方向。

基于深度学习的计算机视觉模型是基于机器学习的计算机视觉的一个子集。深度学习中的“深度”源于神经网络的深度或层数。通常,三层或三层以上的神经网络被认为是深层次的。

基于人工智能的基于深度学习的计算机视觉是基于大量数据进行训练的。数十万、数以百万计的数字图像被用来训练和开发深层神经网络模型,这种情况并不少见。

开始开发计算机视觉

既然我们已经介绍了计算机视觉的基础知识,我们鼓励您开始开发计算机视觉。我们建议初学者开始使用 视觉编程接口( VPI )计算机视觉和图像处理库 进行非人工智能算法或 TAO 工具包完全可操作、随时可用、经过预训练的人工智能模型 。

关于作者

迈克尔·布恩是NVIDIA 自动驾驶汽车和计算机视觉的产品营销经理。在 2019 冠状病毒疾病流行的米迦勒,他开始了一个有执照的专业工程师的职业生涯,从交通基础设施咨询中逐渐进入了新的技术领域。在他的当前角色,米迦勒合作在NVIDIA 的团队,开发和定位令人兴奋的技术解决方案,在人工智能和深入学习的计算机视觉应用的医疗保健( CuCIM ),定义自主车辆平台(驱动器),并支持启用 NVIDIA 计算机视觉和图像处理库视觉编程接口( VPI )社区。 Michael 与研究、工程、产品和活动团队合作,分享、开发和交付下一代技术。

Sandeep Hiremath 是NVIDIA 计算机视觉的首席技术产品经理。他是一位经验丰富的产品领导者,专长于计算机视觉、机器学习和嵌入式系统领域。在NVIDIA ,他负责为汽车、医疗保健、机器人和研究领域的开发人员提供一组计算机视觉和图像处理解决方案的产品愿景和战略。在 MathWorks 的前一份工作中,他在十多年中担任了多个面向客户的角色,涉及客户成功、宣传,以及为学术界、机器人和嵌入式视觉领域的 MATLAB 用户提供营销解决方案。

Ona Ogbona 是 NVIDIA 的高级系统安全工程师,致力于开发自动驾驶解决方案。她的职责包括客户参与、产品开发、系统和安全流程交付,以确保自动驾驶汽车的安全交付。在之前的 ZF 工作中,她为乘用车和卡车开发了转向电子设备,发挥了功能性安全作用,成功地实现了车辆道路释放。在加入汽车行业之前, Ona 一直在陆地和深水石油和天然气行业发挥作用。 Ona 是特许工程师(曾)和工程技术学会( MIET )成员。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109101
  • 计算机
    +关注

    关注

    19

    文章

    7764

    浏览量

    92688
  • 深度学习
    +关注

    关注

    73

    文章

    5590

    浏览量

    123912
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    使用代理式AI激活传统计算机视觉系统的三种方法

    当前的计算机视觉系统擅长于识别物理空间与流程中的事件,却难以诠释场景细节及其意义,也无法推理后续可能发生的情况。
    的头像 发表于 12-01 09:44 333次阅读

    工控机与普通计算机的核心差异解析

    在工业自动化和智能制造领域,计算机设备作为核心控制单元,其选择直接影响整个系统的稳定性与可靠。工控机与普通计算机虽同属计算设备,但其设计目标、性能侧重和应用场景存在根本性差异。准确理
    的头像 发表于 11-25 14:45 1182次阅读
    工控机与普通<b class='flag-5'>计算机</b>的核心差异解析

    什么是全国产化导航计算机子卡?它有多重要

    全国产化导航计算机子卡是实现在国防、航天等国家关键领域技术自主的重要一环。
    的头像 发表于 09-16 18:02 632次阅读
    什么是全国产化导航<b class='flag-5'>计算机</b>子卡?它有多<b class='flag-5'>重要</b>

    【作品合集】赛昉科技VisionFive 2单板计算机开发板测评

    赛昉科技VisionFive 2单板计算机开发板测评作品合集 产品介绍: 昉·星光 2是全球首款集成了3D GPU的高性能量产RISC-V单板计算机,搭载昉·惊鸿-7110(型号:JH-7110
    发表于 09-04 09:08

    易控智驾荣获计算机视觉顶会CVPR 2025认可

    近日,2025年国际计算机视觉与模式识别顶级会议(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美国田纳西州纳什维尔召开。
    的头像 发表于 07-29 16:54 984次阅读

    工业计算机重要性

    工业计算机对某些行业至关重要。我们将在下面详细解释这些行业中的工业计算机应用。1.制造与工业自动化工业级计算机非常适合制造工厂,特别是那些想要自动化装配过程的工厂。在这样的环境中,工业
    的头像 发表于 07-28 16:07 401次阅读
    工业<b class='flag-5'>计算机</b>的<b class='flag-5'>重要性</b>

    自动化计算机经过加固后有什么好处?

    让我们讨论一下部署坚固的自动化计算机的一些好处。1.温度范围宽自动化计算机经过工程设计,配备了支持宽温度范围的组件,使自动化计算解决方案能够在各种不同的极端环境中运行。自动化计算机能够
    的头像 发表于 07-21 16:44 428次阅读
    自动化<b class='flag-5'>计算机</b>经过加固后有什么好处?

    自动化计算机的功能与用途

    工业自动化是指利用自动化计算机来控制工业环境中的流程、机器人和机械,以制造产品或其部件。工业自动化的目的是提高生产率、增加灵活性,并提升制造过程的质量。工业自动化在汽车制造中体现得最为明显,其中许多
    的头像 发表于 07-15 16:32 534次阅读
    自动化<b class='flag-5'>计算机</b>的功能与用途

    工业计算机与商用计算机的区别有哪些

    工业计算机是一种专为工厂和工业环境设计的计算系统,具有高可靠和稳定性,能够应对恶劣环境下的自动化、制造和机器人操作。其特点包括无风扇散热技术、无电缆连接和防尘防水设计,使其在各种工业自动化场景中
    的头像 发表于 07-10 16:36 523次阅读
    工业<b class='flag-5'>计算机</b>与商用<b class='flag-5'>计算机</b>的区别有哪些

    利用边缘计算和工业计算机实现智能视频分析

    IVA的好处、实际部署应用程序以及工业计算机如何实现这些解决方案。一、什么是智能视频分析(IVA)?智能视频分析(IVA)集成了复杂的计算机视觉,通常与卷积神经网
    的头像 发表于 05-16 14:37 636次阅读
    利用边缘<b class='flag-5'>计算</b>和工业<b class='flag-5'>计算机</b>实现智能视频分析

    Arm KleidiCV与OpenCV集成助力移动端计算机视觉性能优化

    生成式及多模态人工智能 (AI) 工作负载的广泛增长,推动了对计算机视觉 (CV) 技术日益高涨的需求。此类技术能够解释并分析源自现实世界的视觉信息,并可应用于人脸识别、照片分类、滤镜处理及增强现实
    的头像 发表于 02-24 10:15 880次阅读

    AR和VR中的计算机视觉

    ):计算机视觉引领混合现实体验增强现实(AR)和虚拟现实(VR)正在彻底改变我们与外部世界的互动方式。即便是在引人入胜的沉浸式
    的头像 发表于 02-08 14:29 2136次阅读
    AR和VR中的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>

    工业计算机的定义与重要性

    运行。随着现代产业向智能化、自动化和数据化的转型,工业计算机在制造业、交通运输、能源、电信等多个领域中扮演着越来越重要的角色。工业计算机的广阔应用促进了生产效率的提
    的头像 发表于 12-25 15:11 977次阅读
    工业<b class='flag-5'>计算机</b>的定义与<b class='flag-5'>重要性</b>

    云端超级计算机使用教程

    云端超级计算机是一种基于云计算的高性能计算服务,它将大量计算资源和存储资源集中在一起,通过网络向用户提供按需的计算服务。下面,AI部落小编为
    的头像 发表于 12-17 10:19 954次阅读

    CIM系统的定义、组成和对于FAB厂的重要性

      本文介绍了CIM(Computer Integrated Manufacturing)系统的定义、组成和对于FAB厂的重要性。 CIM(Computer Integrated
    的头像 发表于 12-16 16:30 8205次阅读