0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

计算机视觉的重要性及如何帮助解决问题

星星科技指导员 来源:NVIDIA 作者:NVIDIA 2022-04-06 16:49 次阅读

这篇文章是为了帮助初学者开发社区,尤其是那些对计算机视觉和计算机科学不熟悉的人。NVIDIA 认识到,通过计算机视觉和人工智能解决并受益于世界的视觉计算挑战需要我们所有人。NVIDIA 很高兴与 人工智能中的黑人女性 合作,并将此帖子献给 人工智能中的黑人女性 。

计算机视觉在现实世界中的应用越来越广泛,其应用也越来越具有挑战性,并且正在改变其意义。计算机视觉已经以某种形式存在了几十年,它正在成为一个越来越常见的短语,遍布世界各地和各个行业:计算机视觉系统、计算机视觉软件、计算机视觉硬件、计算机视觉开发、计算机视觉管道、计算机视觉技术。

什么是计算机视觉?

无论从字面上还是比喻上看,计算机视觉的术语和领域都超出了人们的想象。在特定的非人工智能实例中,计算机视觉也被称为 vision AI 和传统图像处理,在制造业和工业用例中也被称为 machine vision 。

简言之,计算机视觉使包括笔记本电脑智能手机自动驾驶汽车、机器人无人机、卫星和 x 光机在内的设备能够感知、处理、分析和解释数字图像和视频中的数据。

换句话说,计算机视觉从根本上将图像数据或图像数据集作为输入,包括视频的静止图像和运动帧,无论是录制的还是来自实时摄像机的。计算机视觉使设备能够像人类视觉系统一样拥有和使用类似人类的视觉功能。在人类视觉中,你的眼睛实时地将你周围的物理世界感知为不同的光反射。

类似地,计算机视觉设备感知图像和视频的像素,检测模式并解释可用于进一步分析或决策的图像输入。从这个意义上说,计算机视觉“看到”就像人类视觉一样,并使用智能和计算能力来处理输入的视觉数据,以输出有意义的见解,就像机器人探测并避开其路径上的障碍物一样。

不同的计算机视觉任务模拟人类视觉系统,执行、自动化和增强与人类视觉系统类似的功能。

计算机视觉与其他形式的人工智能有何关联?

计算机视觉有助于教授和掌握视觉,就像对话人工智能在识别、翻译和描述文本(我们用来定义和描述周围物理世界的词语)的应用中,有助于通过语音教授和掌握声音的感觉。

同样,计算机视觉通过数字图像和视频帮助教授和掌握视觉。更广泛地说,术语 computer vision 还可用于描述设备传感器(通常为摄像头)在检测、跟踪和识别图像中的对象或图案的应用中如何感知和作为视觉系统工作。

多模态对话人工智能将对话人工智能的功能与多媒体会议应用中的计算机视觉相结合,例如 NVIDIA Maxine 。

计算机视觉还可以广泛用于描述其他类型的传感器,如光探测和测距( LiDAR )和无线电探测和测距(雷达)如何感知物理世界。在自动驾驶汽车中,计算机视觉用于描述激光雷达和雷达传感器如何工作,通常与摄像头一起工作,以识别和分类人、物体和碎片。

有哪些常见任务?

虽然计算机视觉任务涵盖了广泛的感知能力,而且列表还在不断增长,但最新的技术支持并帮助解决涉及检测、分类、分割和图像合成的用例。

检测任务定位并有时跟踪图像中存在的对象。例如,在数字病理医疗领域,检测可能涉及通过医学成像识别癌细胞。在机器人技术领域,软件开发人员正在使用目标检测来避开工厂地板上的障碍物。

分类技术确定视觉数据中存在的对象。例如,在制造业中,物体识别系统将不同类型的瓶子分类包装。在农业领域,农民们正在使用分类来识别作物中的杂草。

分割任务对属于某一类别的像素进行分类,可以按像素单独分类(语义图像分割),也可以将同一类别的多个对象类型指定为单个实例(实例图像分割)。例如,自动驾驶汽车将道路场景的一部分分割为可驾驶空间和非可驾驶空间。

图像合成技术通过变形现有数字图像以包含所需内容来创建合成数据。生成性对抗网络( GAN ),比如 EditGAN ,能够从文本描述和现有的风景和人物图像中生成合成视觉信息。使用合成数据来补充和模拟真实数据是物流领域一个新兴的计算机视觉用例,它将视觉 AI 用于智能库存控制等应用。

什么是不同类型的计算机视觉?

为了理解计算机视觉中的不同领域,理解计算机视觉任务所基于的技术是很重要的。大多数计算机视觉技术都是从一个模型或数学算法开始的,它执行特定的基本操作、任务或组合。虽然我们将传统的图像处理和基于人工智能的计算机视觉算法分别进行分类,但大多数计算机视觉系统依赖于一种组合,这取决于用例、复杂性和所需的性能。

传统的计算机视觉

传统的、基于非深度学习的计算机视觉可以指计算机视觉和图像处理技术。

在传统的计算机视觉中,一组特定的指令执行特定的任务,比如检测图像中的角点或边缘,以识别建筑物图像中的窗口。

另一方面,图像处理对图像执行特定操作,然后可以使用视觉算法对图像进行进一步处理。例如,您可能希望平滑或压缩图像的像素以供显示,或减小其整体大小。这可以比作弯曲进入眼睛的光线来调整焦点或视野。图像处理的其他示例包括调整、转换、重新缩放和扭曲输入图像。

基于人工智能的计算机视觉

基于人工智能的计算机视觉或视觉人工智能依赖于经过视觉数据训练的算法来完成特定任务,而不是像图像处理那样的编程、硬编码指令。

前面提到的检测、分类、分割和合成任务通常都是基于人工智能的计算机视觉算法,因为它们可以实现准确性和鲁棒性。在许多情况下,基于人工智能的计算机视觉算法可以在这两个性能指标方面优于传统算法。

基于人工智能的计算机视觉算法通过学习和适应视觉数据输入,更紧密地模拟人类视觉系统,使其在大多数情况下成为计算机视觉模型的首选。这就是说,基于人工智能的计算机视觉算法需要大量数据,数据的质量直接驱动模型输出的质量。但是,性能超过了成本。

基于人工智能的神经网络自学,这取决于算法的训练数据。基于人工智能的计算机视觉就像是从经验中学习,并根据上下文做出预测,而不是明确的方向。学习过程类似于当你的眼睛看到一个不熟悉的物体,大脑试图学习它是什么,并将其存储起来以备将来预测。

基于人工智能的计算机视觉中机器学习与深度学习的比较

机器学习计算机视觉是一种基于人工智能的计算机视觉。基于人工智能的基于机器学习的计算机视觉具有人工神经网络或层,类似于人脑中的神经网络或层,用于连接和传输有关摄取的视觉数据的信号。在机器学习中,计算机视觉神经网络具有独立且不同的层,明确定义层之间的连接,以及视觉数据传输的预定义方向。

基于深度学习的计算机视觉模型是基于机器学习的计算机视觉的一个子集。深度学习中的“深度”源于神经网络的深度或层数。通常,三层或三层以上的神经网络被认为是深层次的。

基于人工智能的基于深度学习的计算机视觉是基于大量数据进行训练的。数十万、数以百万计的数字图像被用来训练和开发深层神经网络模型,这种情况并不少见。

开始开发计算机视觉

既然我们已经介绍了计算机视觉的基础知识,我们鼓励您开始开发计算机视觉。我们建议初学者开始使用 视觉编程接口( VPI )计算机视觉和图像处理库 进行非人工智能算法或 TAO 工具包完全可操作、随时可用、经过预训练的人工智能模型 。

关于作者

迈克尔·布恩是NVIDIA 自动驾驶汽车和计算机视觉的产品营销经理。在 2019 冠状病毒疾病流行的米迦勒,他开始了一个有执照的专业工程师的职业生涯,从交通基础设施咨询中逐渐进入了新的技术领域。在他的当前角色,米迦勒合作在NVIDIA 的团队,开发和定位令人兴奋的技术解决方案,在人工智能和深入学习的计算机视觉应用的医疗保健( CuCIM ),定义自主车辆平台(驱动器),并支持启用 NVIDIA 计算机视觉和图像处理库视觉编程接口( VPI )社区。 Michael 与研究、工程、产品和活动团队合作,分享、开发和交付下一代技术。

Sandeep Hiremath 是NVIDIA 计算机视觉的首席技术产品经理。他是一位经验丰富的产品领导者,专长于计算机视觉、机器学习和嵌入式系统领域。在NVIDIA ,他负责为汽车、医疗保健、机器人和研究领域的开发人员提供一组计算机视觉和图像处理解决方案的产品愿景和战略。在 MathWorks 的前一份工作中,他在十多年中担任了多个面向客户的角色,涉及客户成功、宣传,以及为学术界、机器人和嵌入式视觉领域的 MATLAB 用户提供营销解决方案。

Ona Ogbona 是 NVIDIA 的高级系统安全工程师,致力于开发自动驾驶解决方案。她的职责包括客户参与、产品开发、系统和安全流程交付,以确保自动驾驶汽车的安全交付。在之前的 ZF 工作中,她为乘用车和卡车开发了转向电子设备,发挥了功能性安全作用,成功地实现了车辆道路释放。在加入汽车行业之前, Ona 一直在陆地和深水石油和天然气行业发挥作用。 Ona 是特许工程师(曾)和工程技术学会( MIET )成员。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4597

    浏览量

    101750
  • 计算机
    +关注

    关注

    19

    文章

    6652

    浏览量

    84565
  • 深度学习
    +关注

    关注

    73

    文章

    5239

    浏览量

    119922
收藏 人收藏

    评论

    相关推荐

    机器视觉、工业视觉计算机视觉这三者的关系

    机器视觉、工业视觉计算机视觉这三者的关系
    的头像 发表于 01-24 10:51 576次阅读
    机器<b class='flag-5'>视觉</b>、工业<b class='flag-5'>视觉</b>和<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>这三者的关系

    最适合 AI 应用的计算机视觉类型是什么?

    计算机视觉是指为计算机赋予人类视觉这一技术目标,从而赋能装配线检查到驾驶辅助和机器人等应用。计算机缺乏像人类一样凭直觉产生
    的头像 发表于 12-18 13:09 6857次阅读
    最适合 AI 应用的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>类型是什么?

    什么是计算机视觉计算机视觉的三种方法

    计算机视觉是指通过为计算机赋予人类视觉这一技术目标,从而赋能装配线检查到驾驶辅助和机器人等应用。计算机缺乏像人类一样凭直觉产生
    的头像 发表于 11-16 16:38 3136次阅读
    什么是<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>?<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>的三种方法

    最适合AI应用的计算机视觉类型是什么?

    计算机视觉是指为计算机赋予人类视觉这一技术目标,从而赋能装配线检查到驾驶辅助和机器人等应用。计算机缺乏像人类一样凭直觉产生
    的头像 发表于 11-15 16:38 239次阅读
    最适合AI应用的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>类型是什么?

    STM32低功耗计算机视觉应用:后装智能无线抄表模型

    STM32低功耗计算机视觉应用:后装智能无线抄表模型
    的头像 发表于 09-21 17:55 526次阅读
    STM32低功耗<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>应用:后装智能无线抄表模型

    计算机视觉前景光明

    电子发烧友网站提供《计算机视觉前景光明.pdf》资料免费下载
    发表于 09-18 10:16 0次下载
    <b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>前景光明

    计算机组成与设计

    组成与设计的一些基本概念和内容,同时探讨这门课程的重要性以及对未来的影响。 一、计算机组成原理 计算机组成原理是计算机科学中的一个重要分支,
    的头像 发表于 08-17 12:37 936次阅读

    人工智能计算机视觉方向是什么

    人工智能计算机视觉方向是什么 人工智能计算机视觉方向是指利用人工智能技术对图像和视频进行各种分析、解释和操作的过程。计算机
    的头像 发表于 08-15 16:06 1200次阅读

    机器视觉计算机视觉的区别

    机器视觉计算机视觉的区别 机器视觉计算机视觉是两个相关但不同的概念。虽然许多人使用这两个术语
    的头像 发表于 08-09 16:51 1143次阅读

    计算机视觉是什么 计算机视觉历史及发展趋势

    正像其它学科一样,一个大量人员研究了多年的学科,却很难给出一个严格的定义,模式识别如此,目前火热的人工智能如此,计算机视觉亦如此。与计算机视觉密切相关的概念有
    发表于 07-20 15:41 0次下载

    计算机视觉的概念和主要任务

    作为人工智能的关键领域之一的计算机视觉近期再次成为了热点,那么你真的了解什么是计算机视觉吗?
    的头像 发表于 07-17 11:20 891次阅读

    计算机视觉体温测量系统

    电子发烧友网站提供《计算机视觉体温测量系统.zip》资料免费下载
    发表于 07-03 11:31 0次下载
    <b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>体温测量系统

    计算机视觉驱动的迪斯科开源分享

    电子发烧友网站提供《计算机视觉驱动的迪斯科开源分享.zip》资料免费下载
    发表于 06-30 14:48 0次下载
    <b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>驱动的迪斯科开源分享

    什么是机器视觉?机器视觉计算机有什么关系?

    机器视觉计算机视觉有什么区别
    的头像 发表于 06-05 09:28 867次阅读
    什么是机器<b class='flag-5'>视觉</b>?机器<b class='flag-5'>视觉</b>与<b class='flag-5'>计算机</b>有什么关系?

    计算机视觉相关概念总结

    为了帮助同事和客户了解更多有关计算机视觉和AI的更多信息,我们言简意赅介绍一些计算机视觉和AI术语,希望能
    的头像 发表于 05-31 10:11 522次阅读