0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

干货!一文读懂AI计算机视觉技术,“视觉五虎将”值得关注

AI机器人 2018-09-21 09:47 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作为人工智能的关键领域之一的计算机视觉近期再次成为了热点,那么你真的了解什么是计算机视觉吗?

一、什么是计算机视觉?

计算机视觉,英文Computer Vision,简称CV。计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等。

二、计算机视觉和机器视觉有何区别?

事实上,二者经常会被混淆,甚至有些“专家”也没分清。

简单的说,二者最大的区别,在于技术要求的侧重点不一样,甚至差别很大。 计算机视觉(CV),主要是对质的分析,比如分类识别,这是一个杯子那是一条狗。或者做身份确认,比如人脸识别,车牌识别。或者做行为分析,比如人员入侵,徘徊,遗留物,人群聚集等。

机器视觉(MV),主要侧重对量的分析,比如通过视觉去测量一个零件的直径,一般来说,对准确度要求很高。

三、计算机视觉主要任务是什么?

计算机视觉的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的信息。计算机视觉任务的主要类型有以下几种:

1、物体检测

物体检测是视觉感知的第一步,也是计算机视觉的一个重要分支。物体检测的目标,就是用框去标出物体的位置,并给出物体的类别。

物体检测和图像分类不一样,检测侧重于物体的搜索,而且物体检测的目标必须要有固定的形状和轮廓。图像分类可以是任意的目标,这个目标可能是物体,也可能是一些属性或者场景。

2、物体识别(狭义)

计算机视觉的经典问题便是判定一组图像数据中是否包含某个特定的物体,图像特征或运动状态。这一问题通常可以通过机器自动解决,但是到目前为止,还没有某个单一的方法能够广泛的对各种情况进行判定:在任意环境中识别任意物体。

现有技术能够也只能够很好地解决特定目标的识别,比如简单几何图形识别、人脸识别、印刷或手写文件识别,或者车辆识别。而且这些识别需要在特定的环境中,具有指定的光照,背景和目标姿态要求。

3、图像分类

一张图像中是否包含某种物体,对图像进行特征描述是物体分类的主要研究内容。一般说来,物体分类算法通过手工特征或者特征学习方法对整个图像进行全局描述,然后使用分类器判断是否存在某类物体。

图像分类问题就是给输入图像分配标签的任务,这是计算机视觉的核心问题之一。这个过程往往与机器学习深度学习不可分割。

4、物体定位

如果说图像识别解决的是what,那么,物体定位解决的则是where的问题。利用计算视觉技术找到图像中某一目标物体在图像中的位置,即定位。

目标物体的定位对于计算机视觉在安防、自动驾驶等领域的应用有着至关重要的意义。

5、图像分割

在图像处理过程中,有时会需要对图像进行分割来提取有价值的用于后继处理的部分,例如筛选特征点,或者分割一或多幅图片中含有特定目标的部分等。

图像分割指的是将数字图像细分为多个图像子区域(像素的集合,也被称作超像素)的过程。图像分割的目的是简化或改变图像的表示形式,使得图像更容易理解和分析。更精确地说,图像分割是对图像中的每个像素加标签的一个过程,这一过程使得具有相同标签的像素具有某种共同视觉特性。

“图像语意分割”是一个像素级别的物体识别,即每个像素点都要判断它的类别。它和检测的区别是,物体检测是一个物体级别的,他只需要一个框,去框住物体的位置,而通常分割是比检测要更难的问题。

计算机视觉是通过创建人工模型来模拟本由人类执行的视觉任务。其本质是模拟人类的感知与观察的一个过程。这个过程不止识别,而是包含了一系列的过程,并且最终是可以在人工系统中被理解和实现的。

四、“视觉五虎将”都是谁?

目前在计算机视觉领域已经涌现出商汤科技、旷视科技、深兰科技、依图科技、云从科技等一批技术领先的独角兽公司,行业称为“视觉五虎将”,我们对这些公司作个简单介绍。

商汤科技:

公开资料显示,商汤科技成立于2014年11月,是中国一家计算机视觉和深度学习原创技术的创新型科技公司,也是一家知名独角兽企业,致力于引领人工智能核心“深度学习”的技术突破,构建人工智能、大数据分析行业解决方案。

目前,商汤科技已与众多知名战略合作伙伴和大客户建立合作,赋能AI于多个行业,迅速落地包括人脸识别、图像识别、视频分析、无人驾驶、医疗影像识别等各类应用技术。此外,商汤科技以人工智能技术服务于各大安防监控公司、银行金融机构、手机厂商、机器人厂商、多家移动APP厂商以及政府公安等客户。

旷视科技:

旷视科技成立于2011年10月,以深度学习和物联传感技术为核心,立足于自有原创深度学习算法引擎Brain++,深耕金融安全,城市安防,手机AR,商业物联,工业机器人五大核心行业。发展至今,旷视已在北京、西雅图、南京设立独立研究院,并在十余个核心城市设立分部。

旷视的核心人脸识别技术Face++曾被美国著名科技评论杂志《麻省理工科技评论》评定为2017全球十大前沿科技,同时公司入榜全球最聪明公司并位列第11名。在中国科技部火炬中心“独角兽”榜单中,旷视排在人工智能类首位。

深兰科技:

深兰科技,2014年由归国博士团队创建,致力于人工智能基础研究和应用开发。在全球拥有近百位全职博士和博士后学术带头人,几百位名校硕士研发人员,团队曾多次获得多项世界大赛和国内大赛奖项。团队利用自主知识产权的深度学习架构、机器视觉、生物智能识别等人工智能算法、无媒介支付等核心技术,在自动驾驶及整车制造、智能机器人、生物智能、AI芯片、智能零售、智慧城市、智慧安防、教育军工等领域都有深入布局,拥有包括英特尔在内6家人工智能联合实验室。

依图科技:

成立于2012年,公司核心业务包括智能安防平台、智慧健康医疗、城市数据大脑、智能硬件设备等。目前,依图的技术早已经服务全国20余省安防,为海关总署及中国边检等提供人像比对系统,并在招商银行、浦发银行,遗迹互联网金融等多个业务场景中广泛应用,车辆识别产品亦被公安系统广泛采用,依图也是目前国内唯一拥有10亿级人像库比对能力的公司,搭建了全球最大的人像系统,覆盖超过15亿人像。

云从科技

成立于2015年4月,是一家从中科院重庆研究院孵化的专注于计算机视觉与人工智能的高科技企业。是计算机视觉头部企业中的国家队,承建了国家发改委的基础项目重大工程——“人工智能基础资源公共服务平台”与产业化项目重大工程“人脸识别系统产业化应用平台”。与公安部、四大银行、证通、民航总局建立联合实验室,推动人工智能产品标准的建立,成为唯一同时制定国标、部标、行标的人工智能企业。国家发改委公布的《2017年“互联网+”重大工程拟支持项目名单》中包含四个AI公司,云从科技是其中唯一一家创业公司。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    计算机专业408考研科目

    408 跨考零基础:三个月入门到精通路线 站在2026年的节点回望,计算机考研408(计算机学科专业基础综合)早已超越了单纯的知识点考核,它更像是场对逻辑思维与系统观的深度洗礼。对于跨考且零基
    发表于 04-11 16:44

    传音相关研究成果入选计算机视觉顶会CVPR 2026

    (Mohamed bin Zayed University of Artificial Intelligence,简称MBZUAI)联合开展的“拍照解题”项目研究取得重要进展,相关成果论文已被计算机视觉领域的国际顶级学术会议CVPR 2026正式录用。
    的头像 发表于 04-03 17:45 2923次阅读
    传音相关研究成果入选<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>顶会CVPR 2026

    瑞芯微SOC智能视觉AI处理器

    需要连接多种外设的产品。显示: 支持双屏异显,最高4K@60fps输出。 RK1126B: 款集成自研NPU的智能视觉AI处理器,专注于视频输入端的AI分析与处理。CPU: 双核A5
    发表于 12-19 13:44

    上海计算机视觉企业行学术沙龙走进西井科技

    12月5日,由中国图象图形学学会青年工作委员会(下简称“青工委”)、上海市计算机学会计算机视觉专委会(下简称“专委会”)联合主办,上海西井科技股份有限公司、江苏路街道商会承办的“上海计算机
    的头像 发表于 12-16 15:39 736次阅读

    使用代理式AI激活传统计算机视觉系统的三种方法

    当前的计算机视觉系统擅长于识别物理空间与流程中的事件,却难以诠释场景细节及其意义,也无法推理后续可能发生的情况。
    的头像 发表于 12-01 09:44 781次阅读

    了解ai计算盒子(边缘计算盒子)是到底是什么产品?

    和生产的各个场景。很多人对这款设备感到陌生,今天就带大家全面解锁ai边缘计算盒子的核心奥秘。ai边缘计算盒子是高度集成计算机
    的头像 发表于 11-10 14:48 1175次阅读
    <b class='flag-5'>一</b><b class='flag-5'>文</b>了解<b class='flag-5'>ai</b><b class='flag-5'>计算</b>盒子(边缘<b class='flag-5'>计算</b>盒子)是到底是什么产品?

    STM32计算机视觉开发套件:B-CAMS-IMX摄像头模块技术解析

    STMicroelectronics用于 STM32开发板的B-CAMS-IMX摄像头模块提供强大的硬件集,可处理多种计算机视觉场景和用例。该模块具有高分辨率500万像素IMX335LQN
    的头像 发表于 10-20 09:46 1610次阅读
    STM32<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>开发套件:B-CAMS-IMX摄像头模块<b class='flag-5'>技术</b>解析

    星宸科技拟赴港IPO,视觉AI SoC全球出货,安防第、机器人第二

    举足轻重的地位,此次上市计划备受市场关注。   星宸科技依托”视觉+AI”的核心框架以及“感知+计算+连接”的核心技术优势,致力于推动
    的头像 发表于 10-15 08:43 1.3w次阅读
    星宸科技拟赴港IPO,<b class='flag-5'>视觉</b><b class='flag-5'>AI</b> SoC全球出货,安防第<b class='flag-5'>一</b>、机器人第二

    NVIDIA DGX Spark桌面AI计算机开启预订

    DGX Spark 现已开启预订!丽台科技作为 NVIDIA 授权分销商,提供从产品到服务的站式解决方案,助力轻松部署桌面 AI 计算机
    的头像 发表于 09-23 17:20 1537次阅读
    NVIDIA DGX Spark桌面<b class='flag-5'>AI</b><b class='flag-5'>计算机</b>开启预订

    什么是机器视觉及其功能?

    机器视觉本质上是个系统(例如计算机)查看的能力。系统通过该能力分析图像,然后作出决策或进行分类。
    的头像 发表于 09-10 17:23 867次阅读
    什么是机器<b class='flag-5'>视觉</b>及其功能?

    易控智驾荣获计算机视觉顶会CVPR 2025认可

    近日,2025年国际计算机视觉与模式识别顶级会议(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美国田纳西州纳什维尔召开。
    的头像 发表于 07-29 16:54 1372次阅读

    带你了解什么是机器视觉网卡

    机器视觉网卡通常指的是在机器视觉系统中用于连接工业相机到计算机的以太网卡。它的核心作用是实现高速、稳定、低延迟的图像数据传输。以下是关于机器视觉网卡的关键信息:1.核心功能:高速图像传
    的头像 发表于 07-09 16:18 859次阅读
    <b class='flag-5'>一</b><b class='flag-5'>文</b>带你了解什么是机器<b class='flag-5'>视觉</b>网卡

    无人机AI视觉行为识别系统

    无人机AI视觉行为识别系统 随着无人机技术的快速发展和计算机视觉领域的突破性进展,无人机AI
    的头像 发表于 07-04 16:53 1205次阅读

    利用边缘计算和工业计算机实现智能视频分析

    IVA的好处、实际部署应用程序以及工业计算机如何实现这些解决方案。、什么是智能视频分析(IVA)?智能视频分析(IVA)集成了复杂的计算机视觉,通常与卷积神经网
    的头像 发表于 05-16 14:37 980次阅读
    利用边缘<b class='flag-5'>计算</b>和工业<b class='flag-5'>计算机</b>实现智能视频分析