0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

盘点2018年计算机视觉领域技术突破

张康康 2019-07-29 18:27 次阅读

回顾2018年,是属于人工智能的一年,不论是Google、Facebook、Intel、阿里巴巴等通过产业布局进入人工智能领域的互联网企业,亦或如旷视科技Face++、极链科技Video++、优必选科技这样直接以人工智能起家的原生技术企业,都将AI注入到每个角落,掀起了一轮又一轮的技术高潮。

因而,除了NLP研究突破接连不断,CV领域同样精彩纷呈,伴随着各式各样落地应用如此接近人们的生活,技术也变得越发成熟。本文整理了在2018年,在CV技术领域取得的最主要的一些重大技术突破。


BigGAN发布

Ian Goodfellow在2014年设计了GAN,在之后的几年中,围绕这个概念产生了多种多样的应用程序。

其中,在ICLR 2019论文中出现的BigGAN,同样是一个GAN,只不过更强大,是拥有了更聪明的课程学习技巧的GAN,由它训练生成的图像连它自己都分辨不出真假,因为除非拿显微镜看,否则将无法判断该图像是否有任何问题,因而,它更被誉为史上最强的图像生成器。


在计算机图像研究史上,BigGAN带来的突破是划时代的,比如在ImageNet上进行128×128分辨率的训练后,它的IS得分能达到166.3,是之前最佳得分52.52分3倍;除了搞定128×128小图之外,BigGAN还能直接在256×256、512×512的ImageNet数据上训练,生成更让人信服的样本。

英伟达Video-to-Video Synthesis

英伟达在2018年的收获颇丰,他们的研究焦点从标准的监督学习转向更具挑战性的机器学习,如半监督学习,领域适应,主动学习和生成模型等。其中,由英伟达在2018年末发布的最大成果之一便是视频到视频生成(Video-to-Video synthesis),它通过精心设计的发生器、鉴别器网络以及时空对抗物镜,合成高分辨率、照片级真实、时间一致的视频,实现了让AI更具物理意识,更强大,并能够推广到新的和看不见的更多场景。


因而,Video-to-Video Synthesis也被看作是在过去几年中,视频领域的一次重大突破,毕竟从静态框架转换为动态框架的难度是很大的,但机器训练却在尽量模拟预测视频将会发生的情景,通过给定的输入视频学习映射函数,产生仿真度极高的视频内容。

Fast.ai18分钟训练ImageNet

在普遍认知还停留在需要大量计算资源来执行适当的深度学习任务时,Fast.ai通过使用16个公共AWS云实例,每个配备8个NVIDIA V100 GPU,运行fast.ai和PyTorch,用18分钟在ImageNet上将图像分类模型训练到了93%的准确率,刷新了一个新的速度记录。


这是一个令人惊喜的结果,尤其在公共基础设施上训练ImageNet能达到这种准确性,并且比其专有TPU Pod群集上的谷歌DAWNBench记录快40%,运行成本仅约为40美元。这意味着一个关键的里程碑出现了,几乎所有人都可以在一个相当大的数据集上训练大规模神经网络。

除了这些重要的节点之外,2018年的计算机视觉技术也部署更多方面,不论是亚马逊发布Rekognition将计算机视觉置于开发人员、微软为OneDrive和SharePoint推出了新的AI服务、Google相册让我们的记忆变得可搜索、还是每个场景下都正在逐渐普及的AI人脸识别等等,计算机视觉正在逐步渗透到我们生活的每个部分。

最后,最值得注意的是,计算机视觉的市场增长几乎与其技术能力的增长是一样快的,预计到 2025年,计算机视觉领域会带来超过262亿美元的收益,因而在人工智能的未来里,计算机视觉一定是最有力的表现形式,并将随处可见。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26405

    浏览量

    264006
  • 计算机视觉
    +关注

    关注

    8

    文章

    1595

    浏览量

    45602
收藏 人收藏

    评论

    相关推荐

    计算机视觉领域的十大核心技术算法

    图像分割算法是计算机视觉领域的基础算法之一,它的主要任务是将图像分割成不同的区域或对象。常见的图像分割算法包括基于阈值的分割、基于区域的分割、基于边缘的分割和基于图割的分割等。
    发表于 02-25 09:38 241次阅读

    量子计算机 未来希望

    自己从事语音识别产品设计开发,而量子技术和量子计算机必将在自然语言处理方面实现重大突破,想通过此书学习量子计算技术,储备知识,谢谢!
    发表于 02-01 12:51

    机器视觉、工业视觉计算机视觉这三者的关系

    机器视觉、工业视觉计算机视觉这三者的关系
    的头像 发表于 01-24 10:51 565次阅读
    机器<b class='flag-5'>视觉</b>、工业<b class='flag-5'>视觉</b>和<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>这三者的关系

    最适合 AI 应用的计算机视觉类型是什么?

    计算机视觉是指为计算机赋予人类视觉这一技术目标,从而赋能装配线检查到驾驶辅助和机器人等应用。计算机
    的头像 发表于 12-18 13:09 6851次阅读
    最适合 AI 应用的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>类型是什么?

    什么是计算机视觉计算机视觉的三种方法

    计算机视觉是指通过为计算机赋予人类视觉这一技术目标,从而赋能装配线检查到驾驶辅助和机器人等应用。计算机
    的头像 发表于 11-16 16:38 3113次阅读
    什么是<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>?<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>的三种方法

    最适合AI应用的计算机视觉类型是什么?

    计算机视觉是指为计算机赋予人类视觉这一技术目标,从而赋能装配线检查到驾驶辅助和机器人等应用。计算机
    的头像 发表于 11-15 16:38 232次阅读
    最适合AI应用的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>类型是什么?

    【RISC-V + OpenCV 计算机视觉】用 VisionFive 2 昉·星光 2 进行物体识别

    RVSpace:【RISC-V + OpenCV 计算机视觉】用 VisionFive 2 昉·星光 2 进行物体识别 bilibili:【【RISC-V + OpenCV 计算机视觉
    发表于 09-08 11:42

    人工智能计算机视觉方向是什么

    “看”并作出决策。 计算机视觉是人工智能领域的一大分支,是以计算机和数字图像处理技术为手段,通过对视觉
    的头像 发表于 08-15 16:06 1186次阅读

    机器视觉计算机视觉的区别

    机器视觉计算机视觉的区别 机器视觉计算机视觉是两个相关但不同的概念。虽然许多人使用这两个术语
    的头像 发表于 08-09 16:51 1113次阅读

    计算机视觉是什么 计算机视觉历史及发展趋势

    正像其它学科一样,一个大量人员研究了多年的学科,却很难给出一个严格的定义,模式识别如此,目前火热的人工智能如此,计算机视觉亦如此。与计算机视觉密切相关的概念有
    发表于 07-20 15:41 0次下载

    计算机视觉的概念和主要任务

    作为人工智能的关键领域之一的计算机视觉近期再次成为了热点,那么你真的了解什么是计算机视觉吗?
    的头像 发表于 07-17 11:20 882次阅读

    计算机视觉六大主要技术介绍

    本文将对计算机视觉应用中最为广泛的六大技术进行介绍。
    的头像 发表于 07-11 17:06 646次阅读

    浅谈深度学习在计算机视觉领域的三大瓶颈

    深度学习能够实现的前提是大量经过标注的数据,这使得计算机视觉领域的研究人员倾向于在数据资源丰富的领域搞研究,而不是去重要的领域搞研究。
    发表于 06-11 10:22 266次阅读
    浅谈深度学习在<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b><b class='flag-5'>领域</b>的三大瓶颈

    什么是机器视觉?机器视觉计算机有什么关系?

    机器视觉计算机视觉有什么区别
    的头像 发表于 06-05 09:28 854次阅读
    什么是机器<b class='flag-5'>视觉</b>?机器<b class='flag-5'>视觉</b>与<b class='flag-5'>计算机</b>有什么关系?

    计算机视觉相关概念总结

    为了帮助同事和客户了解更多有关计算机视觉和AI的更多信息,我们言简意赅介绍一些计算机视觉和AI术语,希望能帮助到大家。
    的头像 发表于 05-31 10:11 514次阅读