0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌推出新的移动框架MobileNetV2提高多种计算机视觉任务

zhKF_jqr_AI 2018-04-07 20:57 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

当地时间4月3日,谷歌推出了一款新的移动框架MobileNetV2,基于上一代MobileNet,这款模型能显著提高多种计算机视觉任务。

去年我们推出了MobileNetV1,这是一款为移动设备而设计的通用计算机视觉神经网络模型,它有分类、检测等功能。这种可以在个人移动设备上运行深度网络的能力极大地提升了用户体验,不仅能随时随地访问,还非常安全、私密、省电。随着新应用的出现,用户可以与现实世界进行实时交互,同样对更高效的深度网络也有更多的需求。

今天,我们很高兴宣布MobileNetV2已经可以支持下一代移动视觉应用。MobileNetV2在MobileNetV1上做出了重大改进,并推动了目前移动设备的视觉识别技术的发展,包括图像分类、检测和语义分割。MobileNetV2作为TensorFlow-Slim图像分类库的一部分发布,或者您可以在Colaboratory中探索MobileNetV2。另外,您还可以利用Jupyter下载笔记本并进行使用。MobileNetV2也可以作为TF-Hub上的模块使用,预训练的检查点可以在GitHub上找到。

MobileNetV2的创建基于MobileNetV1的思想,使用深度可分离卷积作为高效的构建模块。然而,V2在架构中引入了两种新特征:

图层间的线性瓶颈层

瓶颈层之间的快捷连接

基本结构如图所示:

可以看到,瓶颈对模型的中间输入和输出进行编码,而内层包括了模型能将低级概念(如像素)转换为高级描述符(如图像类别)的能力。最后,剩余的连接和传统一样,快速连接可实现更快的训练速度和更高的准确性。具体细节可以查看论文:MobileNetV2:Inverted Residuals and Linear Bottlenecks:https://arxiv.org/abs/1801.04381。

它与第一代MobileNets相比如何?

总体而言,在整个延迟频谱中,MobileNetV2模型在相同精度下的速度更快。特别的是,新模型所用的操作次数减少了2次,参数减少了30%,在谷歌pixel手机上的速度比V1快了30%~40%,同时达到了更高的准确性。

MobileNetV2在目标物体检测和分割时是一个非常高效的特征提取器。例如,当与新发布的SSDLite合作进行物体检测时,新模型在做到与V1同样准确的情况下,速度快了35%。我们已经在TensorFlow目标物体检测API中开源了此模型。

为支持移动设备的语义分割,我们将MobileNetV2当做特征提取器安装在简化版的DeepLabv3上。在语义分割的基准PASCAL VOC 2012中,我们的结果与将V1作为特征提取器实现了相似的性能,但是参数少了5.3倍,在乘加运算上操作次数减少了5.2倍。

由此可见,MobileNetV2作为许多视觉识别任务的基础,是移动设备上高效的模型。我们希望与学术界和开源社区共享,以此帮助更多人的研究和应用发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6245

    浏览量

    110273
  • 计算机视觉
    +关注

    关注

    9

    文章

    1714

    浏览量

    47457

原文标题:谷歌推出MobileNetV2,为下一代移动设备CV网络而生

文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    STM32计算机视觉开发套件:B-CAMS-IMX摄像头模块技术解析

    STMicroelectronics用于 STM32开发板的B-CAMS-IMX摄像头模块提供强大的硬件集,可处理多种计算机视觉场景和用例。该模块具有高分辨率500万像素IMX335LQN
    的头像 发表于 10-20 09:46 724次阅读
    STM32<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>开发套件:B-CAMS-IMX摄像头模块技术解析

    【作品合集】赛昉科技VisionFive 2单板计算机开发板测评

    赛昉科技VisionFive 2单板计算机开发板测评作品合集 产品介绍: 昉·星光 2是全球首款集成了3D GPU的高性能量产RISC-V单板计算机,搭载昉·惊鸿-7110(型号:JH
    发表于 09-04 09:08

    加固计算机是用来干什么的?

    ,具有防尘、防水、防摔的特性,内部还经过防震加固处理,确保在运输、跌落或长时间移动中依旧保持稳定运行。某些加固计算机甚至符合军用标准,能够适应极端环境和高强度任务需求。
    的头像 发表于 08-22 09:55 409次阅读

    易控智驾荣获计算机视觉顶会CVPR 2025认可

    近日,2025年国际计算机视觉与模式识别顶级会议(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美国田纳西州纳什维尔召开。
    的头像 发表于 07-29 16:54 985次阅读

    工业计算机的重要性

    于管理用于产品检查、数据记录和数据分析的运动控制系统,以提高制造生产率。例如,汽车行业从工业边缘计算机中受益匪浅,这些计算机用于自动化制造汽车所涉及的各种过程。工业边
    的头像 发表于 07-28 16:07 401次阅读
    工业<b class='flag-5'>计算机</b>的重要性

    自动化计算机经过加固后有什么好处?

    -40℃的寒冷环境中运行⁰C和温度达到85℃的灼热环境,这要归功于此类系统中使用的宽温度组件和被动冷却技术。2.抗冲击和振动自动化计算机是工业级计算机,其设计和制造可
    的头像 发表于 07-21 16:44 431次阅读
    自动化<b class='flag-5'>计算机</b>经过加固后有什么好处?

    自动化计算机的功能与用途

    工业自动化是指利用自动化计算机来控制工业环境中的流程、机器人和机械,以制造产品或其部件。工业自动化的目的是提高生产率、增加灵活性,并提升制造过程的质量。工业自动化在汽车制造中体现得最为明显,其中许多任务
    的头像 发表于 07-15 16:32 535次阅读
    自动化<b class='flag-5'>计算机</b>的功能与用途

    工业计算机与商用计算机的区别有哪些

    工业计算机是一种专为工厂和工业环境设计的计算系统,具有高可靠性和稳定性,能够应对恶劣环境下的自动化、制造和机器人操作。其特点包括无风扇散热技术、无电缆连接和防尘防水设计,使其在各种工业自动化场景中
    的头像 发表于 07-10 16:36 526次阅读
    工业<b class='flag-5'>计算机</b>与商用<b class='flag-5'>计算机</b>的区别有哪些

    一文带你了解工业计算机尺寸

    一项艰巨的任务。本博客将指导您了解关键的工业计算机尺寸、使用案例。关键工业计算机外形要素及其使用案例一、工业微型PC尺寸范围:宽度:100毫米-180毫米深度:10
    的头像 发表于 04-24 13:35 795次阅读
    一文带你了解工业<b class='flag-5'>计算机</b>尺寸

    NVIDIA 宣布推出 DGX Spark 个人 AI 计算机

    台式超级计算机由 NVIDIA Grace Blackwell 驱动,为开发者、研究人员和数据科学家提供加速 AI 功能;系统由头部计算机制造商(包括华硕、Dell Technologies、HP
    发表于 03-19 09:59 504次阅读
       NVIDIA 宣布<b class='flag-5'>推出</b> DGX Spark 个人 AI <b class='flag-5'>计算机</b>

    将预先训练的固态盘MobileNetV2模型转换为IR,在运行替换器“REPLACEMENT_ID”时发生异常错误怎么解决?

    将预先训练的固态盘 MobileNetV2 模型转换为 IR,但无法转换经过自定义训练的模型。 导出的冻结模型图:python object_detection
    发表于 03-07 08:01

    Arm KleidiCV与OpenCV集成助力移动计算机视觉性能优化

    多种应用中。然而,这些计算机视觉应用可能很难实现最优化的延迟性能和处理速度,特别是在内存大小、电池容量和处理能力有限的移动设备上难度更高。 而 Arm KleidiCV 便能在其中大
    的头像 发表于 02-24 10:15 885次阅读

    微软OmniParser V2:大模型转化为计算机智能体

    )以及Anthropic(Sonnet)等,转化为“计算机使用智能体”(Computer Use Agent)的能力。 与前一版本相比,OmniParser V2在检测更微小、可交互的元素时展现出了更高
    的头像 发表于 02-18 09:31 2676次阅读

    AR和VR中的计算机视觉

    ):计算机视觉引领混合现实体验增强现实(AR)和虚拟现实(VR)正在彻底改变我们与外部世界的互动方式。即便是在引人入胜的沉浸式
    的头像 发表于 02-08 14:29 2154次阅读
    AR和VR中的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>

    云端超级计算机使用教程

    云端超级计算机是一种基于云计算的高性能计算服务,它将大量计算资源和存储资源集中在一起,通过网络向用户提供按需的计算服务。下面,AI部落小编为
    的头像 发表于 12-17 10:19 963次阅读