0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

商汤和港中大开源了基于PyTorch的检测库——mmdetection

电子工程师 来源:未知 作者:李倩 2018-10-19 09:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,香港中文大学-商汤联合实验室开源了基于 PyTorch 的检测库——mmdetection。上个月,商汤和港中大组成的团队在 COCO 比赛的物体检测(Detection)项目中夺得冠军,而 mmdetection 正是基于 COCO 比赛时的 codebase 重构。

商汤称,这个开源库提供了已公开发表的多种视觉检测核心模块。通过这些模块的组合,可以迅速搭建出各种著名的检测框架,比如 Faster RCNN,Mask RCNN,和 R-FCN 等,以及各种新型框架,从而大大加快检测技术研究的效率。

目前,mmdetection 的第一个版本已经实现了 RPN,Fast R-CNN,Faster R-CNN,Mask R-CNN,近期还计划放出 RetinaNet 和 Cascade R-CNN。

项目地址:

https://github.com/open-mmlab/mmdetection

此次项目的参与者,香港中文大学陈恺博士称,相比 FAIR 此前开源的 Detectron,mmdetection 有以下几大优势:

编者注:Detectron 是 FAIR 用于实现最先进的目标检测算法(包括 Mask R-CNN)的软件系统。该系统基于深度学习框架 Caffe 2 ,由 Python 编写而成。(《Mask R-CNN 源代码终上线,Facebook 开源目标检测平台—Detectron》)

Performance 稍高:由于 PyTorch 官方 model zoo 里面的 ResNet 结构和 Detectron 所用的 ResNet 有细微差别(mmdetection 中可以通过 backbone 的 style 参数指定),导致模型收敛速度不一样,所以我们用两种结构都跑了实验,一般来说在 1x 的 lr schedule 下 Detectron的会高,但 2x 的结果 PyTorch 的结构会比较高。

训练速度稍快:Mask R-CNN 差距比较大,其余的很小。采用相同的 setting,Detectron 每个 iteration 需要 0.89s,而 mmdetection 只需要 0.69s。Fast R-CNN 比较例外,比 Detectron 的速度稍慢。另外在我们的服务器上跑 Detectron 会比官方 report 的速度慢 20% 左右,猜测是 FB 的 Big Basin 服务器性能比我们好?

所需显存稍小:显存方面优势比较明显,会小 30% 左右。但这个和框架有关,不完全是 codebase 优化的功劳。一个让我们比较意外的结果是现在的 codebase 版本跑 ResNet-50 的 Mask R-CNN,每张卡(12 G)可以放 4 张图,比我们比赛时候小了不少。

易用性更好:基于 PyTorch 和基于 Caffe2 的 code 相比,易用性是有代差的。成功安装 Detectron 的时间,大概可以装好一打的 mmdetection 吧。

当然,陈恺博士也承认 Detectron 也有一些明显优势,“作为第一个全面的 detection codebase,加上 FAIR 的金字招牌,关注人数和用户很多(虽然吐槽也比较多),release 的模型也比较全面。我们也在努力扩充 model zoo,奈何人力和算力还是有很大差距,所以还需要时间。”

与 mmdetection 一起开源的还有一个基础库——mmcv。据陈恺博士介绍, mmcv 基础库主要分为两个部分:一部分是和 deep learning framework 无关的一些工具函数,比如 IO/Image/Video 相关的一些操作;另一部分是为 PyTorch 写的一套训练工具,可以大大减少用户需要写的代码量,同时让整个流程的定制变得容易。

项目地址:

https://github.com/open-mmlab/mmcv

实际上,mmdetection 和 mmcv 都同属于香港中文大学多媒体实验室的 Open-MMLab 计划。港中大助理教授林达华称,启动 Open-MMLab 计划,是希望在一个统一的代码架构上,逐步开放实验室积累的算法和模型,为计算机视觉的研究社区贡献自己的一分力量。以下是简单说明:

1. 这是一个纯粹的学术开源计划,所开放的都是已经公开发表的算法和模型(包括我们自己和其它研究组提出的代表性算法),不涉及任何的商业化技术。

2. 我们希望这个计划能够降低算法复现的难度,和不必要的重复实验与训练,从而让使用者能够专注于新问题的提出、新思路的探索,而不需要花费主要精力用于已有算法组件的细节调试。

3. 我们在开放的 codebase 中会对现有的主流算法框架进行重构,把它们分解为可复用的组件。希望未来的研究者可以基于这些组件,能迅速建立新的算法框架原型,加快探索的进度。

4. 我们希望 Open-MMLab 成为一个学术交流和探讨的渠道。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 深度学习
    +关注

    关注

    73

    文章

    5590

    浏览量

    123907
  • pytorch
    +关注

    关注

    2

    文章

    813

    浏览量

    14699

原文标题:港中大、商汤开源目标检测工具包mmdetection,对比Detectron如何?

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    商汤科技正式发布并开源全新多模态模型架构NEO

    商汤科技正式发布并开源与南洋理工大学S-Lab合作研发的全新多模态模型架构 —— NEO,为日日新SenseNova 多模态模型奠定新一代架构的基石。
    的头像 发表于 12-08 11:19 149次阅读
    <b class='flag-5'>商汤</b>科技正式发布并<b class='flag-5'>开源</b>全新多模态模型架构NEO

    商汤大装置算力Mall重磅发布

    近日,商汤科技联合华为、帕思、海光、寒武纪、曦望Sunrise、壁仞科技、麒麟软件、摩尔线程等十余家国产生态伙伴,共同发布“商汤大装置算力Mall”。
    的头像 发表于 08-05 10:05 804次阅读

    商汤大装置联合发布临AIDC算电协同平台

    在2025 世界人工智能大会(WAIC)期间,商汤大装置联合达卯科技、宁德时代旗下唯一产投平台溥泉资本发布“临 AIDC 算电协同平台”,并率先在全国首个5A级智算中心“商汤智算
    的头像 发表于 08-05 10:03 865次阅读
    <b class='flag-5'>商汤</b>大装置联合发布临<b class='flag-5'>港</b>AIDC算电协同平台

    飞书富文本组件RichTextVista开源

    近日,飞书正式将其自研的富文本组件 RichTextVista(简称“RTV”)开源,并上线OpenHarmony 三方中心仓。该组件以领先的性能、流畅的渲染体验与高度的开放性,为鸿蒙生态提供
    的头像 发表于 07-16 16:47 760次阅读

    商汤小浣熊家族全面入驻联想生态全平台

    商汤和联想再次携手——商汤科技旗下生产力工具“小浣熊家族”全面入驻联想生态全平台!
    的头像 发表于 05-22 11:30 817次阅读

    商汤科技与松应科技达成战略合作

    商汤科技2025技术交流日上,商汤科技与松应科技完成战略合作签约。
    的头像 发表于 04-16 17:47 953次阅读

    摩尔线程支持DeepSeek开源通信DeepEP和并行算法DualPipe

    DeepSeek开源周第四日,摩尔线程宣布已成功支持DeepSeek开源通信DeepEP和并行算法DualPipe,并发布相关开源代码仓库:MT-DeepEP和MT-DualPipe
    的头像 发表于 02-28 15:58 847次阅读

    摩尔线程完成DeepSeek开源FlashMLA和DeepGEMM适配

    自DeepSeek启动“开源周”以来,已陆续开源三个代码。摩尔线程基于全新MUSA Compute Capability 3.1计算架构,可提供原生FP8计算能力,同时升级高性能线
    的头像 发表于 02-27 14:40 1108次阅读

    沐曦GPU跑通DeepSeek开源代码FlashMLA

    今日,DeepSeek正式启动"开源周"计划,首发代码FlashMLA一经开源即引发全网关注。截至发稿,该项目已在GitHub斩获超7.2K Star!
    的头像 发表于 02-25 16:25 1326次阅读

    AI开源模型有什么用

    AI开源模型作为推动AI技术发展的重要力量,正深刻改变着我们的生产生活方式。接下来,AI部落小编带您了解AI开源模型有什么用。
    的头像 发表于 02-24 11:50 884次阅读

    RT-Thread荣登2024开源创新榜单,跻身中国十大开源社区

    开源领域的卓越贡献,荣登2024年开源创新榜单——2024年度开源社区,成为中国十大开源社区之一。2024年度开源创新榜单发布此次评选活动由
    的头像 发表于 01-08 19:06 1108次阅读
    RT-Thread荣登2024<b class='flag-5'>开源</b>创新榜单,跻身中国十<b class='flag-5'>大开源</b>社区

    利用Arm Kleidi技术实现PyTorch优化

    PyTorch 是一个广泛应用的开源机器学习 (ML) 。近年来,Arm 与合作伙伴通力协作,持续改进 PyTorch 的推理性能。本文将详细介绍如何利用 Arm Kleidi 技术
    的头像 发表于 12-23 09:19 1619次阅读
    利用Arm Kleidi技术实现<b class='flag-5'>PyTorch</b>优化

    鸿蒙原生开源ViewPool在OpenHarmony社区正式上线

    近日,由伙伴参与共建的鸿蒙原生开源“ViewPool”在OpenHarmony社区正式上线。这个开发是基于OpenHarmony技术孵化的成果,充分发挥了平台的技术特性,同时融入了伙伴在应用开发
    的头像 发表于 12-20 14:44 852次阅读

    开源AI模型是干嘛的

    开源AI模型是指那些公开源代码、允许自由访问和使用的AI模型集合。这些模型通常经过训练,能够执行特定的任务。以下,是对开源AI模型的详细
    的头像 发表于 12-14 10:33 1288次阅读

    商汤配售股份筹资27.87亿港元

    近日,商汤科技在交所发布公告,宣布一项重要的配售股份计划。据公告显示,该计划于12月11日(联交所交易时段前)正式实施,商汤科技与配售代理签订了配售协议。 根据协议内容,配售代理已
    的头像 发表于 12-12 10:08 564次阅读