0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌推出一款基于AI和深度学习的图像标注方式“流体标注”

DPVg_AI_era 来源:未知 作者:李倩 2018-10-24 09:17 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

谷歌在其AI博客上介绍了一款基于AI和深度学习的图像标注方式“流体标注”,可作为人工标注者的有力辅助工具,将标记数据集的生成速度提升至现在的3倍,有望缓解目前机器学习研究中,高质量的训练数据获取难的瓶颈。

基于深度学习的现代计算机视觉模型(比如由TensorFlow对象检测API实现的模型)的性能取决于是否可以使用规模越来越大的标记训练数据集(如公开的图像)进行训练。

然而,如何获得高质量的训练数据,正迅速成为计算机视觉领域的主要瓶颈。这对于自动驾驶机器人和图像搜索等应用中使用的语义分段的像素预测任务而言尤其如此。

实际上,传统的手动数据标记工具,需要标记者仔细点击图象边界,来划定图像中的每个对象,这很乏味:在COCO + Stuff数据集中,标记一个图像需要19分钟,而标记整个数据集需要53000小时!

COCO数据集中的图像示例(左)及其逐像素语义标记(右)。图片来源:Florida Memory

本文中的内容将在2018年ACM多媒体会议“勇敢新理念”环节中展示,谷歌的研究人员研究了一种机器学习驱动的界面,可用于标注分类数据,划定图像中每个目标的轮廓和背景,让标记数据集的生成速度提高至原来的3倍。

该工具名为流体标注(Fluid Annotation),从强语义分割模型的输出开始,人工标记者可以使用自然用户界面,通过机器辅助编辑操作进行修改。谷歌此次开发的界面可以让标记者选择要修改的内容和顺序,使他们能够高效地将精力集中在机器尚不了解的内容上。

对COCO数据集中图像使用流体标注界面的可视化。图片来源:gamene

更确切地说,为了对图像进行标记,我们首先通过预训练的语义分割模型(Mask-RCNN)来处理图像。这会生成约1000个图像片段及其分类标签和置信度分数。置信度分数最高的片段用于对标签的初始化,呈现给标记者。

然后,标记者就可以:(1)从机器生成的候选标签中为当前片段选择标签。(2)对机器未覆盖到的对象添加分割段。机器会识别出最可能的预生成段,标记者可以从中选择质量最高的一个。(3)删除现有段。(4)改变重叠段的深度顺序。(Demo链接在此:https://fluidann.appspot.com/,仅限桌面平台)

使用传统手动标记(中列)和流体标注(右)在COCO数据集的三张图像上进行标记的比较。虽然使用手动标记工具时,目标的边界一般更准确,但标记差异的最大原因是人类标记者通常对某一确切的对象分类有不同意见。来源:sneaka(上),Dan Hurt(中),Melodie Mesiano(下)。

流体标注是让图像标注变得更快、更容易的第一步探索。未来的目标是改进对目标边界的标记,进一步利用机器智能提升界面的速度,最终实现对界面的扩展,能够处理以前无法识别的分类,实现最高效、需求最大的数据收集。

而实际上,关于这款工具的论文的预印本早在近一个月前就发在了arxiv上。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6244

    浏览量

    110259
  • AI
    AI
    +关注

    关注

    89

    文章

    38091

    浏览量

    296602
  • 深度学习
    +关注

    关注

    73

    文章

    5590

    浏览量

    123907

原文标题:谷歌推出“流体标注”AI辅助工具,图像标注速度提升3倍!(附论文)

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    自动驾驶数据标注是所有信息都要标注吗?

    [首发于智驾最前沿微信公众号]数据标注对于自动驾驶来说,就像是老师教小朋友知识,数据标注可以让车辆学习辨别道路交通信息的能力。摄像头、雷达、激光雷达(LiDAR)拍下来的只是堆原始信
    的头像 发表于 12-04 09:05 333次阅读
    自动驾驶数据<b class='flag-5'>标注</b>是所有信息都要<b class='flag-5'>标注</b>吗?

    算法工程师不愿做标注工作,怎么办?

    对于算法而言,图像标注项关键性工作,越是大量的新数据集标注,对于算法的性能提升越有帮助。但是图像标注
    的头像 发表于 12-02 17:56 230次阅读
    算法工程师不愿做<b class='flag-5'>标注</b>工作,怎么办?

    浅析多模态标注对大模型应用落地的重要性与标注实例

    ”的关键工序——多模态标注重要性日益凸显。 、什么是多模态标注? 多模态标注是指对文本、图像、语音、视频、点云等异构数据进行跨模态语义关联
    的头像 发表于 09-05 13:49 761次阅读

    自动驾驶数据标注主要是标注什么?

    [首发于智驾最前沿微信公众号]在自动驾驶系统的研发过程中,数据标注是实现高性能感知模型的基础环节,其核心目标是将车辆从环境中采集到的原始感知数据(主要包括图像、点云、视频序列等)转化为具有语义信息
    的头像 发表于 07-30 11:54 905次阅读
    自动驾驶数据<b class='flag-5'>标注</b>主要是<b class='flag-5'>标注</b>什么?

    什么是自动驾驶数据标注?如何好做数据标注

    [首发于智驾最前沿微信公众号]在自动驾驶系统的开发过程中,数据标注项至关重要的工作。它不仅决定了模型训练的质量,也直接影响了车辆感知、决策与控制的性能表现。随着传感器种类和数据量的剧增,有效
    的头像 发表于 07-09 09:19 927次阅读
    什么是自动驾驶数据<b class='flag-5'>标注</b>?如何好做数据<b class='flag-5'>标注</b>?

    AI时代 图像标注不要没苦硬吃

    识别算法的性能提升依靠大量的图像标注,传统模式下,需要人工对同类型数据集进行步步手动拉框,这个过程的痛苦只有做过的人才知道。越多素材的数据集对于算法的提升越有帮助,常规情况下,个2
    的头像 发表于 05-20 17:54 425次阅读
    <b class='flag-5'>AI</b>时代   <b class='flag-5'>图像</b><b class='flag-5'>标注</b>不要没苦硬吃

    东软集团入选国家数据局数据标注优秀案例

    近日,东软飞标医学影像标注平台在国家数据局发布数据标注优秀案例集名单中排名第(案例名称“多模态医学影像智能数据标注平台”)。评选专家认为东软案例取得了显著成效,
    的头像 发表于 05-09 14:37 1013次阅读

    数据标注服务—奠定大模型训练的数据基石

    数据标注是大模型训练过程中不可或缺的基础环节,其质量直接影响着模型的性能表现。在大模型训练中,数据标注承担着将原始数据转化为机器可理解、可学习的信息的关键任务。这过程不仅决定了模型
    的头像 发表于 03-21 10:30 2305次阅读

    标贝数据标注服务:奠定大模型训练的数据基石

    数据标注是大模型训练过程中不可或缺的基础环节,其质量直接影响着模型的性能表现。在大模型训练中,数据标注承担着将原始数据转化为机器可理解、可学习的信息的关键任务。这过程不仅决定了模型
    的头像 发表于 03-21 10:27 879次阅读
    标贝数据<b class='flag-5'>标注</b>服务:奠定大模型训练的数据基石

    自动化标注技术推动AI数据训练革新

    标贝自动化数据标注平台在全栈数据标注场景式中搭载了大模型预标注和自动化标注能力,并应用于3D点云、2D图像、音频、文本等数据场景的大规模、复
    的头像 发表于 03-14 16:46 1091次阅读

    标贝自动化数据标注平台推动AI数据训练革新

    标贝自动化数据标注平台在全栈数据标注场景式中搭载了大模型预标注和自动化标注能力,并应用于3D点云、2D图像、音频、文本等数据场景的大规模、复
    的头像 发表于 03-14 16:42 1345次阅读
    标贝自动化数据<b class='flag-5'>标注</b>平台推动<b class='flag-5'>AI</b>数据训练革新

    拓维信息与整数智能联合推出智能数据标注体机

    近日,拓维信息与整数智能携手合作,共同推出了业内首搭载DeepSeek全系列模型的智能数据标注体机。这款体机率先实现了“数据
    的头像 发表于 02-14 15:22 2656次阅读

    拓维信息×整数智能:联合首发搭载DeepSeek的智能数据标注体机

    近日,拓维信息与整数智能强强联合,共同推出业内首搭载DeepSeek全系列模型的智能数据标注体机,率先打造“数据标注平台+大模型+算力”
    的头像 发表于 02-13 18:07 1472次阅读
    拓维信息×整数智能:联合首发搭载DeepSeek的智能数据<b class='flag-5'>标注</b><b class='flag-5'>一</b>体机

    AI自动图像标注工具SpeedDP将是数据标注行业发展的重要引擎

    利用AI模型训练打造的深度学习算法开发平台SpeedDP,就可以替代人工进行海量的图像数据标注。相比于人工,SpeedDP具有多个优势。更快
    的头像 发表于 01-02 17:53 1121次阅读
    <b class='flag-5'>AI</b>自动<b class='flag-5'>图像</b><b class='flag-5'>标注</b>工具SpeedDP将是数据<b class='flag-5'>标注</b>行业发展的重要引擎

    标贝数据标注在智能驾驶训练中的落地案例

    标贝科技深耕AI数据服务多年,在无人驾驶、自动驾驶等智能驾驶领域拥有丰富的合作案例。多次采用点云标注以及3D&2D融合等标注方式为智能驾驶领域客户提供环境感知、决策策划、车道线
    的头像 发表于 12-24 15:17 3091次阅读
    标贝数据<b class='flag-5'>标注</b>在智能驾驶训练中的落地案例