0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

自动驾驶注释数据:如何判断数据集的有效性

ss 来源:智车科技IV 作者:智车科技IV 2020-12-11 13:47 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

数据是现代机器学习应用程序中最重要的组成部分,包括自动驾驶汽车的感知系统都是依靠数据进行训练的。目前汽车都配备了许多传感器,这些传感器收集信息并输入到汽车计算机,然后信息必须进行实时处理和注释,以便汽车了解行驶中道路前方的情况。但是,汽车计算机上的算法需要接受有关如何进行分类的训练,所以数据标注的准确性变得很重要。以下是Annotell公司在数据标注上的一些探索。

带注释的数据至关重要,它有两个目的:在汽车上的计算机上训练算法以解释收集的信息,并验证计算机确实已学会正确解释收集的信息。由于注释数据用于这两个关键目的,因此注释的质量至关重要。最终,低质量的注释可能会导致汽车误解道路上正在发生的事情。

注释数据的过程始终包括一些人为的决定,第一个挑战就是让人们同意对记录的数据进行正确的注释,而创建这样的注释准则有时并不像人们想象的那么容易。往往需要有效设计注释准则以提高质量方面具有丰富的经验。第二个挑战是在指南的指导下按比例执行注释。

如何判断数据集的有效性?

量化注释质量的一种方法是注释数据集的精度和召回率。考虑一下标注的类型,其中摄像机图像中的一个对象(如接近的车辆)由一个边界框标注。在对此类数据集的质量进行推理时,有两个重要的问题(i)感兴趣的对象是否已由边界框正确标注,以及(ii)边界框是否实际上包含感兴趣的对象。

上面示意图中出现了错误标注。而在完美注释的数据集中,以上两个错误均不存在。因此,定义质量的一种方法是计算这些错误在带注释的数据集中出现的程度。例如计算

实际表示对象的包围盒的比率。这称为精度。理想情况下,精度为1。用边界框正确注释的对象的比率。这就是所谓的召回。理想情况下,召回率为1。

但是,计算数据集的精度和召回率还需要对整个数据集中的每个帧进行人工批判性检查,这可能与注释过程本身一样昂贵!为了在计算精度和召回率时获得效率,因此Annotell团队依靠统计数据来推断精度和召回率。仅对所有注释的统计选择良好的子集进行人工批判性审查,并使用概率论得出有关整个数据集的结论。

更详细地讲,他们使用贝叶斯方法来计算后验分布,以提高精度并召回整个数据集,这取决于已经进行了严格审查的注释的子样本。它不仅提供了精确度和召回率的估计,而且还量化了这些估计中的不确定性。例如,我们可以计算所谓的95%可信度下限,这意味着可以确定95%的精度或召回率不低于此阈值。

Annotell公司提供了一种具有成本效益的工具,用于根据精度和召回级别以及对级别的确定性来衡量注释的质量。

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7348

    浏览量

    95016
  • 注释
    +关注

    关注

    0

    文章

    11

    浏览量

    6680
  • 自动驾驶
    +关注

    关注

    794

    文章

    14987

    浏览量

    181497
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    自动驾驶如何做好数据闭环?

    [首发于智驾最前沿微信公众号]自动驾驶系统能否稳定、安全地工作,关键在于它能不能持续学习、持续改进。自动驾驶系统并不是靠一个写好的程序就能一直用下去的,它在运行过程中会经常遇到“看不懂”或“判断
    的头像 发表于 02-23 14:00 1723次阅读
    <b class='flag-5'>自动驾驶</b>如何做好<b class='flag-5'>数据</b>闭环?

    自动驾驶如何确保数据处理的实时

    [首发于智驾最前沿微信公众号]在自动驾驶系统里,数据处理的实时并不是一个抽象的技术指标,而是直接决定车辆“来不来得及反应”的关键能力。道路环境变化极快,前车急刹、行人突然横穿、旁车并线等情况
    的头像 发表于 02-21 09:48 5344次阅读
    <b class='flag-5'>自动驾驶</b>如何确保<b class='flag-5'>数据</b>处理的实时<b class='flag-5'>性</b>?

    数据洪流中的“隐形守护者”:ICY DOCK 硬盘盒如何重塑自动驾驶数据管理生态

    自动驾驶技术的迅猛迭代,正急剧重塑汽车行业的数据存储与管理生态。相较于传统车载系统,自动驾驶系统需实时处理激光雷达点云、高清视频流、雷达信号、GPS定位及车载传感器等多维度海量数据,这
    的头像 发表于 01-30 14:42 2465次阅读
    <b class='flag-5'>数据</b>洪流中的“隐形守护者”:ICY DOCK 硬盘盒如何重塑<b class='flag-5'>自动驾驶</b><b class='flag-5'>数据</b>管理生态

    自动驾驶BEV Camera数据采集系统:高精度时间同步解决方案

    1 自动驾驶数据采集的时间同步挑战与重要 随着自动驾驶技术的快速发展,车辆准确感知周围环境的能力变得至关重要。在分布式多传感器系统中,信号从创建到存储会历经多个软件模块和系统,产生传
    的头像 发表于 12-11 17:11 1460次阅读
    <b class='flag-5'>自动驾驶</b>BEV Camera<b class='flag-5'>数据</b>采集系统:高精度时间同步解决方案

    SimData:基于aiSim的高保真虚拟数据生成方案

    01前言在自动驾驶感知系统的研发过程中,模型的性能高度依赖于大规模、高质量的感知数据。目前业界常用的数据包括KITTI、nuScenes
    的头像 发表于 11-07 17:35 5502次阅读
    SimData:基于aiSim的高保真虚拟<b class='flag-5'>数据</b><b class='flag-5'>集</b>生成方案

    高程数据自动驾驶中有什么作用?

    最近有小伙伴让智驾最前沿聊聊自动驾驶高精度地图对高程数据的使用依赖,其实在聊这个话题之前,还是需要先知道高程数据是什么,在自动驾驶中到底有什么作用。
    的头像 发表于 11-02 13:44 1980次阅读

    边聊安全 | 高效信息管理模块:支持自动驾驶安全的数据库解决方案

    的危害事件。ISO21448标准涵盖了感知、规划和控制系统的验证和确认,确保车辆在安全和可靠方面表现优异。尤其是规划算法的有效性,直接影响自动驾驶
    的头像 发表于 09-05 16:19 1w次阅读
    边聊安全 | 高效信息管理模块:支持<b class='flag-5'>自动驾驶</b>安全的<b class='flag-5'>数据</b>库解决方案

    如何判断电能质量在线监测装置认证标准的有效性

    LZ-100电能质量在线监测装置 判断电能质量在线监测装置认证标准的有效性,核心是验证标准的 时效、适用、认证关联及完整
    的头像 发表于 09-03 16:26 1303次阅读
    如何<b class='flag-5'>判断</b>电能质量在线监测装置认证标准的<b class='flag-5'>有效性</b>?

    自动驾驶数据标注主要是标注什么?

    的结构化标签。这些标签不仅构成了模型训练与评估的数据基础,也直接影响系统在实际道路环境中的识别、理解和决策能力。准确、系统的数据标注能够有效提升感知算法的鲁棒与泛化能力,因此
    的头像 发表于 07-30 11:54 1616次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>数据</b>标注主要是标注什么?

    数据驱动自动驾驶:核心要素与发展全景解析

    在汽车工业向智能化、网联化转型的浪潮中,自动驾驶技术作为人工智能与交通领域深度融合的标志成果,正重塑全球交通运输格局。数据作为数字经济时代的核心生产要素,已成为自动驾驶系统从理论研发
    的头像 发表于 07-17 11:04 2056次阅读
    <b class='flag-5'>数据</b>驱动<b class='flag-5'>自动驾驶</b>:核心要素与发展全景解析

    什么是自动驾驶数据标注?如何好做数据标注?

    [首发于智驾最前沿微信公众号]在自动驾驶系统的开发过程中,数据标注是一项至关重要的工作。它不仅决定了模型训练的质量,也直接影响了车辆感知、决策与控制的性能表现。随着传感器种类和数据量的剧增,
    的头像 发表于 07-09 09:19 1633次阅读
    什么是<b class='flag-5'>自动驾驶</b><b class='flag-5'>数据</b>标注?如何好做<b class='flag-5'>数据</b>标注?

    自动驾驶汽车是如何准确定位的?

    [首发于智驾最前沿微信公众号]随着自动驾驶技术的快速发展,车辆的精准定位成为安全驾驶与路径规划的核心基础。相比于传统人类驾驶依赖路标和视觉判断自动
    的头像 发表于 06-28 11:42 1484次阅读
    <b class='flag-5'>自动驾驶</b>汽车是如何准确定位的?

    浅析4D-bev标注技术在自动驾驶领域的重要

    感知领域的一项突破创新,通过引入时间维度与全局视角,为自动驾驶系统提供了高精度、多模态的时空真值数据,重塑了自动驾驶系统的开发范式。 4D-BEV标注是什么? 4D-BEV 标注技术
    的头像 发表于 06-12 16:10 2806次阅读

    自动驾驶安全基石:ODD

    电子发烧友网综合报道 自动驾驶ODD(Operational Design Domain)即设计运行域,是指自动驾驶系统被设计为安全、有效运行的具体条件范围。它定义了自动驾驶汽车在哪些
    的头像 发表于 05-19 03:52 6984次阅读

    新能源车软件单元测试深度解析:自动驾驶系统视角

    。 ‌自动驾驶软件的特殊‌ ‌ 感知层: ‌激光雷达、摄像头等传感器数据处理算法的单元测试需覆盖极端场景。例如,激光雷达点云滤波算法在雨雪天气下的噪声抑制能力需通过边界测试验证。某厂商曾在测试中遗漏
    发表于 05-12 15:59