0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

自动驾驶公司标记的数据准确吗

木頭瓶子 2022-07-21 16:38 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

对于依赖深度学习作为自动驾驶关键的自动驾驶汽车 (AV) 供应商而言,数据就是一切——在许多方面,它是唯一的东西。

数据是 AV 公司在公共道路上积累数英里的测试经验、记录和储存数 PB 的道路知识的原因。例如,Waymo 在 7 月份声称在现实世界中行驶了超过 1000 万英里,在模拟中行驶了 100 亿英里。

但还有一个行业不喜欢问的问题:

假设 AV 公司已经在真实道路上收集了 PB 甚至 EB 的数据。该数据集有多少已被标记?也许更重要的是,被注释的数据有多准确?

Edge Case Research 的联合创始人兼首席技术官 Phil Koopman 在最近接受 EE Times 采访时断言,“没有人可以为所有这些贴上标签。”

数据标注:费时费力

注释通常需要专业的人眼观看短视频剪辑,然后在每辆车、行人、路标、交通灯或任何其他可能与自动驾驶算法相关的项目周围绘制和标记框。这个过程不仅耗时而且成本很高。

Medium 上最近的一篇题为“数据注释:人工智能突破背后的十亿美元业务”的报道说明了“托管数据标记服务”的迅速出现,该服务旨在提供特定领域的标记数据,并强调质量控制。故事指出:

除了内部数据标记团队,科技公司和自动驾驶初创公司也严重依赖这些托管标记服务……一些自动驾驶公司每月向数据标记公司支付数百万美元。

在几年前来自 IEEE Spectrum 的另一个故事中,Drive.ai 的联合创始人兼总裁 Carol Reiley 被引述说:

成千上万的人在物品周围贴上标签。每行驶一小时,标记大约需要 800 小时。这些团队都会挣扎。我们的速度已经快了很多,而且我们还在不断优化。

一些公司,例如 Drive,正在使用深度学习来增强注释数据的自动化,以此来加速繁琐的数据标记过程。

让我们使用未标记的数据

然而,Koopman 认为还有另一种方法可以“从积累的数据中榨取价值”。“不标记大多数 PB 的记录数据”如何完成此任务?

他解释说,Edge Case Research 在设计一种允许 AV 行业加速开发更安全的感知软件的方法时“偶然发现”了这一点。Edge Case Research 将其称为“Hologram”,本质上是为 AV 设计的“AI 感知压力测试和风险分析系统”。

更具体地说,正如 Koopman 解释的那样,“Hologram 使用未标记的数据”,系统会两次运行相同的未标记数据。

首先,它在现成的正常感知引擎上运行基线未标记数据。然后,对于相同的未标记数据,应用全息图,添加非常轻微的扰动——噪声。事实证明,通过对系统施加压力,Hologram 可以暴露 AI 算法感知的潜在弱点。

例如,如果在视频剪辑中添加一点颗粒,人类可能会感知到“那里有东西,但我不知道它是什么”。

但是一个人工智能驱动的感知系统,在压力下,要么完全错过一个未知的物体,要么把它踢过门槛,把它放进不同的分类箱。

当 AI 仍在学习时,了解它的置信度(因为它决定了它所看到的)是有用的。但是当人工智能在世界上应用时,置信水平并不能告诉我们太多。人工智能通常是“猜测”或简单地“假设”。

换句话说,人工智能是在伪造它。

根据设计,全息图可以“戳”人工智能驱动的感知软件。它揭示了人工智能系统失败的地方。例如,一个有压力的系统通过神秘地让一个物体从场景中消失来解决它的困惑。

也许,更有趣的是,Hologram 还可以在噪声下识别人工智能“几乎失败”但猜对了的地方。Koopman 说,全息图在视频剪辑中披露了人工智能驱动系统“可能会走运”的区域。

Koopman 说,无需标记 PB 数据但运行两次,Hologram 可以通过收集更多数据或进行更多培训来提供一个提示,即事情看起来“可疑”,以及“你最好回去再看一遍”的区域。 .

这当然是全息图的一个非常简化的版本,因为该工具本身实际上“带有许多由大量工程支持的秘密调味料,”库普曼说。但是,如果 Hologram 可以告诉用户“只有好的部分”值得人工审查,那么它可以带来一种非常有效的方式,从当前锁定的数据中获取真正的价值。

“机器非常擅长与系统博弈,”Koopman 指出。或者“做'p-hacking'之类的事情。” P-hacking 是一种偏见,当研究人员收集或选择数据或统计分析,直到非显着结果变得显着时,才会出现这种偏见。例如,机器可以在不存在的数据中找到相关性。

开源数据集

当被问及这对 Edge Case Research 是否是个好消息时,Koopman 说:“不幸的是,这些数据集仅供研究界使用。不用于商业用途。”

此外,即使您使用这样的数据集来运行 Hologram,您也应该使用用于收集数据的相同感知引擎,以了解一个人的 AI 系统中的薄弱环节。

全息图的屏幕截图

下面是一个屏幕截图,显示了最新的全息图商业版本的工作原理

pYYBAGLXUgCADj6gAAGVE0UN8C0511.jpg


全息图引擎发现感知系统未能识别此停车标志的实例,并为分析人员提供强大的工具来发现触发条件,例如嘈杂的背景。(来源:边缘案例研究)

通过添加噪声,Hologram 会寻找使 AI 系统几乎错过停车标志(橙色条)或完全无法识别停车标志(向下红色条)的触发条件。

橙色条通过收集更多数据来警告 AI 设计人员需要重新训练 AL 算法的特定领域。红条让 AI 设计师可以探索和推测触发条件:是什么导致 AI 错过了停车标志?标志是不是离电线杆太近了?是否有嘈杂的背景或没有足够的可见对比度?Edge Case Research 的产品经理 Eben Myers 解释说,当积累了足够多的触发条件示例时,就有可能识别出特定的触发条件。

poYBAGLXUgWAWUZbAADXHtpHxP4409.jpg

Hologram 帮助 AV 设计人员找到他们的感知软件表现出奇怪的、潜在的不安全行为的边缘情况。(来源:边缘案例研究)

与 Ansys 合作

本周早些时候,Ansys 宣布与 Edge Case Research 达成合作协议。Ansys 计划将 Hologram 集成到其仿真软件中。Ansys 将集成视为设计“业界首个用于开发 AV 的整体仿真工具链”的关键基础组件。Ansys 正在与 BMW 合作,后者已承诺在 2021 年交付其首款 AV。


ANSYS 和 BMW 为自动驾驶创建仿真工具链(来源:Ansys)

— Junko Yoshida,AspenCore Media 全球联合主编,EE Times首席国际记者


审核编辑 黄昊宇
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7314

    浏览量

    93972
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261497
  • AV
    AV
    +关注

    关注

    2

    文章

    269

    浏览量

    45135
  • 自动驾驶
    +关注

    关注

    791

    文章

    14669

    浏览量

    176497
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    高程数据自动驾驶中有什么作用?

    最近有小伙伴让智驾最前沿聊聊自动驾驶高精度地图对高程数据的使用依赖,其实在聊这个话题之前,还是需要先知道高程数据是什么,在自动驾驶中到底有什么作用。
    的头像 发表于 11-02 13:44 1492次阅读

    不同等级的自动驾驶技术要求上有何不同?

    谈到自动驾驶,不可避免地会涉及到自动驾驶分级,美国汽车工程师学会(SAE)根据自动驾驶系统与人类驾驶员参与驾驶行为程度的不同,将
    的头像 发表于 10-18 10:17 2409次阅读

    自动驾驶公司小马智行进入新加坡市场

    9月20日,自动驾驶公司小马智行宣布正式进入新加坡市场,与新加坡最大交通运营服务商康福德高(ComfortDelGro Corporation)合作在当地部署自动驾驶车辆和相关服务,为居民日常出行提供便利。
    的头像 发表于 09-22 17:34 613次阅读

    如何确保自动驾驶汽车感知的准确性?

    [首发于智驾最前沿微信公众号]自动驾驶汽车想要自动驾驶,首先要做的就是能对周边环境实现精准感知,也就是能“看”清道路,那自动驾驶汽车如何在复杂、快速变化的道路环境中做到感知的精确又可靠? 自动
    的头像 发表于 08-23 15:06 1370次阅读
    如何确保<b class='flag-5'>自动驾驶</b>汽车感知的<b class='flag-5'>准确</b>性?

    自动驾驶数据标注主要是标注什么?

    的结构化标签。这些标签不仅构成了模型训练与评估的数据基础,也直接影响系统在实际道路环境中的识别、理解和决策能力。准确、系统的数据标注能够有效提升感知算法的鲁棒性与泛化能力,因此数据标注
    的头像 发表于 07-30 11:54 903次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>数据</b>标注主要是标注什么?

    什么是自动驾驶数据标注?如何好做数据标注?

    [首发于智驾最前沿微信公众号]在自动驾驶系统的开发过程中,数据标注是一项至关重要的工作。它不仅决定了模型训练的质量,也直接影响了车辆感知、决策与控制的性能表现。随着传感器种类和数据量的剧增,有效
    的头像 发表于 07-09 09:19 926次阅读
    什么是<b class='flag-5'>自动驾驶</b><b class='flag-5'>数据</b>标注?如何好做<b class='flag-5'>数据</b>标注?

    自动驾驶汽车是如何准确定位的?

    厘米级的定位精度,并能够实时响应环境变化。为此,自动驾驶系统通常采用多传感器融合的方式,将全球导航卫星系统(GNSS)、惯性测量单元(IMU)、激光雷达(LiDAR)、摄像头、超宽带(UWB)等多种传感器数据进行综合处理,通过算
    的头像 发表于 06-28 11:42 869次阅读
    <b class='flag-5'>自动驾驶</b>汽车是如何<b class='flag-5'>准确</b>定位的?

    卡车、矿车的自动驾驶和乘用车的自动驾驶在技术要求上有何不同?

    [首发于智驾最前沿微信公众号]自动驾驶技术的发展,让组合辅助驾驶得到大量应用,但现在对于自动驾驶技术的宣传,普遍是在乘用车领域,而对于卡车、矿车的自动驾驶发展,却鲜有提及。其实在卡车、
    的头像 发表于 06-28 11:38 708次阅读
    卡车、矿车的<b class='flag-5'>自动驾驶</b>和乘用车的<b class='flag-5'>自动驾驶</b>在技术要求上有何不同?

    自动驾驶安全基石:ODD

    电子发烧友网综合报道 自动驾驶ODD(Operational Design Domain)即设计运行域,是指自动驾驶系统被设计为安全、有效运行的具体条件范围。它定义了自动驾驶汽车在哪些环境、场景
    的头像 发表于 05-19 03:52 5793次阅读

    新能源车软件单元测试深度解析:自动驾驶系统视角

    。 ‌自动驾驶软件的特殊性‌ ‌ 感知层: ‌激光雷达、摄像头等传感器数据处理算法的单元测试需覆盖极端场景。例如,激光雷达点云滤波算法在雨雪天气下的噪声抑制能力需通过边界测试验证。某厂商曾在测试中遗漏
    发表于 05-12 15:59

    沃尔沃与Waabi携手开发自动驾驶卡车

    沃尔沃自动驾驶解决方案公司(V.A.S.)近日宣布与加拿大自动驾驶卡车技术公司Waabi建立合作伙伴关系,共同致力于自动驾驶卡车解决方案的研
    的头像 发表于 02-10 17:33 848次阅读

    从《自动驾驶地图数据规范》聊高精地图在自动驾驶中的重要性

    自动驾驶地图作为L3级及以上自动驾驶技术的核心基础设施,其重要性随着智能驾驶技术的发展愈发显著。《自动驾驶地图数据规范》(DB11/T 20
    的头像 发表于 01-05 19:24 2864次阅读
    从《<b class='flag-5'>自动驾驶</b>地图<b class='flag-5'>数据</b>规范》聊高精地图在<b class='flag-5'>自动驾驶</b>中的重要性

    AUTOSAR通信对自动驾驶的影响 AUTOSAR通信与嵌入式系统设计

    ,AUTOSAR通信与嵌入式系统设计紧密相连,共同推动着自动驾驶技术的发展。 AUTOSAR通信对自动驾驶的影响 提高通信效率和可靠性 AUTOSAR通信协议栈通过标准化的接口和协议,实现了汽车电子控制单元(ECU)之间的高效、可靠的
    的头像 发表于 12-17 15:09 1063次阅读