0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

模拟使软件工程师能够生成训练神经网络所需的数据

星星科技指导员 来源:嵌入式计算设计 作者:Peter McGuinness 2022-07-09 07:45 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在多年前,当多伦多大学的一个团队使用经过训练而不是设计来识别图像的卷积神经网络赢得 Imagenet 挑战赛时,在计算世界的一个有点不起眼的角落发生了重大震动。该团队和其他团队不仅击败了最好的检测算法,而且在许多图像分类任务中都超越了人类。现在,仅仅几年后,深度神经网络似乎是不可避免的。

即使在2012年,机器学习也不是什么新鲜事物,事实上,到目前为止,几乎所有的分类软件都进行了一些训练。但它们在某种程度上都依赖于人工设计的特征提取算法。这个新解决方案(后来以首席研究员的名字命名为 AlexNet)的不同之处在于,它没有这种人工设计的算法,并且完全通过监督学习获得了结果。

这一发现对整个计算领域的影响已经在与图像分类相距甚远的领域产生了巨大的影响,随着研究人员学习如何将深度学习技术应用于更多领域,预计它带来的变化在未来会更加深远。以及越来越多的领域中的更多问题。对深度学习的热情甚至导致一些评论员预测依赖于设计算法的经典软件创作的终结,取而代之的是经过大量数据训练的网络。

软件解决方案从数据暴露演变的愿景有一些引人注目的方面:通过实例进行培训为软件提供了真正的大规模制造技术的可能性。目前,软件制造处于工业化前阶段,每个应用程序都是定制设计的,就像客车制造的汽车一样。借助标准算法平台(网络)和自动化培训环境,深度学习可以为软件做亨利福特为汽车制造所做的事情。

无论您是否同意这一愿景,深度学习的关键特征在于它取决于数据的可用性,因此,特定领域的专业知识变得不如相关数据的所有权重要。正如深度学习先驱 Andrew Ng 所说:“获胜的不是拥有最好算法的人,而是拥有最多数据的人。” 这是希望过渡到新范式的公司面临的核心问题:他们从哪里获取数据?

行为数据的作用

对于依赖在线行为数据的公司来说,答案是显而易见的,我们所有浏览习惯的记录、跟踪和转售现在无处不在,以至于它们的开销都支配了我们的在线体验。对于与现实世界打交道更密切的公司来说,解决方案不太方便。Waymo 是自动驾驶汽车领域最知名的品牌,它通过部署仪表汽车车队来绘制位置图并记录现实世界的摄像头、雷达和其他数据,然后将这些数据输入其感知软件,从而解决了这个问题。该领域的其他参与者也以较小的方式效仿,但即使是拥有数百万英里行驶里程和大量可用数据的 Waymo,也发现它不足以完成这项任务。

首先,并非所有数据都是平等的:为了有用,它必须经过准确和彻底的注释,即使在今天,这仍然是一项昂贵且容易出错的业务。经过几年努力使流程自动化,亚马逊的 Mechanical Turk 仍然是注释数据的首选方法。除了被注释之外,为了有用,数据必须是相关的,当相关性取决于任何给定事件的不常见、危险或完全非法时,这是一个主要问题。可靠、相关的真实数据很难获得,以至于 Waymo 已经开始在沙漠中建立自己的模拟城市,在那里它可以模拟在受控条件下所需的行为。

但是在好莱坞可以制作完全令人信服的 CGI 场景的世界中,必须有可能使用这种能力为现实世界场景创建训练数据,当然,确实如此。几年来,该行业一直在朝着这个方向发展,一个研究人员团队开发了一种方法来注释侠盗猎车手的序列。Udacity 有一个用于自动驾驶汽车模拟器的开源项目,作为其自动驾驶汽车纳米学位的一部分。

与 Udacity 示例一样,大多数可用的模拟器旨在实现验证循环以测试经过训练的感知堆栈,而不是生成主要用于训练本身的数据。那些确实存在的数据模拟器被汽车公司及其初创竞争对手紧紧抓住,展示了他们产生的数据的基本价值。

那么,合成数据真的可以成功地用于训练神经网络吗?需要多少和什么样的数据才能完成这项工作?

什么是 KITTI

总部位于帕洛阿尔托的Highwai发布了其试点研究的结果,该研究使用 KITTI 数据集作为起点,以检查用于增强 KITTI 提供的注释图像的完全合成数据集可能获得的收益。

训练图像是使用 Highwai 的真实世界模拟器制作的,其中包括从市区和住宅郊区场景拍摄的许多序列,这些场景中挤满了各种车辆、行人和自行车。目的是对象检测和分类,而不是跟踪,因此将捕获帧速率设置为较低,以便在保持数据集大小适中的同时捕获各种图像。图像是在一系列条件下拍摄的,包括相机高度和视野、由于一天中的时间和大气影响(如雾和霾)引起的照明和阴影变化。虽然 Highwai 的工具支持 LIDAR,但在这种情况下只捕获了可见光相机数据。注释包括诸如“行人、

使用 Highwai 的数据增强工具包为训练准备数据,以添加相机传感器噪声、图像压缩噪声、向图像添加“干扰”对象并使训练对颜色不敏感。在此过程结束时,合成数据集的总大小为 5,000 张图像中的 54,443 个对象。(相比之下,原始 KITTI 数据集中有 37,164 个对象和 7,000 个图像)。生成数据、扩充数据并将其添加到训练数据集的总时间不到两个小时。

使用的基础网络是一个 Faster RCNN Inception Resnet,它被预训练为上下文中常见对象 (COCO) 数据集上的对象检测器,并进行了两次补充重新训练;首先仅使用 KITTI 数据集生成基线,然后结合 KITTI 和 Highwai 合成数据集。测试是在 KITTI 参考测试数据集上完成的,该数据集仅包含真实世界的图像,并且在仅 KITTI 和 KITTI 加合成训练之间显示出显着的性能提升。添加合成数据后,识别率总体提高了 5.9%,对汽车和行人的检测显着提高——这一结果并不令人惊讶,因为 Highwai 合成数据集集中在这些对象类型上。

需要多少训练数据的问题没有很好的答案,但 Highwai 指出高度针对性的数据管理对于将其保持在合理范围内至关重要。一个很好的例子是他们为一个未公开的对象检测项目创建的数据集,其中实际用于训练的图像和注释数据总量约为 15GB。最初的大约 12,000 张图像包含大约 120,000 个带注释的对象,是从 30,000 个图像和 500,000 个带注释的对象的原始集合中自动整理出来的。

像这样的结果对于独立软件制造商以及系统集成商和 OEM 来说都很重要。当然,他们可以使用亚马逊的服务来帮助训练网络,但如果价值在于数据,那么商业可行性要求他们能够在该领域创建 IP——他们必须能够使用自己的领域专业知识创建自己的训练数据来指定、优化和管理数据集。这意味着旨在生产此类 IP 的工具行业的出现是重要的一步,将受到欢迎。我们可以期待看到使用合成训练数据的专业知识的快速发展,以及生产它的工具的同样快速发展。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4845

    浏览量

    108372
  • 模拟器
    +关注

    关注

    2

    文章

    1031

    浏览量

    45919
  • 机器学习
    +关注

    关注

    67

    文章

    8570

    浏览量

    137420
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    生成式AI赋能工程师挖掘非结构化数据价值

    您是否知道,生成式 AI(GenAI)可以帮助工程师在几秒钟内诊断汽车故障,甚至在设备出现问题之前预测潜在失效?GenAI 正在通过加速数据分析和算法开发,让这些场景从设想走向现实,使
    的头像 发表于 02-28 10:24 681次阅读

    算法工程师需要具备哪些技能?

    算法工程师需要掌握一系列跨学科的技能,涵盖数学基础、编程能力、算法理论、工程实践以及业务理解等多个方面。 以下是具体技能及学习建议: 线性代数核心内容:矩阵运算、特征值分解、向量空间等。应用场
    发表于 02-27 10:53

    什么是BSP工程师

    任何软件的。BSP工程师需要结合硬件原理图修改从芯片厂商拿到的参考代码,调试板子,使板子上的操作系统能够正常稳定工作,从而提供一个稳定的开发调试环境,这个过程叫做点亮板子,行话叫做Br
    发表于 01-13 06:54

    神经网络的初步认识

    日常生活中的智能应用都离不开深度学习,而深度学习则依赖于神经网络的实现。什么是神经网络神经网络的核心思想是模仿生物神经系统的结构,特别是大脑中神经
    的头像 发表于 12-17 15:05 526次阅读
    <b class='flag-5'>神经网络</b>的初步认识

    NMSIS神经网络库使用介绍

    NMSIS NN 软件库是一组高效的神经网络内核,旨在最大限度地提高 Nuclei N 处理器内核上的神经网络的性能并最​​大限度地减少其内存占用。 该库分为多个功能,每个功能涵盖特定类别
    发表于 10-29 06:08

    在Ubuntu20.04系统中训练神经网络模型的一些经验

    模型。 我们使用MNIST数据集,训练一个卷积神经网络(CNN)模型,用于手写数字识别。一旦模型被训练并保存,就可以用于对新图像进行推理和预测。要使用
    发表于 10-22 07:03

    CICC2033神经网络部署相关操作

    在完成神经网络量化后,需要将神经网络部署到硬件加速器上。首先需要将所有权重数据以及输入数据导入到存储器内。 在仿真环境下,可将其存于一个文件,并在 Verilog 代码中通过 read
    发表于 10-20 08:00

    人工智能工程师高频面试题汇总:循环神经网络篇(题目+答案)

    后台私信雯雯老师,备注:循环神经网络,领取更多相关面试题随着人工智能技术的突飞猛进,AI工程师成为了众多求职者梦寐以求的职业。想要拿下这份工作,面试的时候得展示出你不仅技术过硬,还得能解决问题。所以
    的头像 发表于 10-17 16:36 955次阅读
    人工智能<b class='flag-5'>工程师</b>高频面试题汇总:循环<b class='flag-5'>神经网络</b>篇(题目+答案)

    液态神经网络(LNN):时间连续性与动态适应性的神经网络

    神经元,但却能产生复杂的行为。受此启发,与传统的神经网络相比,LNN旨在通过模拟大脑中神经元之间的动态连接来处理信息,这种网络
    的头像 发表于 09-28 10:03 1692次阅读
    液态<b class='flag-5'>神经网络</b>(LNN):时间连续性与动态适应性的<b class='flag-5'>神经网络</b>

    【「AI芯片:科技探索与AGI愿景」阅读体验】+神经形态计算、类脑芯片

    AI芯片不仅包括深度学细AI加速器,还有另外一个主要列别:类脑芯片。类脑芯片是模拟人脑神经网络架构的芯片。它结合微电子技术和新型神经形态器件,模仿人脑神经系统机选原理进行设计,实现类似人脑的超低
    发表于 09-17 16:43

    神经网络的并行计算与加速技术

    问题。因此,并行计算与加速技术在神经网络研究和应用中变得至关重要,它们能够显著提升神经网络的性能和效率,满足实际应用中对快速响应和大规模数据处理的需求。
    的头像 发表于 09-17 13:31 1378次阅读
    <b class='flag-5'>神经网络</b>的并行计算与加速技术

    无刷电机小波神经网络转子位置检测方法的研究

    摘要:论文通过对无刷电机数学模型的推导,得出转角:与三相相电压之间存在映射关系,因此构建了一个以三相相电压为输人,转角为输出的小波神经网络来实现转角预测,并采用改进遗传算法来训练网络结构与参数,借助
    发表于 06-25 13:06

    神经网络RAS在异步电机转速估计中的仿真研究

    众多方法中,由于其结构简单,稳定性好广泛受到人们的重视,且已被用于产品开发。但是MRAS仍存在在低速区速度估计精度下降和对电动机参数变化非常敏感的问题。本文利用神经网络的特点,使估计更为简单、快速
    发表于 06-16 21:54

    基于FPGA搭建神经网络的步骤解析

    本文的目的是在一个神经网络已经通过python或者MATLAB训练好的神经网络模型,将训练好的模型的权重和偏置文件以TXT文件格式导出,然后通过python程序将txt文件转化为coe
    的头像 发表于 06-03 15:51 1595次阅读
    基于FPGA搭建<b class='flag-5'>神经网络</b>的步骤解析