0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

合成和模拟数据将在数据产业迎来浪潮

如意 来源:百家号 作者:SENSORO升哲 2020-07-03 11:50 次阅读

2018年,在微软(Microsoft Build)一架无人机飞过管道,检查管道是否有泄漏或其他损坏。值得注意的是,无人机的视觉检查模型使用实际数据和模拟数据进行了训练。使用合成数据帮助机器学习模型了解异常值,让微软的研究人员能够更快地训练这款模型,且不需要像其他情况下那样在进行数据采集飞行上花费很多。

如今,这项技术终于开始普及了。今年4月,一家初创公司为其合成传感器数据筹集到337万美元,而另一家初创公司发表了一篇关于如何使用模拟数据训练模型来识别机场跑道上的飞机的论文。

谈到机器学习项目时,壳牌首席数据科学家丹·杰文斯对使用模拟数据感到非常兴奋,因为它有助于构建模型的同时还可以检测一些少见的问题。他说:“我认为这是一种非常有趣的方法,可以获取我们正在努力解决的有关边缘案例的信息。尽管我们有很多数据,但同时我们也面临重大问题是,那就是,我们通常对于要发现的问题,我们只有很少的例子来支持。

在石油行业,工厂和管道的腐蚀是巨大的挑战,因为它可能导致灾难性的故障。企业会小心翼翼不让任何东西腐蚀管道,但这也意味着机器学习模型不能用于现实世界的腐蚀实例。因此,他们使用合成数据来提供帮助。例如,壳牌公司也在使用合成数据,试图解决人们在加油站吸烟的问题。因为摄像机并不总能捕捉到吸烟者的画面,有时候离得太远或者没有面对摄像头,所以在这个研究中并没有很多现成的案例;因此,公司努力将模拟合成数据与真实数据结合起来,建立计算机视觉模型。“我们感兴趣的几乎总是‘边缘案例’,不是一般的标准,而且容易检测到与标准图案不符的边缘,很难检测出想要的具体内容。”

与此同时,另外一家AI公司也在试图了解更多关于合成数据的准确性。该公司发表的论文《稀有飞机:合成数据起飞》阐述了研究人员如何将停放在机场的飞机的卫星图像与机器生成的合成数据相结合。当仅使用合成数据时,该模型的准确率只有55%左右,而当仅使用真实数据时准确率则跃升至73%。但是通过将训练样本的10%作为真实数据,其余部分使用合成数据,模型的准确率达到了69%。

人工智能专家认为合成数据将成为大生意。使用这些数据的公司需要考虑到他们的假数据可能会扭曲模型,但如果他们能做到这一点,他们就能以比依赖真实数据更快、更低的成本获得强健的模型。

因此,即使物联网传感器正在释放数拍字节级别的数据,也不可能对所有数据进行注释并将其用于训练模型。因为这些数据可能并不是你真正想要计算机寻找的情况。换言之,预计合成和模拟数据的浪潮将继续到来。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1775

    文章

    43716

    浏览量

    230494
  • 合成
    +关注

    关注

    0

    文章

    15

    浏览量

    13732
  • 大模拟数据
    +关注

    关注

    0

    文章

    2

    浏览量

    5316
收藏 人收藏

    评论

    相关推荐

    多业务光端机在数据中心的应用:提升网络效率的关键

    网络效率方面的作用不可忽视。 一、多业务光端机在数据中心的应用 在数据中心中,多业务光端机主要承担以下任务: 高速数据传输 :数据中心内部需要处理大量的
    的头像 发表于 02-23 14:09 226次阅读

    参数在数据转换器中的应用

    电子发烧友网站提供《参数在数据转换器中的应用.pdf》资料免费下载
    发表于 11-27 11:46 0次下载
    参数<b class='flag-5'>在数据</b>转换器中的应用

    智慧经济时代,浪潮信息存储为智慧世界构筑数据基石

    11月12日,第八届中国数据分析行业峰会在京举办,浪潮信息亮相峰会并发表《数据要素驱动智慧时代》主题演讲。在数据的采传用管存销六个环节中,数据
    的头像 发表于 11-17 16:55 189次阅读
    智慧经济时代,<b class='flag-5'>浪潮</b>信息存储为智慧世界构筑<b class='flag-5'>数据</b>基石

    串口接收的数据在数组里怎么解决?

    串口接收的数据在数组里 采取覆盖的方式 第二次接收的时候要是还没接收完就处理主函数的东西 不是会产生错误 这种情况应该怎么办呢
    发表于 10-27 07:53

    浪潮信息长期赋能MAXIEYE实现云数据中心部署

    ,将共同面向自动驾驶产业下一幕不断升级的AI训练和数据处理需求,打造高效、规模化、平台化的AI智算中心,构建数据驱动、AI驱动的自动驾驶产业新基建,以期更好地赋能
    的头像 发表于 10-19 16:34 576次阅读

    数字孪生在数据中心的应用场景

    数字孪生技术如何应用到数据中心的运营发展,又在数据中心的设计与发展阶段起到怎样的作用呢?本文将在数据中心的设计阶段与运维阶段应用数字孪生技术进行解析。
    的头像 发表于 08-28 15:03 860次阅读
    数字孪生<b class='flag-5'>在数据</b>中心的应用场景

    自动驾驶合成数据科普一:不做真实数据的“颠覆者”,做“杠杆”

    顾名思义,合成数据(synthetic data)就是通过计算机技术生成的数据,而不是由真实事件产生的数据。但合成数据又具备“可用性”,能够在数
    的头像 发表于 08-26 14:34 639次阅读
    自动驾驶<b class='flag-5'>合成数据</b>科普一:不做真实<b class='flag-5'>数据</b>的“颠覆者”,做“杠杆”

    用于对象检测的合成数据生成

    电子发烧友网站提供《用于对象检测的合成数据生成.zip》资料免费下载
    发表于 06-25 11:00 0次下载
    用于对象检测的<b class='flag-5'>合成数据</b>生成

    语音合成数据的重要性:打造自然流畅的语音合成体验

    语音合成技术的快速发展为我们带来了更多便利和丰富的语音交互体验。然而,要实现高质量、自然流畅的语音合成,语音合成数据的重要性不可忽视。本文将探讨语音合成数据的重要性,并阐述它如何为语音
    的头像 发表于 06-24 03:07 337次阅读

    语音合成数据定制服务:为智能化语音应用赋能

    在数字化时代,语音技术的应用越来越广泛,语音合成作为其中的重要组成部分,为智能化语音应用提供了强有力的支持。语音合成技术可以将文本转化为自然流畅的人工语音,使得机器能够通过语音与人进行交互,为用户
    的头像 发表于 06-18 21:26 288次阅读

    GRANDMICRO有容微在数据中心方案应用

    GRANDMICRO有容微在数据中心方案应用
    的头像 发表于 05-30 14:11 428次阅读

    语音合成数据的重要性:训练高质量语音合成模型的关键

    语音合成是一种将文本转换为语音的技术,它在智能客服、智能助手、语音广告等多个领域有着广泛的应用。而要实现高质量的语音合成,就需要大量的语音合成数据
    的头像 发表于 05-15 09:27 643次阅读

    ESP8266 AP &amp; STA如何在数据库中标记日期和时间?

    你好 !我想连接服务器以获取时间和日期,并在数据库上标记我的 ESP8266 的每次使用我需要你的帮助来获得一个脚本,让我连接到 wifi 服务器,在连接到 NOSQL 之后给出正确的时间和日期数据库并标记时间和日期以及我的 ESP 的名称
    发表于 05-08 07:13

    压电纳米定位台在数据存储中的应用!

    极高的运动定位精度和稳定性,在数据存储中具有着非常广泛的应用。在数据存储的领域,通常需要压电纳米定位台来实现纳米甚至亚纳米级别的运动控制精度。 压电纳米定位台用于读写头的高精度调节 压电纳米定位台可以在光盘数据存储
    的头像 发表于 04-26 16:23 468次阅读
    压电纳米定位台<b class='flag-5'>在数据</b>存储中的应用!