0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一文详谈人工智能的数据标注

如意 来源:快资讯 作者:快资讯 2020-07-01 15:17 次阅读

数据标注是大多数人工智能的基础,它决定了机器学习深度学习模型的质量。今天的数据呈现指数级的爆发,比如仅在2018年,就产生了超过30 ZB的数据。而在在任何人工智能项目中,对于数据科学家而言,数据问题都是其中的症结所在。

什么是数据标注?

训练机器学习和深度学习模型,需要丰富的数据,以便将其用于部署,训练和调整模型。训练机器学习和深度学习模型需要大量经过仔细标注的数据。标注原始数据并准备将其应用于机器学习模型和其他AI工作流,被称为数据标注。根据相关统计,数据整理在AI项目中消耗了80%以上的时间。

数据如何标注?

如今,大多数数据都没有标注。带标签的数据,意味着标注或注释目标模型的数据,以便可以预测。通常,数据标注包括数据标注,注释,审核,分类,转录和处理。

标注的数据突出显示某些特征,并根据这些特征对其进行分类,可以通过模型分析其模式以预测新的目标。例如,对于自动驾驶汽车中的计算机视觉,AI专业人员或数据标注者可以使用视频标注工具来指示路牌的位置,并通过行人和其他车辆的位置来训练模型。

数据标注中包含的一系列任务:

1.丰富数据的工具

2.质量保证

3.流程迭代

4.管理数据标签

5.培训新的数据标签

6.项目计划

7.成功指标

8.流程运作

AI专业人员的数据标签挑战?

在典型的AI项目中,专业人员在进行数据标注时会遇到以下几个方面的挑战。

1.数据标签质量低下。数据标签质量低可能有很多原因。其中最突出的原因之一是任何企业或工作流程确实三个决定因素:人员,流程和技术。

2.无法扩展数据标注操作。当数据量不断增长并且业务或项目需要扩展其容量时,由于大多数企业都在内部标记数据,因此它们通常也难以扩展其数据标注任务。

3.难以承受的成本和不存在的结果。企业和AI项目经理通常雇用高薪数据科学家和AI专业人士或一组业余人员来处理数据标签,而企业需要承担高昂的人工成本,当然企业也会面临数据标签不确定所带来的问题,所以合适的专业人员至关重要。

4.质量保证。进行质量检查可以为数据标注过程提供重要价值,尤其是在机器学习模型测试和验证的迭代阶段。

谁来标注数据?

相关调查显示,2019年,企业在数据标签上的支出超过17亿美元。到2024年,这一数字将达到41亿美元。进行数据标注工作,除了雇佣专业的数据科学家和AI专家之外,还可以考虑通过其他方式。

雇员。这包括雇用包括AI专业人员在内的全职或兼职员工,参与AI项目的各个方面,其中之一是数据标注。

托管团队。他们是经验丰富,且训练有素的数据标签团队。

承包商。他们包括自由职业者和临时工。

众包。企业可以使用第三方平台一次性寻找数据标注团队。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1775

    文章

    43710

    浏览量

    230488
  • 机器学习
    +关注

    关注

    66

    文章

    8095

    浏览量

    130514
  • 深度学习
    +关注

    关注

    73

    文章

    5223

    浏览量

    119863
收藏 人收藏

    评论

    相关推荐

    5G智能物联网课程之Aidlux下人工智能开发

    课程类别 课程名称 视频课程时长 视频课程链接 课件链接 人工智能 参赛基础知识指引 14分50秒 https://t.elecfans.com/v/25508.html *附件:参赛基础知识指引
    发表于 04-01 10:40

    嵌入式人工智能的就业方向有哪些?

    嵌入式人工智能的就业方向有哪些? 在新轮科技革命与产业变革的时代背景下,嵌入式人工智能成为国家新型基础建设与传统产业升级的核心驱动力。同时在此背景驱动下,众多名企也纷纷在嵌入式人工智能
    发表于 02-26 10:17

    人工智能大模型、应用场景、应用部署教程超详细资料

    人工智能是IC行业近几年的热词,目前此技术已经有很多成熟的模型和落地案例。在此跟大家做个分享,更多详细资料,请自行搜索:【展锐坦克邦】,坦克邦-智算天地集算法模型、部署说明于体,为广大客户提供了
    发表于 11-13 14:49

    如何使单片机与无线供电结合,从而使人工智能脱离电池和线路?

    如何使单片机与无线供电结合,从而使人工智能脱离电池和线路
    发表于 10-31 06:34

    ai人工智能机器人

    随着时间的推移,人工智能的发展越来越成熟,智能时代也离人们越来越近,近几年人工智能越来越火爆,人工智能的应用已经开始渗透到各行各业,与生活交融,成为人们无法拒绝,无法失去的
    发表于 09-21 11:09

    《通用人工智能:初心与未来》-试读报告

    作者给出的结论。整体读下来,可以给我们关于通用人工智能全面的了解。作者也反复强调了通用人工智能与专用智能的区别。尤其是人们错误的认为堆专用智能
    发表于 09-18 10:02

    如何将人工智能应用到效能评估系统软件中去解决

    ,我们可以将其应用到效能评估系统中,进步提高效能评估的准确性和实用性。   华盛恒辉可以利用人工智能技术,通过对大量数据的分析,来识别和评估各个业务环节的表现,从而对效能进行评估和监测。此外,我们还可
    发表于 08-30 12:58

    人工智能数据是什么

    首先,我们需要了解人工智能数据的定义。通俗地说,人工智能数据就是将人工智能技术和大数据技术相
    的头像 发表于 08-13 10:57 2114次阅读

    语音标注平台是推动人工智能发展的关键工具之一

    随着人工智能(AI)技术的飞速发展,语音识别技术成为了众多应用领域的重要组成部分。然而,要使语音识别系统变得准确和智能,需要大量高质量的语音数据进行训练和标注。而正是“语音
    的头像 发表于 07-21 15:44 491次阅读

    AI 人工智能的未来在哪?

    人工智能、AI智能大模型已经孵化;繁衍过程将突飞猛进,ChatGPT已经上线。 世界首富马斯克认为AI对人类是种威胁;谷歌前CEO施密特认为AI和机器学习对人类有很大益处。 每个国家对核武器的运用有两面性,可造可控;但AI
    发表于 06-27 10:48

    【书籍评测活动NO.16】 通用人工智能:初心与未来

    的新人工智能正在兴起。自然语言处理、人脸识别、自动驾驶、无人系统等复杂人工智能任务相继取得大的突破,人工智能在很多特定问题(如围棋、《星际争霸》游戏、医疗诊断等)的解决上甚至超过了
    发表于 06-21 14:41

    人工智能

    这句话里边有几个参数? 如果x=1则执行a 如果是单计算的话只有1这个参数。 但如果是人工智能的话有如下几个参数, 逻辑门,如果则 未知数,符号x 常量,1 函数,a 很多复杂的智能都可以如此拆分
    发表于 06-10 01:05

    【EASY EAI Nano人工智能开发套件试用体验】EASY EAI Nano人工智能开发套件开箱及硬件初体验

    及接线柱、12V 1A电源等。 EASY EAI Nano人工智能开发板用塑料盒和静电袋包装,里面有根黑色的数据线。 EASY EAI Nano人工智能开发套件包装还是很不
    发表于 05-31 19:18

    AI数据采集标注类型:揭秘数据采集与标注的关键环节

    随着人工智能技术的快速发展,数据采集和标注已成为人工智能领域中不可或缺的一部分。数据采集是获取高质量数据
    的头像 发表于 05-16 18:04 2936次阅读

    数据标注类相关文章:揭秘数据标注的奥秘

    数据标注类相关文章:揭秘数据标注的奥秘 随着人工智能技术的不断发展,数据
    的头像 发表于 05-16 17:35 522次阅读