0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

你不知道的人工智能背后的AI训练师

454398 来源:第一财经日报 作者:第一财经日报 刘佳 2020-08-13 16:45 次阅读

(来源: 第一财经日报 刘佳 在此特别鸣谢!)

我们先看一下数据,据IDC统计,全球每年生产的数据量将从2016年的16.1ZB增至2025年的163ZB。

“抬头是山,低头是煤。”曾在山西传统煤矿工作8年, 整天盯在电脑屏幕前监测矿井瓦斯浓度的郭梅从来没有想过,有一天自己的工作会和人工智能有了联系。

两年前,因为孩子来省会城市太原上学,郭梅在附近求职,做起了数据标注。同样是盯在电脑屏幕前,现在郭梅每天的工作是给图片、文本或者声音进行标注,再把它们交给机器训练和学习。从一开始每天只能标注两三百张,到现在的日均完成1300多张,郭梅按件计酬的收入逐渐提升,已高于当地平均收入水平。

人工智能行业里有句话:有多少智能,背后就有多少人工。像郭梅一样,AI数据标注师成为了随着人工智能发展而出现的新兴就业岗位。2020年2月,“人工智能训练师”正式成为新职业并纳入国家职业分类目录。

他们被称为人工智能背后的人。数据采集和标注是他们的主要工作,目的就是要教会AI认识数据,转化成AI能消化和吸收的“语言”。

这项工作看起来简单枯燥,但意义非常。“就像一辆车没有汽油走不了,数据就是人工智能发展的燃料。有了我们的数据,机器(算法)不断迭代,就能推动人工智能往更好的方向发展。” 从事数据标注的山西麟诺公司总经理李应维对第一财经表示。

“从没想过做人工智能”

二十出头的李宇龙从未亲眼见过自动驾驶汽车,但他的工作却和自动驾驶的AI算法息息相关。

他曾经在生产电子产品的工厂工作,转做AI数据标注后,老板交给他的第一个项目就是“车道线打点”。

简单来说,就是给无人驾驶进行车道线标注。当无人车行驶到一段路时,会自动连续拍摄图片,李宇龙要做的,就是对图片上车辆所行驶的车道旁边两侧的线进行标注,识别虚线还是实线,匹配所对应的属性,从而告诉人工智能虚线车辆可以进行变道,实线不可以进行变道。而标注的难点,在于交会和分岔。

他把自己的工作比作“幼教”,当他拿出一个红苹果给机器并教会它识别,再拿一个绿苹果给它时,因为颜色差异,机器就无法认出了。李宇龙的工作就是不断地帮助机器识别不同的颜色、大小,甚至是被咬了一口的苹果或是坏苹果,直到随便拿出一个苹果,它都能认出来。

李宇龙告诉第一财经记者,数据标注的工作是“按件计酬”,他的日均收入在300元左右。数据显示,2019年,太原市的城镇居民全年人均可支配收入36362元。他说,自己的工资水平在整个基地标注师日均收入中处于中等水平,“据我了解,有人日均收入甚至能破千。”

对于自己的工作,李宇龙说,刚开始接触时,只把它看作一个重复性的工作,并没有想太多。直到后来接触项目多了,涉及的领域包括教育、安防、金融、交通医疗和电商等,每天都在挑战学习能力,也会想要更深入了解自己标注的内容可以应用到的行业。虽然还没有坐过无人车,但他说,现在看到无人驾驶的时候,会想到这里面也包含了自己的标注成果。

像李宇龙、郭梅的工作一样,在每一间数据标注的办公室里,都是类似的工作场景:一排排电脑屏幕前,年轻的数据标注师根据各自分配的任务,对文本、图片、语音和视频做标记、标重点、打标签、框对象、做注释等方式对数据集作出标注,他们可能在为无人车标注车道线、红绿灯,也可能是在为肺部影像标注病毒数据。

是不是“AI富士康”?

数据标注产业促进了不少城镇和农村就业,在河南、河北、贵州等地,还出现了一些特色的“数据标注村”。

据IDC统计,全球每年生产的数据量将从2016年的16.1ZB猛增至2025年的163ZB,其中80%~90%是非结构化数据,这些数据经过清洗与标注才能被唤醒价值。在我国,每年需要进行标注的语音数据超过200万小时,图片则有数亿张,这就产生了源源不断的清洗与标注需求。李应维对第一财经记者说, 他预计明年企业的用工将翻一倍,从160多人扩展到300人左右。

李应维公司所在的百度(山西)人工智能基础数据产业基地,已经成为中国人员和产值规模第一的单体数据标注基地。AI数据标注师从业人员超过2000人,实现营业收入超亿元,企业入驻35家。该基地计划在未来5年培养5万名AI数据标注师,并引入更多AI合作伙伴。

不过,数据标注师看上去是人工智能领域一个“入门”工种:技术门槛低,招工人群范围广泛。他们通过每天数千次的重复动作,和最前沿科技的人工智能产生联系。也因此,外界给这个行业贴上了“AI富士康”的标签。

数据标注带来技术红利,但如果人工智能发展到一定程度,甚至有可能够取代数据标注师的工作。

艾瑞咨询在一份人工智能相关报告指出,随着算法需求越来越旺盛,依赖人工标注不能满足市场需求,因此增强数据处理平台持续学习能力,由机器持续学习人工标注,提升预标注和自动标注能力对人工的替代率将成趋势。此外,随着 AI对数据的要求越来越高,数据标注行业也正逐步进入精细化阶段。

百度(山西)人工智能基础数据产业基地负责人尉赤认为,数据标注是一个很好的入门,进来之后有机会更深度参与到产业链协作当中,例如后续当数据标注越来越机器化,人工和自动化之间要有机的协同,这也对员工提出了更高要求。

此外,当数据标注越来越机器化,人工智能训练师是一个转换工种的机会,标注员们现在标注数据,未来可能向数据治理、数据解决方案设计和项目管理等方向发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6512

    浏览量

    87601
  • AI
    AI
    +关注

    关注

    87

    文章

    26450

    浏览量

    264066
  • 人工智能
    +关注

    关注

    1776

    文章

    43863

    浏览量

    230614
收藏 人收藏

    评论

    相关推荐

    5G智能物联网课程之Aidlux下人工智能开发

    机器人案例.pdf 人工智能 AI泛边缘:智能安防实训 31分38秒 https://t.elecfans.com/v/25509.html *附件:泛边缘案例课.pdf 人工智能
    发表于 04-01 10:40

    是德科技与InterDigital合作展示如何训练人工智能AI)信道估计器

    2024年3月1日,是德科技(Keysight Technologies,Inc.)与 InterDigital 公司(Nasdaq:IDCC)在巴塞罗那 2024 世界移动通信大会(MWC24)上合作展示了如何训练人工智能AI
    的头像 发表于 03-01 14:24 208次阅读

    嵌入式人工智能的就业方向有哪些?

    。 国内外科技巨头纷纷争先入局,在微软、谷歌、苹果、脸书等积极布局人工智能的同时,国内的BAT、华为、小米等科技公司也相继切入到嵌入式人工智能的赛道。那么嵌入式AI可就业的方向有哪些呢? 嵌入式
    发表于 02-26 10:17

    ai人工智能机器人

    随着时间的推移,人工智能的发展越来越成熟,智能时代也离人们越来越近,近几年人工智能越来越火爆,人工智能的应用已经开始渗透到各行各业,与生活交融,成为人们无法拒绝,无法失去的一个重要存在
    发表于 09-21 11:09

    《通用人工智能:初心与未来》-试读报告

    取代人类了吗? 很多人都担心这个问题,其实这个就是有点杞人忧天了。人工智能是服务人类,而不是取代人类。人类是不知道多少万年进化的结果,而计算机是基于逻辑和推理的理论建立的,人类是复杂的是社会的,关于情感
    发表于 09-18 10:02

    基于IDE构建用于STM32微处理器的完整人工智能项目

    本用户手册指导了基于 IDE 逐步构建用于 STM32 微处理器的完整人工智能AI)项目,自动转换预训练好的神经网络(NN)并集成所生成的优化库。本手册还介绍了 X-CUBE-AI
    发表于 09-07 06:15

    人工智能训练师是干什么的

    人工智能训练师是干什么的 随着人工智能AI)技术的发展,训练机器人、算法和系统变得尤为重要。本文将探讨
    的头像 发表于 08-15 16:03 1681次阅读

    人工智能训练师是什么

    人工智能训练师指的是具有相关专业能力的人士,在人工智能领域里,他们负责训练机器学习模型。与传统的计算机科学相比,机器学习是一个相对新的领域,
    的头像 发表于 08-13 14:17 1388次阅读

    华为的人工智能叫什么

    华为的人工智能叫什么 华为的人工智能叫做华为云人工智能(HUAWEI CLOUD AI),它是华为云旗下的AI服务品牌。华为云是华为公司推出
    的头像 发表于 08-12 16:58 6349次阅读

    什么是人工智能ai

    的工作方式,以及运用大量的数据、数学和统计学方法,从而使计算机能够执行人类智慧的任务。随着技术的发展,人工智能AI系统展示了越来越出色的表现。 人工智能AI的发展历史 早在20世纪50
    的头像 发表于 08-12 16:57 7230次阅读

    Ai 部署的临界考虑电子指南

    虽然GPU解决方案对训练AI部署需要更多。 预计到2020年代中期,人工智能行业将增长到200亿美元,其中大部分增长是人工智能推理。英特尔Xeon可扩展处理器约占运行
    发表于 08-04 07:25

    AI 人工智能的未来在哪?

    人工智能AI智能大模型已经孵化;繁衍过程将突飞猛进,ChatGPT已经上线。 世界首富马斯克认为AI对人类是一种威胁;谷歌前CEO施密特认为AI
    发表于 06-27 10:48

    【书籍评测活动NO.16】 通用人工智能:初心与未来

    之后的达特茅斯研讨会开始,用机器来模仿人类学习及其他方面的智能,即实现“人工智能”(Artificial Intelligence,AI)便成为计算机领域持续的研究热点。时至今日,以深度学习为代表
    发表于 06-21 14:41

    【EASY EAI Nano人工智能开发套件试用体验】EASY EAI Nano人工智能开发套件开箱及硬件初体验

    今天收到了EASY EAI Nano人工智能开发套件,为大家做个开箱及硬件评测。 打开快递包装,引入眼帘的是一个设计精美蓝色的大盒子,在盒子里有EASY EAI Nano人工智能开发板、天线、喇叭
    发表于 05-31 19:18

    ChatGPT系统开发AI人功智能方案

    。ChatGPT是一个由OpenAI开发的人工智能语言模型,可以实现自然语言处理、对话生成等功能。要开发一个类似ChatGPT的人工智能系统软件,可以遵循以下步骤:确定应用场景:确定人工智能系统软件要
    发表于 05-18 10:16