电子发烧友网 > 人工智能 > 正文

人工智能背后的人工力量是什么

2019年12月03日 17:17 次阅读

“目前我国已有庞大的数据加工队伍,仅北京就有一百多家专门从事数据标注的公司,全国从事这项工作的人大概超过千万,很多头部的互联网技术企业都有自己的数据标注公司。”

目前人工智能落地场景不断丰富,智能化应用正改变着我们的生活。而在AI产业高速发展的背后,数据标注师这个新职业的从业人数也正在壮大。数据标注行业流行着一句话,“有多少智能,就有多少人工”。目前AI算法能学习的数据,必须通过人力逐一标注,这些人力为AI产业提供养料,构建了AI金字塔的基础。

近日,支付宝公益基金会、阿里巴巴人工智能实验室联合中国妇女发展基金会在贵州铜仁万山区启动了“AI豆计划”,这是该计划在全国启动的第一个试点地区。作为一种 “AI+扶贫”的公益新模式,计划旨在通过AI产业释放出的大量就业机会,在贫困地区培训相关职业人才、孵化社会企业,让贫困群众实现在家门口就业脱贫。

这些从业者不需要背井离乡,她们可以受训上岗,为AI机器学习进行数据的分类和标注工作,让机器可以快速学习和认知文字、图片、视频等内容,成为一名“AI培育师”。

人工智能背后的人工力量是什么

机器学习必需数据标注

AI数据标注员被称作“人工智能背后的人工”。“数据是人工智能的血液。当下是大数据基础上的人工智能,是数据智能的深度学习时代,可以说谁掌握了数据,谁就有可能做好。”中科院自动化所研究员、视语科技创始人王金桥告诉科技日报记者。他解释,当前的人工智能也被称作数据智能,在这个发展阶段,神经网络层数越多,神经网络越深,需要用于训练的数据量越大,“比如目前人脸识别做得好的是中青年人脸识别系统,因为年轻人坐车住酒店,采集的数据量大,小孩和老年人数据相对较少。”

但同时,只有数据是没用的。对于深度学习来讲,数据只有加上标签才有意义,才能用于机器的学习和进化。“标注是一个必须的工作。”王金桥说。

王金桥介绍,从数据的收集、清洗、标注到校验都离不开人工。数据标注最基本的就是画框,比如检测目标是车,标注员就需要把一张图上的所有车都标出来,画框要完全卡住车的外接矩形,框得不准确机器就可能“学坏”。再比如人的姿态识别,就包括18个关键点,经过训练的标注员才能掌握这些关键点的标注,标注完成的数据也才能符合机器学习的标准。

不同的数据类型对标注员的要求也不一样。除了一般较为简单、可以通过培训掌握的标注,还有一些需要专业背景的标注,比如在医疗数据标注中,标注员需要做医疗图像的分割,把肿瘤区域标出来,类似工作就需要看得懂片子的医生完成。再比如地方方言或外国文字,需要的也是掌握那门语言的标注员。

人工标注帮助AI快速落地

随着人工智能的发展,数据的训练量非常大,数据标注公司应运而生,这些公司以网络方式运作,一个平台有产品经理和项目经理,接到一个任务就找人来做,大家通过网络群组报名后,由产品经理来培训,之后各自领取自己的任务,登录账号进行标注,检验经理校验合格后就付钱,不合格则需要重新修正。

“目前已经形成庞大的数据加工队伍,仅北京就有一百多家专门从事数据标注的公司,全国从事这项工作的人大概超过千万,很多头部的互联网技术企业都有自己的数据标注公司。”王金桥说,“这个阶段数据对性能的贡献是最大的,数据越多越丰富、代表性越强、模型效果越好,算法的健壮性和鲁棒性就越强。目前情况是大部分AI公司都还没有实现盈利,但标注公司除外。”

据王金桥介绍,国外也是一样,无人零售、无人驾驶等都需要大量的人力,基于用工成本的问题,除了隐私数据之外,他们会把标注工作放在第三世界国家完成,马来西亚、泰国、印度等国家都有数据标注分公司。

常见的报道中,数据标注总被描述为“血汗工厂”,这项工作和从业者被描述得廉价低质,人被重复性机械式的劳动异化。在王金桥的解释下,这一刻板印象也被逐渐打破。

他直言,目前这种大量的人工标注是有价值的,因为理论上解决问题很难,但有了大量数据,设计深度学习网络,可以在特定场景特定应用中用数据训练神经网络,从而在很多场景中可以让AI快速落地占领市场、驱动行业应用、促进行业升级和迭代。

“比如在手机玻璃缺陷、高铁轨道的缺陷、电网高压线绝缘子损坏等检测工作中,无人机拍摄画面后,由人来检测,随着数据量增加,机器得到的训练越来越充分,机器慢慢可以自动检测,类似工作可以很大程度上由机器代劳。”王金桥说,目前人工智能的智能性虽然比较弱,但在各行各业都会带来改变,这是AI推动产业革命的机会。

数据标注需求持续增加

“现在科研界研究的都是无监督、小样本的深度学习,通过三维合成数据,用虚实结合的数据生成方式来训练机器,尽量减少数据的采集和标注,让机器自主学习、自主进化。”王金桥说,但由于缺乏理论上的突破性技术,所以虽然技术增长速度很快,但整体水平还比较低,目前的深度学习还是依赖基于统计意义的大数据模型,这要求数据足够多、足够均衡、基本满足真实世界的分布。

因此,标注这项工作会一直存在。

但王金桥也表示,随着无监督、小样本深度学习的进步,重复性标注的工作量会越来越少。“机器的识别和人一样,人经过几千年的进化,用语言用文字记录和存储几千年的文明,所以看到桌子就知道是桌子,看到灵芝知道是灵芝。机器也需要不断理解更多的内容,有数据标签,它才能学习,才会有智能。数据的加工是一个长期存在的过程,由画框到基础词汇,慢慢形成自己的知识图谱,才能自我推理和思考。”

目前的数据标注公司基本采取“计件付费”的模式,标注员的待遇与任务量和难度直接相关,熟练工一天能标几千张图片,月收入最高过万。这项工作也有一定专业性,受过培训才知道怎么标、标得清楚,人也要认真细心。“每天产生的数据量太大了,数据量持续增加,对标注的需求也持续增加。”王金桥说。

据阿里巴巴集团副总裁、阿里巴巴人工智能实验室总经理陈丽娟介绍,贵州万山仅仅是一个起点,未来项目的整体规划将聚焦贫困地区,寻找更多更适合发展“AI标注”产业的地区来落地。同时,也希望更多的人工智能企业加入,把AI标注的订单定向输送给贫困地区,为贫困群众提供更多就业机会。陈丽娟说。

延伸阅读

AI数据服务发展新方向:细分化、多模态、专业化

数据表明,当前AI发展出现了细分化、多模态以及专业化三大特征。相应的,新变化对于AI数据服务行业也形成了一定的影响与方向指引。

当前AI已经进入技术落地阶段,应用场景涉及安防、金融、家居、交通等各大行业。而未来,在数据标注行业,从业者也将随着AI行业而一同进入细分市场追逐阶段。

同时多模态也成为了AI技术发展的一个特征。所谓多模态,即是对多维时间、空间、环境数据的感知与融合。如当前的自动驾驶需要雷达+摄像头才能跑的更稳,安防行业需要摄像头+雷达红外RFID才能感知得更精准、更真实。而在数据服务产业,企业也需要适应AI技术发展的多模态特征,掌握对多维传感器融合的数据采集与标注。

此外,尽管当前AI技术已经进入落地阶段,但是头部AI企业的落地场景相较传统行业的AI落地场景,在技术上会更有前沿性。而这些企业的一些先进技术研究也很有可能成为未来数据服务行业的一大发展方向,所以数据服务企业也需要在这些前沿场景中不断探索,才能在行业竞争中获得长期发展。

责任编辑:ct

下载发烧友APP

打造属于您的人脉电子圈

关注电子发烧友微信

有趣有料的资讯及技术干货

关注发烧友课堂

锁定最新课程活动及技术直播

电子发烧友观察

一线报道 · 深度观察 · 最新资讯
收藏 人收藏
分享:

评论

相关推荐

四轴机器人编程与应用

主题简介:本次直播主要讲解四轴机器人控制器基本原理及组成。四轴机器人的核心技术内嵌人工智能算法的工业级运动控制技术和伺服
发烧友学院发表于 2018-10-30 00:00 11696次阅读
四轴机器人编程与应用

IT服务管理可能受到人工智能的影响吗

人工智能或者机器智能将很快会创造出一种前所未有的现象。
发表于 2019-12-03 17:24 0次阅读
IT服务管理可能受到人工智能的影响吗

AI+交通可以加强哪一方面

人工智能运用,可以实现对站内流量的预估,可以根据高峰时段进行可变化闸机开放模式,以达到效率高的控客模....
发表于 2019-12-03 17:21 3次阅读
AI+交通可以加强哪一方面

人工智能如何变得有良知

人工智能可以选择求职面试的应聘者,并决定谁有资格获得工作职位,并且可以为患者进行诊断。
发表于 2019-12-03 17:14 4次阅读
人工智能如何变得有良知

人工智能和大数据有怎样的隐患

有了足够的数据,将会发现计算能力和统计算法的模式。但并不是所有的模式都有意义,因为虚假模式的数量很容....
发表于 2019-12-03 17:11 3次阅读
人工智能和大数据有怎样的隐患

人工智能怎样加快社会治理的现代化

人工智能是科学技术进步的产物,也是人类社会生产力提高的具体表现。人工智能是人类创造的机器智能,是人类....
发表于 2019-12-03 17:06 3次阅读
人工智能怎样加快社会治理的现代化

人工智能通过什么方式加强人类能力

至少在可预见的未来,企业使用人工智能来提高和增强现有能力的价值将远远超过人类开展工作的价值。
发表于 2019-12-03 17:03 3次阅读
人工智能通过什么方式加强人类能力

AI 人工智能落地离不开什么问题

在人工智能等新技术催化下,信息泄密正在围绕“数据”展开,这些数据涉及各类事、物、人、企业、政府部门等....
发表于 2019-12-03 16:59 21次阅读
AI 人工智能落地离不开什么问题

人工智能数据存储需要注意哪一些问题

人工智能和机器学习将成为帮助企业利用其核心数字资产创造竞争优势的两个最重要的工具。
发表于 2019-12-03 16:55 5次阅读
人工智能数据存储需要注意哪一些问题

人工智能怎样做可以更加的智能

近年来保险公司积极运用大数据、云计算、物联网、人工智能和区块链等技术在理赔服务端开展尝试,图像识别技....
发表于 2019-12-03 16:50 5次阅读
人工智能怎样做可以更加的智能

AI落地的关键钥匙是哪一把

发展数字经济可产生的潜在价值巨大,但在实现数据价值的深度挖掘与应用之前, 需要解决开源与使能的问题,....
发表于 2019-12-03 16:43 6次阅读
AI落地的关键钥匙是哪一把

商业人工智能的采用你认为可信吗

对许多组织而言,由于缺乏透明度,人工智能仍然是谜团重重,人们不敢将其投入生产中。
发表于 2019-12-03 16:39 12次阅读
商业人工智能的采用你认为可信吗

使用人工智能和机器学习需要提前知道什么

在业务用例中有效使用人工智能和机器学习技术可以帮助企业领先于其他竞争对手,因为这些技术将会消除困扰其....
发表于 2019-12-03 16:34 6次阅读
使用人工智能和机器学习需要提前知道什么

亚马逊AWS推出AI音乐键盘,帮助程序员简单入门

如何让程序员爱上音乐?亚马逊给出的最新答案是 AI 音乐键盘。
发表于 2019-12-03 16:33 32次阅读
亚马逊AWS推出AI音乐键盘,帮助程序员简单入门

人工智能进入企业后有了怎样改变

人工智能并不是洒落在遗留流程和遗留技术上的神奇精灵,而是对如何做生意的一种根本性的反思。
发表于 2019-12-03 16:30 8次阅读
人工智能进入企业后有了怎样改变

机器学习翻译存在什么局限性

机器学习为企业提供了翻译文档的新机会,他们可以使用机器学习来翻译营销材料和其他文献。
发表于 2019-12-03 16:26 10次阅读
机器学习翻译存在什么局限性

人工智能领域的增速放缓 主要体现在AI应用程序的...

人工智能领域的增速放缓,主要体现在AI应用程序的部署增长方面。原计划23%的数据将在2019年被应用....
发表于 2019-12-03 16:25 18次阅读
人工智能领域的增速放缓 主要体现在AI应用程序的...

华为云底气十足 属于中国AI的黄金时代正在到来

为期两天的 AICon 全球人工智能与机器学习技术大会已落下帷幕,作为一场面向各行业 AI 中高层技....
发表于 2019-12-03 15:46 43次阅读
华为云底气十足 属于中国AI的黄金时代正在到来

在客服行业使用人工智能的好处有哪一些

客户服务机器人是一种可实时提供客户问题交互式答案的技术。组织为机器人提供预先写好的指令,以回答客户通....
发表于 2019-12-03 15:22 27次阅读
在客服行业使用人工智能的好处有哪一些

随着5G以及AIoT的大量应用兴起 宜鼎国际也推...

2019年12月3日消息,闪存市场的工业领域,明年将随着5G以及AIoT的大量应用兴起,陆续推出高规....
发表于 2019-12-03 14:45 29次阅读
随着5G以及AIoT的大量应用兴起 宜鼎国际也推...

人工智能的这三年发生了什么?

据Gartner发布的2017年《技术成熟度报告》显示,其中出现了8项新增技术成果,其中包括5G、人....
发表于 2019-12-03 14:32 127次阅读
人工智能的这三年发生了什么?

人工智能是如何被称为第四次工业革命的催化剂的

人工智能,机器学习,物联网,区块链—随着这些技术的问世,当今人类正在经历一场继互联网之后的重大科技变....
发表于 2019-12-03 14:28 23次阅读
人工智能是如何被称为第四次工业革命的催化剂的

天猫精灵反映了中国AIoT产业带什么情况

着语音交互这条产品路径,天猫精灵正在为中国智能产业化撰写出的独家样本。
发表于 2019-12-03 13:47 33次阅读
天猫精灵反映了中国AIoT产业带什么情况

AI三年的情况是怎样的

围棋所包含的巨大的搜索空间(其状态数远远超过整个宇宙中的原子数)一直是机器学习未能攻克的难题,甚至一....
发表于 2019-12-03 13:38 59次阅读
AI三年的情况是怎样的

中国人工智能芯片行业的规模怎样

随着大数据的发展,计算能力的提升,人工智能近两年迎来了新一轮的爆发。
发表于 2019-12-03 11:50 72次阅读
中国人工智能芯片行业的规模怎样

中国的AI芯片行业能否赶上形式

半导体硅芯片已经成为技术革命的支柱,为移动电话、电脑、无人驾驶汽车和“智能”设备提供动力。
发表于 2019-12-03 11:38 43次阅读
中国的AI芯片行业能否赶上形式

人工智能真正的风险在哪里

面对人工智能的风险,当下存在严重两极化:比如美国加州就决定禁用人脸识别技术,但也有更多企业对风险持视....
发表于 2019-12-03 11:34 25次阅读
人工智能真正的风险在哪里

随着安全需求与经济条件的日益提高 视频监控领域五...

随着人们安全需求与经济条件的日益提高,我国监控摄像头个数逐年增加,在计算机视觉、大数据、云存储等技术....
发表于 2019-12-03 11:32 24次阅读
随着安全需求与经济条件的日益提高 视频监控领域五...

怎样为物联网寻找最佳的投资方式

许多物联网项目的演示方式,大大降低了投资者和客户的吸引力。这将导致项目永远无法启动,即使启动了,也很....
发表于 2019-12-03 11:27 19次阅读
怎样为物联网寻找最佳的投资方式

长沙大规模推进产业智能化 推动新一代人工智能与制...

“未来可能会有许多人工智能中心在世界各个城市崛起,长沙的起步不算早,但是发展却很快,我认为长沙很有机....
发表于 2019-12-03 11:16 41次阅读
长沙大规模推进产业智能化 推动新一代人工智能与制...

山东首个人工智能产业落户 打造新旧动能转换样板

近日,经山东省发展改革委同意,海尔智家股份有限公司将在青岛牵头组建山东省家庭人工智能产业创新中心,联....
发表于 2019-12-03 11:10 38次阅读
山东首个人工智能产业落户 打造新旧动能转换样板

人工智能正在学习量子力学以此来设计新分子

一种新的机器学习算法可以探测分子的量子行为,从而使化学家具有更好的从头开始设计新化合物的能力。
发表于 2019-12-03 10:30 206次阅读
人工智能正在学习量子力学以此来设计新分子

IDC和Forrester对2020年的顶级人工...

IDC和Forrester最近发布了他们对2020年及以后的人工智能(AI)的预测。Forreste....
发表于 2019-12-03 10:28 45次阅读
IDC和Forrester对2020年的顶级人工...

在数据方面人工智能赢得胜利需要一种新颖的存储策略

在数据方面,人工智能就像吃豆人。硬盘驱动器,NAS,常规数据中心和基于云的存储方案无法满足AI对速度....
发表于 2019-12-03 10:22 35次阅读
在数据方面人工智能赢得胜利需要一种新颖的存储策略

人工智能真正落地“刚需场景” 摒弃伪需求非常重要

未来人工智能无处不在,当下各行各业也都贴上了人工智能的标签,而人工智能貌似“无所不能”地渗入百业百态....
发表于 2019-12-03 10:12 26次阅读
人工智能真正落地“刚需场景” 摒弃伪需求非常重要

人工智能技术可以从三个层面对网络进行重构

人工智能加速发展人工智能是研究机器以人类思维方式学习、推理、决策的当前最前沿研究方向之一,是计算机科....
发表于 2019-12-03 10:12 67次阅读
人工智能技术可以从三个层面对网络进行重构

玖富数科集团推出小易机器人,采用最新“端+云”技...

神经网络和深度学习技术的快速发展加速了图像识别、语音识别、自然语言理解等技术的实用化突破,显著提升了....
发表于 2019-12-03 10:05 128次阅读
玖富数科集团推出小易机器人,采用最新“端+云”技...

基于AI的衰老和寿命医疗预测器正在快速兴起

虽然年代和生物年龄的预测因子是在几年前出现的,但最近使用深度学习方法开发的预测因子在研究衰老机理的研....
发表于 2019-12-03 09:54 41次阅读
基于AI的衰老和寿命医疗预测器正在快速兴起

区块链技术对粉丝经济有什么影响

随着粉丝素养不断提升,技术支撑日渐完善,“粉丝经济”正在步入发展快轨,有望保持高速增长的活力。
发表于 2019-12-03 09:53 18次阅读
区块链技术对粉丝经济有什么影响

人脸识别技术和人工智能发展已是大势所趋

人脸识别技术凭借其广阔应用前景被产业各方一致看好,在该领域更是涌现出了一大批明星企业,推动着人脸识别....
发表于 2019-12-03 09:52 122次阅读
人脸识别技术和人工智能发展已是大势所趋

雪亮工程建设智能化 首先需要解决人工智能在雪亮工...

人工智能是计算机科学的分支,它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的....
发表于 2019-12-03 09:40 30次阅读
雪亮工程建设智能化 首先需要解决人工智能在雪亮工...

【转载】如何从零入门人工智能(AI)具体学习步骤和方法

上次我们讲到人工智能的一些应用,对于计算机专业的小白,我们如果对人工智能感兴趣,我们该如何入手呢?本文主要参考...
发表于 2019-11-28 16:20 102次阅读
【转载】如何从零入门人工智能(AI)具体学习步骤和方法

史上最全AI人工智能入门+进阶学习视频全集(200G)【免费领取】

近几年来,人工智能(AI)概念很火热,几乎人人都在学习人工智能,AI市场人才的抢夺也非常的激烈。根据百科的解释...
发表于 2019-11-27 12:10 235次阅读
史上最全AI人工智能入门+进阶学习视频全集(200G)【免费领取】

高焕堂:VR/AR欺骗大脑,AI赋能大脑,两者结合创意无限

高焕堂,台湾VR/AR产业联盟主席、台湾铭传大学《AI潮流下的创新设计思维》课程讲师、台湾科技大学VR技术培训...
发表于 2019-11-26 13:52 5482次阅读
高焕堂:VR/AR欺骗大脑,AI赋能大脑,两者结合创意无限

传感器和人工智能的关系

  谁来阐述一下传感器和人工智能的关系? ...
发表于 2019-11-25 15:51 177次阅读
传感器和人工智能的关系

5G与人工智能的关系

  谁来阐述一下5G与人工智能的关系?
发表于 2019-11-22 17:08 229次阅读
5G与人工智能的关系

大彩智能屏在美容行业的应用.pdf

大彩智能屏在美容行业的应用:随着用户对显示效果的要求越来越高,传统的数码管已经不能满足客户的要求,智能彩屏显示...
发表于 2019-11-22 16:07 143次阅读
大彩智能屏在美容行业的应用.pdf

【瑞芯微RK1808计算棒试用体验】搭建Linux(Ubuntu18.04)环境试用RK1808

       人工智能已成为各行各业离不开的主题,电子发烧友论坛和瑞芯微电子联合推出的RK1808试用...
发表于 2019-10-25 13:05 237次阅读
【瑞芯微RK1808计算棒试用体验】搭建Linux(Ubuntu18.04)环境试用RK1808

基于ARM9内核的智能灭火机器人怎么设计?

人工智能也称机器智能,是一门研究人类智能机理和如何用计算机模拟人类智能活动的学科。经过50多年的发展,人工智能已...
发表于 2019-10-21 06:39 252次阅读
基于ARM9内核的智能灭火机器人怎么设计?

AI的核心是什么?

AI概念笼统,范围广大,到底什么才是AI的核心? ...
发表于 2019-10-18 06:39 206次阅读
AI的核心是什么?

什么是Cortex-A75?

时光飞逝,好像在昨天我们才刚发布ARM Cortex-A73这款最节能的高效能Cortex应用处理器,转眼之间我们就看到Cor...
发表于 2019-10-15 08:28 225次阅读
什么是Cortex-A75?