0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何推动行业从“AI 产品训练”到“AI 产品落地”?

lhl545545 来源:与非网 作者:万能的大熊 2020-09-21 11:50 次阅读

科技发展一日千里,新技术的出现也是层出不穷,行业已经达成共识,相信科技的未来一定是 AI 人工智能。在日常生活中,越来越多的 AI 人工智能技术开始落地。

比如在这次疫情之中,AI 测温系统、服务型机器人、医疗辅助诊断等各种全新技术的采用,可以说帮助中国快速摆脱了疫情的困扰,社会也率先恢复到了正常运转的状态。那么很多人可能要问了,AI 人工智能产品是如何做出来的呢?

这里实际上就要涉及到 AI 人工智能的学习,人工智能虽好但训练不易,必须要有大量的 AI 数据作为训练支撑,而这些 AI 数据,并不是原始的“数据”,必须经过“标注”环节才能应用于人工智能的训练,成为人工智能学习的根基,可以说数据标注的精准度就是 AI 人工智能发展的根基。

在最近的 2020 中国国际服务贸易交易会上,知名头部人工智能数据服务商——云测数据宣布,AI 数据标注项目最高交付精准度已经达到 99.99%,这是一个创纪录的数字,建立了数据标注的一个全新标准,更为重要的是,打开了 AI 人工智能高速发展的大门。

1、好的 AI 需要好的数据

训练 AI 就如同教育学生一样,你必须给它最优质的教材和内容,才有可能把他培养成更优秀的人。对于 AI 来说,优质的 AI 数据就是好的教材,这是一个学习效果的保证。

优质的 AI 数据是来之不易的,首先第一步要先通过各种传感器将场景信息转化为数据;第二步则要通过人工或者机器筛选的方式去伪存真,把没有价值的数据筛掉,留下优质可以学习的数据;第三步是最为关键的数据标注,这个过程有点类似翻译的过程,把数据按照 AI 的特定标注规则“翻译”成机器能理解、能看懂的内容——AI 数据,然后才能用于人工智能技术的学习。

最终人工智能技术落地到底能够“聪明”到什么程度的关键,就取决于这种 AI 数据的量和质,AI 数据的质量越高、数据量越大,训练出来的 AI 也就越聪明。

而云测数据现在把这个 AI 数据的精准标准提升到了 99.99%,可以说已经将数据标注这件事情做到了极致,对于整个行业来说,树立了一个几乎无法企及的高度。换句话说,用云测数据标注的数据精度是最高的,训练效果也是最好的,自然 AI 成长的速度也就是最快的。

云测数据总经理贾宇航表示,“AI 数据质量,决定着 AI 算法的精度,AI 算法精度决定产品质量。云测数据一直将数据质量作为 AI 数据服务的发展核心,为企业提供高质量的场景化的 AI 数据服务。”现在云测数据最高交付精确度达到 99.99%,可以说是 AI 数据行业真正的高质量数据的倡导者和践行者。

从这里我们不难看出,AI 数据最高精度的达成意味着行业的标杆已经出现。从目前行业的整体水平来看,云测数据确实是领先行业的幅度非常巨大的,这对于想要建立领先优势的企业而言,云测数据成为合作的最优选择。

对于整个 AI 人工智能行业的发展来看,这显然进入了一个全新的阶段,毕竟在算力和算法上,目前拉不开什么差距,唯有在 AI 数据量和 AI 数据精度上,企业和企业之间的差别很大。最精准的标注产生最顶级的 AI 数据,这无疑会训练出最强大的 AI 人工智能。这也使得云测数据走到了一个关键的历史位置上,揭开了 AI 人工智能行业发展的全新一页。

2、从“AI 产品训练”到“AI 产品落地”

客观来说,AI 数据服务行业中存在着数据标注质量良莠不齐的情况。微观上看,数据标注质量“坑”了人工智能的模型训练,影响算法结果。但从宏观去看,数据标注层面没有标准已经是一个阻碍中国 AI 人工智能发展的障碍。目前通过长期的技术投入、规则建立和经验积累,云测数据已经开始将数据标注行业从最为原始的劳动密集型升级为技能密集型,这也推动行业的意义从“AI 产品训练”到“AI 产品落地”。现阶段,AI 产品的整体水准有了大幅度的提升,AI 成果也越来越令人瞩目,这和数据标准精度的提升有很大关系。

罗马不是一天建成的,云测数据也不是一开始就能够实现如此高的精度。云测数据能够做到今天的程度,和自己孜孜不倦的构筑数据标注科学体系息息相关。

贾宇航在演讲中介绍说,云测数据首先在标注流程上实现了正规化和科学化,设计了从创建任务、分配任务、标注流转、到质检 / 抽检环节和最后的验收等更完善的管理流程;在企业落地场景和算法模型需要方面则做到了模板化的任务创建,并支持不同种类标注类型和标注方法等,沉淀了完全自主知识产全的平台技术。

云测数据提供的从平台自研、数据场景实验室建立、自建数据交付中心的建立、自身专业工作人员积累等一体化服务,在流程建设和效率方面已经是行业首屈一指。

在流程完善的基础上,云测数据通过不断的积累和行业深耕,输出了 AI 企业在智能驾驶、智能家居、智慧金融、智能安防四大行业领域的训练数据服务解决方案,可贴合实际场景帮助更多行业实现“AI 产品更快更好的落地”,大大推动了 AI 产业的发展,是 AI 领域真正的幕后英雄。

值得一提的是云测数据的场景实验室是一个不小的创举,通过 100%还原真实场景,深入研究所需长尾场景特点,完成在对应传感器下的场景数据采集工作。这种专注和用心,弥补了很多原始数据的不足。

所以做好 AI 数据服务这个工作,不仅是一件有较高难度的事情,还是一件需要非常用心和积累的事情,而这份用心和积累,成为云测数据的护城河。这种在软实力上的优势也是云测数据领军行业的关键所在,而建立在软实力上硬流程的搭建,则更成为同行业无法跨越的鸿沟。

3、AI 学习进入大踏步的前进时代

云测数据这次发布的 99.99%数据标注精准度,结束了 AI 领域的一个维度的竞争。本来大家竞争的要素有 AI 数据的数量质量以及 AI 算法等几个维度,但现在 AI 数据的质量已经到达了顶峰,AI 的算法又不会有什么太大的差距,那么最终的胜负手又回到了数据的总量上了。

不过企业必须要首先选择云测数据进行数据标注,才有可能进入到数据总量的比拼环节,不然,AI 数据的质量关还过不了,那么数量越多反而浪费越多,这一点恐怕会成为未来 AI 企业选择合作伙伴的关键参考项。

数据总量是一个硬成本,而数据精准度则是一个效率指数。同样成本的数据量一定是精准度越高、AI 学习的效率越高,这也使得整个标注行业的数据分成了两类,一类是云测数据标注的数据,一类是其它公司标注的数据。

在云测数据标注的数据的前提下,企业之间的 AI 能力竞争才可以看作是真正的能力之争。这就好像赛车比赛,大家都已经把油门踩到底了,才能一分胜负。所以,这也意味着整个 AI 行业已经进入到了加速发展的快车道。而云测数据的软实力和硬实力,成为这条快车道的关键保障。目前云测数据无论是数据生产效率、质量保证还是隐私方面的把控,都已经做到了极高的水准。对于企业来说,云测数据是自身智能化转型的首选合作伙伴。

值得强调的是,在数据隐私安全方面,云测数据设置了一系列严格措施。其中一条核心原则就是数据绝不复用,当数据合格交付后从不留底,会清毁相关数据;其二,所有和云测数据进行数据采集的用户都会签订数据授权协议,从来源上确保企业用于训练的数据合法合规;同时,云测数据内部还设定了数据隔离、质量保障等一系列数据安全流程和技术。

Testin 云测 CMO 张鹏飞也强调,“从目前看来,AI 数据行业关于安全、隐私等方面并没有统一的标准。但从我们长远角度出发,一直在隐私和安全防护角度下大力气服务行业、树立数据质量标杆,只有以这种负责的态度来服务客户,我们的行业才能‘良币驱除劣币’,真正让人工智能成为新一轮技术革命,改变整个社会和人类进程”。

行业最高精准度的 AI 数据标准的诞生,昭示 AI 领域的爆发式发展即将到来。标注数据就像是信息世界的新基建,只有它完成了,大家才能更好的进行 AI 学习。

AI 行业的加速对于整个社会的信息化发展也会产生巨大的价值,包括智慧城市、智能家居、智能驾驶、智慧金融、新零售等 AI 核心领域相信都会有巨大的飞跃。
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26428

    浏览量

    264034
  • 智能家居
    +关注

    关注

    1912

    文章

    9149

    浏览量

    179329
  • 人工智能
    +关注

    关注

    1776

    文章

    43838

    浏览量

    230589
收藏 人收藏

    评论

    相关推荐

    基于NVIDIA Omniverse构建并由OpenUSD和生成式AI助力的产品配置器

    达索系统凭借其 3DEXCITE 解决方案成为行业领军企业之一,通过生成式 AI 支持的交互性和叙事,推动产品的商业销售。
    的头像 发表于 04-24 10:20 102次阅读

    字节跳动被曝正秘密研发多个AI产品

    据多位知情人士透露,科技巨头字节跳动正在人工智能(AI)大模型领域秘密研发多个创新产品。其中,多模态数字人产品备受瞩目,该产品将结合先进的AI
    的头像 发表于 03-05 11:22 435次阅读

    蚂蚁集团AI研发部门开源AI Infra技术,助力大模型训练效率提升

    蚂蚁集团AI创新研发部门NextEvo近日宣布,他们将全面开源AI Infra技术,以推动AI研发效率的提升。该技术框架名为DLRover,目标在于实现大规模分布式
    的头像 发表于 02-04 10:01 434次阅读

    AI算力应用中的光模块产品

    预测 光模块是数据中心内部互连和数据中心相互连接的核心部件。100G和400G是主流产品,800G过去主要用在超算等领域。据LightCounting预计,2023年800G全球普及率仅0.62%。而以ChatGPT为代表的AI大模型,对数据中心内外的数据流量都提出了新要
    的头像 发表于 01-02 15:32 199次阅读
    <b class='flag-5'>AI</b>算力应用中的光模块<b class='flag-5'>产品</b>

    安谋科技赵永超:生成式AI加速落地行业应用创新从“芯”突破

    生成式AI的发展机遇,以及企业要如何面对生成式AI落地难题。   随着ChatGPT等生成式AI的横空出世,为各行各业带来了新的驱动力。而如何利用好生成式
    的头像 发表于 12-26 14:32 689次阅读
    安谋科技赵永超:生成式<b class='flag-5'>AI</b>加速<b class='flag-5'>落地</b>,<b class='flag-5'>行业</b>应用创新从“芯”突破

    实测百度新文库,AI重构最彻底的产品都有什么用?

    AI
    脑极体
    发布于 :2023年10月19日 09:09:22

    英码科技精彩亮相火爆的IOTE 2023,多面赋能AIoT产业发展!

    产品,包括覆盖多层次算力的智能工作站(边缘计算盒子)、AI加速卡等;同时向大家展示自研的AI技术服务——“深元”0代码移植工具链和创新性的行业解决方案,赋能更多AIoT产业生态企业快速
    发表于 09-25 10:03

    AI新品 | 兆瀚RA5900-B AI训练服务器

    END 原文标题:AI新品 | 兆瀚RA5900-B AI训练服务器 文章出处:【微信公众号:拓维信息】欢迎添加关注!文章转载请注明出处。
    的头像 发表于 08-14 17:25 641次阅读

    训练好的ai模型导入cubemx不成功怎么解决?

    训练好的ai模型导入cubemx不成功咋办,试了好几个模型压缩了也不行,ram占用过大,有无解决方案?
    发表于 08-04 09:16

    Ai 部署的临界考虑电子指南

    虽然GPU解决方案对训练AI部署需要更多。 预计2020年代中期,人工智能行业将增长到200亿美元,其中大部分增长是人工智能推理。英特尔Xeon可扩展处理器约占运行
    发表于 08-04 07:25

    AI视觉检测在工业领域的应用

    产品图像。 2.图像处理:系统将采集的图像数据进行预处理、过滤、降噪等操作,以便更好地提取特征信息。 3.特征提取:系统采用深度学习等技术,对图像数据进行深度学习训练,提取出产品
    发表于 06-15 16:21

    AI边缘计算盒子是如何推动边缘AI应用落地

    AI边缘计算盒子(AI Edge Computing Box)是一种集成了边缘计算和AI算法处理能力的设备,可以用于推动边缘AI应用的
    的头像 发表于 05-26 14:08 692次阅读

    什么是预训练AI模型?

    训练 AI 模型是为了完成特定任务而在大型数据集上训练的深度学习模型。这些模型既可以直接使用,也可以根据不同行业的应用需求进行自定义。
    的头像 发表于 05-25 17:10 633次阅读

    中国开源未来发展峰会“问道 AI 分论坛”即将开幕!

    过去几个月,AI 几乎已经成为全民热议的话题。各式开源大模型、训练框架层出不穷;AI 技术也加速应用在各个领域和行业,例如服务运营优化、解决供应链问题等等;数据库、云计算、大前端等多类
    发表于 05-09 09:49