0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人工智能算法的演进升级需要高质量数据作为支撑

倩倩 来源:腾讯网 作者:腾讯网 2021-01-28 13:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AI 数据是推动人工智能落地发展的核心基础,是人工智能技术应用和发展的基石。人工智能的大规模应用需要利用海量数据对模型进行训练,可以说,没有高质量的数据就没有人工智能的大规模应用。可以说,AI 数据基础设施已经成为AI 新基建的重要支撑。

国家工业信息安全发展研究中心最新发布的《2020年AI新基建发展白皮书》中指出,人工智能算法的演进升级需要高质量数据作为支撑。经过清洗标注、去掉噪声数据的高质量数据集比未经过处理的数据集更适合人工智能算法进行训练。质量不断提升的数据集已经成为人工智能技术发展的重要推动力,高质量AI数据正驱动人工智能算法更加智能化。

回顾过去,早期的数据标注行业曾长期处于粗放的发展模式,数据粗制、混乱、复用的情况屡见不鲜;但随着AI与各个产业结合得愈加紧密,AI商业化程度进入新的高度,行业属性较强的垂直领域加速落地,数据标注的需求正逐渐转向个性化、场景化和准确化,数据服务供应商的技术实力、精细化管理能力、流程把控能力不断提升,数据标注行业走向专业化、精细化、定制化。

这也意味着必须有能力超群的代表站出来,重新定义数据标注行业的规则。

目前,数据标注行业的企业机构主要分为三类:第一类是AI公司内部的标注部门,第二类是数据标注众包平台,第三类是以场景化、高精度数据采集和标注见长的公司。

第一种形式顾名思义,科技企业自身有数据采集标注需求,大量数据标注任务由公司内部完成。

第二种是众包平台,以亚马逊众包平台Mechanical Turk为代表,基本按照“需求公司——众包平台——多个互联网用户”的模式完成。

第三种是以云测数据为代表的,专门从事高精度、场景化数据采集和标注的第三方企业。

与其他数据标注公司不同的是,云测数据更强调高精准度的场景化的数据服务。其CTO陈冠诚认为,“通过云测数据的服务,企业可以将自己算法的识别精度推到一个新的高度,进而落地成为产品被用户使用,而沉淀的用户数据以及用户在分享过程中逐渐产生的更多互联网数据,则会让整个数据库演变成大数据生态。”

实际上,这所体现的正是对数据质量的把控能力和对场景深度的还原能力。

以云测数据为例,为进一步满足场景化数据的需求,首创了“数据场景实验室”进行相应的场景化数据生产,以满足AI行业应用场景逐渐趋于长尾和碎片化的趋势;并从帮助客户梳理数据需求出发,通过自建数据标注基地和自研的数据标注平台进行数据的全流程把控,在保证数据的质量、效率和隐私安全的前提下,来帮助AI企业或部门快速构建核心数据壁垒,加速AI产业化落地的进程。

舍恩伯格在他的《大数据时代》中预言:“数据可以量化一切,文字变成了数据,方位变成了数据,沟通变成了数据,直到万物的数据化。

当下,数据价值驱动的数字经济正成为推动社会前进的主要模式,由各种AI等创新技术驱动的数字化转型成为了新基建的核心。“新基建”的东风促使我国人工智能、5G、工业互联网等行业迎来大规模提速发展机遇期,AI数据作为新的生产要素声名渐显,以云测数据为代表的深耕数据采集、数据标注的人工智能数据服务商将进一步助力AI产业生态的完善。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4761

    浏览量

    97153
  • 人工智能
    +关注

    关注

    1813

    文章

    49746

    浏览量

    261602
  • 数字经济
    +关注

    关注

    2

    文章

    1117

    浏览量

    20104
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    四维图新亮相2025国际前瞻人工智能安全与治理大会

    日前,2025国际前瞻人工智能安全与治理大会在北京举行。作为数据治理领域的典型代表,四维图新打造的“‘车云’数据协同治理,赋能车企高质量发展
    的头像 发表于 11-08 17:20 1235次阅读

    研华AI智能体推动储能产业高质量发展

    储能行业正面临海量数据处理与AI应用挑战。研华科技推出软硬件一体化控制方案,实现整站交付效率提升90%。该方案打通从数据采集到AI智能体构建的全链路,推动储能系统向智能
    的头像 发表于 11-02 15:43 650次阅读

    中科曙光入选信通院2025上半年度高质量数字化转型十大典型案例

    9月16日,中国信通院正式公布《高质量数字化转型产品及服务典型案例(2025上半年度)》评选成果。天翼云与中科曙光联合打造的“智能政务应用翼政通驱动的混合云智算一体机”,成功入选中国信通院2025
    的头像 发表于 09-17 11:42 871次阅读

    标贝科技参编《人工智能高质量数据集建设指南》

    人工智能迈入“数据驱动”的关键发展阶段,高质量数据集已成为突破技术瓶颈、推动产业落地的核心引擎。日前,中国信息通信研究院人工智能研究所联合清华大学计算社会科学与国家治理实验室、中国
    的头像 发表于 09-11 17:19 694次阅读

    易华录入选国家首批高质量数据集建设先行先试工作名单

    8月28日下午,在2025中国国际大数据产业博览会上,国家数据局发布了首批高质量数据集建设先行先试工作名单。经中国电科推荐、国家数据局评审,易华录申报的“文博行业
    的头像 发表于 09-04 09:04 798次阅读

    中国中车通过中国信通院可信AI人工智能数据质量四级评估

    评估方法 总体要求》(2021-1303T-YD)行业标准开展,标志着中国中车在人工智能高质量数据建设方向迈入行业“顶尖”水平。
    的头像 发表于 08-22 17:02 1205次阅读

    索尼重载设备的高质量远程制作方案和应用(2)

    索尼的远程制作可以被称之为制作级的高质量远程制作,或重载设备的高质量远程制作,远程设备结合常规系统设备,提供和本地制作类似的制作级高质量图像,延续电视台/制作公司的设备特点和优势。
    的头像 发表于 08-21 15:56 878次阅读
    索尼重载设备的<b class='flag-5'>高质量</b>远程制作方案和应用(2)

    大模型时代,如何推进高质量数据集建设?

    高质量数据集,即具备高价值、高密度、标准化特征的数据集合。 在AI领域,高质量数据集地位举足轻重,如同原油经炼化成为汽油驱动汽车,海量原始数据需转化为
    的头像 发表于 08-21 13:58 533次阅读

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    应用场景。从数据采集,到模型推理,都能完整且自如地参与,轻松解锁人工智能全流程实训,让你深度体验AI技术的魅力 。 四、九门课程全覆盖,满足多元学习需求 对于高校教学或者技术学习来说,课程覆盖的广度
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    应用场景。从数据采集,到模型推理,都能完整且自如地参与,轻松解锁人工智能全流程实训,让你深度体验AI技术的魅力 。 四、九门课程全覆盖,满足多元学习需求 对于高校教学或者技术学习来说,课程覆盖的广度
    发表于 08-07 14:23

    明远智睿SSD2351开发板:视频监控领域的卓越之选

    服务器。在监控中心,工作人员可以通过监控软件对视频画面进行实时查看、回放和分析,及时发现异常情况并采取相应措施。此外,开发板还可以结合人工智能算法,实现视频内容的智能分析,如人脸识别、行为分析等,提高安防
    发表于 05-30 10:24

    浅析:数字经济时代,高质量数据集对AI产业带来哪些新的变化

    ​在数字经济与人工智能深度融合的今天,数据已超越传统生产要素,成为驱动AI技术突破与产业变革的核心动力。高质量数据集不仅是AI模型性能跃升的基石,更重塑了从技术研发到商业落地的全产业链条。 近年来
    的头像 发表于 05-09 15:10 748次阅读

    喜报丨阿丘科技荣登苏州市人工智能大模型与高质量数据集双项榜单

    科技”)凭借自主研发的“PCB缺陷检测视觉大模型”与“AQ工业基础材料加工缺陷数据集”,分别入选“苏州市级培育人工智能大模型”及“苏州市首批行业高质量数据集”两大榜单。厚
    的头像 发表于 02-21 11:18 902次阅读
    喜报丨阿丘科技荣登苏州市<b class='flag-5'>人工智能</b>大模型与<b class='flag-5'>高质量数据</b>集双项榜单

    广汽集团召开高质量发展大会

    春回大地,万象更新。近两日广东省、广州市聚焦“建设现代化产业体系”主题,相继召开“新春第一会”——高质量发展大会,吹响奋进号角。广汽集团党委书记、董事长冯兴亚作为省市重点产业高质量发展代表参加会议,与产学研各界代表共聚一堂,共绘
    的头像 发表于 02-07 10:18 1019次阅读

    【「具身智能机器人系统」阅读体验】+数据在具身人工智能中的价值

    熟练程度,但由于其多模态性质,训练 EAI 模型需要更多的机器人数据。这些机器人数据包括各种传感输入和交互类型,不仅极具挑战性,而且收集成本高昂。 训练 EAI 的第一个挑战是访问广泛、高质量
    发表于 12-24 00:33