0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数据爆炸时代:加速AI落地中的困境

NVIDIA英伟达 来源:智东西 2020-04-29 16:31 次阅读

在数据和算法重新定义的世界中,数字化转型正构成传统企业的新竞争力,但实际被收集和利用的数据,远比人们想象中少。

有效数据量少、模型开发效率低、专业技术人才匮乏,这些问题在企业应用数据分析面前形成了难以跨越的天堑。一边中国市场上超半数的企业已经采用机器学习方法,实现高级数据分析预测,另一边机器学习、数据科学的普及之路仍荆棘丛生。

在这一背景下,IDC发布《数据分析新速度:加速数据科学转变成商业洞察》白皮书,重新审视数据科学的定义与生态,对机器学习、数据科学在中国市场的落地现状进行全面调研。

数据爆炸时代:加速AI落地中的困境

在大数据、人工智能等新兴技术的助推下,数据科学从常规数据分析发展到高级预测分析与智能预测,其定义正在被重新审视。

本白皮书中,IDC将机器学习与图算法为主的工作负载定义为数据科学,其核心技术即经典机器学习技术,正在企业用户中开始复兴。据IDC调研,当前中国市场上74%的企业已采用包含机器学习的数据科学平台,其他企业均表示在未来24个月内有计划采用这一平台。

在当前金融应用场景中,80%的分析预测模型采用机器学习模型,支撑预判欺诈风险、优化量化投资等业务应用。而每成功识别一笔欺诈交易行为,每准确预测一次市场行情变化,对企业的经济利益可能是百万级甚至上亿级。

还有在零售场景,随着个性化服务需求升级,更多零售企业正通过机器学习形成线下线上融合的用户画像追踪,实现千人千面精准营销,显著提升用户粘度。

数据科学在文娱、教育、电信、制造、医疗、政府、媒体、能源、交通、地产等行业中均得到广泛应用。根据IDC提供的数据,中国企业在深度学习和机器学习方面的投入持续增加,高级数据预测分析、经典机器学习相关的市场规模在2018年达到3.0亿美金,预计到2022年将达到29亿美金。

2018-2022年中国人工智能应用市场规模(单位:百万美金)

不过企业要想应用机器学习,还需先解决很多挑战。

首先,数据准备和建模耗时长。其次,数据资源严重匮乏。IDC调研发现,目前只有一线互联网公司拥有超数千PB级别数据,大部分企业的数据量仅在1TB-20TB之间。另外企业积累的大部分数据不能直接用于模型训练,被注入到AI模型的数据不足1%。此外,数据科学工作负载开发效率不高。许多刚涉足机器学习应用的企业,对底层算力和基于硬件的优化缺乏清晰的认知,尚未意识到加速计算给企业开发效率带来的价值。

企业采用加速方案后的效果

要在应用机器学习时绕开这些瓶颈,选择合适的数据科学平台则至为关键。

数据科学平台选型:门槛低,速度快

DC在白皮书中,就平台选择的考量因素给出许多具体可行的建议。

例如使用机器学习平台开发模型时,应与企业实际业务需求充分匹配。

IDC发现,大部分企业已采用加速方案,其中采用GPU加速的居多,占比达50%。

企业采用机器学习平台时使用到的加速方案情况

其中,NVIDIA在2018年10月推出RAPIDS开源GPU加速平台正得到越来越多企业的应用。

NVIDIA RAPIDS平台致力于加速大规模数据分析和机器学习工作负载,该平台建立在NVIDIA CUDA-X AI平台之上,提供了一系列面向机器学习、深度学习和高性能计算的专用GPU加速库,这些库与NVIDIA Tensor Core GPU无缝地配合工作,可加速从数据准备、模型训练到预测的整个端到端流程,大大提升AI任务执行效率和模型精度,同时降低基础架构TCO。

当前百度、阿里云、IBM、Oracle、Kinetica、H2O、SAP、SAS、Databricks等公司都已采用NVIDIA RAPIDS平台加速数据科学研究。

应用无处不在,精度效率双提升

从应用角度来看,在国内金融、零售、云计算等多个行业场景中,RAPIDS均已展现出色的加速能力。

1、案例一:提升端到端量化投资预测效果

在金融领域,如何提升开发效率是量化投资工具面临的主要挑战。

宽邦科技打造的AI量化投资平台BigQuant旨在让金融业务人员都能零门槛地使用AI提升投资效率和效果,每月为金融机构和10万C端用户提供数百万次机器学习模型训练。

采用NVIDIA RAPIDS平台后,其GBDT模型在特征工程提取环节速度提升100倍,聚类算法速度提升200倍,同时系统预测准确度也得以提升。

2、案例二:显著提升理赔审核能力

银行做信用评分时,通常用XGBoost在Spark上进行运算,完成一次端到端模型迭代一般需要几天,新的用户行为特征也不能实时更新到模型训练中,会影响后期的精度。

平安科技引入NVIDIA RAPIDS在NVIDIA DGX-2超级计算机上进行模型运算,将模型运算速度提升40倍,模型训练时间从周压缩到分钟,不仅大大节省人力成本。

平安科技副总工程师、联邦学习技术部总经理王健宗表示,RAPIDS平台“不仅大大提升了效率,对于精度的提升也指日可待”。

3、案例三:大幅提速数据准备

云计算厂商也在借助RAPIDS平台提升任务执行效率,国内首家提供RAPIDS加速库服务的公有云厂商是阿里云。

机器学习算法往往产生大量数据传输,至今仍难以实现并行化。随着服务器系统引入GPU加速的机器学习算法以及NVIDIA NVLink、NVSwitch等技术,模型训练现可轻松分布在多个GPU和多个节点间,几乎不会产生延迟。

实例上,使用GPU加速的XGBoost训练任务可提速20倍以上。

结语:加速数据分析正渗透到更多行业

数据科学应用的程度正拉大企业间的竞争差距和收益差距,数字化程度好的银行、航空公司、酒店等机构,收入及税前利润明显高于数字化落后的同类机构。

企业如果不想在智能化趋势中落后于人,不仅希望有更易上手的数据科学平台,而且需要采用更好的加速方案来缩短开发周期。

IDC预计到2021年,90%的新智能系统将嵌入以决策为中心的加速计算架构,能自动检测和评估当前形势并作出应对决策。这将帮助更多企业优化生产效率,更为游刃有余地去适应客户需求以及竞争环境的快速变化。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 核心技术
    +关注

    关注

    4

    文章

    619

    浏览量

    19396
  • 机器学习
    +关注

    关注

    66

    文章

    8116

    浏览量

    130546
  • 数据分析
    +关注

    关注

    2

    文章

    1351

    浏览量

    33732

原文标题:74%企业已采用数据科学平台!IDC新报告,揭秘加速数据分析的核心要诀

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA在加速识因智能AI大模型落地应用方面的重要作用介绍

    本案例介绍了 NVIDIA 在加速识因智能 AI 大模型落地应用方面的重要作用。生成式大模型已广泛应用于各领域,通过学习人类思维方式,能快速挖掘海量内容,满足不同需求。
    的头像 发表于 03-29 15:28 271次阅读

    AI时代怎么样不被淘汰?讯飞AI鼠标助力你在AI时代成长

    AI时代怎么样不被淘汰?讯飞AI鼠标助力你在AI时代成长 随着人工智能的发展,AI
    的头像 发表于 03-23 11:41 392次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>时代</b>怎么样不被淘汰?讯飞<b class='flag-5'>AI</b>鼠标助力你在<b class='flag-5'>AI</b><b class='flag-5'>时代</b>成长

    一图看懂星河AI数据中心网络,全面释放AI时代算力

    华为中国合作伙伴大会 | 一图看懂星河AI数据中心网络,以网强算,全面释放AI时代算力
    的头像 发表于 03-22 10:28 165次阅读
    一图看懂星河<b class='flag-5'>AI</b><b class='flag-5'>数据</b>中心网络,全面释放<b class='flag-5'>AI</b><b class='flag-5'>时代</b>算力

    AI大模型加速落地! 西部数据助力数据中心智能化升级

    面对AI大模型的发展和普及,西部数据作为全球数据存储解决方案提供商,如何看待这种浪潮到来,生成式AI技术发展对现有基础设施部署工作带来哪些挑战?对存储产品带来了哪些新的发展机遇和要求?
    的头像 发表于 02-18 00:03 4058次阅读
    <b class='flag-5'>AI</b>大模型<b class='flag-5'>加速</b><b class='flag-5'>落地</b>! 西部<b class='flag-5'>数据</b>助力<b class='flag-5'>数据</b>中心智能化升级

    【国产FPGA+OMAPL138开发板体验】(原创)5.FPGA的AI加速源代码

    使用硬件加速器来进一步提升性能。我写的这个简化的代码只是为了帮助理解FPGA如何可能参与AI计算的过程。在实际的FPGA AI加速项目中,还需要考虑如何有效地处理
    发表于 02-12 16:18

    AI大模型在端侧加速落地已成必然趋势,芯片厂商提前布局!

    普遍认为,2024年AI大模型在商业应用会有极大突破。   “AI大模型在端侧的加速落地已成必然趋势。”在星宸科技上周举办的2023开发者大会暨产品发布会上,该公司董事长&总经理林永育
    的头像 发表于 12-29 00:47 1452次阅读
    <b class='flag-5'>AI</b>大模型在端侧<b class='flag-5'>加速</b><b class='flag-5'>落地</b>已成必然趋势,芯片厂商提前布局!

    安谋科技赵永超:生成式AI加速落地,行业应用创新从“芯”突破

    生成式AI的发展机遇,以及企业要如何面对生成式AI落地难题。   随着ChatGPT等生成式AI的横空出世,为各行各业带来了新的驱动力。而如何利用好生成式
    的头像 发表于 12-26 14:32 680次阅读
    安谋科技赵永超:生成式<b class='flag-5'>AI</b><b class='flag-5'>加速</b><b class='flag-5'>落地</b>,行业应用创新从“芯”突破

    基于紫光同创FPGA的图像采集及AI加速(盘古50K开发板)

    基于紫光同创FPGA的图像采集及AI加速(盘古50K开发板)
    发表于 11-03 11:02

    签了!英特尔与联想、爱奇艺引领加速AI PC落地

    10月31日下午,英特尔公司、联想集团、爱奇艺三方备忘合作发布会在北京举行。三家企业签署合作备忘录,旨在携手加速AI变革在应用端的落地,为用户带来全新的AI高级智能化体验。此次签署备忘
    的头像 发表于 11-01 14:06 243次阅读
    签了!英特尔与联想、爱奇艺引领<b class='flag-5'>加速</b><b class='flag-5'>AI</b> PC<b class='flag-5'>落地</b>

    适用于数据中心和 AI 时代的网络

    数据中心的未来和推动 AI 时代方面发挥的关键作用。 专用数据中心:AI 工厂和 AI 云 目前
    的头像 发表于 10-27 20:05 249次阅读
    适用于<b class='flag-5'>数据</b>中心和 <b class='flag-5'>AI</b> <b class='flag-5'>时代</b>的网络

    GITEX Global 2023 | 超融合数据中心网络,赋AI时代新动能

    王武伟发表了“超融合数据中心网络,赋AI时代新动能”的主题演讲,他指出,随着AI应用加速、云化架构不断升级,
    的头像 发表于 10-17 23:30 275次阅读

    AI加速器架构设计与实现》+第2章的阅读概括

    首先感谢电子发烧友论坛提供的书籍和阅读评测的机会。 拿到书,先看一下封面介绍。这本书的中文名是《AI加速器架构设计与实现》,英文名是Accelerator Based on CNN Design
    发表于 09-17 16:39

    携手共进16载,英特尔联合生态伙伴加速云计算与AI创新落地

    齐聚一堂,就数据洪流时代下,云计算与互联网行业的发展趋势、大数据及人工智能等领域众多创新技术与实践进行了深入探讨。会上,英特尔分享了其如何通过丰富全面的软、硬件产品组合加速云服务与
    的头像 发表于 09-15 19:35 280次阅读
    携手共进16载,英特尔联合生态伙伴<b class='flag-5'>加速</b>云计算与<b class='flag-5'>AI</b>创新<b class='flag-5'>落地</b>

    数据中心 AI 加速器:当前一代和下一代

    数据中心 AI 加速器:当前一代和下一代演讲ppt分享
    发表于 07-14 17:15 0次下载

    AI边缘计算盒子是如何推动边缘AI应用落地

    AI边缘计算盒子(AI Edge Computing Box)是一种集成了边缘计算和AI算法处理能力的设备,可以用于推动边缘AI应用的落地
    的头像 发表于 05-26 14:08 692次阅读