0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

给AI时代装配“新大脑”:数据密集型超算带来了哪些变革?

脑极体 来源:脑极体 作者:脑极体 2021-07-12 21:58 次阅读

这几天,世界人工智能大会成为了行业中当之无愧的流量焦点,而媒体与分析师对这届大会的关注点也各有不同。

我们发现,世界人工智能大会来到第四届,大家关心的不再仅仅是基础算法创新以及酷炫的黑科技应用。AI相关的产业基础设施、规模化落地方案的关注度逐步增强。大家更多把AI视作一个产业结构,而非单单一种技术来加以讨论。

说到AI的产业会基础设施,就不能不提到超算。无论对于科研、行业,甚至区域发展与国家战略来说,超算都是AI与相关新一代信息技术的核心。而随着AI等技术带来数据量大规模增长、数据结构多元化、数据分析任务复杂化,原本的HPC(高性能计算)体系也迎来了全新的变革与挑战。HPC正在走向HPDA(高性能数据分析)的新方向,AI时代的超算体系正在从计算密集型转向到数据密集型。

我们知道,人的聪明才智不仅来自反应能力,还来源于对知识、记忆、经验的准确调取和应用。当AI要变得更聪明时,一定需要更强大的数据处理能力。数据密集型超算,可以说是社会经济真正需要的AI大脑。

人脑中的记忆是存储在神经元当中的,那么AI时代的超算大脑中,数据将要存储在哪呢?

一场由数据密集型超算带来的存储变革正在发生。7月8日,在2021世界人工智能大会(WAIC2021)上,上海交通大学与华为公司联合发布了数据密集型超算示范中心。这是双方继4月份联合成立“高性能计算&存储技术联合创新中心”以来的又一重磅合作,开创了产学研一体化推动超算发展的全新模式。

让我们以此为基础来谈一谈:智能时代为什么必须发展数据密集型的“新超算”?与此同时,存储产业又如何帮助“新超算”跨越数据裂谷?

智能时代,数据密集型超算的产业需求

自疫情发生以来,全球无数国家和地区,相继意识到了超算能力的重要性。在确诊病例、寻找治疗方法以及研发疫苗的过程中,病毒与蛋白质解析能力至关重要。而相关工作就非常明显地展现出了计算由计算密集型,向数据密集型转化;由HPC向HPDA演进的必要性。

病毒解析任务中,需要快速产生海量数据,并且其结构复杂、数据形态多元。类似计算任务不仅考验计算能力,更考验全流程化的数据存放、调用、解析与再利用能力。如果仅仅是算得快,那么任务可能在数据的全流程循环中浪费大量时间。而疫情面前,时间就是生命。

在AI进入产业化周期的阶段,类似问题出现在各行业的超算需求中。自动驾驶、油气勘探、天文分析、工业数字化孪生,都清晰地指向数据密集型计算。

华为IT产品线解决方案设计部部长陈默博士认为,超算发展目前主要有6大趋势:架构集群化、计算异构化、数据密集化、网络IP化、运营自动化和应用容器化。这些趋势的出现,不仅考验了超算本身的算力发展,还给超算的存储体系带来了一系列挑战。比如说:

1、超算对应的数据存储量与存储类型快速增加:自动驾驶、卫星探测等任务带来了数据量的几何级飙升。而智慧城市、地质勘探等行业带来了大量非结构化数据、混合类型数据的存在任务,这都对存储体系产生了更高要求。

2、数据调用性能极大增加,要求存储能力增强:HPDA形态下的超算体系,需要完成海量数据的短时间内大量吞吐,这对存储性能提出了挑战。

3、产业智能化趋势,要求存储可靠性趋向极致:在生产场景中落地的超算,需要结果高度可靠,且不能出现重复,更不能持续故障。这要求存储的可靠性极高,并具有强大的自我修复与诊断能力。

4、超算中心和数据中心融合:超算体系未来将承担更多的数据服务与数据利用职能,这就要求数据在存算场景中反复流动,快速循环,形成有效的数据湖场景。这将对现有存储体系造成巨大的升级。

这些趋势的存在和发展,意味着数据密集型超算必将建立在存储能力的升级与进化之上。海量存储能力升级支撑数据密集型超算与HPDA趋势;超算升级又支撑了AI产业化发展。

这样来看,今年我们希望在世界人工智能大会中找到的产业底座,一定蕴藏在海量存储体系当中。

应对HPDA挑战,需要存储能力升级

为了应对数据密集型超算中出现的一系列数据存算挑战,华为推出了OceanStor Pacific存储,在高密设计、应对混合负载能力,以及多协议互通三大领域完成了创新,从而更准确满足海量、多种类数据的快速存算需求,助力超算体系升级。

我们可以具体来看一下这三大能力是如何解决数据密集型超算所遇到挑战的。

首先,HPDA的核心挑战就是海量数据的涌入,以及业务量的几何级增长,很快会造成机房空间不足、存储成本高昂的问题,相关用户不能无限制投入成本和空间用以存放数据。为了解决这个问题,华为推出了OeanStor Pacific高密专用硬件,基于全新的高密架构设计提供更高的容量利用率,在有限的机房空间里存下更多数据。

其次,随着AI产业化的推进,超算体系中的一套存储必须支持不同业务流程、产业环节的混合负载。以油气勘探为例,过往数据采集、解释、处理每个环节的业务能力对存储的需求都不同,如果搭建多套存储会造成大量迁移成本和安全风险。华为OceanStor Pacific推出了新一代分布式并行文件系统,从而应对混合负载挑战。

再有,数据密集型超算需要让数据在其他环节、不同系统之间进行复杂的循环流动,这就需要存储具备多协议互通能力。华为OeanStor Pacific具备业界领先的多协议互通能力,能够实现多个存储服务同时访问一份数据,提高跨环节、跨系统的数据分析效率。

面向数据密集型超算的产业趋势,华为也并不仅仅是提供市场需要的产品和技术,而是与科研界、产业界走到一起,联手探索未来超算的更多可能性。比如上海交通大学与华为联合打造的数据密集型超算示范中心。

产学研一体,探索超算下一幕

数据密集型超算的进化,以及HPC向HPDA的演进,都不是一家企业、一个产业链环节能够完成的任务,而是需要这个领域中产学研各界高效协同,更准确完成从基础设施革新、技术创新到产业落地的一系列工程。

华为与上海交通大学联手打造的数据密集型超算示范中心,就是一种有效的产学研一体化协作模式。华为OceanStor Pacific存储对于HPDA的赋能与帮助,不应该等待产业界慢慢探索发掘,而是应该在有效的示范与引导下,确保行业用户和超算建设方能够准确找到切入点,实现投入产出比最大化。

数据密集型超算示范中心就是这样一个产学研一体化打造的示范项目,其具有两大创新点,一是国内高校建设的第一个ARM超算体系,二是在国内高校首次践行“数据密集型超算”的建设理念。围绕数据密集型超算的建设理念,华为与上海交大紧密协作,持续投入了相关技术与应用创新,并且在科研合作、人才培育等领域进行生态化合作。以此来探索超算在智能时代的有效升级路径。

回到存储领域,华为OceanStor Pacific存储为数据密集型超算示范中心提供了统一的数据底座,对异构化算力实现了坚实支撑,既确保了创新型的超算部署成功落地,同时还增强了结果验证能力,提升了用户操作体验与运行效率。

未来,数据密集型超算将在AI走入千行百业、探索技术边界的进程里起到中坚作用。而相关的存储能力则是众多想象力的基础。

我们在今年的世界人工智能大会中,不仅能够看到对AI基础设施的关注,甚至能看到“基础设施的基础设施”迎来了升级进化。

基建是无数产业发展的灵魂,我们在高速公路、高铁上见到的故事,正在AI、存储中又一次上演着。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26443

    浏览量

    264038
收藏 人收藏

    评论

    相关推荐

    一文带您了解基于富唯智能AI-ICDP打造的可重构柔性装配产线

    在当今日益复杂多变的工业制造环境中,传统装配产线面临着多层控制器架构冗余、柔性化需求增加、控制器语言多样以及标准化程度低等多重挑战。为了解决这些行业痛点,富唯智能凭借其创新的AI-ICDP平台,成功打造了可重构柔性装配产线,为工
    的头像 发表于 04-25 17:53 411次阅读
    一文带您了解基于富唯智能<b class='flag-5'>AI</b>-ICDP打造的可重构柔性<b class='flag-5'>装配</b>产线

    鸿蒙OS开发实例:【ArkTS类库多线程CPU密集型任务TaskPool】

    CPU密集型任务是指需要占用系统资源处理大量计算能力的任务,需要长时间运行,这段时间会阻塞线程其它事件的处理,不适宜放在主线程进行。例如图像处理、视频编码、数据分析等。 基于多线程并发机制处理CPU密集型任务可以提高CPU
    的头像 发表于 04-01 22:25 319次阅读
    鸿蒙OS开发实例:【ArkTS类库多线程CPU<b class='flag-5'>密集型</b>任务TaskPool】

    鸿蒙OS开发实例:【ArkTS类库多线程I/O密集型任务开发】

    使用异步并发可以解决单次I/O任务阻塞的问题,但是如果遇到I/O密集型任务,同样会阻塞线程中其它任务的执行,这时需要使用多线程并发能力来进行解决。 I/O密集型任务的性能重点通常不在于CPU
    的头像 发表于 04-01 16:32 107次阅读
    鸿蒙OS开发实例:【ArkTS类库多线程I/O<b class='flag-5'>密集型</b>任务开发】

    博泰“车联网云服务平台”入选2023年度专利密集型产品名单

    近日,中国专利保护协会首次组织开展了专利密集型产品认定工作,并于近期发布2023年专利密集型产品名单,博泰的“车联网云服务平台”入选2023年度专利密集型产品名单。
    的头像 发表于 03-29 10:23 135次阅读
    博泰“车联网云服务平台”入选2023年度专利<b class='flag-5'>密集型</b>产品名单

    鸿蒙原生应用开发-ArkTS语言基础类库多线程I/O密集型任务开发

    使用异步并发可以解决单次I/O任务阻塞的问题,但是如果遇到I/O密集型任务,同样会阻塞线程中其它任务的执行,这时需要使用多线程并发能力来进行解决。 I/O密集型任务的性能重点通常不在于CPU的处理
    发表于 03-21 14:57

    鸿蒙原生应用开发-ArkTS语言基础类库多线程CPU密集型任务TaskPool

    CPU密集型任务是指需要占用系统资源处理大量计算能力的任务,需要长时间运行,这段时间会阻塞线程其它事件的处理,不适宜放在主线程进行。例如图像处理、视频编码、数据分析等。 基于多线程并发机制处理CPU
    发表于 03-19 14:14

    HarmonyOS CPU与I/O密集型任务开发指导

    一、CPU密集型任务开发指导 CPU密集型任务是指需要占用系统资源处理大量计算能力的任务,需要长时间运行,这段时间会阻塞线程其它事件的处理,不适宜放在主线程进行。例如图像处理、视频编码、数据
    的头像 发表于 02-18 10:17 665次阅读
    HarmonyOS CPU与I/O<b class='flag-5'>密集型</b>任务开发指导

    如何评估ADA4610的偏置电流噪声输出端带来了多大的噪声?

    请结合ada4610的数据手册和如下原理图,评估偏置电流噪声输出端带来多大的噪声影响?
    发表于 11-13 06:52

    为汽车接口、安全和计算密集型负载选择和使用 FPGA

    ,而豪华车则可能采用 70 个或更多。越来越多的汽车需要极其复杂的密集型计算能力,用于执行高级驾驶辅助系统(ADAS)、信息娱乐、控制、网络和安全等任务。其中许多应用涉及与人工智能 (AI) 相结合的图像和视频处理方面的机器视觉。 独立的处理器架构难以处理传感器、照相机和
    的头像 发表于 10-03 14:37 396次阅读
    为汽车接口、安全和计算<b class='flag-5'>密集型</b>负载选择和使用 FPGA

    HarmonyOS CPU与I/O密集型任务开发指导

    一、CPU密集型任务开发指导 CPU密集型任务是指需要占用系统资源处理大量计算能力的任务,需要长时间运行,这段时间会阻塞线程其它事件的处理,不适宜放在主线程进行。例如图像处理、视频编码、数据分析等
    发表于 09-26 16:29

    用于密集型在轨边缘计算的微处理器和FPGA

    在这篇文章中,我想探讨和比较用于边缘密集型星载处理的微处理器和FPGA。一些应用需要从不同带宽的多个传感 器(如RF、LIDAR、成像和GNSS)获取大量数据,同时需要实时做出关键决策,如用
    发表于 09-14 14:34 1次下载
    用于<b class='flag-5'>密集型</b>在轨边缘计算的微处理器和FPGA

    云优化性能:使用基于闪存的存储的I/O密集型工作负载

    电子发烧友网站提供《云优化性能:使用基于闪存的存储的I/O密集型工作负载.pdf》资料免费下载
    发表于 08-28 10:04 0次下载
    云优化性能:使用基于闪存的存储的I/O<b class='flag-5'>密集型</b>工作负载

    阿里平头哥发布首个 RISC-V AI 软硬全栈平台

    平台通过软硬件深度协同,较经典方案提升 8 成性能,支持运行 170 余个主流 AI 模型,推动 RISC-V 进入高性能 AI 应用时代。 平头哥表示,他们通过更新自研一站式
    发表于 08-26 14:14

    边缘计算与 AI 的结合将带来怎样的变革

    边缘计算与人工智能(AI)的结合将带来许多变革和创新。边缘计算指的是将计算和数据存储能力移动到接近数据源的边缘设备,例如
    的头像 发表于 05-26 11:19 401次阅读
    边缘计算与 <b class='flag-5'>AI</b> 的结合将<b class='flag-5'>带来</b>怎样的<b class='flag-5'>变革</b>?

    PCIe 6.0入门之什么是 PCIe 6.0

    PCI Express® 6.0 (PCIe® 6.0) 规范由 PCI-SIG® 于 2022 年 1 月发布。最新一代的 PCIe 标准带来了许多激动人心的新功能,旨在提高计算密集型工作负载的性能,包括数据中心、
    的头像 发表于 05-22 17:27 5114次阅读
    PCIe 6.0入门之什么是 PCIe 6.0