0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

智算中心加速布局,上游计算、存储、互联都涉及哪些芯片技术

Carol Li 来源:电子发烧友 作者:李弯弯 2024-07-24 01:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)智算中心是承载人工智能计算需求的基础设施,专门用于处理AI算法和模型所需的大量计算任务。与传统的数据中心和超算中心不同,智算中心更侧重于AI算力的提供,以满足日益增长的人工智能应用需求。

近期,中国各地纷纷加快数字基建项目的建设步伐,智算中心成为布局重点。从北京到四川,从宁夏到河南,多地智算中心项目相继开工或投入使用。国家统计局最新数据显示,我国算力基础设施建设已达到世界领先水平,智能算力规模占比提升至逾30%。

智算中心技术架构

智算中心的技术架构通常包含多个层次,从底层的硬件基础设施到上层的软件平台和算法服务,形成了一个完整的计算生态系统。

硬件基础设施层主要包括计算设备、存储系统和网络设施。计算设备包括高性能服务器、计算节点、GPU加速卡等,提供强大的计算能力和并行处理能力。这些设备是智算中心的核心组成部分,能够支持大规模数据处理和复杂的计算任务。

存储系统包括高速硬盘阵列、分布式文件系统、对象存储系统等,用于存储和管理海量数据。这些系统提供了高可靠性、高吞吐量和快速访问的存储解决方案,确保数据的安全性和可用性。

网络基础设施包括高速以太网、光纤网络、交换机、路由器等,支持数据传输和通信。这些设备提供了高带宽和低延迟的网络连接,以满足大规模数据传输和分布式计算的需求。

软件平台层包括算法和人工智能技术、大数据处理平台、AI使能软件和开发框架、云平台管理调度系统。算法和人工智能技术:包括机器学习算法、神经网络、图像处理和自然语言处理等,用于数据处理、机器学习、深度学习和模型训练等任务。这些算法和技术是智算中心实现智能计算的关键。

大数据处理平台:如Hadoop、Spark等,提供分布式和并行计算的能力,能够高效地处理大规模数据集。这些平台为智算中心提供了强大的数据处理和分析能力。

AI使能软件和开发框架:如CANN(华为昇腾AI计算架构)、MindSpore(华为全场景AI框架)等,为AI开发者提供便捷的开发环境和工具链,降低AI应用的开发门槛和成本。

云平台管理调度系统:如ModelArts(华为云AI开发平台)等,提供算力资源的统一管理和调度服务,实现算力资源的灵活配置和高效利用。

智算中心涉及的芯片及企业

从计算层面来看,智算中心以人工智能计算任务为主,是AI算力的核心基础设施。它采用专门的AI算力硬件,如GPU、NPU、TPU等,这些芯片擅长并行计算,能够高效处理AI算法中的大量简单矩阵运算任务。

智算服务器作为智算中心的主要算力硬件,通常采用“CPU+GPU”或“CPU+NPU”的异构计算架构,以充分发挥不同算力芯片在性能、成本和能耗上的优势。

这种强大的算力驱动AI模型对数据进行深度加工,源源不断产生各种智慧计算服务,面向全行业领域提供基于深度学习技术的人工智能算法能力、算法框架和相关接口

华为、天数智芯、摩尔线程、中科曙光、燧原科技、英伟达英特尔AMD等都推出有相关的芯片。如,华为推出了昇腾系列AI芯片昇腾910和昇腾310等,这些芯片专为AI训练和推理设计,具有高性能和低功耗的特点。昇腾系列已广泛应用于数据中心、云服务和边缘计算等领域,为智算中心提供强大的算力支持。

英伟达推出了多款针对AI训练和推理的GPU产品,如A100、H100等。英特尔也推出了多款AI芯片产品,如Habana Labs的Gaudi系列芯片,旨在与英伟达竞争。AMD在AI芯片领域也有所布局,推出了MI系列GPU和APU产品。

从存储方面来看,智算中心需要存储海量的数据,包括结构化数据、非结构化数据等。这些数据是AI算法训练和推理的基础。因此,智算中心在存储方面需要具备高容量、高可靠性、高可用性等特点。

存储设备通常采用高性能的硬盘或固态硬盘,并配备冗余的存储架构,以确保数据的安全性和可访问性。一般而言,智算中心的主要算力硬件智算服务器,其DRAM容量和NAND容量通常是传统服务器的数倍。三星、美光、SK海力士等都有相关芯片都广泛应用于数据中心、云计算等领域,为智算中心提供高性能的存储解决方案。

网络互联方面,智算中心的设备互联首先依赖于硬件基础设施,包括高性能的交换机、路由器、无线产品等网络设备,以及用于连接服务器、存储设备等的光纤、网线等物理介质。为了实现设备间的高效互联,智算中心通常采用高速互联技术,如InfiniBand、RoCE(RDMA over Converged Ethernet)等。这些技术能够提供低延迟、高带宽的数据传输能力,满足AI算法对算力的需求。

在智算中心中,GPU是核心的计算单元。为了实现GPU之间的高效互联,通常采用NVLink等专用通信协议,以实现高速的P2P(点对点)互联带宽。NVLink是NVIDIA开发并推出的一种私有通信协议,它采用点对点结构、串列传输,可以达到数百GB/s的P2P互联带宽。

写在最后

智算中心作为智慧时代的基础设施,将在未来社会经济发展中发挥越来越重要的作用。随着技术的不断进步和应用场景的不断拓展,智算中心将迎来更加广阔的发展前景。而上游产业链为智算中心提供了必要的硬件和软件支持。这些产业链参与者的共同努力和协作,推动了智算中心计算能力的不断提升和发展。



声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4696

    浏览量

    89572
  • 计算
    +关注

    关注

    2

    文章

    458

    浏览量

    39839
  • 智算中心
    +关注

    关注

    0

    文章

    108

    浏览量

    2451
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    100G 高速线缆:睿海光电以技术突破构筑智互联的高效基石

    在人工智能大模型训练需求爆发与全球智中心加速布局的背景下,数据中心内部短距互联的效率成为制约
    的头像 发表于 08-19 14:52 501次阅读

    睿海光电领航AI光模块:超快交付与全场景兼容赋能智时代——以创新实力助力全球客户构建高效力底座

    一、AI力革命催生光模块新需求,睿海光电以技术优势抢占制高点 人工智能、超大规模数据中心和云计算的高速发展,对光模块的传输效率、兼容性及交付周期提出更高要求。作为全球AI光模块领域的
    发表于 08-13 19:03

    加速AI未来,睿海光电800G OSFP光模块重构数据中心互联标准

    客户的共同选择 超中心应用 :为某国家实验室提供800G OSFP SR8模块,构建E级超互联网络 AI训练集群 :某自动驾驶企业采用我们的解决方案,GPU间通信延迟降低至1.2μ
    发表于 08-13 16:38

    力网络的“神经突触”:AI互联技术如何重构分布式训练范式

      电子发烧友网综合报道 随着AI技术迅猛发展,尤其是大型语言模型的兴起,对于力的需求呈现出爆炸性增长。这不仅推动了智中心的建设,还对网络互联
    的头像 发表于 06-08 08:11 7077次阅读
    <b class='flag-5'>算</b>力网络的“神经突触”:AI<b class='flag-5'>互联</b><b class='flag-5'>技术</b>如何重构分布式训练范式

    芯片的生态突围与力革命

    电子发烧友网报道(文 / 李弯弯)大芯片,即具备强大计算能力的集成电路芯片,主要应用于高性能计算(HPC)、人工智能(AI)、数据
    的头像 发表于 04-13 00:02 2611次阅读

    长电科技强化存储芯片业务布局

    近日,多家媒体报道,高力基础设施、手机等端侧智能需求涌现,叠加智能化汽车加速接入大模型,将进一步提升存储需求,多家存储原厂已启动涨价。
    的头像 发表于 03-13 16:27 1194次阅读

    信而泰CCL仿真:解锁AI力极限,智中心网络性能跃升之道

    中心RoCE网络提供精准评估方案,助力企业突破力瓶颈,释放AI澎湃动力! 什么是智中心中心
    的头像 发表于 02-24 17:34 985次阅读
    信而泰CCL仿真:解锁AI<b class='flag-5'>算</b>力极限,智<b class='flag-5'>算</b><b class='flag-5'>中心</b>网络性能跃升之道

    中心的核心硬件是什么?

    中心,作为人工智能时代的关键基础设施,其核心硬件的构成与性能直接影响着智能计算的效率与质量。以下是对智中心核心硬件的详细阐述:一、AI
    的头像 发表于 02-17 14:42 1997次阅读
    智<b class='flag-5'>算</b><b class='flag-5'>中心</b>的核心硬件是什么?

    云 GPU 加速计算:突破传统力瓶颈的利刃

    在数字化时代,数据呈爆炸式增长,传统的力已难以满足复杂计算任务的需求。无论是人工智能的深度学习、大数据的分析处理,还是科学研究中的模拟计算,都对力提出了极高的要求。而云 GPU
    的头像 发表于 02-17 10:36 517次阅读

    国家超平台推出AI生态加速计划

    昨日,国家超互联网平台正式推出了旨在促进AI生态发展的新举措——“AI生态伙伴加速计划”。该计划旨在通过提供一系列激励措施,加速AI技术
    的头像 发表于 02-14 09:16 687次阅读

    中科曙光以AI加速智能计算服务千行万业

    近年来,中科曙光以AI为中心,全面重构底层芯片、液冷、计算存储、智集群、基础软件栈、管理平台,并与AI场景有机适配、融合,
    的头像 发表于 02-10 17:45 1554次阅读

    中心的入门指南,技术小白也能懂

    是什么?智中心,全称智能计算中心,是一个专门为人工智能应用提供强大计算能力和数据存储的基础设施。简单来说,它就像一个超级强大的“大脑”,能
    的头像 发表于 02-08 14:27 1833次阅读
    智<b class='flag-5'>算</b><b class='flag-5'>中心</b>的入门指南,<b class='flag-5'>技术</b>小白也能懂

    中国信通院栗蔚:云计算与AI加速融合,如何开启智时代新纪元?

    中国信通院栗蔚:云计算与AI加速融合,如何开启智时代新纪元?
    的头像 发表于 01-17 18:48 1388次阅读
    中国信通院栗蔚:云<b class='flag-5'>计算</b>与AI<b class='flag-5'>加速</b>融合,如何开启智<b class='flag-5'>算</b>时代新纪元?

    中心力如何衡量?

    (ComputationalPower)是指智中心通过其内部的计算设备(如CPU、GPU、AI芯片等)对数据进行处理和计算的能力。它体现了
    的头像 发表于 01-16 14:03 4214次阅读
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b><b class='flag-5'>中心</b>的<b class='flag-5'>算</b>力如何衡量?

    中心会取代通用中心吗?

    随着人工智能(AI)技术的飞速发展,计算需求不断攀升,数据中心行业正经历着前所未有的变革。传统的通用中心与新兴的智
    的头像 发表于 01-06 14:45 891次阅读
    智<b class='flag-5'>算</b><b class='flag-5'>中心</b>会取代通用<b class='flag-5'>算</b>力<b class='flag-5'>中心</b>吗?