0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

奇异摩尔专用DSA加速解决方案重塑人工智能与高性能计算

奇异摩尔 来源:奇异摩尔 2024-09-19 11:45 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

写在开头,奇异摩尔的 NDSA 互联系列产品基于高性能RoCEv2 RDMA引擎,是面向智算网络通信加速及无损数据传输的专用DSA加速解决方案。

本文部分内容来源于麦肯锡白皮书

随着摩尔定律下的晶体管缩放速度放缓,单纯依靠增加晶体管密度的通用计算的边际效益不断递减,促使专用计算日益多样化,于是,针对特定计算任务的专用架构成为计算创新的焦点。

在过去的几十年的时间里,半导体晶圆上的晶体管密度几乎每两年翻一番,这一趋势令人瞩目。但在过去几年中,晶体管缩放的速度显著放缓,比摩尔定律预测的速度落后了大约十倍。

2018年,著名计算机架构师约翰·亨尼斯西(John Hennessy)和大卫·帕特森(David Patterson)在图灵讲座中指出,半导体工艺创新的放缓将逐渐增加对架构创新的激励——即集成电路的设计方式,以执行计算任务。

“他们认为,通用计算架构(如CPU)固有的低效性将开始被专门针对特定计算任务的架构(也称为领域专用架构,DSAs)的计算能力和成本效益所取代 。”

与此同时,随着计算和数字化在云计算(人工智能和高性能计算)、网络、边缘、物联网(IoT)和自动驾驶等众多应用领域中普及,高度领域专用的计算工作负载正在为DSAs提供有意义的性能优势。大型语言模型(生成式AI的核心引擎),例如ChatGPT,在高容量的AI工作负载中提供了进一步的专业化,这促进了进一步的硬件专业化。 DSA(domain-specific architecture)为特定应用领域开发的硬件和软件的商业潜力是巨大的。专用的图形处理单元 (GPU) 和张量处理单元 (TPU) 已经在数据中心获得了重要的市场份额,它们在 AI 工作负载学习和推理方面的表现优于 CPU。使用GPU和TPU对某些应用的性能提升是非常显著的,特定工作负载的可以实现15 到 50 倍的加速。此外,在汽车领域,来自领先供应商的定制的专用于某些计算场景的DSA硬件也提供了安全支持日益提高的自动驾驶水平所需的低延迟、高性能推理。

wKgaombrnnKAGY13AAKCgBR1DvE660.png

随着 DSA 扩展到其他应用领域,麦肯锡咨询估计到 2026 年,DSA 将占约 900 亿美元的收入(约占全球半导体市场的 10% 至 15%),高于 2022 年的约 400 亿美元。因此,我们看到在这个方向的硬件类的风险投资显着增加也就不足为奇了。

01 算力革命下的高性能网络DSA

随着人工智能及高性能计算的高速发展,服务器集群的瓶颈逐渐从单CPU、GPU、APU的算力转换到硬件间的互联能力。传统的数据中心架构中包含CPU、内存、存储和网络等组件,但CPU目前已经公认不再是运行基础设施功能的最佳位置了。对于下一代数据中心而言,面向网络加速的DSA将扮演重要的角色,根据不同应用场景的需求,加速数据传输。同时,以太网速度从25G增加到100G、200G、400G,再到800G,甚至还有持续增长的趋势,超大规模数据中心的硬件架构在逐渐转变。

据估计,对于超大规模数据中心来说,大约有一半的CPU被用在了非创收型任务上。网络DSA可以承担大部分繁重的工作,将CPU解放出来,专注于创收的应用处理上。同时,由于功能和作用不同,北向网络和高带宽域在设计时侧重点不同。北向网络侧重于网络控制与管理,主要是网络控制器与上层应用之间的接口通信。高带宽域网络侧重于数据传输性能,旨在提供高速度、低延迟的网络连接。基于RoCE的RDMA技术,兼容现有的以太网基础设施,拥抱开放生态,是业界解决高带宽域网络与北向网络数据传输的重要解决方案。

02 Chiplet设计方法与DSA的完美结合

结合Chiplet设计方法学与DSA的设计,可以构建出高效、灵活且高度定制化的计算平台。Chiplet设计方法学通过将处理器设计拆分为多个独立的Chiplet,每个Chiplet可以针对特定功能进行优化。这样可以在设计、制造和测试中提高灵活性。同时,不同的Chiplet分工明确,可以专门处理不同的任务,例如CPU核心、内存控制器、I/O接口等。而DSA针对特定计算任务进行优化,例如生成式人工智能、图形处理、网络处理等,相比于通用处理器,DSA在其特定领域内具有更高的性能和能效比。

通过Chiplet方法学,可以将多个DSA集成到一个系统中,创建一个高度定制化的平台。比如,一个系统可以包含CPU、GPU、TPU、DPU等Chiplet,根据应用需求灵活组合。在这一背景下,组件之间的高速可连接对于确保顺利快速的数据传输至关重要。互联标准、带宽、延迟和低延迟是关键指标。

03奇异摩尔NDSA网络加速与无损数据传输解决方案

在智算中心领域,奇异摩尔 的NDSA互联系列产品复用以太网基础设施,基于高性能RoCEv2 RDMA引擎,面向智算网络通信加速及无损数据传输的专用DSA加速解决方案。

AI原生智能网卡

奇异摩尔的Kiwi NDSA-SNIC AI原生智能网卡针对网络数据传输,基于RoCE V2 RDMA技术,自适应网络调度算法,搭载可编程加速核心SDPU,高达800G传输带宽,实现Tb级万卡集群无损数据传输。

高性能网络加速芯粒

奇异摩尔的高性能网络加速芯粒 – Kiwi NDSA互联芯粒针对高带宽域数据传输,基于RoCEv2 RDMA技术,单芯粒传输带宽高达800G,携带UCIe-D2D芯粒可扩展互联接口,实现集群内TB级的高速通信。

写在最后,无论是在高性能计算领域还是在人工智能领域,我们会预见更多加速数据传输的DSA问世。它们通过提供高吞吐量效率,计算节点之间的超快速互连,或提升人工智能训练的效率,为半导体价值链的参与者及其客户带来更多的革新和挑战。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    462

    文章

    53581

    浏览量

    459489
  • 人工智能
    +关注

    关注

    1813

    文章

    49772

    浏览量

    261710
  • 奇异摩尔
    +关注

    关注

    0

    文章

    73

    浏览量

    3982

原文标题:Kiwi Talks | DSA专用领域芯片正在重塑人工智能与高性能计算

文章出处:【微信号:奇异摩尔,微信公众号:奇异摩尔】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AMD携全栈式AI解决方案亮相进博会,赋能人工智能+

    2025年11月5日,上海: 第八届中国国际进口博览会在上海正式启幕。作为全球高性能与自适应计算领导者,AMD连续五年亮相进博会。今年,以“AMD赋能人工智能+”为主题,AMD全面展示贯穿云、端
    的头像 发表于 11-06 12:53 131次阅读
    AMD携全栈式AI<b class='flag-5'>解决方案</b>亮相进博会,赋能<b class='flag-5'>人工智能</b>+

    MT8391(Genio 720)参数规格书 _AIoT高性能边缘智能解决方案

    随着物联网技术的蓬勃发展和人工智能的广泛应用,智能设备正逐步迈向更高效、更智能的阶段。而联发科MT8391(Genio 720)平台正是为满足这一趋势而打造的高性能边缘
    的头像 发表于 10-20 20:17 337次阅读
    MT8391(Genio 720)参数规格书 _AIoT<b class='flag-5'>高性能</b>边缘<b class='flag-5'>智能解决方案</b>

    傲琪人工合成石墨片: 破解智能手机散热困境的创新解决方案

    的突破 傲琪人工合成石墨片针对这些需求提供了全面解决方案。该材料采用先进的高温石墨化工艺制备,形成了高度取向的晶体结构,实现了卓越的面内导热性能。 与传统金属材料相比,石墨片在相同厚度下提供更优的热传导
    发表于 09-13 14:06

    墨芯人工智能亮相2025外滩大会

    9月10日至13日,墨芯人工智能在2025外滩大会盛大亮相,成为"数据与计算展区"备受瞩目的焦点之一。作为深耕稀疏计算的AI芯片企业,墨芯在此次展会上全方位展示了其人工智能芯片、
    的头像 发表于 09-11 14:04 610次阅读

    RISC-V+DSA:跃昉科技袁博浒解析芯算格局重塑的技术路径

    《RISC-V+DSA重塑芯算格局的必然选择》的主题演讲,深入探讨了RISC-V架构与特定领域加速架构(DSA)结合的技术路径及其在高性能
    的头像 发表于 07-23 10:32 600次阅读
    RISC-V+<b class='flag-5'>DSA</b>:跃昉科技袁博浒解析芯算格局<b class='flag-5'>重塑</b>的技术路径

    Axelera AI:边缘计算加速智能创新解决方案

    。AxeleraAI凭借其卓越的AI加速解决方案,致力于协助企业快速部署高性能、低功耗的边缘计算平台,广泛应用于智慧城市、智慧交通及工业检测等领域。接下来说明AxeleraAI产品特色
    的头像 发表于 07-17 11:00 1094次阅读
    Axelera AI:边缘<b class='flag-5'>计算</b><b class='flag-5'>加速</b><b class='flag-5'>智能</b>创新<b class='flag-5'>解决方案</b>

    AI芯片:加速人工智能计算专用硬件引擎

    人工智能(AI)的快速发展离不开高性能计算硬件的支持,而传统CPU由于架构限制,难以高效处理AI任务中的大规模并行计算需求。因此,专为AI优化的芯片应运而生,成为推动深度学习、
    的头像 发表于 07-09 15:59 940次阅读

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模
    发表于 07-04 11:10

    开售RK3576 高性能人工智能主板

    ,HDMI-4K 输出,支 持千兆以太网,WiFi,USB 扩展/重力感应/RS232/RS485/IO 扩展/I2C 扩展/MIPI 摄像头/红外遥控 器等功能,丰富的接口,一个全新八核拥有超强性能人工智能
    发表于 04-23 10:55

    Cognizant将与NVIDIA合作部署神经人工智能平台,加速企业人工智能应用

    -Cognizant将与NVIDIA合作部署神经人工智能平台,加速企业人工智能应用 Cognizant将在关键增长领域提供解决方案,包括企业级AI
    的头像 发表于 03-26 14:42 584次阅读
    Cognizant将与NVIDIA合作部署神经<b class='flag-5'>人工智能</b>平台,<b class='flag-5'>加速</b>企业<b class='flag-5'>人工智能</b>应用

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    ,涵盖了通信、人工智能、工业自动化、视频处理等多个领域: • 通信行业:用于基站、网络边缘计算等场景,处理复杂的物理协议和逻辑控制。 • 人工智能:FPGA的并行处理能力使其在高性能
    发表于 03-03 11:21

    高性能计算,名副其实的“算力皇冠”

    近年来,从金融到汽车、从教育到医疗,人工智能技术,特别是以ChatGPT为代表的生成式人工智能,正在给整个世界带来颠覆性体验。在如今这个“人工智能时代”,人工智能技术的发展离不开服务于
    的头像 发表于 02-08 14:27 1305次阅读
    <b class='flag-5'>高性能</b><b class='flag-5'>计算</b>,名副其实的“算力皇冠”

    RK3399Pro处理器:高性能与AI加速的完美结合

    RK3399Pro是一款高性能处理器,专为需要强大计算能力和人工智能加速的应用场景而设计。其主要特性如下: 高性能CPU核心:搭载双核Cor
    的头像 发表于 02-07 18:11 1414次阅读

    GIGABYTE CES 2025全方位展示人工智能计算解决方案

    GIGABYTE Technology,作为全球服务器和数据中心解决方案的领先创新企业,再次展现了其在人工智能计算发展领域的卓越实力。在即将到来的CES 2025上,GIGABYTE将全方位展示
    的头像 发表于 01-10 14:16 1030次阅读

    鸿蒙原生页面高性能解决方案上线OpenHarmony社区 助力打造高性能原生应用

    随着HarmonyOS NEXT的正式推出,鸿蒙原生应用开发热度高涨,数量激增。但在三方应用鸿蒙化进程中,性能问题频出。为此,HarmonyOS NEXT推出了一整套原生页面高性能解决方案,包括
    发表于 01-02 18:00