0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

利用人工智能定时方案简化高性能计算加速

Silicon Labs 来源:未知 作者:工程师郭婷 2018-08-07 15:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

云计算人工智能AI)将会是解决一些世界上最大的挑战的关键,如加速科学发现、加快医学研究、能源、医疗保健和其他行业创新步伐。数据科学家现在有能力利用人工智能和高性能计算(HPC)来分析海量数据,比以往更快地了解数据并解决问题。

随着对HPC需求的增加,数据中心正在越来越多地针对高性能计算工作进行优化。这反过来又刺激了对低延迟,高吞吐量数据处理和网络连接性进行优化的专用计算,网络和存储硬件的需求。这种市场趋势同样增加了对高性能定时解决方案的需求,以优化HPC工作负载加速器的运行。

服务器加速

硬件加速器用于加速数据中心应用中的HPC工作负载。虽然图形处理单元(GPU)历来被用于此目的,但现场可编程门阵列(FPGA)正日益成为另一种可行的选择。两种解决方案都能将并行处理、快速I / O和高速存储器接口结合起来,以扩展处理性能,使服务器能够高效地运行神经网络,为搜索引擎、语音识别、自然语言翻译和图像处理提供动力。 GPU和FPGA正在向更高速度的25 Gbps I / O接口转变,以便更轻松地扩展多个IC之间的协同处理。

如图1所示,这些高速I / O接口需要低抖动定时参考,以最大限度地降低误码率并提高整体系统性能。低抖动晶振(XOs)和时钟发生器非常适合GPU / FPGA I / O时钟Silicon Labs的Si510 XO和Si5332时钟发生器等高性能定时器件非常适合此应用,因为它们结合了低抖动参考定时,小尺寸和内置电源噪声抑制功能,最大限度地降低了开关电源对高速I / O性能的电源噪声的影响。

利用人工智能定时方案简化高性能计算加速

FPGA/GPU加速卡的参考定时

网络接口卡

网络接口卡(NIC)用于连接数据中心网络内的服务器和存储资源。随着对带宽需求的增加,数据中心正在从使用传统10GbE / 40GbE光纤网络转向使用更高速度的25GbE / 50GbE / 100GbE网络。这些网卡不仅需要协调大量数据的传输,还可以使用网卡将特定工作负载和应用程序从软件移动到硬件中,帮助数据中心更高效地运行。网卡将数据从PCIe传输到以太网,并为网络提供高速接口。诸如Silicon Labs的Si53204 PCIe缓冲器等定时器件可用于PCIe时钟分配,Si510 XO可用于为以太网MAC / PHY提供低抖动参考时钟。

利用人工智能定时方案简化高性能计算加速

网络接口卡的参考定时

存储

在存储应用中,业界正在迅速从使用基于低速SATA(6 Gbps)和SAS(12 Gbps)CPU /内存互连解决方案的硬盘驱动器转向使用基于NVMExpress®接口规范的固态存储设备。 NVM Express(NVMe)的一个主要优点是可以缩短延迟时间并提高内存访问速度,使其成为闪存数据传输的理想解决方案。 NVMe的另一个好处是它使用流行的PCI Express(PCIe)串行接口将SSD与服务器/ CPU互连,后者已经支持用于高速串行数据传输的嵌入式PCIe接口。

如下图所示,SSD控制器需要一个高性能PCIe时钟发生器来提供参考定时。该时钟必须支持展频时钟生成,以减少EMI并确保符合辐射标准。此外,选择符合最新批准的PCIe Gen 4标准的面向未来的时钟源,并保持与PCIe Gen 1/2/3兼容至关重要。 Si52204缓冲器是展频时钟发生器的一个例子,符合PCIe Gen 1/2/3/4规范,并具有显著的余量。

利用人工智能定时方案简化高性能计算加速

PCIe/NVMe SSD的定时

快速到达市场时间

数据中心硬件通常每两到三年更新一次。 HPC加速器和基于NVMe的SSD的主要优势在于,它们可以快速部署,以帮助数据中心运营商应对市场需求转变以及更快地推出新应用程序和Web服务。另一个好处是可扩展性。附加卡使用PCIe连接器插入标准服务器主板,立即为现有服务器提供扩展功能。附加卡的设计时间可以短至六个月,使数据中心操作员能够快速添加新功能并部署新的Web服务,而无需在数据中心内更换设备。

上市时间也是用于HPC加速器和基于NVMe的SSD的时钟器件的关键考虑因素。硬件设计人员应该考虑可编程定时解决方案,这些解决方案可以单独定制和优化以满足其特定的性能,功耗和空间要求。

高性能计算加速的未来

在过去几年中,定制硬件解决方案的重要性不断增加,以解决HPC和工作负载处理问题。随着新型GPU,FPGA和ASIC产品面市,这种趋势预计会加速,这些产品支持更低的延迟,更高的IO速度,更高容量的存储器接口以及更快的CPU,内存和加速器卡之间的数据传输。

最近,PCI-SIG工作组批准了PCIe Gen 4标准,该标准支持16 Gbps速率的CPU存储器I / O加速器互连。符合第四代标准的解决方案目前正在开发中,预计将于2019年开始大规模部署。此外,PCI-SIG刚刚启动了PCIe Gen 5的工作,这将支持32 Gbps速率的CPU内存I / O加速器互连。

不是静止不动,已经定义了三个竞争标准来为PCIe提供备用解决方案。这些新的总线/互连标准之一是CCIX(用于加速器的高速缓存一致互连)。 CCIX利用PCIe物理层,但将数据速率扩展到25 Gbps。它还指定处理器和加速器之间的高速缓存一致性。另一个竞争标准是OpenCAPI(相干加速器处理器接口)。

该扩展总线标准基于IBM Power9 BlueLink 25 Gbps I / O进行互连,并支持Nvidia的NVLink 2.0协议,以实现处理器之间的连贯存储器共享。第三个标准是Gen-Z,这是一种内存结构,使任何设备都能够与其他设备进行通信,就好像它正在与自己的本地内存进行通信一样,从而使应用程序能够直接访问任何类型的DRAM和NVM。

虽然很难预测哪些标准将在未来的CPU-内存-I / O互连中占上风,但一个趋势是明确的。未来的加速器互连技术将越来越依赖于高性能定时解决方案来优化高速I / O性能。未来的定时解决方案必须具有出色的抖动性能,以最大限度地降低系统级误码率。与标准兼容性和与FPGA / GPU供应商的经过验证的互操作性也将至关重要,从而可简化多种标准和设备之间的互操作性。由于不断增加的空间和功耗限制,未来的定时解决方案也必须高度集成,使单个组件能够提供所有board-level的定时。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1665

    文章

    22587

    浏览量

    641153
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11378

    浏览量

    226511
  • 云计算
    +关注

    关注

    39

    文章

    8061

    浏览量

    145029
  • 人工智能
    +关注

    关注

    1821

    文章

    50547

    浏览量

    267926

原文标题:【技术干货】创新的定时方案简化高性能计算加速

文章出处:【微信号:SiliconLabs,微信公众号:Silicon Labs】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    TDK推出SensorGPT以加速边缘人工智能开发

    TDK株式会社(TSE:6762)宣布在传感器技术方面取得进展,推出用于优化并加速智能物联网解决方案部署的 SensorGPT™。该技术利用生成式
    的头像 发表于 05-16 15:03 1055次阅读
    TDK推出SensorGPT以<b class='flag-5'>加速</b>边缘<b class='flag-5'>人工智能</b>开发

    浅谈人工智能(2)

    。 强人工智能(Strong AI),又称通用人工智能(Artificial General Intelligence)或完全人工智能,指的是可以胜任人类所有工作的人工智能。 超
    的头像 发表于 02-22 08:24 454次阅读
    浅谈<b class='flag-5'>人工智能</b>(2)

    声智科技助力第一届产学结合高校通用人工智能大赛决赛圆满落幕

    当通用人工智能(AGI)浪潮席卷全球,如何缩短前沿算法与产业应用之间的距离?本周一,第一届产学结合高校通用人工智能大赛(AGIUC)决赛圆满落幕。作为赛事官方支持单位,声智科技深度参与赛题设计、算力
    的头像 发表于 02-01 10:27 1069次阅读

    一文了解Mojo编程语言

    Mojo 是一种由 Modular AI 公司开发的编程语言,旨在将 Python 的易用性与 C 语言的高性能相结合,特别适合人工智能(AI)、高性能计算(HPC)和系统级编程场景。
    发表于 11-07 05:59

    MT8391(Genio 720)参数规格书 _AIoT高性能边缘智能解决方案

    随着物联网技术的蓬勃发展和人工智能的广泛应用,智能设备正逐步迈向更高效、更智能的阶段。而联发科MT8391(Genio 720)平台正是为满足这一趋势而打造的高性能边缘
    的头像 发表于 10-20 20:17 1053次阅读
    MT8391(Genio 720)参数规格书 _AIoT<b class='flag-5'>高性能</b>边缘<b class='flag-5'>智能解决方案</b>

    【艾为视角】保证大方向正确!利用人工智能解决一线实际问题

    保证大方向正确,加快迭代,小步快跑。聚焦内部效率提升,利用人工智能改变作业模式、简化管理,结合业务场景解决一线实际问题。——任总在GTS人工智能实践进展汇报会上的讲话1聚焦内部效率提升,利用人
    的头像 发表于 09-26 19:03 878次阅读
    【艾为视角】保证大方向正确!<b class='flag-5'>利用人工智能</b>解决一线实际问题

    【产品介绍】Altair HPCWorks高性能计算管理平台(HPC平台)

    AltairHPCWorksAltair高性能计算平台最大限度地利用复杂的计算资源,并简化计算
    的头像 发表于 09-18 17:56 1067次阅读
    【产品介绍】Altair HPCWorks<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>管理平台(HPC平台)

    墨芯人工智能亮相2025外滩大会

    9月10日至13日,墨芯人工智能在2025外滩大会盛大亮相,成为"数据与计算展区"备受瞩目的焦点之一。作为深耕稀疏计算的AI芯片企业,墨芯在此次展会上全方位展示了其人工智能芯片、
    的头像 发表于 09-11 14:04 1036次阅读

    云天励飞亮相2025深圳通用人工智能大会

    近日,以“模驱具身・智启未来”为主题的2025 AGIC深圳(国际)通用人工智能大会暨深圳(国际)通用人工智能产业博览会(以下简称大会)在深圳国际会展中心(宝安)开幕。
    的头像 发表于 09-01 14:09 1099次阅读

    利用超微型 Neuton ML 模型解锁 SoC 边缘人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们将介绍这对开发人员意味着什么,以及使用 Neuton 模型如何改进您的开发和终端
    发表于 08-31 20:54

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    家人们,最近在研究人工智能相关设备,挖到了一款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!可☎(壹捌伍 柒零零玖 壹壹捌陆) 一、开箱即学,便捷拉满 这个实验箱真的是为使用者
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    家人们,最近在研究人工智能相关设备,挖到了一款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!可☎(壹捌伍 柒零零玖 壹壹捌陆) 一、开箱即学,便捷拉满 这个实验箱真的是为使用者
    发表于 08-07 14:23

    中汽中心出席车用人工智能标准化促进中心成立会议

    近日,我国汽车领域首个以车用人工智能标准化为研究目标的技术组织——车用人工智能标准化促进中心成立会议在天津召开,中汽中心副总经理龚进峰出席会议并致辞。来自整车企业、零部件企业、高校、科研机构等70多家单位的180余位代表参会。
    的头像 发表于 07-21 16:48 1070次阅读

    Axelera AI:边缘计算加速智能创新解决方案

    。AxeleraAI凭借其卓越的AI加速解决方案,致力于协助企业快速部署高性能、低功耗的边缘计算平台,广泛应用于智慧城市、智慧交通及工业检测等领域。接下来说明AxeleraAI产品特色
    的头像 发表于 07-17 11:00 1094次阅读
    Axelera AI:边缘<b class='flag-5'>计算</b><b class='flag-5'>加速</b><b class='flag-5'>智能</b>创新解决<b class='flag-5'>方案</b>

    AI芯片:加速人工智能计算的专用硬件引擎

    人工智能(AI)的快速发展离不开高性能计算硬件的支持,而传统CPU由于架构限制,难以高效处理AI任务中的大规模并行计算需求。因此,专为AI优化的芯片应运而生,成为推动深度学习、
    的头像 发表于 07-09 15:59 2108次阅读