0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

2.34纳秒超低时延,满足金融市场高频交易,AMD发布新一代金融加速卡

花茶晶晶 来源:电子发烧友网 作者:黄晶晶 2024-11-11 01:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/黄晶晶)面对金融行业处理大量数据、即时交易的需求,AMD提供CPUFPGA的全套解决方案支持快速地交易执行。其中,在资本市场,HFT(高频交易)对低时延格外看重,低时延是降低成本和获得利润的关键所在。

近日,AMD推出Alveo UL3422 加速卡,它是由 AMD Virtex UltraScale+ FPGA 提供支持,其采用新颖的收发器架构,具备硬化且经过优化的网络连接核,专为高速交易定制打造。它可实现超低时延交易执行,达到低于3纳秒的 FPGA 收发器时延和突破性的“tick-to-trade”性能,这是标准现成 FPGA 无法实现的。AMD Alveo UL3422为交易商、做市商和金融机构提供了一款针对机架空间和成本进行优化的纤薄型加速卡,旨在快速部署到各种服务器中。
wKgZomcw8u2AcLi5AAWGtUoOEPk271.png

高频交易的需求点

高频交易是使用算法非常迅速地实现tick-to-trade交易。它使用非常复杂的算法,以及要求非常高的硬件。通常是利用市场上非常小的价差以及市场的低效,在短时高频发生的交易来获得利润。

因此,高频交易主要有三大特点,一是要求低时延,只差几微秒可能就是盈利几百万美元到亏损之间的差别。二是基础设施也非常关键,要进行高频交易经常需要在交易所租用服务器,实现交易所的服务器共置,通过这样的方式来获得优势。有很多的高频交易公司都是在交易所非常接近的地方或者就是在交易所来部署基础设施。在机架上服务器的数量,对于高频交易来说也非常重要。三是算法也能够给高频交易带来优势,自适应计算还能够帮助高频交易的交易商来实现监管合规,这对于他们的效率也非常重要。

Alveo UL3422具有超低时延,且更具性价比

Alveo UL3422是AMD Alveo超低时延加速卡产品组合的一个最新成员,相比于一年前推出的Alveo UL3524,Alveo UL3422的设计更具有性价比,又能够保持Alveo UL3524的诸多优势。

Alveo UL3422具有精简功能集,与Alveo UL3524卡相比,它有优化的连接,以及板载内存。Alveo UL3422 加速卡减少了端口密度、板载内存和连接选项,但依然采用相同的 AMD Virtex UltraScale+ VU2P FPGA 来实现超低时延。
wKgaomcw8viARdcsAAJi-NkcYAY365.png

Alveo UL3422 加速卡具备787K LUT(可编程逻辑),支持PCIe 4.0 x8系统总线,并板载多达16GB内存。两个QSFP-DD模块提供了10G、25G网络端口;两个ARF6端口可以连接多张卡;PPS时钟同步1个输入接口,1个输出接口,可以和外部单元交互,获得精准时间戳。有非常纤薄的尺寸规格,全高、半长( FHHL )尺寸规格封装,适用于1U服务器,优化机架空间能够显著节省共置服务器的费用,也可以灵活适用于2U和4U服务器配置,可以增加每台服务器卡的数量。
wKgZomcw8wKAZQ1fAASZYwGKJIs731.png

AMD主要通过GTF收发器来实现超低延时的目标。AMD自适应和嵌入式计算事业部的高级产品线经理Shyam Chander解析,GTF和GTY两种收发器的网络协议都是一样的,但GTF收发器比之前的GTY收发器性能提升约7倍,时延从16纳秒降低到仅仅2.34纳秒,主要是实现了最大的硬化。而tick-to-trade这个时延能够降低40%到49%,相当于14纳秒(13.9纳秒),尤其是对于金融行业的交易来说,这是一个巨大的优势。
wKgaomcw8wyAGNilAAM6j-RrSeI586.png
wKgaomcw8xWAF9gsAAISSe8RN6o750.png

Shyam Chander进一步表示,GTY的收发器是能够在Virtex UltraScale+ 所有纳米级别的产品上都可以有的,包括16纳米。但是GTF仅仅是在VirtexUltraScale+ VU2P FPGA芯片上,专为超低时延市场开发的一款收发器,无论是Alveo UL3422,还是之前推出的AlveoUL3524都是基于这样的芯片,能够支持超低时延的应用需求。

Alveo UL3422加速卡可以用于支持算法、交易,FPGA和DSP块能够实现加速,能够执行客户的交易策略,它内置的RAM可以实现内存的迅速访问和存储,DDR4可以用于存储订单簿信息和历史定价的数据。

AMD提供不同的加速卡产品组合,应用各种算法交易用例,主要分为三类。第一类是时延低于20纳秒的超低时延FPGA,这类交易对速度要求高,算法要求简洁明了;Alveo UL3422和AlveoUL3524等产品可满足这类需求。第二类是时延低于100纳秒的低时延FPGA,包括FPGA和自适应的SoC,对时间的要求可以放松一些,算法复杂程度有所提高,数据的数量也会更加大,会进行更加深层次的历史模型的分析。Alveo V80可满足需求。
wKgZomcw8x2AdfCGAAIhNFmsSco383.png

第三类是传统的CPU交易,延时低于1000纳秒,在处理过程中数据主要通过CPU的主机来进行处理和计算,数据传输是通过NIC实现的。Alveo X3522能够支持这些低时延的CPU交易,EPYC、锐龙都能够满足相关的工作负载和用例的需求。

生态合作,加快开发设计

Alveo UL3422 加速卡通过利用可用的基础设施生态系统解决方案和参考设计来实现快速部署,从而为交易开发人员提供快速完成设计并投入市场所需的优势。其由不断壮大的生态系统合作伙伴解决方案网络提供支持,这些解决方案提供 IP 和开发框架,以实现交易解决方案的快速实施。例如Exegy 是一家端到端前台交易解决方案提供商,它能够预构建的基础设施IP可以实现超低时延,运行时堆栈和API也简化了开发。Hypertec 是一家面向金融服务行业的硬件、云和增值解决方案提供商,Xelera Technologies 是一家面向高速网络技术和机器学习( ML )应用的软件提供商, 与 AMD 合作助力应对高频交易中机器学习算法的时延缺陷。
wKgZomcw8yeANYZDAAJeXomPCb4566.png

Alveo UL3422 采用 AMD Vivado 设计套件支持传统 FPGA 流程,并附带一套参考设计和性能基准,使 FPGA 设计人员能够快速探索关键指标并根据规范制定定制交易策略。

AMD 为开发人员提供了开源且受到社区支持的FINN开发框架,令低时延 AI 模型能够部署到高性能交易系统中。FINN 项目采用 PyTorch 和神经网络量化技术,旨在缩小 AI 模型尺寸的同时保持准确性。FINN 编译器可生成能与 AMD FPGA 共同使用的量化神经网络( QNN )硬件 IP 块。

小结:

AMD的UL3422正是因为市场上客户既要数据传输快又要尺寸小价格合适,这实际是工作负载和网络节点需求之间的平衡。除了金融科技之外,在科研活动当中,很多数据馈送的处理需要交换机中来完成,如果有一个交换机能够实现超低时延,也是非常重要的要求,AMD同样看到了这样的应用趋势。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5650

    浏览量

    139057
  • 加速卡
    +关注

    关注

    1

    文章

    68

    浏览量

    11324
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    OBOO鸥柏丨金融触屏终端PLC工控体机保障交易自动化安全数字科技

    ,推出的金融终端工控体机凭借卓越的技术实力,为金融交易安全提供了全方位的数字科技保障。多维度安全防护体系金融终端工控体机采用多层次安全防
    的头像 发表于 11-25 21:03 336次阅读
    OBOO鸥柏丨<b class='flag-5'>金融</b>触屏终端PLC工控<b class='flag-5'>一</b>体机保障<b class='flag-5'>交易</b>自动化安全数字科技

    算力密度翻倍!江原D20加速卡发布一卡双芯重构AI推理标杆

    的关键技术瓶颈。   在此背景下,江原科技推出采用自研AI芯片的AI加速卡江原D10,并在今年5月实现量产交付。在大算力AI芯片全流程国产化产业链实现首次突破后,11月11日,江原科技再次发布新一代全国产AI
    的头像 发表于 11-14 08:21 9556次阅读
    算力密度翻倍!江原D20<b class='flag-5'>加速卡</b><b class='flag-5'>发布</b>,<b class='flag-5'>一卡</b>双芯重构AI推理标杆

    科技云报到:文读懂香港金融科技周:DART将带领香港金融科技驶向何方?

    “香港史上最大规模金融科技活动”的盛会,其核心突破在于实现了“政策发布-技术展示-商业配对”的生态闭环。 英国智库Z/Yen集团最新报告显示,香港不仅稳居全球金融中心第三、亚太第,更
    的头像 发表于 11-09 17:20 1171次阅读
    科技云报到:<b class='flag-5'>一</b>文读懂香港<b class='flag-5'>金融</b>科技周:DART将带领香港<b class='flag-5'>金融</b>科技驶向何方?

    华为助力埃及EGID推动金融科技创新

    安全保障、创新技术应用等关键职责,并与埃及证券交易所形成深度协作,共同为埃及金融市场的稳定性、透明度和效率提供坚实保障。作为埃及金融科技生态系统的核心支撑单位,EGID在推动金融数字化
    的头像 发表于 10-24 09:39 366次阅读

    曙光存储推出面向金融的可信AI存储

    近日,曙光存储推出面向金融的可信AI存储,助力金融行业高效、安全、稳定地使用关键业务敏感数据。该方案基于全球领先的集中式全闪存储FlashNexus,构建“真存算分离”架构,保障金融可信AI应用,
    的头像 发表于 10-23 09:24 503次阅读

    声智科技发布金融声学AI模型

    在瞬息万变的金融市场中,信息的获取与解读能力决定了投资的成败。然而,传统的文本分析手段,即使是依赖于先进的大型语言模型,也常常受限于精心设计的公司叙事和“言不由衷”的言辞。当企业高管在财报电话会议上谨慎措辞时,真正的风险信号可能被掩盖。
    的头像 发表于 08-30 16:26 1201次阅读
    声智科技<b class='flag-5'>发布</b><b class='flag-5'>金融</b>声学AI模型

    赛思金融时钟服务器:确保金融市场稳定的关键

    在当今全球化的金融市场中,时间对于交易者和投资者来说至关重要。为了确保金融市场的稳定和公平,各种金融工具和服务的需求不断增加。其中,金融时钟
    的头像 发表于 07-24 16:47 1099次阅读
    赛思<b class='flag-5'>金融</b>时钟服务器:确保<b class='flag-5'>金融市场</b>稳定的关键

    时统设备在各行业都扮演什么角色?​

    市场公平的 “护航者”​ 在瞬息万变的金融市场中,交易时间的精确性和致性如同天平的砝码,是确保市场公平有序运行的关键所在。SYN016
    发表于 06-12 16:18

    410 基于 XCVU9P+ C6678 的 100G 光纤的加速卡

    基于 XCVU9P+ C6678 的 100G 光纤的加速卡
    的头像 发表于 05-08 08:32 554次阅读
    410 基于 XCVU9P+ C6678 的 100G 光纤的<b class='flag-5'>加速卡</b>

    寒武纪基于思元370芯片的MLU370-X8 智能加速卡产品手册详解

    MLU370-X8智能加速卡是全面升级的数据中心训推体AI加速卡,基于寒武纪全新一代思元370芯片,接口为PCIe 4.0 X16,是全高全长双宽(FHFL-Dual-Slot)的标
    的头像 发表于 04-24 17:57 4121次阅读
    寒武纪基于思元370芯片的MLU370-X8 智能<b class='flag-5'>加速卡</b>产品手册详解

    Tick数据×股票API:高频交易策略的精准引擎

    金融市场中,每毫秒的延迟都可能意味着数百万的收益差距。当传统投资者还在依赖K线图的“轮廓”时,顶尖交易者早已通过Tick数据和股票API的组合,构建了洞察市场脉搏的“超感知能力”。这种能力不仅关乎
    的头像 发表于 04-15 10:42 1060次阅读

    TRACO POWER推出新一代金属封装AC/DC电源模块

    TXN 系列是 TRACO POWER 推出的新一代金属封装 AC/DC 电源,结构紧凑、坚固耐用,专为成本敏感型的工业应用场景设计。
    的头像 发表于 04-08 16:59 997次阅读

    雷科技发布新一代无人机高度计雷达UAM231

    新一代无人机高度计雷达UAM231重磅发布,无人机雷达产品家族迎新成员。
    的头像 发表于 01-17 09:09 1985次阅读

    HOLTEK发布新一代32位超低功耗MCU

    Holtek(合泰)近期正式推出了其全新一代的32位Arm® Cortex®-M0+超低功耗(ULP,Ultra Low Power)MCU系列——HT32L52231与HT32L52241。这两款
    的头像 发表于 12-24 14:55 1321次阅读

    AMD Alveo媒体加速产品组合SDK 1.2.1发布

    我们很高兴地宣布AMD Alveo 媒体加速产品组合( AMA )SDK 1.2.1 版本发布,从而进步扩展 AMD Alveo MA35
    的头像 发表于 12-18 16:01 1044次阅读