0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

2.34纳秒超低时延,满足金融市场高频交易,AMD发布新一代金融加速卡

晶芯观察 来源:电子发烧友网 作者:黄晶晶 2024-11-11 01:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/黄晶晶)面对金融行业处理大量数据、即时交易的需求,AMD提供CPUFPGA的全套解决方案支持快速地交易执行。其中,在资本市场,HFT(高频交易)对低时延格外看重,低时延是降低成本和获得利润的关键所在。

近日,AMD推出Alveo UL3422 加速卡,它是由 AMD Virtex UltraScale+ FPGA 提供支持,其采用新颖的收发器架构,具备硬化且经过优化的网络连接核,专为高速交易定制打造。它可实现超低时延交易执行,达到低于3纳秒的 FPGA 收发器时延和突破性的“tick-to-trade”性能,这是标准现成 FPGA 无法实现的。AMD Alveo UL3422为交易商、做市商和金融机构提供了一款针对机架空间和成本进行优化的纤薄型加速卡,旨在快速部署到各种服务器中。
wKgZomcw8u2AcLi5AAWGtUoOEPk271.png

高频交易的需求点

高频交易是使用算法非常迅速地实现tick-to-trade交易。它使用非常复杂的算法,以及要求非常高的硬件。通常是利用市场上非常小的价差以及市场的低效,在短时高频发生的交易来获得利润。

因此,高频交易主要有三大特点,一是要求低时延,只差几微秒可能就是盈利几百万美元到亏损之间的差别。二是基础设施也非常关键,要进行高频交易经常需要在交易所租用服务器,实现交易所的服务器共置,通过这样的方式来获得优势。有很多的高频交易公司都是在交易所非常接近的地方或者就是在交易所来部署基础设施。在机架上服务器的数量,对于高频交易来说也非常重要。三是算法也能够给高频交易带来优势,自适应计算还能够帮助高频交易的交易商来实现监管合规,这对于他们的效率也非常重要。

Alveo UL3422具有超低时延,且更具性价比

Alveo UL3422是AMD Alveo超低时延加速卡产品组合的一个最新成员,相比于一年前推出的Alveo UL3524,Alveo UL3422的设计更具有性价比,又能够保持Alveo UL3524的诸多优势。

Alveo UL3422具有精简功能集,与Alveo UL3524卡相比,它有优化的连接,以及板载内存。Alveo UL3422 加速卡减少了端口密度、板载内存和连接选项,但依然采用相同的 AMD Virtex UltraScale+ VU2P FPGA 来实现超低时延。
wKgaomcw8viARdcsAAJi-NkcYAY365.png

Alveo UL3422 加速卡具备787K LUT(可编程逻辑),支持PCIe 4.0 x8系统总线,并板载多达16GB内存。两个QSFP-DD模块提供了10G、25G网络端口;两个ARF6端口可以连接多张卡;PPS时钟同步1个输入接口,1个输出接口,可以和外部单元交互,获得精准时间戳。有非常纤薄的尺寸规格,全高、半长( FHHL )尺寸规格封装,适用于1U服务器,优化机架空间能够显著节省共置服务器的费用,也可以灵活适用于2U和4U服务器配置,可以增加每台服务器卡的数量。
wKgZomcw8wKAZQ1fAASZYwGKJIs731.png

AMD主要通过GTF收发器来实现超低延时的目标。AMD自适应和嵌入式计算事业部的高级产品线经理Shyam Chander解析,GTF和GTY两种收发器的网络协议都是一样的,但GTF收发器比之前的GTY收发器性能提升约7倍,时延从16纳秒降低到仅仅2.34纳秒,主要是实现了最大的硬化。而tick-to-trade这个时延能够降低40%到49%,相当于14纳秒(13.9纳秒),尤其是对于金融行业的交易来说,这是一个巨大的优势。
wKgaomcw8wyAGNilAAM6j-RrSeI586.png
wKgaomcw8xWAF9gsAAISSe8RN6o750.png

Shyam Chander进一步表示,GTY的收发器是能够在Virtex UltraScale+ 所有纳米级别的产品上都可以有的,包括16纳米。但是GTF仅仅是在VirtexUltraScale+ VU2P FPGA芯片上,专为超低时延市场开发的一款收发器,无论是Alveo UL3422,还是之前推出的AlveoUL3524都是基于这样的芯片,能够支持超低时延的应用需求。

Alveo UL3422加速卡可以用于支持算法、交易,FPGA和DSP块能够实现加速,能够执行客户的交易策略,它内置的RAM可以实现内存的迅速访问和存储,DDR4可以用于存储订单簿信息和历史定价的数据。

AMD提供不同的加速卡产品组合,应用各种算法交易用例,主要分为三类。第一类是时延低于20纳秒的超低时延FPGA,这类交易对速度要求高,算法要求简洁明了;Alveo UL3422和AlveoUL3524等产品可满足这类需求。第二类是时延低于100纳秒的低时延FPGA,包括FPGA和自适应的SoC,对时间的要求可以放松一些,算法复杂程度有所提高,数据的数量也会更加大,会进行更加深层次的历史模型的分析。Alveo V80可满足需求。
wKgZomcw8x2AdfCGAAIhNFmsSco383.png

第三类是传统的CPU交易,延时低于1000纳秒,在处理过程中数据主要通过CPU的主机来进行处理和计算,数据传输是通过NIC实现的。Alveo X3522能够支持这些低时延的CPU交易,EPYC、锐龙都能够满足相关的工作负载和用例的需求。

生态合作,加快开发设计

Alveo UL3422 加速卡通过利用可用的基础设施生态系统解决方案和参考设计来实现快速部署,从而为交易开发人员提供快速完成设计并投入市场所需的优势。其由不断壮大的生态系统合作伙伴解决方案网络提供支持,这些解决方案提供 IP 和开发框架,以实现交易解决方案的快速实施。例如Exegy 是一家端到端前台交易解决方案提供商,它能够预构建的基础设施IP可以实现超低时延,运行时堆栈和API也简化了开发。Hypertec 是一家面向金融服务行业的硬件、云和增值解决方案提供商,Xelera Technologies 是一家面向高速网络技术和机器学习( ML )应用的软件提供商, 与 AMD 合作助力应对高频交易中机器学习算法的时延缺陷。
wKgZomcw8yeANYZDAAJeXomPCb4566.png

Alveo UL3422 采用 AMD Vivado 设计套件支持传统 FPGA 流程,并附带一套参考设计和性能基准,使 FPGA 设计人员能够快速探索关键指标并根据规范制定定制交易策略。

AMD 为开发人员提供了开源且受到社区支持的FINN开发框架,令低时延 AI 模型能够部署到高性能交易系统中。FINN 项目采用 PyTorch 和神经网络量化技术,旨在缩小 AI 模型尺寸的同时保持准确性。FINN 编译器可生成能与 AMD FPGA 共同使用的量化神经网络( QNN )硬件 IP 块。

小结:

AMD的UL3422正是因为市场上客户既要数据传输快又要尺寸小价格合适,这实际是工作负载和网络节点需求之间的平衡。除了金融科技之外,在科研活动当中,很多数据馈送的处理需要交换机中来完成,如果有一个交换机能够实现超低时延,也是非常重要的要求,AMD同样看到了这样的应用趋势。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5707

    浏览量

    140397
  • 加速卡
    +关注

    关注

    1

    文章

    75

    浏览量

    11361
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    法本信息加入华为全球金融伙伴融海计划

    以“融海有为,智启未来”为主题的华为第二届全球金融伙伴周,于2026年3月31日-4月2日在东莞三丫坡顺利举办。本次活动面向海外金融市场,吸引全球30多个国家和地区的400多位伙伴嘉宾,其中包括60
    的头像 发表于 04-16 14:01 187次阅读

    选择AMD Alveo V80加速卡的五大理由

    V80 是款用途高度多样化的加速卡,业已应用于高性能计算、金融科技、数据分析、传感器处理、网络、存储等众多市场,能利用 AMD Vers
    的头像 发表于 04-10 14:59 294次阅读

    OneAgent智能体全球发布会圆满落幕:引领金融AI交易新时代

    2026年3月25日,聚焦金融AI领域的盛会《OneAgent智能体全球产品发布会》在中国杭州成功落幕。本次发布会吸引了全球金融科技领域的行业专家、投资机构以及技术爱好者的关注,标志着
    的头像 发表于 03-30 15:16 312次阅读

    AMD Alveo MA35D媒体加速卡的AMA SDK 1.4.0版本发布

    我们非常高兴地宣布,面向 AMD Alveo MA35D 媒体加速卡的最新 AMA SDK 1.4.0 版本现已发布。该版本旨在为要求严苛的媒体工作负载提供坚如磐石的稳定性和性能提升。此次更新体现了我们致力于优化平台以适应生产环
    的头像 发表于 03-19 09:36 618次阅读

    FPGA硬件加速卡设计原理图:1-基于Xilinx XCKU115的半高PCIe x8 硬件加速卡 PCIe半高 XCKU115-3-FLVF1924-E芯片

    FPGA硬件加速, PCIe半高, XCKU115, 光纤采集, 信号计算板, 硬件加速卡
    的头像 发表于 02-12 09:52 540次阅读
    FPGA硬件<b class='flag-5'>加速卡</b>设计原理图:1-基于Xilinx XCKU115的半高PCIe x8 硬件<b class='flag-5'>加速卡</b> PCIe半高 XCKU115-3-FLVF1924-E芯片

    UPS不间断电源:金融交易系统的“零中断守护者”

    ​在金融市场的数字脉搏中,每一秒都跳动着数以亿计的交易指令。当银行数据中心的服务器突然断电,当证券交易所的交易系统意外宕机——这些由电力问题
    的头像 发表于 01-28 08:36 969次阅读
    UPS不间断电源:<b class='flag-5'>金融交易</b>系统的“零中断守护者”

    软通动力在东南亚金融市场业务拓展中取得重大突破

    近日,软通动力凭借自主研发的“软通天璇AISE”及配套实施方法论,历经严苛技术验证,在东南亚金融市场业务拓展中取得重大突破。成功斩获东南亚某头部银行信贷审批系统技术栈翻新工程项目,签约金额达数千万
    的头像 发表于 01-27 13:54 673次阅读

    Sutherland与ComplyAdvantage推出AI原生“统金融犯罪合规”解决方案,旨在打击日益复杂的新一代金融犯罪

    全球业务与数字转型领军企业Sutherland今日宣布,与领先的AI驱动风险智能平台ComplyAdvantage达成战略合作伙伴关系。双方联合推出套全面的AI驱动金融犯罪(FinCrime)管理
    的头像 发表于 12-17 15:19 469次阅读

    国芯科技携手中云信安打造新一代金融POS机芯片

    测试中获得成功,这标志着国芯科技携手中云信安在金融POS行业内率先基于抗量子密码算法实现重要技术突破,率先在业内满足了国际PCI安全标准委员会颁布的PCI PTS 7.0标准。
    的头像 发表于 12-15 11:42 756次阅读
    国芯科技携手中云信安打造<b class='flag-5'>新一代金融</b>POS机芯片

    算力密度翻倍!江原D20加速卡发布一卡双芯重构AI推理标杆

    的关键技术瓶颈。   在此背景下,江原科技推出采用自研AI芯片的AI加速卡江原D10,并在今年5月实现量产交付。在大算力AI芯片全流程国产化产业链实现首次突破后,11月11日,江原科技再次发布新一代全国产AI
    的头像 发表于 11-14 08:21 1.1w次阅读
    算力密度翻倍!江原D20<b class='flag-5'>加速卡</b><b class='flag-5'>发布</b>,<b class='flag-5'>一卡</b>双芯重构AI推理标杆

    华为助力埃及EGID推动金融科技创新

    安全保障、创新技术应用等关键职责,并与埃及证券交易所形成深度协作,共同为埃及金融市场的稳定性、透明度和效率提供坚实保障。作为埃及金融科技生态系统的核心支撑单位,EGID在推动金融数字化
    的头像 发表于 10-24 09:39 692次阅读

    曙光存储推出面向金融的可信AI存储

    近日,曙光存储推出面向金融的可信AI存储,助力金融行业高效、安全、稳定地使用关键业务敏感数据。该方案基于全球领先的集中式全闪存储FlashNexus,构建“真存算分离”架构,保障金融可信AI应用,
    的头像 发表于 10-23 09:24 776次阅读

    赛思金融时钟服务器:确保金融市场稳定的关键

    在当今全球化的金融市场中,时间对于交易者和投资者来说至关重要。为了确保金融市场的稳定和公平,各种金融工具和服务的需求不断增加。其中,金融时钟
    的头像 发表于 07-24 16:47 1356次阅读
    赛思<b class='flag-5'>金融</b>时钟服务器:确保<b class='flag-5'>金融市场</b>稳定的关键

    410 基于 XCVU9P+ C6678 的 100G 光纤的加速卡

    基于 XCVU9P+ C6678 的 100G 光纤的加速卡
    的头像 发表于 05-08 08:32 864次阅读
    410 基于 XCVU9P+ C6678 的 100G 光纤的<b class='flag-5'>加速卡</b>

    寒武纪基于思元370芯片的MLU370-X8 智能加速卡产品手册详解

    MLU370-X8智能加速卡是全面升级的数据中心训推体AI加速卡,基于寒武纪全新一代思元370芯片,接口为PCIe 4.0 X16,是全高全长双宽(FHFL-Dual-Slot)的标
    的头像 发表于 04-24 17:57 6076次阅读
    寒武纪基于思元370芯片的MLU370-X8 智能<b class='flag-5'>加速卡</b>产品手册详解