0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Achronix联合BittWare推出了VectorPath S7t-VG6 PCIe加速卡

5RJg_mcuworld 来源:嵌入式资讯精选 2019-11-27 15:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

据Semico Research预测,数据中心加速器市场预计将从2018年的28.4亿美元增长到2023年的211.9亿美元,这其中包括CPUGPUFPGAASIC,而FPGA预计将是年复合增长率最高的细分市场,因为越来越多的企业级工作负载加速应用采用FPGA方式。例如在人工智能应用中,虽然采用GPU训练样本更加有效(相对来说成本也比较高),但是人工智能应用的下半场将进入推理阶段,这一阶段的增长会超过训练阶段,而这一阶段恰好是FPGA非常擅长的,GPU也只能望其项背了。

正是看好这一市场的未来前景,Achronix联合BittWare(Molex子公司)推出了VectorPath S7t-VG6 PCIe加速卡。

接口和尺寸都是标准的,拿来即可使用

VectorPathS7t-VG6 PCIe加速卡立足于FPGA芯片

据Achronix公司市场营销副总裁Steve Mensor介绍,作为唯一能够提供高端独立FPGA芯片和嵌入式FPGA(eFPGA)硅知识产权(IP)技术的FPGA供应商,非常看好其在加速器方面的应用,因为在这一应用中,FPGA与传统CPU相比性能高出了10~100倍(因具体应用而异)。

这些应用都需要硬件加速器

FPGA方式加速在不同应用领域有所差异

VectorPath S7t-VG6 PCIe加速卡上核心的FPGA芯片采用了Achronix公司的Speedster7t,其基于高度优化的全新架构,性能如同ASIC,但是同时拥有FPGA的灵活性和增强功能,远远优于传统FPGA解决方案。Speedster7t采用全新的二维片上网络(2D NoC),这种结构如同在FPGA可编程逻辑结构上运行的高速公路网络一样,支持接口和可编程逻辑结构中的自定义加速功能之间的高带宽通信,这样每个MLP都是一个高度可配置的计算密集型单元模块,具有多达32个乘法器/累加器(MAC),可以支持4位到24位的整数格式和各种浮点模式。Steve Mensor表示,正是有了2D NoC,使FPGA就成为了像软件一样友好的硬件,FPGA IP生态公司在完成设计之后,可以便捷地将其IP连接到AXI接口,而所有的高速接口和存储器交给Speedster7t就可以了。

2D NoC结构

更加关键的是Speedster7t器件具有满足未来人工智能和机器学习要求的超高带宽接口,包括400G以太网端口、用于数据传输的PCI Express Gen5端口以及支持低成本、高带宽存储的GDDR6控制器

在谈到公司战略时,Steve Mensor表示,目前很多友商都在采用软件思维发展FPGA芯片,但是开发者需要考虑他们的哪些应用要放在哪里处理,而且还要考虑芯片内部的数据传输,而Achronix则走另一条路线,努力提高算力,在底层依然采用硬件思维,这样熟悉FPGA开发的工程师会很容易上手,2D NoC消除了传统FPGA使用可编程路由和逻辑查找表资源在整个FPGA中移动数据流中出现的拥塞和性能瓶颈。Steve Mensor坚信,这条传统的发展路线会走得更加顺畅。

感觉内部清爽多了吧!

更多关于Speedster7t的细节,请点击“别人聊FPGA,咱们来说说FPGA+!”

选用VectorPathS7t-VG6 PCIe加速卡,享受两家公司的服务

VectorPath S7t-VG6 PCIe加速卡是Achronix和BittWare两家公司深度合作的产品,这款加速卡包括一整套Achronix的ACE开发工具以及BittWare的基板管理控制器和开发工具包,其中包括API、PCIe驱动程序、诊断自测和应用示例设计,为工程师提供开箱即用的体验。VectorPath S7t-VG6 PCIe加速卡可以提供以下硬件功能:400GbEQSFP-DD和100GbE QSFP56接口,8组GDDR6存储器可提供4 Tbps的总带宽,1组带有错误检查和纠正功能的、运行频率为2666 MHz的DDR4存储器,符合PCI认证要求Speedster7tFPGA集成了带宽为20 Tbps的二维片上网络,692K的6输入查找表(LUT),40K Int8MAC提供高于80 TOps的算力,用于连接扩展卡的4通道PCIe Gen4连接器OCuLink。

Speedster7t是唯一可以支持GDDR6的FPGA芯片

BittWare公司副总裁Sam Bichara介绍,像微软、Facebook这类位于tier1的大公司早在3年前已经将FPGA应用到其数据中心的加速应用中,但是那些处于tier2或者更小的公司没有财力和人力将FPGA融合到自己应用中的工作,但是又急需FPGA硬件加速卡,所以BittWare和Achronix深度合作定制了这款加速器来满足这类客户的需求,客户拿来即可用。

根据客户需求的不同,这款加速器可以有不同的合作模式,比如如果客户的需求在100片以上时,BittWare可以根据客户功能要求重新设计和打造加速卡;当客户批量达到上万单品时,BittWare可以支持客户利用自己优选的、获得了授权的合约制造商来制造和测试S7t-VG6加速卡,客户在获得授权之后,甚至可以创建其自有的S7t-VG6加速卡品种。

使用VectorPath S7t-VG6 PCIe开发过程中遇到的任何问题,Achronix和BittWare均可以提供售后支持和服务。BittWare现在已经可以接受订单,2020年第二季度发货。

有了VectorPath S7t-VG6 PCIe加速卡,中小企业数据中心的CPU也不用“硬抗”了,交给VectorPath S7t-VG6 PCIe中的FPGA处理就OK了。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 控制器
    +关注

    关注

    114

    文章

    17877

    浏览量

    195140
  • 以太网
    +关注

    关注

    41

    文章

    6188

    浏览量

    181560
  • 机器学习
    +关注

    关注

    67

    文章

    8565

    浏览量

    137226

原文标题:有了这个基于FPGA的加速卡,中小企业做AI也不是事了!

文章出处:【微信号:mcuworld,微信公众号:嵌入式资讯精选】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    选择AMD Alveo V80加速卡的五大理由

    AMD Alveo V80 加速卡专为需要实时加速的企业数据中心和云服务提供商而设计,它结合了可编程逻辑、片上高带宽内存( HBM )、高速网络核心以及网络直连接口,可实现实时性能。Alveo
    的头像 发表于 04-10 14:59 313次阅读

    FPGA硬件加速卡设计原理图:1-基于Xilinx XCKU115的半高PCIe x8 硬件加速卡 PCIe半高 XCKU115-3-FLVF1924-E芯片

    FPGA硬件加速, PCIe半高, XCKU115, 光纤采集, 信号计算板, 硬件加速卡
    的头像 发表于 02-12 09:52 551次阅读
    FPGA硬件<b class='flag-5'>加速卡</b>设计原理图:1-基于Xilinx XCKU115的半高<b class='flag-5'>PCIe</b> x8 硬件<b class='flag-5'>加速卡</b> <b class='flag-5'>PCIe</b>半高 XCKU115-3-FLVF1924-E芯片

    新品 | LLM-8850 Kit,高性能AI加速卡套件 DinMeter v1.1,1/32DIN标准嵌入式开发板

    LLM-8850KitLLM-8850Kit是一款面向边缘AI与嵌入式计算场景的高性能AI加速卡套件,由LLM-8850CardAI加速卡与LLM-8850PiHat转接板组成。核心加速卡
    的头像 发表于 01-30 16:11 1391次阅读
    新品 | LLM-8850 Kit,高性能AI<b class='flag-5'>加速卡</b>套件 DinMeter v1.1,1/32DIN标准嵌入式开发板

    高速信号处理设计方案:413-基于双XCVU9P+C6678的100G光纤加速卡

    C6678, XCVU9P, ZU19EG开发板,, 高速信号处理, 光纤加速卡, XCVU9P光纤加速卡
    的头像 发表于 01-08 16:06 455次阅读
    高速信号处理设计方案:413-基于双XCVU9P+C6678的100G光纤<b class='flag-5'>加速卡</b>

    昆仑芯R200 AI加速卡技术规格解析

    昆仑芯R200加速卡基于7nm XPU-R架构,在150W功耗下提供256 TOPS INT8算力,侧重高性能推理。配备最高32GB GDDR6内存(512GB/s带宽)及108路视频
    的头像 发表于 12-14 13:12 1907次阅读
    昆仑芯R200 AI<b class='flag-5'>加速卡</b>技术规格解析

    专为边缘而生:深度解析昆仑芯K100 AI加速卡,释放128 TOPS极致能效

    昆仑芯K100边缘AI加速卡以75W超低功耗实现128 TOPS的INT8算力,重新定义边缘推理能效标准。其半高半长设计搭载8GB HBM内存与256GB/s带宽,支持INT8至FP32多精度计算
    的头像 发表于 12-14 11:12 3182次阅读
    专为边缘而生:深度解析昆仑芯K100 AI<b class='flag-5'>加速卡</b>,释放128 TOPS极致能效

    深圳光量子工厂启示:PCI 加速卡为何偏向 25MHz 2016 有源晶振?

    在 PCI 加速卡项目中,工程师使用SJK 2016 系列有源晶振 25MHZ。原因不仅仅是规格匹配,更在于系统复杂度。
    的头像 发表于 12-12 16:43 1351次阅读
    深圳光量子工厂启示:PCI <b class='flag-5'>加速卡</b>为何偏向 25MHz 2016 有源晶振?

    算力密度翻倍!江原D20加速卡发布,一双芯重构AI推理标杆

    的关键技术瓶颈。   在此背景下,江原科技推出采用自研AI芯片的AI加速卡江原D10,并在今年5月实现量产交付。在大算力AI芯片全流程国产化产业链实现首次突破后,11月11日,江原科技再次发布新一代全国产AI加速卡——江原D20
    的头像 发表于 11-14 08:21 1.1w次阅读
    算力密度翻倍!江原D20<b class='flag-5'>加速卡</b>发布,一<b class='flag-5'>卡</b>双芯重构AI推理标杆

    虚拟电厂加速卡不是噱头!万点规模VPP的性能分水岭

    。   此时仅靠边缘MPU/CPU的通用算力,可能无法及时处理数据清洗、异常检测、指令下发校验等任务,而加速卡(如 GPU、FPGA 加速卡)的并行计算能力可快速消化数据洪流,避免“小包风暴”导致的系统顿。   虚拟电厂对AG
    的头像 发表于 10-10 08:59 2827次阅读

    Achronix亮相2025全球AI芯片峰会

    在近日举行的2025全球AI芯片峰会上,Achronix Speedster7t FPGA的大模型推理平台展示获得众多业界人士的积极反响。
    的头像 发表于 09-23 18:01 1483次阅读

    图像信号分析处理设计原理图:536-基于FMC接口的XCZU7EV 通用PCIe 视觉处理 工业控制

    XCZU7EV 通用PCIe , 图像信号分析处理 , 视觉处理 , 工业控制 , 存储
    的头像 发表于 07-08 10:47 1405次阅读
    图像信号分析处理<b class='flag-5'>卡</b>设计原理图:536-基于FMC接口的XCZU<b class='flag-5'>7</b>EV 通用<b class='flag-5'>PCIe</b><b class='flag-5'>卡</b> 视觉处理<b class='flag-5'>卡</b> 工业控制<b class='flag-5'>卡</b>

    如何精准测试PCIe M.2接口

    在AI加速、轻薄笔电、智能边缘、无线通信等新兴应用推动下,PCIe M.2接口正迅速成为高速互联的核心载体。从NVMe SSD、Wi-Fi 7无线模组到AI推理加速卡,小巧的M.2插槽
    的头像 发表于 07-07 16:42 1457次阅读

    智算加速卡是什么东西?它真能在AI战场上干掉GPU和TPU!

    随着AI技术火得一塌糊涂,大家都在谈"大模型"、"AI加速"、"智能计算",可真到了落地环节,算力才是硬通货。你有没有发现,现在越来越多的AI企业不光用GPU,也不怎么迷信TPU了?他们嘴里多了一个新词儿——智算加速卡
    的头像 发表于 06-05 13:39 1893次阅读
    智算<b class='flag-5'>加速卡</b>是什么东西?它真能在AI战场上干掉GPU和TPU!

    410 基于 XCVU9P+ C6678 的 100G 光纤的加速卡

    基于 XCVU9P+ C6678 的 100G 光纤的加速卡
    的头像 发表于 05-08 08:32 874次阅读
    410 基于 XCVU9P+ C6678 的 100G 光纤的<b class='flag-5'>加速卡</b>

    边缘AI运算革新 DeepX DX-M1 AI加速卡结合Rockchip RK3588多路物体检测解决方案

    DeepX 推出了一款革命性的产品 DeepX DX-M1 AI 推理加速卡 采用 PCIe Gen3 M.2 M-Key 接口,具备高达 25 TOPS 的卓越运算性能,以及高准确度、低功耗、低温
    的头像 发表于 05-06 14:15 1249次阅读
    边缘AI运算革新 DeepX DX-M1 AI<b class='flag-5'>加速卡</b>结合Rockchip RK3588多路物体检测解决方案