0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

最被看好的 AI 芯片初创公司之一,Tenstorrent加速卡出货

E4Life 来源:电子发烧友网 作者:周凯扬 2024-01-04 00:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)在 CRN 发布的 2023 年十大半导体初创公司的名单上,我们看到了不少AI 芯片厂商的名字,比如Cerebras Systems、SiMa.ai和Tenstorrent。其中Tenstorrent 最惹人关注,这家位于多伦多的初创企业如今由知名半导体业界大神 Jim Keller担任CEO。

Tenstorrent 在 2021 年收获了富达集团领投的 2 亿美元融资后,又在2023 年获得了来自现代汽车集团和三星催化剂基金会领投的 1 亿美元融资。但对于这家厂商的硬件产品,我们却很少得见真容,直到最近其开发套件开放订购和出货。

开发套件出货,新的 AI 硬件开发平台

从 Tenstorrent 的官网来看,目前已经开放订购的是其第一代 PCIe 4.0 AI 推理加速卡,e75 和 e150,两者的定价分别为 599 美元和 799 美元。e75 开发套件可用于基础的推理任务,采用了 1/2 PCIe长度的设计搭配了 Tenstorrent 的第一代 AI 芯片 Grayskull,集成了96 个 Tensix 核心、96MB 的 SRAM、8GB LPDDR4 内存,核心频率达到 1GHz,整个板卡的功耗约为75W。

e150 则是 3/4 长度的 PCIe 加速卡,同样搭载了一个 Grayskull 芯片,但核心数却达到了 120个,同时配备了120MB 的 SRAM,核心频率也提升至 1.2GHz,单卡功耗约为 200W.

e75 虽然只是入门级的推理硬件套件,却已经给到了完整的开发流程,开发者可以使用两种不同的软件实现方式,一套是从上至下的 TT-Buda,另一套是从下至上的TT-Metalium。TT-Buda适用于想要开箱即用,直接将任何模型投入量产的客户。而TT-Metalium则适用于想要充分了解 Tenstorrent软硬件,并借此定制开发模型的客户。

需要注意的是,e75 和 e150仅仅是 AI 加速卡而已,仍需要搭配一套通用计算系统才能精心开展 AI 开发。目前其仅支持 x86_64 架构和 Ubuntu 20.04 以上版本的系统,且需要 64GB 的内存和至少 100GB 的存储。

Tenstorrent 下一代 AI 芯片

除了第一代芯片 Grayskull 以外,Tenstorrent也公开了基于第二代芯片 Wormhole 的 PCIe AI 加速卡 n150 和 n300,n150 搭载了一个 Wormhole 芯片,而 n300 搭载了两个 Wormhole 芯片,因此两者的 Tensix 核心数存在较大差异,分别是 72 个和 128 个,单板功耗分别为 160W和 300W。

从内存配置上看,Wormhole也确实是面向更高性能的 AI 解决方案,将 Grayskull 的 LPDDR4 内存换成了带宽更高的 GDDR6 内存。根据Tenstorrent 提供的说明,GraySkull 和 Wormhole 已经支持了市面上主流的模型,比如 BERT、GPT-2、MobileNetV3、ResNet和YOLOv5等等,而性能更强的 Wormhole还提供了对 Falcon 和 Stable Diffusion 的支持。

不过,与可以单独购买单个开发套件的 e75 和 e150 相比,目前 n150 和 n300 只开放了批量购买,且并没有公布定价。要知道,无论是 Grayskull还是 Wormhole,都只是 Tenstorrent对 AI 芯片的早期设计与尝试,两者均基于 12nm 工艺开发,且实际算力差距并不大,都在 300TFLOPS@INT8左右,只是其他硬件资源配置上有些许不同。而后续即将推出的 Black Hole将基于 6nm 工艺打造,将算力提升至1000TFLOPS@INT8 左右。

在其产品路线图上,预计在今年公开发布的 Grendel才是其针对高端 AI 计算的杀手锏。Grendel采用了全新的 Chiplet 设计,且用到了自研的 RISC-V CPU 核心,结合 3nm 工艺的 AI&CPU Chiplet,以及 7nm 工艺的内存与 I/O Chiplet,将提供一个完整可扩展的 AI 硬件平台。

写在最后

对于任何一个新的 AI 开发平台而言,硬件开发套件和配套软件都是至关重要的,甚至决定了愿意尝试的开发者基数。Tenstorrent 在开放了 e75 和e150的购买后,无疑给不少还在观望其硬件架构的开发一个尝鲜的机会。而开箱即用的体验,想必也会吸引不少厂商对后续的高性能产品产生兴趣。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41988

    浏览量

    303082
  • 加速卡
    +关注

    关注

    1

    文章

    75

    浏览量

    11369
  • AI芯片
    +关注

    关注

    17

    文章

    2182

    浏览量

    36888
  • Tenstorrent
    +关注

    关注

    0

    文章

    15

    浏览量

    295
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AMD正式推出Instinct MI350P PCIe GPU加速卡

    AMD于2026年5月8日正式推出Instinct MI350P PCIe GPU加速卡,作为四年来首款面向企业级市场的PCIe接口Instinct系列产品,其以“精简架构+极致能效”为核心,专为AI推理任务优化,实现从部署到运行的“开箱即用”体验,重新定义企业级
    的头像 发表于 05-08 11:25 660次阅读

    瀚博半导体载天VA16加速卡成功适配DeepSeek-V4大模型

    4月24日,深度求索正式开源全新系列模型DeepSeek-V4。瀚博半导体第时间完成载天VA16加速卡的FP4+FP8 混合精度适配,加速大模型高并发、低成本落地。
    的头像 发表于 05-06 15:54 537次阅读

    选择AMD Alveo V80加速卡的五大理由

    V80 是款用途高度多样化的加速卡,业已应用于高性能计算、金融科技、数据分析、传感器处理、网络、存储等众多市场,能利用 AMD Versal 自适应 SoC 架构提供高效的量产路径。
    的头像 发表于 04-10 14:59 458次阅读

    FPGA硬件加速卡设计原理图:1-基于Xilinx XCKU115的半高PCIe x8 硬件加速卡 PCIe半高 XCKU115-3-FLVF1924-E芯片

    FPGA硬件加速, PCIe半高, XCKU115, 光纤采集, 信号计算板, 硬件加速卡
    的头像 发表于 02-12 09:52 635次阅读
    FPGA硬件<b class='flag-5'>加速卡</b>设计原理图:1-基于Xilinx XCKU115的半高PCIe x8 硬件<b class='flag-5'>加速卡</b> PCIe半高 XCKU115-3-FLVF1924-E<b class='flag-5'>芯片</b>

    推理<2ms!Ultralytics最新YOLO26+树莓派+国产AI加速卡实现 500 FPS 端侧 AI 性能巅峰!

    关键词:YOLO26、树莓派、国产AI加速卡、M5Stack、边缘AI速度快、功耗低、纯国产,树莓派终于有了真正实用的AI加速方案近年来,随
    的头像 发表于 01-30 16:11 7120次阅读
    推理<2ms!Ultralytics最新YOLO26+树莓派+国产<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>实现 500 FPS 端侧 <b class='flag-5'>AI</b> 性能巅峰!

    新品 | LLM-8850 Kit,高性能AI加速卡套件 DinMeter v1.1,1/32DIN标准嵌入式开发板

    LLM-8850KitLLM-8850Kit是款面向边缘AI与嵌入式计算场景的高性能AI加速卡套件,由LLM-8850CardAI加速卡
    的头像 发表于 01-30 16:11 1526次阅读
    新品 | LLM-8850 Kit,高性能<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>套件 DinMeter v1.1,1/32DIN标准嵌入式开发板

    高速信号处理设计方案:413-基于双XCVU9P+C6678的100G光纤加速卡

    C6678, XCVU9P, ZU19EG开发板,, 高速信号处理, 光纤加速卡, XCVU9P光纤加速卡
    的头像 发表于 01-08 16:06 535次阅读
    高速信号处理设计方案:413-基于双XCVU9P+C6678的100G光纤<b class='flag-5'>加速卡</b>

    昆仑芯R200 AI加速卡技术规格解析

    昆仑芯R200加速卡基于7nm XPU-R架构,在150W功耗下提供256 TOPS INT8算力,侧重高性能推理。配备最高32GB GDDR6内存(512GB/s带宽)及108路视频解码能力,支持
    的头像 发表于 12-14 13:12 2150次阅读
    昆仑芯R200 <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>技术规格解析

    迈向云端算力巅峰:昆仑芯K200 AI加速卡全面解读

    昆仑芯K200作为云端AI加速卡,在K100架构基础上全面升级。其INT8算力达256 TOPS,配备16GB HBM内存与512GB/s带宽,专为千亿参数大模型训练与高并发推理优化。采用全高全长双
    的头像 发表于 12-14 11:17 2481次阅读
    迈向云端算力巅峰:昆仑芯K200 <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>全面解读

    专为边缘而生:深度解析昆仑芯K100 AI加速卡,释放128 TOPS极致能效

    昆仑芯K100边缘AI加速卡以75W超低功耗实现128 TOPS的INT8算力,重新定义边缘推理能效标准。其半高半长设计搭载8GB HBM内存与256GB/s带宽,支持INT8至FP32多精度计算
    的头像 发表于 12-14 11:12 3304次阅读
    专为边缘而生:深度解析昆仑芯K100 <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>,释放128 TOPS极致能效

    深圳光量子工厂启示:PCI 加速卡为何偏向 25MHz 2016 有源晶振?

    在 PCI 加速卡项目中,工程师使用SJK 2016 系列有源晶振 25MHZ。原因不仅仅是规格匹配,更在于系统复杂度。
    的头像 发表于 12-12 16:43 1448次阅读
    深圳光量子工厂启示:PCI <b class='flag-5'>加速卡</b>为何偏向 25MHz 2016 有源晶振?

    算力密度翻倍!江原D20加速卡发布,一卡双芯重构AI推理标杆

    的关键技术瓶颈。   在此背景下,江原科技推出采用自研AI芯片AI加速卡江原D10,并在今年5月实现量产交付。在大算力AI
    的头像 发表于 11-14 08:21 1.1w次阅读
    算力密度翻倍!江原D20<b class='flag-5'>加速卡</b>发布,<b class='flag-5'>一卡</b>双芯重构<b class='flag-5'>AI</b>推理标杆

    虚拟电厂加速卡不是噱头!万点规模VPP的性能分水岭

    。   此时仅靠边缘MPU/CPU的通用算力,可能无法及时处理数据清洗、异常检测、指令下发校验等任务,而加速卡(如 GPU、FPGA 加速卡)的并行计算能力可快速消化数据洪流,避免“小包风暴”导致的系统顿。   虚拟电厂对AG
    的头像 发表于 10-10 08:59 2939次阅读

    新品 | LLM-8850 Card, AX8850边缘设备AI加速卡

    LLM‑8850 Card是款面向边缘设备的M.2M-KEY2242 AI加速卡,把42 mm的袖珍体积与AxeraAX8850 SoC的24 TOPS @ INT8算力结合起来,为
    的头像 发表于 09-26 18:18 1546次阅读
    新品 | LLM-8850 Card, AX8850边缘设备<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>

    智算加速卡是什么东西?它真能在AI战场上干掉GPU和TPU!

    随着AI技术火得塌糊涂,大家都在谈"大模型"、"AI加速"、"智能计算",可真到了落地环节,算力才是硬通货。你有没有发现,现在越来越多的AI
    的头像 发表于 06-05 13:39 2034次阅读
    智算<b class='flag-5'>加速卡</b>是什么东西?它真能在<b class='flag-5'>AI</b>战场上干掉GPU和TPU!