0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

最被看好的 AI 芯片初创公司之一,Tenstorrent加速卡出货

E4Life 来源:电子发烧友网 作者:周凯扬 2024-01-04 00:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)在 CRN 发布的 2023 年十大半导体初创公司的名单上,我们看到了不少AI 芯片厂商的名字,比如Cerebras Systems、SiMa.ai和Tenstorrent。其中Tenstorrent 最惹人关注,这家位于多伦多的初创企业如今由知名半导体业界大神 Jim Keller担任CEO。

Tenstorrent 在 2021 年收获了富达集团领投的 2 亿美元融资后,又在2023 年获得了来自现代汽车集团和三星催化剂基金会领投的 1 亿美元融资。但对于这家厂商的硬件产品,我们却很少得见真容,直到最近其开发套件开放订购和出货。

开发套件出货,新的 AI 硬件开发平台

从 Tenstorrent 的官网来看,目前已经开放订购的是其第一代 PCIe 4.0 AI 推理加速卡,e75 和 e150,两者的定价分别为 599 美元和 799 美元。e75 开发套件可用于基础的推理任务,采用了 1/2 PCIe长度的设计搭配了 Tenstorrent 的第一代 AI 芯片 Grayskull,集成了96 个 Tensix 核心、96MB 的 SRAM、8GB LPDDR4 内存,核心频率达到 1GHz,整个板卡的功耗约为75W。

e150 则是 3/4 长度的 PCIe 加速卡,同样搭载了一个 Grayskull 芯片,但核心数却达到了 120个,同时配备了120MB 的 SRAM,核心频率也提升至 1.2GHz,单卡功耗约为 200W.

e75 虽然只是入门级的推理硬件套件,却已经给到了完整的开发流程,开发者可以使用两种不同的软件实现方式,一套是从上至下的 TT-Buda,另一套是从下至上的TT-Metalium。TT-Buda适用于想要开箱即用,直接将任何模型投入量产的客户。而TT-Metalium则适用于想要充分了解 Tenstorrent软硬件,并借此定制开发模型的客户。

需要注意的是,e75 和 e150仅仅是 AI 加速卡而已,仍需要搭配一套通用计算系统才能精心开展 AI 开发。目前其仅支持 x86_64 架构和 Ubuntu 20.04 以上版本的系统,且需要 64GB 的内存和至少 100GB 的存储。

Tenstorrent 下一代 AI 芯片

除了第一代芯片 Grayskull 以外,Tenstorrent也公开了基于第二代芯片 Wormhole 的 PCIe AI 加速卡 n150 和 n300,n150 搭载了一个 Wormhole 芯片,而 n300 搭载了两个 Wormhole 芯片,因此两者的 Tensix 核心数存在较大差异,分别是 72 个和 128 个,单板功耗分别为 160W和 300W。

从内存配置上看,Wormhole也确实是面向更高性能的 AI 解决方案,将 Grayskull 的 LPDDR4 内存换成了带宽更高的 GDDR6 内存。根据Tenstorrent 提供的说明,GraySkull 和 Wormhole 已经支持了市面上主流的模型,比如 BERT、GPT-2、MobileNetV3、ResNet和YOLOv5等等,而性能更强的 Wormhole还提供了对 Falcon 和 Stable Diffusion 的支持。

不过,与可以单独购买单个开发套件的 e75 和 e150 相比,目前 n150 和 n300 只开放了批量购买,且并没有公布定价。要知道,无论是 Grayskull还是 Wormhole,都只是 Tenstorrent对 AI 芯片的早期设计与尝试,两者均基于 12nm 工艺开发,且实际算力差距并不大,都在 300TFLOPS@INT8左右,只是其他硬件资源配置上有些许不同。而后续即将推出的 Black Hole将基于 6nm 工艺打造,将算力提升至1000TFLOPS@INT8 左右。

在其产品路线图上,预计在今年公开发布的 Grendel才是其针对高端 AI 计算的杀手锏。Grendel采用了全新的 Chiplet 设计,且用到了自研的 RISC-V CPU 核心,结合 3nm 工艺的 AI&CPU Chiplet,以及 7nm 工艺的内存与 I/O Chiplet,将提供一个完整可扩展的 AI 硬件平台。

写在最后

对于任何一个新的 AI 开发平台而言,硬件开发套件和配套软件都是至关重要的,甚至决定了愿意尝试的开发者基数。Tenstorrent 在开放了 e75 和e150的购买后,无疑给不少还在观望其硬件架构的开发一个尝鲜的机会。而开箱即用的体验,想必也会吸引不少厂商对后续的高性能产品产生兴趣。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    90

    文章

    38209

    浏览量

    297065
  • 加速卡
    +关注

    关注

    1

    文章

    68

    浏览量

    11324
  • AI芯片
    +关注

    关注

    17

    文章

    2072

    浏览量

    36584
  • Tenstorrent
    +关注

    关注

    0

    文章

    15

    浏览量

    251
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI推理的存储,看好SRAM?

    电子发烧友网报道(文/黄晶晶)近几年,生成式AI引领行业变革,AI训练率先崛起,带动高带宽内存HBM飞冲天。但我们知道AI推理的广泛应用才能推动A
    的头像 发表于 03-03 08:51 2438次阅读
    <b class='flag-5'>AI</b>推理的存储,<b class='flag-5'>看好</b>SRAM?

    算力密度翻倍!江原D20加速卡发布,一卡双芯重构AI推理标杆

    的关键技术瓶颈。   在此背景下,江原科技推出采用自研AI芯片AI加速卡江原D10,并在今年5月实现量产交付。在大算力AI
    的头像 发表于 11-14 08:21 9559次阅读
    算力密度翻倍!江原D20<b class='flag-5'>加速卡</b>发布,<b class='flag-5'>一卡</b>双芯重构<b class='flag-5'>AI</b>推理标杆

    虚拟电厂加速卡不是噱头!万点规模VPP的性能分水岭

    。   此时仅靠边缘MPU/CPU的通用算力,可能无法及时处理数据清洗、异常检测、指令下发校验等任务,而加速卡(如 GPU、FPGA 加速卡)的并行计算能力可快速消化数据洪流,避免“小包风暴”导致的系统顿。   虚拟电厂对AG
    的头像 发表于 10-10 08:59 2150次阅读

    新品 | LLM-8850 Card, AX8850边缘设备AI加速卡

    LLM‑8850 Card是款面向边缘设备的M.2M-KEY2242 AI加速卡,把42 mm的袖珍体积与AxeraAX8850 SoC的24 TOPS @ INT8算力结合起来,为
    的头像 发表于 09-26 18:18 549次阅读
    新品 | LLM-8850 Card, AX8850边缘设备<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>

    此芯科技发布“合AI加速计划,赋能边缘与端侧AI创新

    此芯科技正式发布“合AI加速计划,旨在为边缘计算和端侧AI场景提供高能效的全栈算力解决方案。该计划由此芯科技联合多家行业合作伙伴共同发起,推出基于此芯P1SoC及此芯P1+
    的头像 发表于 09-15 11:53 2011次阅读
    此芯科技发布“合<b class='flag-5'>一</b>”<b class='flag-5'>AI</b><b class='flag-5'>加速</b>计划,赋能边缘与端侧<b class='flag-5'>AI</b>创新

    25W 功耗稳跑 104TOPS!H2 加速卡:让智能医疗设备的 AI 分析 “快又稳”

    H2 加速卡的出现,不仅解决了众多智能设备厂商“算力不足、空间受限、稳定性差”的三大难题,更通过医疗级可靠性设计与全链路服务支持,成为了设备厂商打造差异化产品的“秘密武器”。
    的头像 发表于 07-21 18:00 857次阅读
    25W 功耗稳跑 104TOPS!H2 <b class='flag-5'>加速卡</b>:让智能医疗设备的 <b class='flag-5'>AI</b> 分析 “快又稳”

    智算加速卡是什么东西?它真能在AI战场上干掉GPU和TPU!

    随着AI技术火得塌糊涂,大家都在谈"大模型"、"AI加速"、"智能计算",可真到了落地环节,算力才是硬通货。你有没有发现,现在越来越多的AI
    的头像 发表于 06-05 13:39 1314次阅读
    智算<b class='flag-5'>加速卡</b>是什么东西?它真能在<b class='flag-5'>AI</b>战场上干掉GPU和TPU!

    410 基于 XCVU9P+ C6678 的 100G 光纤的加速卡

    基于 XCVU9P+ C6678 的 100G 光纤的加速卡
    的头像 发表于 05-08 08:32 555次阅读
    410 基于 XCVU9P+ C6678 的 100G 光纤的<b class='flag-5'>加速卡</b>

    边缘AI运算革新 DeepX DX-M1 AI加速卡结合Rockchip RK3588多路物体检测解决方案

    DeepX 推出了款革命性的产品 DeepX DX-M1 AI 推理加速卡 采用 PCIe Gen3 M.2 M-Key 接口,具备高达 25 TOPS 的卓越运算性能,以及高准确度、低功耗、低温
    的头像 发表于 05-06 14:15 1249次阅读
    边缘<b class='flag-5'>AI</b>运算革新 DeepX DX-M1 <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>结合Rockchip RK3588多路物体检测解决方案

    AI加速卡到底是个啥?文让小白也能看懂AI时代的“超级计算器”!

    你有没有发现,现在人工智能(AI)越来越火了?聊天机器人能陪你谈天说地,自动驾驶汽车能自己避障,手机拍照能自动美颜……这些背后都离不开种神秘的技术——AI加速卡
    的头像 发表于 04-28 14:46 3518次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>到底是个啥?<b class='flag-5'>一</b>文让小白也能看懂<b class='flag-5'>AI</b>时代的“超级计算器”!

    寒武纪基于思元370芯片的MLU370-X8 智能加速卡产品手册详解

    MLU370-X8智能加速卡是全面升级的数据中心训推AI加速卡,基于寒武纪全新代思元370芯片
    的头像 发表于 04-24 17:57 4123次阅读
    寒武纪基于思元370<b class='flag-5'>芯片</b>的MLU370-X8 智能<b class='flag-5'>加速卡</b>产品手册详解

    算力破局:科通技术以&quot;AI大模型+AI芯片&quot;重构智算底座

    “科通技术”)推出的“DeepSeek+AI芯片”全场景方案,在云AI领域取得重大突破。除了GPU的算力总量,云AI大挑战来源于GPU集
    的头像 发表于 03-17 11:14 714次阅读

    边缘AI新突破:MemryX AI加速卡与RK3588打造高效多路物体检测方案

    本方案特别结合了 Orange Pi 5 Plus (Rockchip RK3588) 与 MemryX AI 加速卡,构建出套高性价比的智能解决方案。凭借 MemryX 提供的丰富软件资源
    的头像 发表于 03-06 10:45 951次阅读
    边缘<b class='flag-5'>AI</b>新突破:MemryX <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>与RK3588打造高效多路物体检测方案

    AI+PCB 初创公司

    近年来,人工智能(AI)与印刷电路板(PCB)设计的结合催生了多家初创公司,致力于通过AI技术提升PCB设计的效率和质量。以下是些值得关注
    的头像 发表于 02-08 15:09 3796次阅读

    英伟达收购AI初创公司Run:ai

    全球领先的芯片制造商英伟达近日正式完成了对以色列人工智能初创公司Run:ai的收购。这收购案在经过欧盟反垄断机构的严格审查后,最终获得了批
    的头像 发表于 12-31 10:46 874次阅读