0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一年一颗新AI芯片,Tenstorrent可怕的迭代速度

E4Life 来源:电子发烧友网 作者:周凯扬 2023-04-26 01:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)RISC-V作为不少初创公司都在拼命耕耘的一大市场,无论是高性能处理器还是AI加速器都在逐步冒头。虽说RISC-V是开源开放的,但这些商业公司倒不见得会对其产品路线给到足够的信息曝光。而反观有着传奇架构师Jim Keller坐镇的AI芯片创企Tenstorrent,却给出了相当具有野心的产品路线图。

极速迭代的产品路线图

Tenstorrent一年内打造了五大多发射译码的RISC-V处理器IP,以其规模不同分为双发射、3发射、4发射和6发射的Alastor和8发射的Ascalon。其中Alastor主要用户客户端和边缘侧应用,而Ascalon则用于服务器、笔记本等高性能计算应用。

从规格来看,以上产品看起来堆料十足,但具体落地性能目前仍未无从得知。据了解,原本Tenstorrent原本是打算直接授权来自SiFive的RISC-V处理器IP,但最终还是由于性能原因率团队自研,全力打造出了Ascalon,其单核心性能大抵与苹果过去的Cyclone微架构核心类似。

除了这些IP,Tenstorrent还有同样关键的AI处理器产品线,比如2020年推出的GraySkull和2021年的Wormhole,而后者的性能约为GraySkull的两倍。对于任何AI芯片来说最难的其实不是把单颗芯片的性能做高,而是实现足够的扩展性,这也正是Wormhole的优势所在。

相较GraySkull,Wormhole加入了16个100GbE以太网端口,从而实现总计400Gb/s的发射与接收带宽。这也提供了最为简单高效的扩展性,要想做到Hyperscaler只需往上堆芯片即可。

不过也有一个问题,那就是如果买下这些芯片并打造大规模机架的话,其线材成本可能会占据一半。就拿他们的Galaxy系统为例,这是一个规模为48U的服务器系统,集成了256个Wormhole芯片,也就是256个100GbE用于外部互联,同时还集成了3TB以上的GDDR6 DRAM

接着到了2022年,他们将格芯的12nm工艺换成了台积电的7nm工艺,将GDDR6换成了DDR5,内存通道数从6个增加至8个,以太网也升级至了400GbE,更重要的是他们加入了SiFive的X280矢量处理器核心。最后是今年计划打造的Grendel芯片,该芯片将采用台积电4nm工艺打造,将单芯片RISC-V CPU核心数从24颗扩充至64颗,同时进一步扩充以太网接口,提供更高的扩展性。

Tenstorrent的豪华阵容

对于任何一个AI初创公司,更何况是想要与英伟达竞争的企业来说,人才都是最重要的一环,尤其是在硬件设计上。而这恰恰是Tenstorrent的优势所在,因为他们现在的团队确实拥有了一个“全明星阵容”。

首先就是刚CTO转为CEO没多久的Jim Keller,这位传奇架构师是AMD K8/K8、Zen与苹果A4/A5系列背后的功臣,也是x86-64指令集的合著者之一,还一度帮助特斯拉打造了HW 3.0硬件平台。

你可能会觉得Jim Keller这几年似乎做的都是幕前演讲工作,其团队中是否还有真正扛鼎之人呢?任何一个初创公司都不应该单单宣传和神化他们的主心骨,因此这就不得不提到Ascalon的首席架构师Wei-han Lien。而他正是苹果M1芯片的首席架构师,所以Ascalon的设计也就很好理解了,因为M1同样是8发射的。

除此这些硬件设计大拿之外,Tenstorrent近期还吸收了不少软件开发者,比如此前负责ARM SoC平台在上游Linux内核维护的Olof Johansson等。更有趣的是,刚从英特尔图形部门离职不久的Raja Koduri也成了Tenstorrent董事会成员之一。

小结

在打造了如此具有野心的产品路线图,又拥有来自苹果、AMD和英特尔的各种人才后,Tenstorrent已然成了数据中心市场不可小觑的一家初创公司。但我们也都见识了各种AI创企在该领域的出现与消失,Tenstorrent最终在交付产品和产品实际性能上能否如愿,那才是最终的决定因素,毕竟无论是走哪条技术路线,都避免不了与全球AI硬件装机量最大的英伟达正面竞争。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI芯片
    +关注

    关注

    17

    文章

    2165

    浏览量

    36869
  • Tenstorrent
    +关注

    关注

    0

    文章

    15

    浏览量

    293
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    一颗芯片如何同时搞定PMSM、步进和直流电机?TMC4671这颗伺服芯片里藏了什么?

    一颗芯片如何同时搞定PMSM步进和直流电机TMC4671这颗伺服芯片里藏了什么?在伺服控制领域,电机类型繁多——三相PMSM/BLDC、两相步进、单相直流电机——每种电机通常需要匹配不同的驱动方案
    的头像 发表于 04-24 17:38 98次阅读
    <b class='flag-5'>一颗</b><b class='flag-5'>芯片</b>如何同时搞定PMSM、步进和直流电机?TMC4671这颗伺服<b class='flag-5'>芯片</b>里藏了什么?

    70V电机驱动,一颗芯片就够了?TMC9660:驱动、控制、电源我都包了!

    70V电机驱动,一颗芯片就够了?TMC9660ATB+T驱动控制电源我都包了做电机驱动的工程师大概都有过这样的经历:方案选型时,左边一颗栅极驱动器,右边一颗运放做电流采样,中间
    的头像 发表于 04-23 13:53 99次阅读
    70V电机驱动,<b class='flag-5'>一颗</b><b class='flag-5'>芯片</b>就够了?TMC9660:驱动、控制、电源我都包了!

    浮思特 | 一颗全能型升降压芯片,如何应对复杂电源设计挑战?

    在电源设计的世界里,工程师常常面临个“两难”困境:输入电压可能高于或低于所需的输出电压。传统方案往往需要升压和降压两芯片分别应对,不仅占板面积大,系统成本也居高不下。有没有一颗
    的头像 发表于 04-17 09:44 427次阅读
    浮思特 | <b class='flag-5'>一颗</b>全能型升降压<b class='flag-5'>芯片</b>,如何应对复杂电源设计挑战?

    请问下如何知道一颗图像传感器是DVP还是MIPI输出

    请问下如何知道一颗图像传感器是DVP还是MIPI输出
    发表于 04-04 10:32

    把大模型“刻进”芯片AI芯片推理速度17000 tokens/秒

    电子发烧友网综合报道 近期,加拿大多伦多初创公司Taalas正式发布首款AI推理芯片HC1,将大模型权重直接蚀刻到芯片的金属互连层中,实现推理速度达17000 tokens/秒。  
    的头像 发表于 03-01 06:45 7552次阅读
    把大模型“刻进”<b class='flag-5'>芯片</b>,<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>推理<b class='flag-5'>速度</b>17000 tokens/秒

    如何用一颗低成本Flash语音芯片,同时实现高性能与设计自由?WTN6 F系列给出答案

    在追求极致性价比与开发灵活性的电子产品市场,如何选择一颗合适的语音芯片,常常让工程师陷入两难:是选择低价但功能固定的方案,还是为灵活性支付高昂成本?这行业痛点,正被广州唯创电子推出的WTN6F系列
    的头像 发表于 01-27 12:38 216次阅读
    如何用<b class='flag-5'>一颗</b>低成本Flash语音<b class='flag-5'>芯片</b>,同时实现高性能与设计自由?WTN6 F系列给出答案

    算法一年变,芯片不换:边缘计算正在被时间差撕裂

    算法迭代速度正在显著快于硬件更换周期,边缘GPU正面临场日益严峻的考验。“这款芯片设计之时,Transformer模型才刚刚进入主流视野;等到芯片
    的头像 发表于 01-15 11:14 615次阅读
    算法<b class='flag-5'>一年</b><b class='flag-5'>一</b>变,<b class='flag-5'>芯片</b>十<b class='flag-5'>年</b>不换:边缘计算正在被时间差撕裂

    浮思特 | 一颗芯片搞定多点触控,敦泰 FT7311 电容触控方案解析

    在智能终端、人机交互设备不断升级的今天,触控体验已经成为影响产品竞争力的关键因素之。触控是否灵敏、稳定,是否能在复杂环境下可靠工作,背后往往取决于一颗核心触控芯片的能力。今天想和大家分享
    的头像 发表于 01-13 09:52 478次阅读
    浮思特 | <b class='flag-5'>一颗</b><b class='flag-5'>芯片</b>搞定多点触控,敦泰 FT7311 电容触控方案解析

    如何用一颗芯片搞定语音、显示与传感?解码唯创高集成语音IC方案

    在智能化设备功能日益复杂的今天,传统设计往往面临个困境:每增加项新功能,就需要堆叠一颗新的功能芯片。这不仅挤占了宝贵的PCB空间,更推高了物料成本与开发难度。作为国内领先的语音IC
    的头像 发表于 01-09 09:13 289次阅读
    如何用<b class='flag-5'>一颗</b><b class='flag-5'>芯片</b>搞定语音、显示与传感?解码唯创高集成语音IC方案

    为何一颗TMC5160芯片,就能解决电机驱动中的噪声、振动与精度等问题?

    种不同的思路:将系统级运动控制智慧,高度集成于一颗芯片之内。TMC5160核心参数览属性参数控制电压3.3V~5V电机驱动电压8V~60VDC输出电流支持外部
    的头像 发表于 12-29 15:53 415次阅读
    为何<b class='flag-5'>一颗</b>TMC5160<b class='flag-5'>芯片</b>,就能解决电机驱动中的噪声、振动与精度等问题?

    一颗芯片卖爆了是什么感觉

    转载自《钟林谈芯》 一颗芯片卖爆了是什么感觉?是痛并快乐着。 市场的火热,出乎意料。交付的压力使人焦虑和心痛,不愿辜负客户、市场对三伍微的认可和支持。尽管之前做了“足够”的安全备货,但市场需求的爆火
    的头像 发表于 11-26 15:11 508次阅读
    <b class='flag-5'>一颗</b><b class='flag-5'>芯片</b>卖爆了是什么感觉

    长晶接口电路CJLSF0102系列一颗料同时替代TI与安世

    在国产替代浪潮下,工程师最怕“一颗料买不着、两料调不通”。长晶科技(CJ)推出的CJLSF0102BAN/CJLSF0102VAN,用一颗双通道自动双向总线电平转换芯片,同时把TI的
    的头像 发表于 11-13 17:19 952次阅读
    长晶接口电路CJLSF0102系列<b class='flag-5'>一颗</b>料同时替代TI与安世

    一颗优质的音频功放芯片硬核素质有哪些?优质音频功放芯片的全维度评估框架

    音频功放芯片作为电子设备的"声音引擎",其性能直接决定了终端产品的音质表现与用户体验。在消费电子、智能家居、汽车音响等领域快速发展的今天,一颗优秀的音频功放芯片需要在功率输出、失真控制、能效管理等
    的头像 发表于 09-17 14:17 1947次阅读

    一颗快充芯片给我的6个启发:从规格书里读懂精妙设计

    背后,真正运筹帷幄的英雄是谁?答案,往往藏在一颗不起眼的芯片里。最近,我偶然得到了份来自“无锡速芯微电子”的FS213A快充协议芯片的数据手册(Datasheet)。本以为这只是
    的头像 发表于 09-17 14:06 841次阅读
    <b class='flag-5'>一颗</b>快充<b class='flag-5'>芯片</b>给我的6个启发:从规格书里读懂精妙设计

    3-16串一颗芯片搞定 全解AMG8816全集成BMS主控的参数真相

    3-16串一颗芯片搞定”——全解AMG8816全集成BMS主控的参数真相 在 电动两轮车、园林工具和储能小型Pack 日趋精简化的今天,一颗“能干事”的电池管理芯片(BMS主控)正成为
    的头像 发表于 07-30 16:38 2300次阅读
    3-16串<b class='flag-5'>一颗</b><b class='flag-5'>芯片</b>搞定 全解AMG8816全集成BMS主控的参数真相