电子发烧友网报道,近期,美国人工智能硬件及软件研发公司SambaNova宣布推出其第五代RDU可重构数据流单元AI芯片SN50芯片,同时推出基于该芯片的SambaRack SN50风冷机架系统。SN50芯片专为智能体推理工作负载设计,具备超低延迟、高吞吐量和节能等突出特性,性能更是达到上代产品的5倍。在存储结构上,它采用大容量内存 + HBM + SRAM的三层次架构,极大优化了时延表现。
与英伟达的产品相比,SN50表现亮眼。在Llama 3.3 70B模型上,其最大速度是英伟达B200 GPU的5倍,智能体推理吞吐量是后者的三倍以上;对于OpenAI GPT-OSS-120B模型,能效可达B200的8倍。与SambaNova自身2024年推出的SN40L相比,SN50也有显著提升,提供2.5倍的16位浮点性能和5倍的FP8性能,分别达到1.6和3.2 petaFLOPS。
SambaNova标志性的三层内存架构在SN50上基本保持不变,该架构允许在几分之一秒内切换模型,并高效卸载键值缓存。每个RDU配备432MB片上SRAM、64GB HBM2E内存(带宽1.8TB/s)以及256GB到2TB的DDR5内存。尽管HBM2E的选择看似奇特,但SambaNova首席执行官Rodrigo Liang表示,这是为了在内存价格上涨时期确保顺利出货,避免陷入供应链争夺。
虽然SN50在纸面参数上与现代GPU相比不那么突出,仅提供英伟达Blackwell架构约64%的密集FP8计算能力、三分之一的HBM容量和不到四分之一的内存带宽,但SambaNova认为其数据流架构通过重叠计算和通信减少数据移动开销,能使用更少、功耗更低的加速器。
对于SN50,与英伟达的B200相比,它可提供高达5倍的每用户生成速度。而且,SambaNova的SN40L加速器已展现出强大实力,能以每秒378个token的速度提供大语言模型服务,比最接近的基于GPU的推理服务提供商快100多个token每秒。
在扩展性方面,SN50也表现出色。单个推理工作器可扩展到多达256个加速器,是英伟达NVL72机架中加速器数量的3.5倍以上。同时,为每个RDU配备了通过交换结构实现的2.2TB/s双向芯片间带宽,支持更大扩展域。不过,由于只有16个风冷RDU和每机架15 - 30千瓦的功耗,其芯片封装密度不算高。
目前,软银将率先在其位于日本的下一代AI数据中心部署SN50芯片。
SambaNova于2017年由甲骨文前高管Rodrigo Liang与斯坦福大学教授Kunle Olukotun等联合创立,总部位于硅谷帕罗奥图。公司主营全栈生成式AI平台及定制化芯片研发,核心技术包含可重构数据流单元(RDU)、DataScale机架级系统及SambaFlow编译器,通过神经网络图映射硬件技术提升AI模型训练效率。
SambaNova2018年获谷歌风投领投5600万美元首轮融资,2020年完成贝莱德领投的2.5亿美元C轮融资,2021年D轮融资后估值达51亿美元,累计融资超11亿美元。2023年推出台积电代工的SN40L芯片,支持5万亿参数模型运算,应用于阿贡国家实验室的药品研发与气象预测项目。其SambaNova套件已部署于ADI等企业,支持从数据中心到边缘计算的AI应用。
近期,SambaNova又成功融资3.5亿美元,旨在推进数据流架构技术,将其定位为基于GPU的AI系统的替代方案。这轮融资参与者包括英特尔资本等,打破了英特尔计划收购SambaNova的传言。英特尔将与SambaNova建立“多年期”合作关系,新RDU将使用至强处理器,双方还将开展硬件软件协同设计。
尽管英特尔在生成式AI领域因数据中心GPU和Gaudi产品线失误而落后,但此次与SambaNova的合作,或许能为其带来新的发展机遇,而SambaNova也将在资金与技术支持下,在AI芯片领域继续大步前行。
与英伟达的产品相比,SN50表现亮眼。在Llama 3.3 70B模型上,其最大速度是英伟达B200 GPU的5倍,智能体推理吞吐量是后者的三倍以上;对于OpenAI GPT-OSS-120B模型,能效可达B200的8倍。与SambaNova自身2024年推出的SN40L相比,SN50也有显著提升,提供2.5倍的16位浮点性能和5倍的FP8性能,分别达到1.6和3.2 petaFLOPS。
SambaNova标志性的三层内存架构在SN50上基本保持不变,该架构允许在几分之一秒内切换模型,并高效卸载键值缓存。每个RDU配备432MB片上SRAM、64GB HBM2E内存(带宽1.8TB/s)以及256GB到2TB的DDR5内存。尽管HBM2E的选择看似奇特,但SambaNova首席执行官Rodrigo Liang表示,这是为了在内存价格上涨时期确保顺利出货,避免陷入供应链争夺。
虽然SN50在纸面参数上与现代GPU相比不那么突出,仅提供英伟达Blackwell架构约64%的密集FP8计算能力、三分之一的HBM容量和不到四分之一的内存带宽,但SambaNova认为其数据流架构通过重叠计算和通信减少数据移动开销,能使用更少、功耗更低的加速器。
对于SN50,与英伟达的B200相比,它可提供高达5倍的每用户生成速度。而且,SambaNova的SN40L加速器已展现出强大实力,能以每秒378个token的速度提供大语言模型服务,比最接近的基于GPU的推理服务提供商快100多个token每秒。
在扩展性方面,SN50也表现出色。单个推理工作器可扩展到多达256个加速器,是英伟达NVL72机架中加速器数量的3.5倍以上。同时,为每个RDU配备了通过交换结构实现的2.2TB/s双向芯片间带宽,支持更大扩展域。不过,由于只有16个风冷RDU和每机架15 - 30千瓦的功耗,其芯片封装密度不算高。
目前,软银将率先在其位于日本的下一代AI数据中心部署SN50芯片。
SambaNova于2017年由甲骨文前高管Rodrigo Liang与斯坦福大学教授Kunle Olukotun等联合创立,总部位于硅谷帕罗奥图。公司主营全栈生成式AI平台及定制化芯片研发,核心技术包含可重构数据流单元(RDU)、DataScale机架级系统及SambaFlow编译器,通过神经网络图映射硬件技术提升AI模型训练效率。
SambaNova2018年获谷歌风投领投5600万美元首轮融资,2020年完成贝莱德领投的2.5亿美元C轮融资,2021年D轮融资后估值达51亿美元,累计融资超11亿美元。2023年推出台积电代工的SN40L芯片,支持5万亿参数模型运算,应用于阿贡国家实验室的药品研发与气象预测项目。其SambaNova套件已部署于ADI等企业,支持从数据中心到边缘计算的AI应用。
近期,SambaNova又成功融资3.5亿美元,旨在推进数据流架构技术,将其定位为基于GPU的AI系统的替代方案。这轮融资参与者包括英特尔资本等,打破了英特尔计划收购SambaNova的传言。英特尔将与SambaNova建立“多年期”合作关系,新RDU将使用至强处理器,双方还将开展硬件软件协同设计。
尽管英特尔在生成式AI领域因数据中心GPU和Gaudi产品线失误而落后,但此次与SambaNova的合作,或许能为其带来新的发展机遇,而SambaNova也将在资金与技术支持下,在AI芯片领域继续大步前行。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
AI芯片
+关注
关注
17文章
2164浏览量
36865 -
SambaNova
+关注
关注
0文章
8浏览量
397
发布评论请先 登录
相关推荐
热点推荐
搭载第五代骁龙8至尊版移动平台的OPPO Find X9 Ultra发布
今日,OPPO正式发布旗下新一代超大杯影像旗舰——OPPO Find X9 Ultra。新机搭载#第五代骁龙8至尊版移动平台,除了带来旗舰性能和配置升级,还进一步挖掘影像潜力,打造出哈苏全大底
基于第五代骁龙8至尊版的AI影像特性和价值体验
NPU与ISP性能的提升和软件层面的优化,不断拓宽移动摄影的边界,让专业级影像能力走向日常。基于第五代骁龙 8至尊版移动平台的AI影像特性,这些心动瞬间都能够被清晰记录并保留。本期我们将为大家详细介绍第五代骁龙8至尊版的
高通推出第五代骁龙8至尊版移动平台for Galaxy
高通技术公司今日宣布推出迄今为止最先进的骁龙 移动平台——第五代骁龙 8至尊版移动平台for Galaxy,将在全球为三星Galaxy S26 Ultra提供支持,并在部分地区为Galaxy
新品 | 英飞凌第五代CoolGaN™ BDS 650V 氮化镓双向开关
新品英飞凌第五代CoolGaNBDS650V氮化镓双向开关CoolGaNG5系列650V双向开关(BDS)是一款单片集成器件,能够在两个方向上主动阻断电压和电流。它在电力电子领域,特别是在实现单级
iQOO Z11 Turbo搭载第五代骁龙8移动平台
今日,iQOO正式发布了iQOO Z11 Turbo,新机搭载#第五代骁龙8移动平台,在性能、外观、屏幕、影像等方面实现了多维度升级,不仅是好看实用的新生旗舰,更是具备硬核实力的“战斗精灵”。
新品 | 第五代氮化镓CoolGaN™ 650V G5双通道晶体管
新品第五代氮化镓CoolGaN650VG5双通道晶体管第五代氮化镓CoolGaN650VG5双通道晶体管将半桥功率级集成于小型6×8mmQFN-32封装中,该功率级由两个导通电阻典型值140m
瑞萨电子基于R-Car第五代SoC推出端到端多域融合解决方案,加速推动SDV创新
芯片样品、完整评估板及RoX白盒SDK现已上市,将于CES 2026亮相 全球半导体解决方案供应商瑞萨电子(TSE:6723)今日宣布围绕其第五代(Gen 5)R-Car产品家族进一步扩展软件定义
CPU暴涨36%,AI性能飙升46%!高通第五代骁龙8发布,一加首发
11月26日,高通在北京发布骁龙8系全新成员——第五代骁龙8移动平台。第五代骁龙8定位于旗舰芯片,这是高通首次采用骁龙8系双旗舰布局。高通产品市场总监马晓民强调,两款
奇瑞汽车第五代瑞虎8全球上市
11月10日,自研旗舰 全球冠军——第五代瑞虎8全球上市发布会于北京雁栖湖隆重举行。作为中国新燃油战略下的全新力作,新车集“硬核全能”的驾控实力与“电感体验”的智慧舒适于一身,为用户带来全面越级的驾
奇瑞汽车第五代瑞虎8即将上市
11月10日,奇瑞新燃油战略下的重点车型——第五代瑞虎8将正式上市。作为瑞虎8冠军家族的全新产品,第五代瑞虎8集全新设计、电感体验、“赛级民用”的驾控及安全于一身,引领全球燃油车进入下一个时代。
奇瑞汽车第五代瑞虎8开启预售
世界高城,驭鉴冠军。2025年11月3日,第五代瑞虎8在拉萨正式开启预售,预售价10.59万元至13.59万元,同时提供虎款、豹款两种造型供选择。为助力更多用户畅享豪华大五座家庭SUV出行体验,第五代瑞虎8同步带来
新品 | 第五代CoolGaN™ 650-700V氮化镓功率晶体管G5
新品第五代CoolGaN650-700V氮化镓功率晶体管G5第五代650-700VGaN氮化镓功率晶体管可实现高频工况下的效率提升,并满足最高质量标准,能够打造具有超高效率的高可靠性设计。该系
高通骁龙旗舰移动平台新成员第五代骁龙8至尊版即将于2025骁龙峰会发布
• 第五代骁龙8至尊版是我们旗舰移动平台产品家族中的最新成员。 • “至尊版”的命名专属于我们最具行业领先性的产品,也就是在功能、体验和创新方面不断突破边界的平台。 • 产品路线图中未来发布的移动
TOLL和DFN封装CoolGaN™ 650V G5第五代氮化镓功率晶体管
新品TOLL和DFN封装CoolGaN650VG5第五代氮化镓功率晶体管第五代CoolGaN650VG5氮化镓功率晶体管可在高频工况下显著提升能效,符合业界最高质量标准,助力打造兼具超高效率与卓越
德赛西威第五代智能座舱G10PH硬件平台首发点亮
2025上海国际车展盛大举行,全球汽车智能化科技焦点汇聚于此。德赛西威在展会现场展示重大技术突破——第五代智能座舱G10PH硬件平台成功首发点亮,距离该平台在今年1月国际消费电子展(CES)上全球首发仅时隔三个月。
SambaNova发布第五代RDU AI芯片,专为智能体推理工作负载设计
评论