0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA特供芯片B30曝光,没有HBM,没有NVLink

Carol Li 来源:电子发烧友 作者:综合报道 2025-06-04 00:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网综合报道 消息称,NVIDIA正在为中国市场研发一款名为“B30”的降规版AI芯片,这款芯片将首度支持多GPU扩展,允许用户通过连接多组芯片来打造更高性能的计算集群。B30芯片预计将采用最新的Blackwell架构,使用GDDR7显存,而非高频宽内存(HBM),也不会采用台积电的先进封装技术。

不少人认为多GPU扩展能力指的是NVLink,但NVIDIA已在其消费级GPU芯片中取消了NVLink支持,因此B30是否支持NVLink目前还不能确定。有消息称B30芯片的多GPU互联功能可能基于NVIDIA的ConnectX-8 SuperNICs技术,这一技术曾在Computex 2025上展示,用于连接RTX Pro 6000 GPU。

NVIDIA ConnectX-8 SuperNIC是业内首款在单个设备中集成支持 PCIe Gen6 的交换机和超高速网络的 SuperNIC。ConnectX-8 专为现代 AI 基础架构设计,可提供更高的吞吐量,同时简化系统设计并提高功耗和成本效益。

NVIDIA ConnectX-8 正在重新定义基于 PCIe 的系统的可能性。通过将 PCIe Gen6 交换机和高性能 SuperNIC 集成到单个集成设备中,ConnectX-8 可简化服务器设计,减少组件数量,并解锁现代 AI 工作负载所需的高带宽通信路径。从而打造更简单、更节能的平台,同时降低总体拥有成本 (TCO) 并实现出色的性能可扩展性。

此外,ConnectX-8 SuperNIC 还可在基于多 GPU 的平台中实现增强的机密计算能力。

B30与H20存在性能差异,主要体现在几个方面:1、显存技术差异,H20芯片采用HBM3显存,带宽高达4.0TB/s,而B30芯片预计使用GDDR7显存,带宽可能降至1.7TB/s左右。HBM3在带宽和能效比上显著优于GDDR7,尤其在处理大规模数据集时,H20的显存性能优势将更明显。

2、互联技术对比:H20支持NVLink技术,卡间互联带宽高达900GB/s,适合构建大规模计算集群。B30芯片的多GPU扩展功能可能依赖ConnectX-8 SuperNICs技术,而非NVLink,其互联带宽和延迟可能不及H20,在需要低延迟通信的场景中表现可能受限。

3、性能定位差异:H20芯片在FP8和FP16精度下的Tensor Core性能分别为296 TFLOPS和148 TFLOPS,适用于高精度计算任务。B30芯片作为降规版,单芯片算力可能低于H20,但通过多GPU扩展可提升整体性能,适合对成本敏感但需要一定扩展性的应用场景。

4、应用场景适配:H20芯片在垂类模型训练和推理任务中表现优异,尤其适合需要高带宽和低延迟的场景。B30芯片则更侧重于通过多GPU扩展满足中小规模计算需求,可能在性价比和灵活性上更具优势,但单芯片性能可能无法与H20媲美。

与华为昇腾910等国产芯片相比,B30系列在显存容量上占优,但价格和能效比可能处于劣势。B30售价预估为6500-8000美元,较H20的1-1.2万美元降低约40%,但仍高于部分国产芯片。

B30在中国市场的发展面临挑战。如技术限制,显存带宽和接口简化导致性能下降,可能无法满足高端客户需求,长期来看,技术限制可能削弱NVIDIA在中国市场的竞争力。市场接受度上,中国客户对性能和成本的平衡较为敏感,B30需通过实际表现证明价值。国产芯片的崛起可能分流部分市场需求,B30需在生态和价格上持续优化。

另外,出口管制政策可能进一步收紧,影响B30的供应链和市场份额。中国对自主可控技术的重视可能推动国产芯片替代,B30需应对政策不确定性。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • HBM
    HBM
    +关注

    关注

    2

    文章

    426

    浏览量

    15697
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Arm Neoverse平台集成NVIDIA NVLink Fusion

    新闻重点 Arm 与 NVIDIA 持续深化合作,在 AI 时代推动协同设计与合作迈向新高度。 生态系统合作伙伴可将高效的 Arm 架构计算能力集成至 NVIDIA NVLink Fusion
    的头像 发表于 11-26 11:08 274次阅读

    使用NVIDIA NVLink Fusion技术提升AI推理性能

    本文详细阐述了 NVIDIA NVLink Fusion 如何借助高效可扩展的 NVIDIA NVLink scale-up 架构技术,满足日益复杂的 AI 模型不断增长的需求。
    的头像 发表于 09-23 14:45 573次阅读
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>NVLink</b> Fusion技术提升AI推理性能

    英伟达最新B30A芯片曝光:算力角逐中的新变数

    在全球AI芯片市场风云变幻之际,英伟达再次成为焦点。据路透社8月19日报道,两位知情人士透露,英伟达正在为中国市场开发一款基于其最新Blackwell架构的新型人工智能芯片——B30A,其性能将超越
    的头像 发表于 08-22 16:41 1158次阅读

    外媒:英伟达正开发新款中国特供芯片B30A 或为旗舰AI芯品B300的阉割版

    我们看到英伟达的旗舰新品 B300备受关注;但是受限于美国实施出口限制措施,英伟达不会出货,就像此前英伟达推出的H20 芯片就是专门为中国市场研发的;现在据说英伟达正开发新款中国特供芯片
    的头像 发表于 08-20 15:19 3091次阅读
    外媒:英伟达正开发新款中国<b class='flag-5'>特供</b><b class='flag-5'>芯片</b><b class='flag-5'>B30</b>A 或为旗舰AI芯品<b class='flag-5'>B</b>300的阉割版

    今日看点丨传英伟达正研发新款中国特供AI芯片;扎克伯格计划改革Meta的人工智能业务

    出售高端人工智能技术存在担忧,尽管新芯片的研发工作正在进行中,但要获得在市场上销售的许可的前景却并不明朗。   这款芯片最初被称为B30A,预计其架构将比H20更为先进,但其计算能力仍将远低于英伟达面向
    发表于 08-20 10:15 2166次阅读

    英伟达预计向中国客户交付 “第三代” 阉割芯片

    基于 GB202 GPU,采用 GDDR7 内存,最大带宽可达 800Gbps,适合小规模集群推理和小模型后训练;B40/B30 芯片则保留了与 H20 相同的 NVLink 互联功能
    的头像 发表于 06-21 00:03 3537次阅读

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    的应用层面的工作,对于芯片底层基本原理兴趣缺缺,本帖结合自己实际生活与工作中对GPU新品的应用实例和书中内容分享下相关见解。 NVlink的初应用 **NVlink(SLI)**是NVIDIA
    发表于 06-18 19:31

    NVIDIA B30芯片的核心解读

    以下是关于NVIDIA B30芯片的核心解读,综合最新行业信息与分析: 一、 产品定位:中国特供的“精准阉割版”​ ​ ​ 设计目标 ​ 专为中国市场定制,旨在规避美国出口管制(如H2
    的头像 发表于 06-05 14:44 2923次阅读

    借助NVIDIA技术加速半导体芯片制造

    NVIDIA Blackwell GPU、NVIDIA Grace CPU、高速 NVIDIA NVLink 网络架构和交换机,以及诸如 NVIDI
    的头像 发表于 05-27 13:59 871次阅读

    NVIDIA推出NVLink Fusion技术

    NVIDIA 发布 NVIDIA NVLink Fusion,这款全新芯片将助力行业用户通过全球领先且广泛采用的计算互连架构 —— NVIDIA
    的头像 发表于 05-22 09:59 704次阅读

    Sky5® NR MB/HB LNA 前端模块(B3、B39、B2/25、B34、B1、B66、B40、B30B41 和 B7) skyworksinc

    电子发烧友网为你提供()Sky5® NR MB/HB LNA 前端模块(B3、B39、B2/25、B34、B1、
    发表于 05-07 18:35
    Sky5® NR MB/HB LNA 前端模块(<b class='flag-5'>B</b>3、<b class='flag-5'>B</b>39、<b class='flag-5'>B</b>2/25、<b class='flag-5'>B</b>34、<b class='flag-5'>B</b>1、<b class='flag-5'>B</b>66、<b class='flag-5'>B</b>40、<b class='flag-5'>B30</b>、<b class='flag-5'>B</b>41 和 <b class='flag-5'>B</b>7) skyworksinc

    NVIDIA NVLink 深度解析

    引言 NVIDIA NVLink 是一种关键的高速互连技术,专为加速计算而设计,尤其是在多 GPU 系统以及 GPU 和支持 CPU 之间 ^1^。NVLink 的出现标志着传统互连瓶颈的突破,凸显
    的头像 发表于 05-06 18:14 3998次阅读

    NVIDIA Research在多个领域不断取得突破

    近二十年来,NVIDIA Research 的研究成果催生了包括 NVIDIA DLSS、NVLink 和 Cosmos 在内的标志性产品。
    的头像 发表于 03-28 09:52 735次阅读

    DLP3010曝光时间超过20000曝光值时,配置返回正确但是dlp没有投光,为什么?

    通过i2c配置dlp曝光在27张条纹序列。当dlp的曝光时间超过20000曝光值时,配置返回正确但是dlp没有投光。 ps:应该不是暗时间配置的问题,配置之前会通过命令读取按时间。
    发表于 02-21 07:05

    芯片静电测试之HBM与CDM详解

    芯片制造与使用的领域中,静电是一个不容小觑的威胁。芯片对于静电极为敏感,而HBM(人体模型)测试和CDM(充放电模型)测试是评估芯片静电敏感度的重要手段。
    的头像 发表于 12-16 18:07 9536次阅读
    <b class='flag-5'>芯片</b>静电测试之<b class='flag-5'>HBM</b>与CDM详解