针对ChatGPT等大型语言模型的推理,我们宣布推出一款新的Hopper GPU配备双GPU NVLINK的PCIE H100

同时还可支持商用PCIE服务器轻松扩展
目前在云上唯一可以实际处理ChatGPT的GPU是HGX A100与适用于GPT-3处理的HGX A100相比,一台搭载四对H100及双GPU NVLINK的标准服务器的速度
H100可将大型语言模型的处理成本,降低一个数量级

Grace Hopper非常适合处理大型数据集,例如适用于推荐系统和大型语言模型的AI数据库。
如今,利用大容量内存,CPU会存储和查询巨型嵌入表,然后将结果传输到GPU进行推理,借助Grace-Hopper, Grace可以查询嵌入表,并将结果直接传输到Hopper速度比PCIE快7倍

GTC 2023主题直播地址:https://t.elecfans.com/live/2302.html
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
cpu
+关注
关注
68文章
11370浏览量
226408 -
服务器
+关注
关注
14文章
10440浏览量
91851 -
gtc
+关注
关注
0文章
75浏览量
4781 -
ChatGPT
+关注
关注
31文章
1608浏览量
10433
发布评论请先 登录
相关推荐
热点推荐
豪言自家芯片比英伟达GPU强10倍,这家AI公司再获融资
电子发烧友网报道(文 / 吴子鹏)在 AI 算力需求呈指数级增长的今天,英伟达凭借其 GPU 和 CUDA 生态构筑的 “护城河” 似乎坚不可摧。然而,一股由前谷歌 TPU 核心工程师组成
图为科技CEO苏世鹏受邀出席NVIDIA GTC 2026大会,与英伟达CEO黄仁勋合影留念!
2026 年英伟达 GTC 全球人工智能与加速计算大会于美国圣·何塞圆满落幕。
GPU不是AI的唯一解:英伟达用Groq LPU证明,推理赛道需要“另一条腿”
电子发烧友网报道(文/莫婷婷)过去十年,人工智能的爆发式增长与GPU需求紧密相连。凭借其卓越的并行计算能力,GPU成为AI算力的绝对代名词。 然而,英伟达给出颠覆性的新解。在最
连接器如何理解GTC 2026大会?
2026 年3月16日,英伟达 GTC 大会再次震撼世界。英伟达创始人兼首席执行官黄仁勋发布 Vera Rubin 架构,正式宣告
宜鼎亮相英伟达GTC 2026:智能医疗、智能车载两大亮点,展现技术整合与AI落地实力
全球边缘AI解决方案领先品牌宜鼎国际(Innodisk)今年受邀出席在美国圣何塞(San Jose)举办的英伟达(NVIDIA)GTC 2026大会。
新思科技与英伟达多项硬核科技成果亮相GTC 2026
新思科技(Synopsys, Inc.,纳斯达克股票代码:SNPS)在英伟达 GTC 2026 大会(NVIDIA GTC 2026)上,展示了其与
NVIDIA新闻:英伟达10亿美元入股诺基亚 英伟达推出全新量子设备
研发并推出相关产品。 英伟达CEO黄仁勋出现在美国华盛顿的GTC DC大会上的演讲中表示;“今天我们宣布与诺基亚建立了合作关系,诺基亚是世界第二大电信制造商,这是一个价值3万亿美元的产
今日看点:苹果认证中国快充品牌遭美调查;英伟达拟向OpenAI投资最高1000亿美元
系统建设并部署至少10吉瓦的人工智能(AI)数据中心,用于训练和运行下一代模型。这一耗电量相当于800万户美国家庭的用电量。 英伟达CEO黄仁勋曾表示,10吉瓦相当于400万至500万块图形处理器(GPU),约等于
发表于 09-23 10:09
•528次阅读
英伟达最新B30A芯片曝光:算力角逐中的新变数
目前允许在中国销售的H20型号。这一消息瞬间点燃了行业内外的关注热情,为本就竞争激烈的AI芯片领域增添了新的变数。 架构升级:站在巨人肩膀上的革新 B30A芯片将基于英伟达去年GTC大会上发布的新一代计算架构——Blackw
传英伟达自研HBM基础裸片
"后的下一代AI GPU "Feynman"。 有分析指出,英伟达此举或是将部分GPU功能集成到基础裸片中,旨在提高HBM和GPU的整体
aicube的n卡gpu索引该如何添加?
请问有人知道aicube怎样才能读取n卡的gpu索引呢,我已经安装了cuda和cudnn,在全局的py里添加了torch,能够调用gpu,当还是只能看到默认的gpu0,显示不了gpu1
发表于 07-25 08:18
英伟达获美批准恢复H20在华销售,同步推出全新兼容GPU
7月15日上午,央广财经记者从英伟达方面确认,英伟达已经获得美国批准,将恢复 H20 在中国的销售,并推
【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理
带来了总双向带宽160GB/s的通讯速率,远高于当时的PCIe接口(实际比现在的PCIe5.0也还要快)。首代的NVlink主要是增强了GPU到GP
发表于 06-18 19:31
英伟达拟再推中国特供GPU,今年6月量产!
电子发烧友网综合报道 近年来,美国政府对华半导体出口管制政策不断收紧,英伟达等半导体企业面临严峻挑战。为保持在中国市场的竞争力,英伟达推出了
发表于 05-27 00:03
•4955次阅读
GTC 2023直播:英伟达推出Hopper GPU,速度比PCIE快7倍
评论