0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌新一代 TPU 芯片 Ironwood:助力大规模思考与推理的 AI 模型新引擎​

Carol Li 来源:电子发烧友 作者:李弯弯 2025-04-12 00:57 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文 / 李弯弯)日前,谷歌在 Cloud Next 大会上,隆重推出了最新一代 TPU AI 加速芯片 ——Ironwood。据悉,该芯片预计于今年晚些时候面向 Google Cloud 客户开放,将提供 256 芯片集群以及 9,216 芯片集群两种配置选项。


在核心亮点层面,Ironwood 堪称谷歌首款专门为 AI 推理精心设计的 TPU 芯片,能够有力支持大规模思考与推理 AI 模型。谷歌方面表示,它代表着 AI 发展从 “响应式” 向 “主动式” 的范式转变,未来 AI 代理将能够主动检索并生成数据,进而提供深度见解,而非仅仅输出原始数据。

在性能与能效表现上,Ironwood 取得了重大突破。其每瓦性能达到上一代 TPU Trillium 的两倍,能效近乎首款云 TPU 的 30 倍。单芯片配备 192GB 高带宽内存(HBM),容量为 Trillium 的 6 倍;HBM 带宽高达 7.2TB/s,是 Trillium 的 4.5 倍。芯片间互连(ICI)带宽提升至 1.2TB/s,为 Trillium 的 1.5 倍,这一提升有力地支持了大规模分布式训练与推理任务。

此外,Ironwood 还是谷歌首款支持 FP8 浮点格式的 TPU 芯片。在此之前,TPU 仅支持 INT8(用于推理)和 BF16(用于训练)。采用 FP8 计算可使 AI 训练吞吐量翻倍,性能相较于 BF16 提升 10 倍。

Ironwood 还配备了增强版 SparseCore 专用加速器,可用于处理高级排名和推荐任务中常见的超大嵌入。凭借这一增强版 SparseCore,其能够加速更多领域的任务,应用范围从传统的 AI 任务拓展至金融和科学等领域。

在系统架构与扩展性方面,Ironwood 可扩展至 9216 个液冷芯片,借助突破性的 ICI 网络进行连接,功率接近 10 兆瓦。它提供 256 芯片和 9216 芯片两种 Pod 配置,其中 9216 芯片的 Pod 配置整体 AI 算力可达 42.5 Exaflops。谷歌先进的液冷解决方案能够确保芯片在持续繁重的 AI 工作负载下依然保持高性能。

谷歌的 TPU 作为专为机器学习设计的定制化加速芯片,自 2015 年首次亮相以来,已成为 AI 硬件领域的重要力量。TPU 主要应用于训练和推理大规模 AI 模型(如 AlphaGo、PaLM、Gemini 等),并深度融入 Google Cloud 以及谷歌内部 AI 服务之中。

截至目前,TPU 已历经多次版本迭代:TPU v1 支持 INT8 精度,主要用于谷歌内部项目(如 AlphaGo、RankBrain);TPU v2/v3 面向训练与推理场景,支持浮点运算,v3 进一步增加了内存和互连带宽;TPU v4 的算力达到 TPU v3 的 2.7 倍,采用液冷技术,支持 4096 芯片互联的 Pod 集群,适用于超大规模模型(如 PaLM)。

由此可见,谷歌 TPU 凭借其专用化设计、高能效比以及与 TensorFlow 的深度集成等优势,成为大规模 AI 模型训练与推理的核心硬件支撑。如今,Ironwood 的推出不仅将进一步巩固谷歌在 AI 硬件领域的领先地位,也势必为生成式 AI 的下一阶段发展提供强大的计算动力。​

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6245

    浏览量

    110272
  • TPU
    TPU
    +关注

    关注

    0

    文章

    164

    浏览量

    21540
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    直击英伟达腹地?谷歌TPU v7开放部署,催生OCS产业链红利

    Processing Unit, TPU)构建了套完整的AI算力基础设施体系。   11月,谷歌宣布第七
    的头像 发表于 11-27 08:53 8435次阅读
    直击英伟达腹地?<b class='flag-5'>谷歌</b><b class='flag-5'>TPU</b> v7开放部署,催生OCS产业链红利

    谷歌云发布最强自研TPU,性能比前代提升4倍

    精心设计,能够轻松处理从大型模型训练到实时聊天机器人运行以及AI智能体操作等各类复杂任务。   谷歌在新闻稿中着重强调,“Ironwood”是专为应对最严苛的工作负载而打造的。无论是
    的头像 发表于 11-13 07:49 8148次阅读
    <b class='flag-5'>谷歌</b>云发布最强自研<b class='flag-5'>TPU</b>,性能比前代提升4倍

    【内测活动同步开启】这么小?这么强?新一代模型MCP开发板来啦!

    【内测活动同步开启】这么小?这么强?新一代模型MCP开发板来啦! 聆思全新一代六合芯片「LS26系列」,搭载WIFI / BLE &a
    发表于 09-25 11:47

    新一代超大模型训练引擎XTuner V1开源

    9月8日,上海人工智能实验室(上海AI实验室)开源书生大模型新一代训练引擎XTuner V1。
    的头像 发表于 09-10 10:55 884次阅读

    大规模专家并行模型在TensorRT-LLM的设计

    DeepSeek-V3 / R1 等模型采用大规模细粒度混合专家模型 (MoE) 架构,大幅提升了开源模型的质量。Llama 4 和 Qwen3 等新发布的开源
    的头像 发表于 09-06 15:21 932次阅读
    <b class='flag-5'>大规模</b>专家并行<b class='flag-5'>模型</b>在TensorRT-LLM的设计

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    DeepSeek-R1:强大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的新一代AI
    发表于 07-16 15:29

    谷歌新一代生成式AI媒体模型登陆Vertex AI平台

    我们在 Vertex AI 上推出新一代生成式 AI 媒体模型: Imagen 4、Veo 3 和 Lyria 2。
    的头像 发表于 06-18 09:56 901次阅读

    广和通发布新一代AI语音智能体FiboVista

    近日,2025火山引擎Force原动力大会正式开幕。广和通发布新一代AI语音智能体FiboVista,并已率先应用于车联网,成为智能驾驶的“用车伙伴”和“出行伴侣”。通过创新AI
    的头像 发表于 06-17 09:22 1003次阅读

    Google推出第七TPU芯片Ironwood

    在 Google Cloud Next 25 大会上,我们隆重推出第 7 Tensor Processing Unit (TPU) — Ironwood。这不仅是我们迄今为止性能最高、扩展性最佳的定制
    的头像 发表于 04-16 11:20 1343次阅读
    Google推出第七<b class='flag-5'>代</b><b class='flag-5'>TPU</b><b class='flag-5'>芯片</b><b class='flag-5'>Ironwood</b>

    谷歌第七TPU Ironwood深度解读:AI推理时代的硬件革命

    谷歌第七TPU Ironwood深度解读:AI推理时代的硬件革命 Google 发布了
    的头像 发表于 04-12 11:10 2935次阅读
    <b class='flag-5'>谷歌</b>第七<b class='flag-5'>代</b><b class='flag-5'>TPU</b> <b class='flag-5'>Ironwood</b>深度解读:<b class='flag-5'>AI</b><b class='flag-5'>推理</b>时代的硬件革命

    适用于数据中心和AI时代的800G网络

    ,成为新一代AI数据中心的核心驱动力。 AI时代的两大数据中心:AI工厂与AIAI时代
    发表于 03-25 17:35

    让大模型训练更高效,奇异摩尔用互联创新方案定义下一代AI计算

      电子发烧友网报道(文/吴子鹏)近段时间以来,DeepSeek现象级爆火引发产业对大规模数据中心建设的思考和争议。在训练端,DeepSeek以开源模型通过算法优化(如稀疏计算、动态
    的头像 发表于 02-18 09:19 1920次阅读
    让大<b class='flag-5'>模型</b>训练更高效,奇异摩尔用互联创新方案定义下<b class='flag-5'>一代</b><b class='flag-5'>AI</b>计算

    OpenAI发布新一代推理模型o3及o3-mini

    近日,OpenAI在为期12天的发布会上宣布了新一代推理模型o3及其精简版o3-mini。这两款模型被专门设计用于在回答问题之前进行更深入的思考,以期提高答案的准确性。 据悉,o3
    的头像 发表于 12-24 09:29 1144次阅读

    OpenAI推出新一代推理模型o3系列

    AI技术日新月异的今天,OpenAI再次引领潮流,于近日正式发布了其新一代推理模型系列——o3。此次发布的o3系列包括两个版本,分别是标准版的o3和精简版的o3-mini。 据OpenAI介绍
    的头像 发表于 12-23 11:00 1123次阅读

    谷歌发布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名为“深度研究”的新特性,旨在为用户提供更加全面和深入的复杂主题探索与报告撰写辅助。 Gemini 2.0通过高
    的头像 发表于 12-12 10:13 971次阅读