电子发烧友网报道(文/李弯弯)近日,谷歌云在官方博客上正式宣布,公司成功推出第七代TPU(张量处理器)“Ironwood”,该芯片预计在未来几周内正式上市。
“Ironwood”由谷歌自主精心设计,能够轻松处理从大型模型训练到实时聊天机器人运行以及AI智能体操作等各类复杂任务。
谷歌在新闻稿中着重强调,“Ironwood”是专为应对最严苛的工作负载而打造的。无论是大规模模型训练、复杂的强化学习(RL),还是高容量、低延迟的AI推理和模型服务,它都能游刃有余。与TPU v5p相比,“Ironwood”的峰值性能大幅提升,达到10倍之多;和TPU v6e(Trillium)相比,其单芯片在训练和推理工作负载下的性能均提升4倍以上,成为谷歌迄今为止性能最强大、能效最高的定制芯片。
不仅如此,新一代“Ironwood” TPU在集群连接能力上也有着惊人表现。它可在单个集群中连接多达9216颗芯片,有效消除“最复杂模型中的数据瓶颈”,让客户能够毫无压力地运行并扩展当前世界上最大、数据量最密集的模型。
张量处理单元(TPU)是谷歌公司专为加速机器学习和深度学习任务而设计的专用集成电路芯片(ASIC)。其研发项目始于2013年,旨在解决数据中心机器学习工作负载的加速需求。2016年5月,在Google I/O开发者大会上,TPU首次公开亮相,并应用于AlphaGo人工智能围棋系统,这一事件标志着TPU正式进入大众视野。
TPU的名称源于谷歌TensorFlow开源深度学习框架,它采用脉动阵列架构和低精度计算技术,在矩阵运算任务中展现出卓越性能,推理速度比传统GPU和CPU高15至30倍,能效比提升30至80倍。
2024年5月,谷歌发布了第六代TPU(Trillium)。这款芯片采用3D堆叠封装技术和液冷系统,在性能和能效方面都有显著提升。其峰值计算性能较TPUv5e提升4.7倍,能效比比TPUv5e高67%,内存容量增至32GB,芯片互联速度达3200 Gbps,支持256芯片集群部署,单个Pod算力达925.9 teraflops,并于2024年12月通过Google Cloud向客户提供商用服务。
此外,谷歌还宣布启动Project Suncatcher计划,将Trillium TPU部署于卫星群构建太空机器学习计算系统,计划2027年发射原型卫星,并计划2026年部署并提供超过1吉瓦算力。
谷歌在TPU领域的发展不仅体现在技术迭代上,还收获了重要订单。当地时间10月23日,AI初创公司Anthropic宣布与谷歌达成合作,将部署多达100万个谷歌的TPU芯片,用于训练旗下AI大模型Claude。此次扩展计划价值数百亿美元,预计算力容量将于2026年达到1GW(千兆瓦)级别。
对于此次合作,谷歌云首席执行官Thomas Kurian表示,Anthropic选择大幅扩展TPU的使用,是对TPU性价比和效率多年认可的体现。Anthropic的首席财务官Krishna Rao也表示,此次合作不仅加强了谷歌与Anthropic的伙伴关系,也证明了自研芯片TPU的泛用性。
自2018年起,谷歌开始通过谷歌云出售TPU算力,目前公开大客户包括Salesforce、Safe Superintelligence、Midjourney和Anthropic等。
尽管谷歌TPU发展势头迅猛,但在当前AI芯片领域,英伟达的GPU依然占据主导地位。谷歌计算和人工智能基础设施副总裁兼总经理Mark Lohmeyer曾透露,TPU研发初衷是为了缓解算力压力,减少对外部芯片的采购量。研究机构Gartner的分析师Gaurav Gupta也指出,尽管谷歌拥有自研芯片,但由于需要为客户保持灵活性,其仍是英伟达最大的客户之一。和TPU相比,GPU能够处理更广泛的工作负载,可以更好地适应客户算法或模型的变化。
“Ironwood”由谷歌自主精心设计,能够轻松处理从大型模型训练到实时聊天机器人运行以及AI智能体操作等各类复杂任务。
谷歌在新闻稿中着重强调,“Ironwood”是专为应对最严苛的工作负载而打造的。无论是大规模模型训练、复杂的强化学习(RL),还是高容量、低延迟的AI推理和模型服务,它都能游刃有余。与TPU v5p相比,“Ironwood”的峰值性能大幅提升,达到10倍之多;和TPU v6e(Trillium)相比,其单芯片在训练和推理工作负载下的性能均提升4倍以上,成为谷歌迄今为止性能最强大、能效最高的定制芯片。
不仅如此,新一代“Ironwood” TPU在集群连接能力上也有着惊人表现。它可在单个集群中连接多达9216颗芯片,有效消除“最复杂模型中的数据瓶颈”,让客户能够毫无压力地运行并扩展当前世界上最大、数据量最密集的模型。

图:包含9,216颗Ironwood的TPU集群(来源:谷歌云)
张量处理单元(TPU)是谷歌公司专为加速机器学习和深度学习任务而设计的专用集成电路芯片(ASIC)。其研发项目始于2013年,旨在解决数据中心机器学习工作负载的加速需求。2016年5月,在Google I/O开发者大会上,TPU首次公开亮相,并应用于AlphaGo人工智能围棋系统,这一事件标志着TPU正式进入大众视野。
TPU的名称源于谷歌TensorFlow开源深度学习框架,它采用脉动阵列架构和低精度计算技术,在矩阵运算任务中展现出卓越性能,推理速度比传统GPU和CPU高15至30倍,能效比提升30至80倍。
2024年5月,谷歌发布了第六代TPU(Trillium)。这款芯片采用3D堆叠封装技术和液冷系统,在性能和能效方面都有显著提升。其峰值计算性能较TPUv5e提升4.7倍,能效比比TPUv5e高67%,内存容量增至32GB,芯片互联速度达3200 Gbps,支持256芯片集群部署,单个Pod算力达925.9 teraflops,并于2024年12月通过Google Cloud向客户提供商用服务。
此外,谷歌还宣布启动Project Suncatcher计划,将Trillium TPU部署于卫星群构建太空机器学习计算系统,计划2027年发射原型卫星,并计划2026年部署并提供超过1吉瓦算力。
谷歌在TPU领域的发展不仅体现在技术迭代上,还收获了重要订单。当地时间10月23日,AI初创公司Anthropic宣布与谷歌达成合作,将部署多达100万个谷歌的TPU芯片,用于训练旗下AI大模型Claude。此次扩展计划价值数百亿美元,预计算力容量将于2026年达到1GW(千兆瓦)级别。
对于此次合作,谷歌云首席执行官Thomas Kurian表示,Anthropic选择大幅扩展TPU的使用,是对TPU性价比和效率多年认可的体现。Anthropic的首席财务官Krishna Rao也表示,此次合作不仅加强了谷歌与Anthropic的伙伴关系,也证明了自研芯片TPU的泛用性。
自2018年起,谷歌开始通过谷歌云出售TPU算力,目前公开大客户包括Salesforce、Safe Superintelligence、Midjourney和Anthropic等。
尽管谷歌TPU发展势头迅猛,但在当前AI芯片领域,英伟达的GPU依然占据主导地位。谷歌计算和人工智能基础设施副总裁兼总经理Mark Lohmeyer曾透露,TPU研发初衷是为了缓解算力压力,减少对外部芯片的采购量。研究机构Gartner的分析师Gaurav Gupta也指出,尽管谷歌拥有自研芯片,但由于需要为客户保持灵活性,其仍是英伟达最大的客户之一。和TPU相比,GPU能够处理更广泛的工作负载,可以更好地适应客户算法或模型的变化。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
TPU
+关注
关注
0文章
173浏览量
21721
发布评论请先 登录
相关推荐
热点推荐
汽车行业在阿里云使用平头哥自研真武PPU超10万卡
4月11日,在2026智能电动汽车发展高层论坛上,阿里云智能集团公共云事业部副总裁、AI汽车行业总经理李强透露,目前已有30多家车企和智驾方案提供商在阿里云上开展智驾研发,实际使用的平
阿里云发布新一代千问Qwen3.6-Plus,媲美Claude系列最强模型
继今年2月16日,阿里云发布Qwen3.5 Plus之后,4月2日,阿里云发布新一代大语言模型Qwen3.6-Plus,迭代速度明显加快。相
微软发布AI芯片Maia 200,性能超越谷歌TPU和亚马逊Trainium
电子发烧友网综合报道 美东时间1月26日,微软重磅发布第二代自研人工智能芯片Maia 200,这一举措成为微软减少对英伟达芯片依赖、高效驱动自身服务的关键一步,也标志着其在自
提前实测AT4V H00电流传感器,抗谐波干扰性能比同类型产品提升30%!
电子2025升级款AT4VH00霍尔开环电流传感器,专门针对工业场景核心痛点“抗谐波干扰”做了专项实测,结果直接超出预期:其抗谐波干扰性能比同价位主流产品提升30%
亚马逊发布新一代AI芯片Trainium3,性能提升4倍
Trainium 4的开发计划。亚马逊表示,这款芯片能够比英伟达市场领先的图形处理单元(GPU)更便宜、更高效地驱动AI模型背后的密集计算。 作为亚马逊首款3纳米工艺AI芯片,Trainium3的核心突破在于性能、能效与
亚马逊新一代自研服务器芯片Graviton5问世,性能提升25%
电子发烧友网综合报道 近日,亚马逊云科技宣布推出其迄今为止性能最强、能效最高的Amazon Graviton5处理器,为Amazon EC2上的广泛工作负载提供最佳性价比。与上一代相比
季丰电子自研PCB管理系统的简单介绍
季丰电子自研的PCB管理系统,整合报价+投板+Release三大核心模块,覆盖从设计发布、订单对接到生产交付的全业务流程。
看点:台积电计划发行235亿元新台币债券 谷歌云发布最强自研TPU(张量处理器)
%,140亿元新台币;7年期的利率1.53%,30亿元新台币;10年期的利率1.58%,65亿元新台币。 首个深海生境智能多模态大模型发布 11月6日,自然资源部在2025厦门国际海洋周开幕式上发布全球首个面向深海典型生境的多模态大模型“DePTH-GPT”。“DePTH
今日看点:谷歌芯片实现量子计算比经典超算快13000倍;NFC 技术突破:读取距离从 5 毫米提升至 20 毫米
谷歌芯片实现量子计算比经典超算快13000倍 近日,谷歌在《自然》杂志披露与Willow芯片相关的量子计算突破性研究成果。该公司称这是历史上首次证明量子计算机可以在硬件上成功运行一项可
发表于 10-23 10:20
•1779次阅读
亚马逊云科技在中国区域推出Amazon Graviton4实例 以自研芯片驱动企业算力升级
北京2025年9月10日 /美通社/ -- 亚马逊云科技宣布,通过与光环新网和西云数据的紧密合作,在亚马逊云科技(北京)区域和亚马逊云科技(宁夏)区域推出基于新一代
国产真自研高性能图形 GPU 重磅发布:跑分超 RTX4060,畅玩《黑神话・悟空》
系列。 砺算科技创始人、CEO 宣以方表示,砺算 7G100 系列 GPU 从计算核心到指令集完全由自主设计,基于自研 “天图” 架构,并配备自研指令集、
发表于 07-26 21:45
•6244次阅读
高端芯片自研,服务器芯片传来好消息!
电子发烧友网报道(文/黄晶晶)当前,自研处理器已经跨过了能用的阶段,逐渐走向好用,但无论是消费级还是服务器级都面临着如何在性能上接近国外高端产品,以及生态上如何更加完善的问题。国内厂商对于服务器芯片
谷歌云发布最强自研TPU,性能比前代提升4倍
评论