欲把AI计算成本打下来，谷歌高效益TPU正式开放-电子发烧友网

电子发烧友网报道（文/周凯扬）对于每个想要自己开发和部署AI模型的应用开发者来说，硬件和服务器支出都是一笔不小的费用。就以英伟达的GPU为例，即便是消费级的GPU，最近也迎来了一波涨价潮，更不用爆火的A100/H100等型号了。

即便是租赁服务器，基于这些热门硬件的服务器也远算不上便宜，因此不少云服务厂商为了进一步拉拢更多AI应用开发者，纷纷推出了性价比更高的选项。这些选项有的是基于CPU的AI计算服务器，有的是基于第三方AI加速器打造的服务器，还有的则是由云服务厂商基于自研加速器打造且独家提供的服务器。

谷歌高性价比TPU面世

谷歌在今年8月底发布了第五代的自研TPU，TPU v5e。谷歌称该加速器实现了性能与成本效益的平衡。相比上一代TPU v4，TPU V5e提供了同成本下两倍的训练性能，以及针对LLM和生成式AI模型2.5倍的推理性能。

TPU v5e架构

单个TPU v5e Pod由256个芯片互联，总带宽超过400Tb/s，INT8总算力达100petaOps。而且谷歌为TPU v5e采用了更灵活的配置选项，其支持8个不同的虚拟机配置，单个切片支持单芯片到250多个芯片，如此一来客户就可以根据自己的模型大小来选择合适的配置。

而且过去借助谷歌TPU进行的训练负载只局限于单个切片中，谷歌为此开发了Multislice技术，可通过芯片间互联以及数据中心网络中的多个TPU Pod相连，从而将训练工作扩展到数万个芯片上。

为了进一步扩大对开发生态的支持，TPU v5e还内置了对JAX、Pytorch和Tensorflow等领先AI框架，以及 Hugging Face 的 Transformers 和 Accelerate、PyTorch Lightning 和 Ray等一系列常用开源工具的支持。

开放使用与自用

近日，谷歌终于宣布TPU v5e进入公用阶段，且在最新的MLPerf训练3.1测试中，TPUv5e获得了更好的表现。在该测试中，谷歌改进了创新的混合精度训练算法，除了原生支持的BF16外，还用到了INT8精度格式。这意味着客户在提高了模型准确性的同时，将花费更少的成本。

从谷歌云对于TPU v5e的定价表来看，v5e在成本效益上确实有着极大的优势。不过需要注意的是，v5e与v2、v3 Pod类似，每个芯片中只有一个TensorCore，而v4 Pod的每个芯片中有两个TensorCore。这也是为何v5e的单芯片峰值算力为197TFLOPS，而v4的单芯片峰值算力为275TFLOPS，可即便如此，在按芯片小时的定价下，其所需成本依然低于v4。

在如此高的性价比下，谷歌不仅将TPU提供给外部开发者使用，其内部一些开发项目也开始用上TPU v5e。比如其PaLM模型的创建，就用到了上文提到的Multislice技术，谷歌的Bard团队同样在用TPU v5e训练这一生成式AI聊天机器人。

写在最后

其实在TPUv5e开放使用之前，谷歌也正式开放了A3 VM这类GPU加速虚拟机的使用。这也是多数云服务厂商采用的多方案供应策略，其自研加速器只需要为客户提供一个高性价比的方案，而追求更高性能的客户，依然可以选择基于H100 GPU打造的服务器。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
26464

浏览量
264091

risc-v多核芯片在AI方面的应用

应用中的成本。最后，RISC-V多核芯片不仅可以应用于AI边缘计算领域，还可以扩展到其他领域，如数据中心、云计算、自动驾驶、机器人等，为这些领域提供

发表于 04-28 09:20

谷歌AI大模型Gemma全球开放使用

谷歌公司近日宣布，其全新的AI大模型Gemma现已在全球范围内开放使用。这一重要举措不仅彰显了谷歌在AI领域的领先地位，还为其在全球范围内的

发表于 02-28 18:12 •704次阅读

Groq推出大模型推理芯片超越了传统GPU和谷歌TPU

Groq推出了大模型推理芯片，以每秒500tokens的速度引起轰动，超越了传统GPU和谷歌TPU。

发表于 02-26 10:24 •389次阅读

Groq推出大模型推理芯片超越了传统GPU和<b class='flag-5'>谷歌</b><b class='flag-5'>TPU</b>

谷歌宣布Gemma大模型全球开放使用

谷歌公司近日宣布，其先进的AI大模型Gemma即日起在全球范围内开放使用。这一新模型由谷歌DeepMind和其他团队合作开发，并与其最大的AI

发表于 02-23 10:41 •354次阅读

谷歌TPU v5p超越Nvidia H100，成为人工智能领域的竞争对手

TPU v5p已在谷歌“AI超级计算机”项目中发挥重要作用，这并非专业科研型超算平台，而是面向各类人工智能应用。与Nvidia开放GPU购买

发表于 12-26 15:20 •935次阅读

谷歌最强大的定制设计人工智能加速器—TPU v5p芯片

谷歌正迅速成为 BFF Nvidia 的强大对手——为其超级计算机提供动力的 TPU v5p AI 芯片速度更快，内存和带宽比以往任何时候都多，甚至击败了强大的 H100

发表于 12-26 09:31 •1305次阅读

谷歌发布多模态Gemini大模型及新一代TPU系统Cloud TPU v5p

谷歌亦发布新一代TPU 系统——Cloud TPU v5p，以帮助训练尖端的 AI 模型。目

发表于 12-12 10:50 •805次阅读

成都汇阳投资关于谷歌携 Gemini 王者归来，AI 算力和应用值得期待

“Cloud TPU v5p”, 以及来自谷歌云的人工智能超级计算机。本次谷歌推出的多模态大模型Gemini 依然采用Transformer 架构，采用

发表于 12-11 14:40 •630次阅读

AI创企Anthropic将采用谷歌Cloud TPU v5e芯片

随着制造更大ai模型的竞争越来越激烈，像谷歌这样的大型技术企业与该领域最尖端的新生企业建立了关系。据消息人士透露，anthropic已达成协议，将在最近4年里花费30多亿美元购买谷歌的云计算

发表于 11-09 11:55 •389次阅读

LT8630:100V,0.6A 同步微电逐步降低高效益转换监管数据表 LT8630:100V,0.6A 同步微电逐步降低高效益转换监管数据表

电子发烧友网为你提供ADI(ADI)LT8630:100V,0.6A 同步微电逐步降低高效益转换监管数据表相关产品参数、数据手册，更有LT8630:100V,0.6A 同步微电逐步降低高效益转换监管

发表于 10-07 17:47

价格没谈拢？谷歌考虑抛弃AI赢家博通自研TPU

今天，谷歌高层管理层讨论了在2027年放弃博通作为人工智能芯片的供应商。谷歌的这种苦恼是在就tpu芯片价格与博通对峙之后才实现的。

发表于 09-22 09:34 •352次阅读

挑战微软和亚马逊谷歌发布企业级AI工具和芯片争夺云计算市场份额

的软件工具。谷歌在年度云会议上公布的AI芯片、工具和合作伙伴关系，以期在云计算市场挑战亚马逊和微软。谷歌云首席执行官托马斯·库里安(Thomas Kurian)在旧金山举行的

发表于 08-31 00:08 •705次阅读

单张消费级显卡微调多模态大模型

把大模型的训练门槛打下来！我们在单张消费级显卡上实现了多模态大模型（LaVIN-7B, LaVIN-13B）的适配和训练

发表于 06-30 10:43 •1365次阅读

一站式供应商中德模式把成本“打下来”!

作为新能源磁元件一站式供应商，中德电子通过快速反应机制、保持产品一致性、一站式产品等多种方式降低生产 “一站式供应主要根据客户的需求，从材料研发、制粉到产品的制成都由我们完成。好处在于制造成本、服务

发表于 06-05 14:27 •496次阅读

如何使用具有成本效益的esp12f液位传感器？

大家好，请推荐一个成本效益好的水位传感器，用于与 7 英尺左右的高架水箱的 arduino 接口，用谷歌搜索并开始了解超声波 sr04t 传感器，但确实建议便宜的选择以及它必须用于水箱的数量（大约 5) 并且最初的预算很低.

发表于 06-01 09:01