0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

欲把AI计算成本打下来,谷歌高效益TPU正式开放

E4Life 来源:电子发烧友网 作者:周凯扬 2023-11-14 00:18 次阅读

电子发烧友网报道(文/周凯扬)对于每个想要自己开发和部署AI模型的应用开发者来说,硬件和服务器支出都是一笔不小的费用。就以英伟达GPU为例,即便是消费级的GPU,最近也迎来了一波涨价潮,更不用爆火的A100/H100等型号了。

即便是租赁服务器,基于这些热门硬件的服务器也远算不上便宜,因此不少云服务厂商为了进一步拉拢更多AI应用开发者,纷纷推出了性价比更高的选项。这些选项有的是基于CPU的AI计算服务器,有的是基于第三方AI加速器打造的服务器,还有的则是由云服务厂商基于自研加速器打造且独家提供的服务器。

谷歌高性价比TPU面世

谷歌在今年8月底发布了第五代的自研TPU,TPU v5e。谷歌称该加速器实现了性能与成本效益的平衡。相比上一代TPU v4,TPU V5e提供了同成本下两倍的训练性能,以及针对LLM和生成式AI模型2.5倍的推理性能。

wKgaomVR-HqAJvSzAABXKc7C2hk445.png
TPU v5e架构


单个TPU v5e Pod由256个芯片互联,总带宽超过400Tb/s,INT8总算力达100petaOps。而且谷歌为TPU v5e采用了更灵活的配置选项,其支持8个不同的虚拟机配置,单个切片支持单芯片到250多个芯片,如此一来客户就可以根据自己的模型大小来选择合适的配置。

而且过去借助谷歌TPU进行的训练负载只局限于单个切片中,谷歌为此开发了Multislice技术,可通过芯片间互联以及数据中心网络中的多个TPU Pod相连,从而将训练工作扩展到数万个芯片上。

为了进一步扩大对开发生态的支持,TPU v5e还内置了对JAX、Pytorch和Tensorflow等领先AI框架,以及 Hugging Face 的 TransformersAccelerate、PyTorch Lightning 和 Ray等一系列常用开源工具的支持。

开放使用与自用

近日,谷歌终于宣布TPU v5e进入公用阶段,且在最新的MLPerf训练3.1测试中,TPUv5e获得了更好的表现。在该测试中,谷歌改进了创新的混合精度训练算法,除了原生支持的BF16外,还用到了INT8精度格式。这意味着客户在提高了模型准确性的同时,将花费更少的成本。

wKgZomVR-IOANSMPAAIyMIzn61I221.png
从谷歌云对于TPU v5e的定价表来看,v5e在成本效益上确实有着极大的优势。不过需要注意的是,v5e与v2、v3 Pod类似,每个芯片中只有一个TensorCore,而v4 Pod的每个芯片中有两个TensorCore。这也是为何v5e的单芯片峰值算力为197TFLOPS,而v4的单芯片峰值算力为275TFLOPS,可即便如此,在按芯片小时的定价下,其所需成本依然低于v4。

在如此高的性价比下,谷歌不仅将TPU提供给外部开发者使用,其内部一些开发项目也开始用上TPU v5e。比如其PaLM模型的创建,就用到了上文提到的Multislice技术,谷歌的Bard团队同样在用TPU v5e训练这一生成式AI聊天机器人

写在最后

其实在TPUv5e开放使用之前,谷歌也正式开放了A3 VM这类GPU加速虚拟机的使用。这也是多数云服务厂商采用的多方案供应策略,其自研加速器只需要为客户提供一个高性价比的方案,而追求更高性能的客户,依然可以选择基于H100 GPU打造的服务器。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26464

    浏览量

    264091
收藏 人收藏

    评论

    相关推荐

    risc-v多核芯片在AI方面的应用

    应用中的成本。 最后,RISC-V多核芯片不仅可以应用于AI边缘计算领域,还可以扩展到其他领域,如数据中心、云计算、自动驾驶、机器人等,为这些领域提供
    发表于 04-28 09:20

    谷歌AI大模型Gemma全球开放使用

    谷歌公司近日宣布,其全新的AI大模型Gemma现已在全球范围内开放使用。这一重要举措不仅彰显了谷歌AI领域的领先地位,还为其在全球范围内的
    的头像 发表于 02-28 18:12 704次阅读

    Groq推出大模型推理芯片 超越了传统GPU和谷歌TPU

    Groq推出了大模型推理芯片,以每秒500tokens的速度引起轰动,超越了传统GPU和谷歌TPU
    的头像 发表于 02-26 10:24 389次阅读
    Groq推出大模型推理芯片 超越了传统GPU和<b class='flag-5'>谷歌</b><b class='flag-5'>TPU</b>

    谷歌宣布Gemma大模型全球开放使用

    谷歌公司近日宣布,其先进的AI大模型Gemma即日起在全球范围内开放使用。这一新模型由谷歌DeepMind和其他团队合作开发,并与其最大的AI
    的头像 发表于 02-23 10:41 354次阅读

    谷歌TPU v5p超越Nvidia H100,成为人工智能领域的竞争对手

    TPU v5p已在谷歌AI超级计算机”项目中发挥重要作用,这并非专业科研型超算平台,而是面向各类人工智能应用。与Nvidia开放GPU购买
    的头像 发表于 12-26 15:20 935次阅读

    谷歌最强大的定制设计人工智能加速器—TPU v5p芯片

    谷歌正迅速成为 BFF Nvidia 的强大对手——为其超级计算机提供动力的 TPU v5p AI 芯片速度更快,内存和带宽比以往任何时候都多,甚至击败了强大的 H100
    的头像 发表于 12-26 09:31 1305次阅读

    谷歌发布多模态Gemini大模型及新一代TPU系统Cloud TPU v5p

    谷歌亦发布新一代TPU 系统——Cloud TPU v5p,以帮助训练尖端的 AI 模型。目
    的头像 发表于 12-12 10:50 805次阅读
    <b class='flag-5'>谷歌</b>发布多模态Gemini大模型及新一代<b class='flag-5'>TPU</b>系统Cloud <b class='flag-5'>TPU</b> v5p

    成都汇阳投资关于谷歌携 Gemini 王者归来,AI 算力和应用值得期待

    “Cloud TPU v5p”, 以及来自谷歌云的人工智能超级计算机。 本次谷歌推出的多模态大模型Gemini 依然采用Transformer 架构,采用
    的头像 发表于 12-11 14:40 630次阅读
    成都汇阳投资关于<b class='flag-5'>谷歌</b>携 Gemini 王者归来,<b class='flag-5'>AI</b> 算力和应用值得期待

    AI创企Anthropic将采用谷歌Cloud TPU v5e芯片

    随着制造更大ai模型的竞争越来越激烈,像谷歌这样的大型技术企业与该领域最尖端的新生企业建立了关系。据消息人士透露,anthropic已达成协议,将在最近4年里花费30多亿美元购买谷歌的云计算
    的头像 发表于 11-09 11:55 389次阅读

    LT8630:100V,0.6A 同步微电逐步降低高效益转换监管数据表 LT8630:100V,0.6A 同步微电逐步降低高效益转换监管数据表

    电子发烧友网为你提供ADI(ADI)LT8630:100V,0.6A 同步微电逐步降低高效益转换监管数据表相关产品参数、数据手册,更有LT8630:100V,0.6A 同步微电逐步降低高效益转换监管
    发表于 10-07 17:47
    LT8630:100V,0.6A 同步微电逐步降低<b class='flag-5'>高效益</b>转换监管数据表 LT8630:100V,0.6A 同步微电逐步降低<b class='flag-5'>高效益</b>转换监管数据表

    价格没谈拢?谷歌考虑抛弃AI赢家博通自研TPU

    今天,谷歌高层管理层讨论了在2027年放弃博通作为人工智能芯片的供应商。谷歌的这种苦恼是在就tpu芯片价格与博通对峙之后才实现的。
    的头像 发表于 09-22 09:34 352次阅读

    挑战微软和亚马逊 谷歌发布企业级AI工具和芯片争夺云计算市场份额

    的软件工具。谷歌在年度云会议上公布的AI芯片、工具和合作伙伴关系,以期在云计算市场挑战亚马逊和微软。 谷歌云首席执行官托马斯·库里安(Thomas Kurian)在旧金山举行的
    的头像 发表于 08-31 00:08 705次阅读
    挑战微软和亚马逊 <b class='flag-5'>谷歌</b>发布企业级<b class='flag-5'>AI</b>工具和芯片争夺云<b class='flag-5'>计算</b>市场份额

    单张消费级显卡微调多模态大模型

    把大模型的训练门槛打下来!我们在单张消费级显卡上实现了多模态大模型(LaVIN-7B, LaVIN-13B)的适配和训练
    的头像 发表于 06-30 10:43 1365次阅读
    单张消费级显卡微调多模态大模型

    一站式供应商 中德模式把成本打下来”!

    作为新能源磁元件一站式供应商,中德电子通过快速反应机制、保持产品一致性、一站式产品等多种方式降低生产 “一站式供应主要根据客户的需求,从材料研发、制粉到产品的制成都由我们完成。好处在于制造成本、服务
    的头像 发表于 06-05 14:27 496次阅读
    一站式供应商 中德模式把<b class='flag-5'>成本</b>“<b class='flag-5'>打下来</b>”!

    如何使用具有成本效益的esp12f液位传感器?

    大家好,请推荐一个成本效益好的水位传感器,用于与 7 英尺左右的高架水箱的 arduino 接口,用谷歌搜索并开始了解超声波 sr04t 传感器,但确实建议便宜的选择以及它必须用于水箱的数量(大约 5) 并且最初的预算很低.
    发表于 06-01 09:01