谷歌发布多模态Gemini大模型及新一代TPU系统Cloud TPU v5p-电子发烧友网

谷歌亦发布新一代TPU 系统——Cloud TPU v5p，以帮助训练尖端的 AI 模型。目前，Bard 已开始使用 Gemini Pro 的微调版本来进行更高级的推理，并计划将 Gemini 引入旗下智能手机品牌 Pixel。此外，从 12 月 13 日起，开发者和企业客户可以通过 Google AIStudio 或 Google Cloud Vertex AI 中的 Gemini API 访问 Gemini Pro。谷歌计划于 2024 年初向开发人员和企业客户正式推出 Gemini Ultra。

（1）Gemini 多模态：支持文本、图像、视频、音频输入，支持文本和图像输出。

（2）Gemini 三个版本：Ultra、Pro、Nano。

（3）AlphaCode2：Gemini 加成，擅长编程、涵盖了复杂的数学和理论计算机科学等问题。

（4）视频理解方面：从官方的演示视频里我们可以看到，Gemini 对于演示人员的动作可以进行分析和推理，并且实时性很高。从类人角度看，实现了听、说、看、互动等，甚至可以同时识别和理解文本、图像和视频。

（5）应用融合情况：Bard 和 Pixel 8 Pro 智能手机已经应用了 Gemini，未来 Gemini 会被整合到 Google 的搜索引擎、广告产品、Chrome 浏览器等。

（6）硬件层面：用了谷歌的 TPU 集群。Gemini Ultra 用了最新版本的 v5p，如图 v5p 在互联带宽方面的提升更显著。

谷歌使用内部设计的 TPU v4 和 v5e 训练 Gemini 1.0。谷歌针对三种不同的尺寸对 Gemini 1.0 进行了优化：

①Gemini Ultra，是谷歌迄今为止最大且能力最强的模型，适用于复杂度高的任务，主要面向数据中心和企业级应用；

②Gemini Pro，可扩展的模型，适用于广泛的任务，其为谷歌诸多 AI 服务提供动力，目前已成为 Bard 的支柱模型；

③Gemini Nano，作为运行在终端设备上的最为高效的模型，其能够在Android 设备上本地和离线运行。Pixel 8 Pro 将会是第一款运行Gemini Nano 的智能手机。Gemini Nona 拥有两个版本，其中，Nano-1 参数量为 1.8B，Nano-2 参数量为 3.25B。在公布 Gemini的同时，谷歌亦推出其迄今为止最强大、最高效且可扩展的 TPU 系统 Cloud TPU v5p，该系统专为训练尖端 AI 模型而设计。

在 AI 性能方面，TPU v5p 能够提供 459 TFLOPS 的 BF16 性能或 918 TFLOPS的 INT8 性能，支持 95GB 的高带宽内存，能够以 2.76TB/s 的速度传输数据。在模型训练方面，TPU v5p 在 LLM 训练速度上显示出 2.8倍的代际提升，即使相比 TPU v5e 也有约 50%的提升。

Gemini 是首款原生多模态大模型，其性能或基本全面领先 GPT-4Gemini 可无缝理解和推理各种模态的输入内容，并非将纯文本、纯视觉及纯音频模型拼接在一起，后者如 OpenAI 的 GPT-4、DALL·E和 Whisper。根据谷歌官方的评估，从自然图像、音频、视频理解到数学推理，Gemini Ultra 在 32 个常用的学术基准的 30 个上超越GPT-4。在 MMLU（大规模多任务语言理解）测试中，Gemini Ultra以 90.0%的高分首次超过人类专家，力压得分为 86.4%的 GPT-4。在图像、音频和视频等基准测试中，Gemini Ultra 超越之前的领先模型，且这一成果是在没有 OCR 系统帮助的情况下实现的，充分体现了 Gemini 原生多模态的特性。

审核编辑：刘清

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

TPU

TPU

+关注

关注
0

文章
132

浏览量
20546
OCR

OCR

+关注

关注
0

文章
137

浏览量
16128
GPT

GPT

+关注

关注
0

文章
300

浏览量
14868

原文标题：谷歌发布多模态Gemini大模型及新一代TPU系统Cloud TPU v5p

文章出处：【微信号：AI_Architect，微信公众号：智能计算芯世界】欢迎添加关注！文章转载请注明出处。

谷歌发布史上最强大模型Gemini，全方位领先GPT-4，MMLU基准达人类专家水平

电子发烧友网报道（文/吴子鹏）美国当地时间周三，谷歌发布了其新一代人工智能模型Gemini（双子星）。谷

发表于 12-08 00:11 •2519次阅读

Groq推出大模型推理芯片超越了传统GPU和谷歌TPU

Groq推出了大模型推理芯片，以每秒500tokens的速度引起轰动，超越了传统GPU和谷歌TPU。

发表于 02-26 10:24 •386次阅读

谷歌推出新一代大模型Gemini 1.5

近日，谷歌在无预警的情况下发布了其下一代大模型——Gemini 1.5，这款模型在性能上实现了显著增强，并在长上下文理解方面取得了令人瞩目的

发表于 02-20 13:55 •328次阅读

TPU-MLIR开发环境配置时出现的各种问题求解

想要的容器的名字注意TPU-MLIR工程在docker中的路径应该是/workspace/tpu-mlir 2.3. ModelZoo(可选) TPU-MLIR中自带yolov5s

发表于 01-10 08:02

谷歌TPU v5p超越Nvidia H100，成为人工智能领域的竞争对手

TPU v5p已在谷歌“AI超级计算机”项目中发挥重要作用，这并非专业科研型超算平台，而是面向各类人工智能应用。与Nvidia开放GPU购买策略不同，谷歌高端

发表于 12-26 15:20 •921次阅读

谷歌最强大的定制设计人工智能加速器—TPU v5p芯片

谷歌正迅速成为 BFF Nvidia 的强大对手——为其超级计算机提供动力的 TPU v5p AI 芯片速度更快，内存和带宽比以往任何时候都多，甚至击败了强大的 H100

发表于 12-26 09:31 •1301次阅读

成都汇阳投资关于多模态驱动应用前景广阔，上游算力迎机会!

“Cloud TPU v5p”, 以及来自谷歌云的人工智能超级计算机。本次谷歌推出的多模态大

发表于 12-18 13:08 •275次阅读

谷歌Gemini模型AI网络及TPU拆解

Gemini 是一款新型的多模态大语言模型，此前多模态大模型在处理视频、文字、图像等多维度输入信息时是采用分别训练分别输出再进行拼接的方式，

发表于 12-14 09:55 •521次阅读

成都汇阳投资关于谷歌携 Gemini 王者归来，AI 算力和应用值得期待

“Cloud TPU v5p”, 以及来自谷歌云的人工智能超级计算机。本次谷歌推出的多模态大

发表于 12-11 14:40 •628次阅读

价格没谈拢？谷歌考虑抛弃AI赢家博通自研TPU

今天，谷歌高层管理层讨论了在2027年放弃博通作为人工智能芯片的供应商。谷歌的这种苦恼是在就tpu芯片价格与博通对峙之后才实现的。

发表于 09-22 09:34 •350次阅读

TPU和NPU的区别

和NPU之间的区别。什么是TPU？ TPU，即Tensor Processing Unit，是由Google公司开发的專用於深度学习的加速器。它被设计成一个ASIC（应用特定集成电路），可延长深度学习模型的训练和推理速度。

发表于 08-27 17:08 •3598次阅读

如何使用TPU-MLIR进行模型转换

TPU-MLIR之精度验证

发表于 08-21 10:41 •463次阅读

TPU内存（一）

TPU内存（一）

发表于 08-18 11:29 •426次阅读

TPU内存（二）

TPU内存（二）

发表于 08-18 11:29 •268次阅读

如何验证MC68332 TPU配置是否正确？

a) 以下 TPU 模块配置在项目中完成 *M332_TPU_TMCR = 0x1e4c；/* 选择 TCR1 时基 = 250nsec， TCR2 = 4usec，仿真模式

发表于 05-09 08:17