0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌发布多模态Gemini大模型及新一代TPU系统Cloud TPU v5p

智能计算芯世界 来源:智能计算芯世界 2023-12-12 10:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

谷歌亦发布新一代TPU 系统——Cloud TPU v5p,以帮助训练尖端的 AI 模型。目前,Bard 已开始使用 Gemini Pro 的微调版本来进行更高级的推理,并计划将 Gemini 引入旗下智能手机品牌Pixel。此外,从 12 月 13 日起,开发者和企业客户可以通过 Google AIStudio 或 Google Cloud Vertex AI 中的 Gemini API 访问 Gemini Pro。谷歌计划于 2024 年初向开发人员和企业客户正式推出 Gemini Ultra。

(1)Gemini 多模态:支持文本、图像、视频、音频输入,支持文本和图像输出。

(2)Gemini 三个版本:Ultra、Pro、Nano。

(3)AlphaCode2:Gemini 加成,擅长编程、涵盖了复杂的数学和理论计算机科学等问题。

(4)视频理解方面:从官方的演示视频里我们可以看到,Gemini 对于演示人员的动作可以进行分析和推理,并且实时性很高。从类人角度看,实现了听、说、看、互动等,甚至可以同时识别和理解文本、图像和视频。

(5)应用融合情况:Bard 和 Pixel 8 Pro 智能手机已经应用了 Gemini,未来 Gemini 会被整合到 Google 的搜索引擎、广告产品、Chrome 浏览器等。

(6)硬件层面:用了谷歌的 TPU 集群。Gemini Ultra 用了最新版本的 v5p,如图 v5p 在互联带宽方面的提升更显著。

46b61608-987f-11ee-8b88-92fbcf53809c.png

谷歌使用内部设计的 TPU v4 和 v5e 训练 Gemini 1.0。谷歌针对三种不同的尺寸对 Gemini 1.0 进行了优化:

①Gemini Ultra,是谷歌迄今为止最大且能力最强的模型,适用于复杂度高的任务,主要面向数据中心和企业级应用;

②Gemini Pro,可扩展的模型,适用于广泛的任务,其为谷歌诸多 AI 服务提供动力,目前已成为 Bard 的支柱模型;

③Gemini Nano,作为运行在终端设备上的最为高效的模型,其能够在Android 设备上本地和离线运行。Pixel 8 Pro 将会是第一款运行Gemini Nano 的智能手机。Gemini Nona 拥有两个版本,其中,Nano-1 参数量为 1.8B,Nano-2 参数量为 3.25B。在公布 Gemini的同时,谷歌亦推出其迄今为止最强大、最高效且可扩展的 TPU 系统 Cloud TPU v5p,该系统专为训练尖端 AI 模型而设计。

在 AI 性能方面,TPU v5p 能够提供 459 TFLOPS 的 BF16 性能或 918 TFLOPS的 INT8 性能,支持 95GB 的高带宽内存,能够以 2.76TB/s 的速度传输数据。在模型训练方面,TPU v5p 在 LLM 训练速度上显示出 2.8倍的代际提升,即使相比 TPU v5e 也有约 50%的提升。

Gemini 是首款原生多模态大模型,其性能或基本全面领先 GPT-4Gemini 可无缝理解和推理各种模态的输入内容,并非将纯文本、纯视觉及纯音频模型拼接在一起,后者如 OpenAI 的 GPT-4、DALL·E和 Whisper。根据谷歌官方的评估,从自然图像、音频、视频理解到数学推理,Gemini Ultra 在 32 个常用的学术基准的 30 个上超越GPT-4。在 MMLU(大规模多任务语言理解)测试中,Gemini Ultra以 90.0%的高分首次超过人类专家,力压得分为 86.4%的 GPT-4。在图像、音频和视频等基准测试中,Gemini Ultra 超越之前的领先模型,且这一成果是在没有 OCR 系统帮助的情况下实现的,充分体现了 Gemini 原生多模态的特性。






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • TPU
    TPU
    +关注

    关注

    0

    文章

    176

    浏览量

    21734
  • OCR
    OCR
    +关注

    关注

    0

    文章

    176

    浏览量

    17305
  • GPT
    GPT
    +关注

    关注

    0

    文章

    376

    浏览量

    17016

原文标题:谷歌发布多模态Gemini大模型及新一代TPU系统Cloud TPU v5p

文章出处:【微信号:AI_Architect,微信公众号:智能计算芯世界】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    谷歌发布第八TPU,训练推理分离,搭载自研CPU

    电子发烧友网报道(文/李弯弯)在2026年4月22日举行的谷歌云Next大会上,谷歌正式发布了第八张量处理单元(TPU)。此次
    的头像 发表于 04-24 09:03 6397次阅读
    <b class='flag-5'>谷歌</b><b class='flag-5'>发布</b>第八<b class='flag-5'>代</b><b class='flag-5'>TPU</b>,训练推理分离,搭载自研CPU

    直击英伟达腹地?谷歌TPU v7开放部署,催生OCS产业链红利

    Processing Unit, TPU)构建了套完整的AI算力基础设施体系。   11月,谷歌宣布第七 TPU
    的头像 发表于 11-27 08:53 9862次阅读
    直击英伟达腹地?<b class='flag-5'>谷歌</b><b class='flag-5'>TPU</b> <b class='flag-5'>v</b>7开放部署,催生OCS产业链红利

    谷歌发布Gemini for Science

    2026年5月20日,谷歌I/O开发者大会上,谷歌正式推出Gemini for Science——款专门面向科研场景的AI
    的头像 发表于 05-21 10:42 794次阅读

    谷歌正式发布Gemini Spark

    5月20日,谷歌在I/O 2026上正式发布Gemini Spark——款全天候运行的个人AI助手。它基于
    的头像 发表于 05-21 10:39 440次阅读

    阿里巴巴正式发布新一代千问旗舰模型Qwen3.7-Max

    5月20日,阿里巴巴正式发布新一代千问旗舰模型Qwen3.7-Max。这款面向智能体时代全面设计的大模型,在三方机构Arena全球大
    的头像 发表于 05-21 09:10 587次阅读

    模态模型 前沿算法与实战应用 第季》精品课程简介

    ;模态拼接\"向\"模态共生\"演进: 统架构 :如GPT-4V、Flamingo等模型通过单
    发表于 05-01 17:46

    谷歌新一代TPU,专用于推理

    行业芯事行业资讯
    电子发烧友网官方
    发布于 :2026年04月21日 11:19:52

    Gemini CLI 中转站配置使用教程

    gemini-cli gemini > 给我个昨天所有更改的摘要 ? 主要功能 代码理解与生成 查询和编辑大型代码库 使用模态
    发表于 02-10 17:29

    百度正式发布并开源新一代文档解析模型PaddleOCR-VL-1.5

    1 月 29 日,百度正式发布并开源新一代文档解析模型 PaddleOCR-VL-1.5。该模型以仅 0.9B 参数的轻量架构,在全球权威文档解析评测榜单 OmniDocBench
    的头像 发表于 01-30 10:03 896次阅读
    百度正式<b class='flag-5'>发布</b>并开源<b class='flag-5'>新一代</b>文档解析<b class='flag-5'>模型</b>PaddleOCR-VL-1.5

    晶晨携手谷歌,助力端侧大模型Gemini的硬件落地

    电子发烧友网报道 在科技飞速发展的当下,端侧智能技术正以前所未有的速度渗透到各个领域。1月28日,晶晨股份透露,公司与谷歌有着长达十余年的深度合作基础。作为谷歌新一代端侧AI硬件(整合Gemi
    的头像 发表于 01-29 10:44 2573次阅读

    AI芯片大单!Anthropic从博通采购100万颗TPU v7p芯片

    Anthropic供应基于TPU v7p的机架级 AI 系统,绕过TPU芯片的另开发参与方谷歌
    的头像 发表于 01-06 08:38 1.1w次阅读

    商汤科技正式发布并开源全新模态模型架构NEO

    商汤科技正式发布并开源了与南洋理工大学S-Lab合作研发的全新模态模型架构 —— NEO,为日日新SenseNova
    的头像 发表于 12-08 11:19 1241次阅读
    商汤科技正式<b class='flag-5'>发布</b>并开源全新<b class='flag-5'>多</b><b class='flag-5'>模态</b><b class='flag-5'>模型</b>架构NEO

    谷歌发布最强自研TPU,性能比前代提升4倍

    电子发烧友网报道(文/李弯弯)近日,谷歌云在官方博客上正式宣布,公司成功推出第七TPU(张量处理器)“Ironwood”,该芯片预计在未来几周内正式上市。   “Ironwood”由谷歌
    的头像 发表于 11-13 07:49 9160次阅读
    <b class='flag-5'>谷歌</b>云<b class='flag-5'>发布</b>最强自研<b class='flag-5'>TPU</b>,性能比前代提升4倍

    拥抱DeepSeek开源生态| 算能TPU接入TileLang,集结北大复旦山大顶尖团队!

    近日,DeepSeekV3.2-Exp上线,官宣支持国产AI算子编程语言TileLang并发布了针对V3.2的算子示例,这意味着支持“同语义、跨后端”的TileLang得到了权威认
    的头像 发表于 10-03 19:08 1699次阅读
    拥抱DeepSeek开源生态| 算能<b class='flag-5'>TPU</b>接入TileLang,集结北大复旦山大顶尖团队!

    商汤日日新V6.5模态模型登顶全球权威榜单

    6.5 Pro)模态模型以82.2的综合成绩登顶榜首,领先Gemini 2.5 Pro以及GPT-5等国际顶尖
    的头像 发表于 09-10 09:55 1040次阅读