0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Google Gemma优化后可在NVIDIA GPU上运行

NVIDIA英伟达 来源:NVIDIA英伟达 2024-02-25 11:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

借助 TensorRT-LLM,Google 全新开放语言模型可在 NVIDIA AI 平台(包括本地 RTX AI PC)上加速运行。

2024 年 2 月 21 日,NVIDIA 携手 Google 在所有 NVIDIA AI 平台上发布面向 Gemma 的优化功能,Gemma 是 Google 最先进的新型轻量级 2B 和 7B 开放语言模型,可在任何地方运行,从而降低成本并加快特定领域用户案例的创新工作。

NVIDIA 和 Google 的团队紧密合作,利用 NVIDIA TensorRT-LLM(用于优化大语言模型推理性能的开源库),在数据中心的 NVIDIA GPU云计算和搭载 NVIDIA RTX GPU 的 PC 上运行时,加速 Gemma 性能(Gemma 由创建 Gemini 模型的相同研究和技术构建)。

这使开发者能将全球高性能 AI PC 中超过 1 亿台搭载 NVIDIA RTX GPU 的用户作为潜在用户进行开发。

开发者还可在搭载 NVIDIA GPU 的云端运行 Gemma,该实例拥有 141GB HBM3e 显存,速度为 4.8TB/秒,Google 将于今年部署该实例。

此外,企业级开发者还可利用 NVIDIA 丰富的工具生态系统(包括依托 NeMo 框架的 NVIDIA AI Enterprise 和 TensorRT-LLM),对 Gemma 进行微调,并将优化后的模型部署到生产应用中。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5706

    浏览量

    110154
  • 云计算
    +关注

    关注

    39

    文章

    8049

    浏览量

    144848
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5295

    浏览量

    136116

原文标题:共耀光芒:Google Gemma 优化后可在 NVIDIA GPU 上运行

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIAGoogle Cloud携手推进代理式与物理AI发展

    企业可以使用 NVIDIA Vera Rubin 驱动的 A5X 实例 (可扩展至近 100 万个 Rubin GPU)、Google Distributed Cloud 的 Gem
    的头像 发表于 04-27 15:35 436次阅读

    Google AI Edge Gallery中探索Gemma 4的Agent Skills

    的端侧 AI 开发工具包。借助 Gemma 4,您将不再局限于简单的聊天机器人,而是可以构建直接在本地设备运行的智能体和自主 AI 应用场景。Gemma 4 支持多步规划、自主行动、
    的头像 发表于 04-23 09:19 555次阅读

    Google正式推出最新开放模型Gemma 4

    今天,我们正式推出 Gemma 4 —— 这是我们迄今为止最智能的开放模型。Gemma 4 专为高级推理和智能体 (Agentic) 工作流而设计,实现了单位参数下前所未有的智能水平。这一突破性进展
    的头像 发表于 04-08 10:06 609次阅读
    <b class='flag-5'>Google</b>正式推出最新开放模型<b class='flag-5'>Gemma</b> 4

    NVIDIAGoogle探讨AI模型的演进方向

    在 GTC 会场,观众座无虚席,两位计算领域最具影响力的领导人物,NVIDIA 首席科学家 Bill Dally,以及 Google DeepMind 与 Google Research 首席科学家 Jeff Dean 登台对话
    的头像 发表于 04-03 10:03 531次阅读

    NVIDIA Jetson模型赋能AI在边缘端落地

    开源生成式 AI 模型不再局限于数据中心,而是开始深入到现实世界的各种机器中。从 Orin 到 Thor,NVIDIA Jetson 系列正在成为运行 NVIDIA Nemotron、Cosmos
    的头像 发表于 03-16 16:27 694次阅读
    <b class='flag-5'>NVIDIA</b> Jetson模型赋能AI在边缘端落地

    如何在 VisionFive v2 使用外部 GPU

    如果旧的 amd gpu 在 VisionFive V2 运行,我想使用带有开源 amd 驱动程序的 amd gpu。我需要什么以及如何将 GPU
    发表于 03-13 06:38

    谷歌正式发布Gemma Scope 2模型

    大语言模型 (LLM) 具备令人惊叹的推理能力,但其内部决策过程在很大程度上仍然不透明。如果系统未按预期运行,对其内部运作机制缺乏可见性将难以准确定位问题根源。过去,我们通过发布 Gemma
    的头像 发表于 01-24 14:01 775次阅读

    NVIDIA RTX PRO 5000 Blackwell GPU的深度评测

    NVIDIA RTX PRO 5000 Blackwell 是 NVIDIA RTX 5000 Ada Generation 的升级迭代产品,其各项核心指标均针对 GPU 加速工作流的高性能
    的头像 发表于 01-06 09:51 4443次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 Blackwell <b class='flag-5'>GPU</b>的深度评测

    在Python中借助NVIDIA CUDA Tile简化GPU编程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 编程模式。它是自 CUDA 发明以来 GPU 编程最核心的更新之一。借助 GPU tile kernels,可以用
    的头像 发表于 12-13 10:12 1493次阅读
    在Python中借助<b class='flag-5'>NVIDIA</b> CUDA Tile简化<b class='flag-5'>GPU</b>编程

    谷歌推出AI模型Gemma 3 270M

    过去几个月,Gemma 开放模型系列的发展是激动人心的。我们推出了 Gemma 3 和 Gemma 3 QAT,为单一云端和桌面加速器带来了最先进的性能。
    的头像 发表于 09-11 15:09 1343次阅读

    NVIDIA RTX PRO 4500 Blackwell GPU测试分析

    今天我们带来全新 NVIDIA Blackwell 架构 GPU —— NVIDIA RTX PRO 4500 Blackwell 的测试,对比上一代产品 NVIDIA RTX 450
    的头像 发表于 08-28 11:02 4463次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>测试分析

    NVIDIA桌面GPU系列扩展新产品

    NVIDIA 桌面 GPU 系列扩展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的头像 发表于 08-18 11:50 1691次阅读

    NVIDIA RTX AI加速FLUX.1 Kontext现已开放下载

    NVIDIA RTX 与 NVIDIA TensorRT 现已加速 Black Forest Labs 的最新图像生成和编辑模型;此外,Gemma 3n 现可借助 RTX 和 NVIDIA
    的头像 发表于 07-16 09:16 2226次阅读

    谷歌Gemma 3n预览版全新发布

    Gemma 3 和 Gemma 3 QAT 的成功发布之后,我们的先进开放模型系列具备了在单一云端或桌面加速器运行的能力,我们正在进一步推进我们对可访问 AI 的愿景。
    的头像 发表于 06-26 17:18 1145次阅读

    树莓派5Gemma 2:如何打造高效的边缘AI解决方案?

    从数学基础到边缘实现,研究团队:Conecta.ai(ufrn.br)摘要1.引言2.GEMMA2:通用集成机器模型算法2.1模型架构2.2预训练2.3训练3.边缘AI实现1.引言GEMMA
    的头像 发表于 06-20 16:57 1841次阅读
    树莓派5<b class='flag-5'>上</b>的<b class='flag-5'>Gemma</b> 2:如何打造高效的边缘AI解决方案?