0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌推出效率与性能跃阶的全新开放模型标准

谷歌开发者 来源:谷歌开发者 2024-09-09 15:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者 /Google DeepMind 研究副总裁 Clement Farabet 和Google DeepMind 总监 Tris Warkentin

AI 有可能解决人类面临的一些最紧迫的问题,但前提是每个人都拥有构建 AI 的工具。这就是我们在今年早些时候推出 Gemma的原因,Gemma 是一系列轻量级开放模型系列,采用了与创建 Gemini 模型相同的研究和技术。我们还陆续推出了 CodeGemma、RecurrentGemma 和 PaliGemma,以此不断发展我们的 Gemma 系列,上述每个模型都能为不同的 AI 任务提供独特的功能,并且可以通过与 Hugging Face、NVIDIA 和 Ollama 等合作伙伴的集成轻松访问。

现在,我们正式向全球研究人员和开发者发布 Gemma 2。Gemma 2 分为 90 亿 (9B) 和 270 亿 (27B) 两种参数版本,与第一代相比,其性能更强、推理效率更高,并且在安全性方面也有显著提升。事实上,作为一种有竞争力的替代方案,Gemma 2 27B 的性能可以与规模是其两倍的模型相媲美,截至去年 12 月,只有专有模型才能达到此性能水准。如今,这可以在单个 NVIDIA H100 Tensor Core GPU 或 TPU 的主机上实现,从而显著降低了部署成本。

效率与性能跃阶的

全新开放模型标准

我们在重新设计的架构上构建了 Gemma 2,旨在提供卓越的性能和推理效率。以下是它脱颖而出的原因:

非凡性能:Gemma 2 27B 在同类规模的模型中性能最优,甚至比其规模大两倍以上的模型更具竞争力。而 Gemma 2 9B 模型也具有一流的性能,优于 Llama 3 8B 以及其他相同规模类别的开放模型。如需了解详细性能分析,请查阅技术报告。

立竿见影的降本增效:Gemma 2 27B 模型旨在助您使用单个 Google Cloud TPU 主机、NVIDIA A100 80GB Tensor Core GPU 或 NVIDIA H100 Tensor Core GPU 以全精度高效运行推理,从而显著降低成本,同时保持高效性能。这使得 AI 部署更加易于访问且经济实惠。

跨硬件的极速推理:Gemma 2 经过优化,可以在一系列硬件上以不可思议的速度运行,包括强大的游戏本电脑、高端台式机和云端配置等。您可以在 Google AI Studio 中以全精度体验 Gemma 2,在 CPU 上使用 Gemma.cpp 量化版本解锁本地性能,或者通过 Hugging Face Transformer 在配备 NVIDIA RTX 或 GeForce RTX 的家用电脑上试用。

wKgZombeqGGAMx_IAAHxD9e82Fk135.png

专为开发者和研究人员打造

Gemma 2 不仅功能更强大,并且还能够更轻松地集成到您的工作流程中:

开放且易于访问:就像最初的 Gemma 模型一样,Gemma 2 可在我们商业友好型的 Gemma 许可下使用,支持开发者和研究人员分享和商业化他们的创新成果。

广泛的框架兼容性:由于 Gemma 2 与 Hugging Face Transformer 等主要 AI 框架兼容,并且通过原生 Keras 3.0、vLLM、Gemma.cpp、Llama.cpp 和 Ollama 兼容 JAX、PyTorch 和 TensorFlow,因此您可以轻松地将其与您偏好的工具和工作流一起使用。此外,我们还通过 NVIDIA TensorRT-LLM 优化了 Gemma,支持该模型在 NVIDIA 加速基础架构上运行,或作为 NVIDIA NIM 推理微服务运行,并将很快优化支持 NVIDIA NeMo。您现在便可以使用 Keras 和 Hugging Face 进行微调。我们正在积极努力,以提供更多参数高效的微调选项。

轻松部署:从七月开始,Google Cloud 客户将能够在 Vertex AI 上轻松部署和管理 Gemma 2。

探索新的 Gemma 手册,其中包含一系列实用示例和指南,帮助您构建自己的应用并针对特定任务微调 Gemma 2 模型。还可了解如何轻松使用您的工具与 Gemma 集成,包括用于如检索增强生成等常见任务。

负责任的 AI 开发

我们致力于为开发者和研究人员提供负责任地构建和部署 AI 所需的资源,包括使用我们负责任的生成式 AI 工具包 (Responsible Generative AI Toolkit)。最近开源的 LLM Comparator 可帮助开发者和研究人员深入评估语言模型。现在,您可以使用配套的 Python 库对您的模型和数据进行比较评估,并在应用中可视化结果。此外,我们正在积极致力于为 Gemma 模型开源文本水印技术 SynthID。

在训练 Gemma 2 时,我们遵循稳健的内部安全流程和过滤预训练数据,并根据一套全面的指标开展严格的测试和评估,以识别和减轻潜在的偏见和风险。我们在大量的与安全和代表性危害相关的公共基准上发布我们的结果。

wKgaombeqJqAJUl_AAMZGB9ABWQ735.png

使用 Gemma 构建的项目

我们首次推出 Gemma 时获得了超过 1,000 万次的下载量,并促成了无数鼓舞人心的项目。例如,Navarasa 利用 Gemma 创建了一个基于印度语言多样性的模型。

如今,Gemma 2 将帮助开发者落地更具雄心的项目,在他们的 AI 创作中释放全新的性能和潜力。我们将不懈地探索新的架构,并开发专门的 Gemma 变体,以应对更广泛的 AI 任务和挑战。这包括即将推出的Gemma 2 2.6B 模型,旨在进一步弥合轻量级可访问性与强大性能之间的差距。您可以参阅技术报告以详细了解。

开始构建

Gemma 2 现已在 Google AI Studio 中推出,因此您可以在无需硬件要求的情况下测试 Gemma 2 27B 的全部性能。您还可以从 Kaggle 和 Hugging Face 模型下载 Gemma 2 的模型权重,Vertex AI Model Garden 中也即将推出。

为了方便研究和开发,您还可通过 Kaggle 或 Colab notebook 免费使用 Gemma 2。首次使用 Google Cloud 的用户可能有资格获得 300 美元积分。学术研究人员可以通过申请 Gemma 2 学术研究计划 (Gemma 2 Academic Research Program)获取 Google Cloud 积分,从而加速 Gemma 2 的研究。申请现已开放,截止日期为 8 月 9 日。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Google
    +关注

    关注

    5

    文章

    1801

    浏览量

    60255
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296416
  • 模型
    +关注

    关注

    1

    文章

    3648

    浏览量

    51703

原文标题:效率与性能提升 | 可供开发者和研究人员使用的 Gemma 2 现已发布

文章出处:【微信号:Google_Developers,微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA推出面向语言、机器人和生物学的全新开源AI技术

    NVIDIA 秉持对开源的长期承诺,推出了面向语言、机器人和生物学的全新开源 AI 技术,为构建开源生态系统做出贡献,扩展 AI 的普及并推动创新。NVIDIA 正将这些模型、数据和训练框架贡献给 Hugging Face,让
    的头像 发表于 11-06 11:49 682次阅读

    腾讯地图推出全新时空智能开放平台“盖亚”

    2025年9月17日,在2025腾讯全球数字生态大会上,腾讯地图正式推出全新时空智能开放平台“盖亚”(GAIA,Geospatial Artificial Intelligence Atlas
    的头像 发表于 09-18 10:26 1756次阅读

    谷歌推出AI模型Gemma 3 270M

    过去几个月,Gemma 开放模型系列的发展是激动人心的。我们推出了 Gemma 3 和 Gemma 3 QAT,为单一云端和桌面加速器带来了最先进的性能
    的头像 发表于 09-11 15:09 867次阅读

    TDK推出全新SmartMotion ICM-536xx系列高性能六轴IMU

    TDK株式会社(东京证券交易所代码:6762)重磅推出全新的SmartMotion® ICM-536xx系列高性能六轴IMU,并向特定客户开放供货。
    的头像 发表于 09-05 09:15 734次阅读

    2025联想创新开放日正式开启

    今天,以“创新ING 热AI进行时”为主题的联想2025创新开放日正式开启,全面呈现联想集团在“人工智能+”方面的布局与落地成果。
    的头像 发表于 08-29 15:39 799次阅读

    澎峰科技完成OpenAI最新开源推理模型适配

    澎峰科技现已完成 OpenAI 最新开源推理模型 gpt-oss-20b 在 DeepFusion 大模型一体机上的原生适配与优化,用户可一键启用这颗“小而强悍”的新引擎,在本地享受企业级 AI 生产力!
    的头像 发表于 08-14 11:34 1146次阅读

    OpenAI与NVIDIA共同开发全新开放模型

    NVIDIA 为 gpt-oss-120b 带来业界领先性能,在单个 NVIDIA Blackwell 系统上实现每秒 150 万个 Token。
    的头像 发表于 08-12 15:11 1229次阅读

    亚马逊云科技现已上线OpenAI开放权重模型

    开放权重模型,向数百万亚马逊云科技客户开放。 客户可利用这些全新开放权重模型的先进推理能力,支持Agentic工作流、代码生成、科学分析和数
    的头像 发表于 08-06 19:29 668次阅读

    翼辉信息推出全新开发环境RealEvo-Stream

    翼辉信息推出全新开发环境—— RealEvo-Stream。全面融合云与 AI 能力,基于 VSCode 插件即可快速上手开发 SylixOS 应用。支持 Windows、Linux 及 macOS
    的头像 发表于 06-18 15:06 976次阅读
    翼辉信息<b class='flag-5'>推出</b><b class='flag-5'>全新开</b>发环境RealEvo-Stream

    十二相同步发电机降等效模型研究

    摘要:十二相同步发电机整流系统能够提供高品质直流电能,但是发电机模型复杂,解析分析困难。为此,推导了十二相整流发电机的等效三相降模型和状态空间平均模型,简化了
    发表于 06-17 08:59

    数据标注与大模型的双向赋能:效率性能的跃升

    其自动化能力,反过来推动数据标注效率实现数倍增长,开启人工智能发展的全新篇章。一、数据标注大模型性能的基石大模型
    的头像 发表于 06-04 17:15 1641次阅读
    数据标注与大<b class='flag-5'>模型</b>的双向赋能:<b class='flag-5'>效率</b>与<b class='flag-5'>性能</b>的跃升

    谷歌 Gemini 2.0 Flash 系列 AI 模型上新

    版震撼登场,同时在 Gemini App 中推出推理模型 Gemini 2.0 Flash Thinking 实验版。 此次推出模型各具亮点。性能
    的头像 发表于 02-07 15:07 1081次阅读

    Traco Power推出全新TXO系列开放式框架AC/DC电源

    在工业领域,电源设备的稳定性和可靠性至关重要。Traco Power全新推出的TXO系列开放式框架AC/DC电源,以高效率、强化隔离和多功能性,为成本敏感型工业应用提供了理想的解决方案
    的头像 发表于 01-15 16:12 1833次阅读
    Traco Power<b class='flag-5'>推出</b><b class='flag-5'>全新</b>TXO系列<b class='flag-5'>开放</b>式框架AC/DC电源

    NVIDIA推出开放式Llama Nemotron系列模型

    作为 NVIDIA NIM 微服务,开放式 Llama Nemotron 大语言模型和 Cosmos Nemotron 视觉语言模型可在任何加速系统上为 AI 智能体提供强效助力。
    的头像 发表于 01-09 11:11 1180次阅读

    谷歌发布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名为“深度研究”的新特性,旨在为用户提供更加全面和深入的复杂主题探索与报告撰写辅助。 Gemini 2.0通过高级推理和长上
    的头像 发表于 12-12 10:13 966次阅读