0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌推出TranslateGemma全新开放翻译模型系列

谷歌开发者 来源:谷歌开发者 作者:谷歌开发者 2026-02-26 10:22 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者 / 资深研究科学家David Vilar,产品经理Kat Black

我们已正式推出 TranslateGemma,这一全新的开放翻译模型系列基于 Gemma 3 构建,并提供 4B、12B 和 27B 三种参数规模。TranslateGemma 的问世标志着开放翻译领域迈出了重要一步,它可帮助人们跨越 55 种语言进行交流,无论身在何处或使用何种设备均可轻松实现。

我们将最先进的大模型相关知识提炼到紧凑的高性能开放模型中,由此打造出了这套效率与质量兼备的模型。

性能表现胜于其规模两倍的模型

在我们的技术评估中,最引人注目的一项发现是这些模型的效率。得益于专项训练流程,TranslateGemma 12B 模型在 WMT24++ 基准测试中的表现远超 Gemma 3 27B 基准模型 (基于 MetricX 指标衡量)。

对于开发者而言,这是一项重大突破。仅需不到基准模型一半的参数量,即可实现高保真级的翻译质量。这项效率突破可在不影响准确率的前提下,显著提高吞吐量并降低延迟。同样地,4B 模型的性能可与规模较大的 12B 基准模型的性能相媲美,这也使其成为适合移动端推理的强大模型。

我们基于 WMT24++ 数据集对 TranslateGemma 进行了全面评估。该数据集包含 55 种语言,涵盖多种语系,高资源、中资源和低资源语言应有尽有。与 Gemma 基准模型相比,TranslateGemma 在所有语言中均可大幅降低错误率,并能以更高效率实现更高质量。

基于 Gemini 构建

这种智能密度究竟是如何实现的?这要归功于一套独特的两阶段微调过程,此过程将 Gemini 模型的 "直觉" 提炼到一个开放架构当中。

监督微调 (SFT): 我们在一个多样化的平行数据数据集上对 Gemma 3 基准模型进行了微调。此数据集包含大量人工翻译文本,并结合由最先进的 Gemini 模型生成的高质量合成翻译,即使在低资源语言中也能实现广泛的语言覆盖率和高保真度。

强化学习 (RL): 为了进一步优化翻译质量,我们引入了一个新颖的强化学习阶段。我们使用包含 MetricX-QE 和 AutoMQM 等高级指标在内的多种奖励模型,来引导模型产生更符合语境且听起来更自然的翻译。

前所未有的语言覆盖率

我们对 TranslateGemma 在 55 个语言对上进行了严格的训练和评估,以确保它能在主要语言 (如西班牙语、法语、中文和印地语) 以及多种低资源语言中均提供高质量的可靠性能。

除了这些核心语言外,我们还通过针对近 500 个其他语言对进行训练来突破极限。TranslateGemma 的设计定位是成为深度优化的坚实基础,使其成为研究人员针对特定语言对微调其前沿模型,或提升低资源语言翻译质量的理想起点。虽然我们尚未确认此扩展集合的评估指标,但我们已将完整列表纳入技术报告,以此鼓励社区进行探索和深度研究。

强大的多模态能力

TranslateGemma 模型延续了 Gemma 3 强大的多模态功能。我们根据 Vistra 图像翻译基准执行的测试表明,文本翻译能力的提升也会对图像内文本的翻译能力产生积极影响,即使在 TranslateGemma 训练过程中未进行特定的多模态微调亦是如此。

全场景灵活部署

TranslateGemma 为开放翻译模型树立了全新标准,并在最优性能与卓越效率之间取得平衡。这些模型专为多样化的部署环境而设计,还有三种规模任您选择:

4B 模型: 针对移动端和边缘部署进行了优化。

12B 模型: 设计为可在消费级笔记本电脑上流畅运行,为本地开发环境带来研究级的强大性能。

27B 模型: 旨在提供最大保真度,能够在云端的单个 H100 GPU 或 TPU 上运行。

即刻体验 TranslateGemma

TranslateGemma 版本的发布为研究人员和开发者提供了功能强大且适配灵活的工具,以满足各种翻译相关任务的需求。我们期待看到社区在这些模型的基础上进行构建并加以利用,共同打破语言障碍并促进跨文化深度理解。具体试用方式如下:

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6264

    浏览量

    112156
  • 开源
    +关注

    关注

    3

    文章

    4414

    浏览量

    46558
  • 模型
    +关注

    关注

    1

    文章

    3861

    浏览量

    52322

原文标题:TranslateGemma: 全新开放翻译模型系列,助您实现高效的多模态翻译

文章出处:【微信号:Google_Developers,微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Google正式推出新开放模型Gemma 4

    今天,我们正式推出 Gemma 4 —— 这是我们迄今为止最智能的开放模型。Gemma 4 专为高级推理和智能体 (Agentic) 工作流而设计,实现了单位参数下前所未有的智能水平。这一突破性进展
    的头像 发表于 04-08 10:06 682次阅读
    Google正式<b class='flag-5'>推出</b>最<b class='flag-5'>新开放</b><b class='flag-5'>模型</b>Gemma 4

    NVIDIA 扩展开放模型系列,推动代理式、物理和医疗 AI 下一阶段发展

    NVIDIA BioNeMo 平台的一部分,Proteina-Complexa 模型可加速蛋白质药物研发——同时推出全新开放数据集,包含数百万条由 AI 预测的蛋白质复合物结构数据,该数据集由 NVIDIA、
    的头像 发表于 03-17 09:18 605次阅读
    NVIDIA 扩展<b class='flag-5'>开放</b><b class='flag-5'>模型</b><b class='flag-5'>系列</b>,推动代理式、物理和医疗 AI 下一阶段发展

    NVIDIA推出代理式AI蓝图与电信推理模型

    借助全新开源大型电信模型与 NVIDIA Blueprint,电信运营商能够利用自有数据训练 AI 智能体,构建自主网络。
    的头像 发表于 03-06 17:37 3152次阅读

    月之暗面全新开源旗舰模型Kimi K2.5上线模力方舟

    模力方舟平台现已上线来自月之暗面(Moonshot AI)发布的全新开源旗舰模型Kimi K2.5。
    的头像 发表于 01-29 10:20 1344次阅读
    月之暗面<b class='flag-5'>全新开</b>源旗舰<b class='flag-5'>模型</b>Kimi K2.5上线模力方舟

    谷歌正式推出Gemini 3 Flash模型

    我们正式推出了 Gemini 3 Flash,这是以较低成本打造的高效前沿智能,成功地进一步扩展了 Gemini 3 模型系列
    的头像 发表于 01-22 16:04 826次阅读

    NVIDIA在CES 2026发布全新开放模型、数据和工具

    为扩展开放模型生态,NVIDIA 发布全新开放模型、数据和工具,推动各行业 AI 技术的发展。
    的头像 发表于 01-09 10:42 808次阅读

    深入解析NVIDIA Nemotron 3系列开放模型

    这一全新开放模型系列引入了开放的混合 Mamba-Transformer MoE 架构,使多智能体系统能够进行快速长上下文推理。
    的头像 发表于 12-24 10:34 4442次阅读
    深入解析NVIDIA Nemotron 3<b class='flag-5'>系列</b><b class='flag-5'>开放</b><b class='flag-5'>模型</b>

    NVIDIA 推出 Nemotron 3 系列开放模型

    新闻摘要: ● Nemotron 3 系列开放模型包含 Nano、Super 和 Ultra 三种规模,具有极高的效率和领先的精度,适用于代理式 AI 应用开发。 ● Nemotron 3 Nano
    的头像 发表于 12-16 09:27 907次阅读
    NVIDIA <b class='flag-5'>推出</b> Nemotron 3 <b class='flag-5'>系列</b><b class='flag-5'>开放</b><b class='flag-5'>模型</b>

    NVIDIA携手Mistral AI发布全新开源大语言模型系列

    全新 Mistral 3 系列涵盖从前沿级到紧凑型模型,针对 NVIDIA 平台进行了优化,助力 Mistral AI 实现云到边缘分布式智能愿景。
    的头像 发表于 12-13 09:58 1568次阅读

    面向科学仿真的开放模型系列NVIDIA Apollo正式发布

    用于加速工业和计算工程的开放模型系列 NVIDIA Apollo 于近日举行的 SC25 大会上正式发布。
    的头像 发表于 11-25 11:15 7.4w次阅读

    NVIDIA推出面向语言、机器人和生物学的全新开源AI技术

    NVIDIA 秉持对开源的长期承诺,推出了面向语言、机器人和生物学的全新开源 AI 技术,为构建开源生态系统做出贡献,扩展 AI 的普及并推动创新。NVIDIA 正将这些模型、数据和训练框架贡献给 Hugging Face,让
    的头像 发表于 11-06 11:49 1374次阅读

    腾讯地图推出全新时空智能开放平台“盖亚”

    2025年9月17日,在2025腾讯全球数字生态大会上,腾讯地图正式推出全新时空智能开放平台“盖亚”(GAIA,Geospatial Artificial Intelligence Atlas
    的头像 发表于 09-18 10:26 2313次阅读

    谷歌推出AI模型Gemma 3 270M

    过去几个月,Gemma 开放模型系列的发展是激动人心的。我们推出了 Gemma 3 和 Gemma 3 QAT,为单一云端和桌面加速器带来了最先进的性能。
    的头像 发表于 09-11 15:09 1389次阅读

    2025联想创新开放日正式开启

    今天,以“创新ING 热AI进行时”为主题的联想2025创新开放日正式开启,全面呈现联想集团在“人工智能+”方面的布局与落地成果。
    的头像 发表于 08-29 15:39 1214次阅读

    亚马逊云科技现已上线OpenAI开放权重模型

    开放权重模型,向数百万亚马逊云科技客户开放。 客户可利用这些全新开放权重模型的先进推理能力,支持Agentic工作流、代码生成、科学分析和数
    的头像 发表于 08-06 19:29 1006次阅读