0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

借助谷歌FunctionGemma模型构建下一代端侧智能体

谷歌开发者 来源:谷歌开发者 2026-01-20 09:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者 / 代表 Gemma 和 ODML 团队的产品经理 Kat Black,研究工程师 Ravin Kumar

对于 Gemma 模型系列而言,2025 年是充满变革的一年。我们的下载量已从 1 亿次增长到超过 3 亿次,同时还展现了开放模型的变革潜力: 从凭借Gemma 3定义最先进的单加速器性能,到通过C2S Scale 计划推动癌症研究,皆是最佳佐证。

自Gemma 3 270M模型发布以来,我们收到开发者最迫切的需求就是原生函数调用功能。我们认真听取了这一反馈,意识到随着行业从纯粹的对话式交互向主动智能体转变,模型不能仅局限于对话,更需要具备执行能力。这在设备端尤为重要,因为智能体可以自动执行复杂的多步骤工作流程,例如设置提醒或切换系统设置。若要在边缘端实现这一点,模型必须足够轻量级以支持本地运行,同时还要具备足够的专业性以确保可靠性。

现在,我们正式推出了 FunctionGemma,这是针对函数调用而特别优化的 Gemma 3 270M 模型版本。它旨在为进一步训练定制化、快速、私密且本地运行的智能体奠定坚实的基础,从而将自然语言翻译成可执行的 API 操作。

FunctionGemma 可以作为完全独立的智能体,处理私密的离线任务,也可以作为大型互联系统的智能分流器。在此模式下,它能够在边缘端即时处理常见指令,同时将更复杂的任务调度至 Gemma 3 27B 等模型进行处理。

FunctionGemma 的独特之处

执行与对话合二为一: FunctionGemma 既能与计算机 "对话",也能与人类交流。它可以生成结构化的函数调用来执行工具,然后切换到相应模式,用自然语言为用户汇总结果。

为定制化而生: FunctionGemma 的设计理念在于按需塑造,而不仅仅是依靠提示驱动。在我们的 "Mobile Actions" 评估中,微调提升了模型的可靠性,将准确率从 58% 的基准线提高到 85%。这证实了对于边缘端智能体而言,经过专门训练的专家模型是实现生产级性能的高效捷径。

专为边缘计算设计: 该模型体积小巧,足以在NVIDIA Jetson Nano等边缘设备和手机上运行,FunctionGemma 使用了 Gemma 的 25.6 万词表,能够高效地对 JSON 与多语言输入进行分词处理。这使得它成为在特定领域微调的强大基础,通过缩短序列长度来确保极致的低延迟表现,并确保用户隐私。

广泛的生态系统支持: 该模型可无缝融入整个工作流中常用的工具: 可以使用Hugging Face Transformers、Unsloth、Keras 或NVIDIA NeMo进行微调,并使用LiteRT-LM、vLLM、MLX、Llama.cpp、Ollama、Vertex AI或LM Studio进行部署。

361eb7b6-f1fe-11f0-92de-92fbcf53809c.png

△ FunctionGemma 在 "Mobile Actions" 数据集上的准确率变化,基于预留评估集上微调前后的对比。

选择 FunctionGemma 的时机

FunctionGemma 是自然语言与软件执行之间的桥梁。在以下情境,FunctionGemma 是您的不二之选:

您有明确定义的 API 接口范围: 您的应用具备一套既定的功能操作 (例如智能家居、多媒体、导航等)。

您已准备好进行微调: 您需要的是通过对特定数据进行微调所带来的高度一致性与确定性,而不是零样本提示带来的不确定性。

您优先考虑 "本地优先" 的部署方式: 您的应用需要近乎即时的响应延迟与完全的数据隐私保护,并且能够在边缘设备的计算与电池限制下高效运行。

您正在构建复合系统: 您需要一个轻量级的边缘模型来处理本地操作,使您的系统能够在设备端即时处理常见指令,并且仅在遇到更复杂任务时才会调用更大规模的模型 (如 Gemma 3 27B)。

如何体验 FunctionGemma 的实际效果

让我们看看这些模型如何重塑真实的用户体验。您可以通过Google AI Edge Gallery 应用中的两种不同体验来探索它的能力: 一个互动游戏和一个开发者挑战。

Mobile Actions 微调

这个演示重新构想了助理交互的形式,使其成为完全离线的能力。无论是 "为明天的午餐创建一个日程"、"将 John 添加到我的联系人" 还是 "打开手电筒",该模型都能解析自然语言并识别正确的操作系统工具来执行命令。要解锁这个智能体,您可以使用我们的微调操作手册来构建模型,并将其部署到自己的移动设备上。

TinyGarden 游戏演示

在这个互动小游戏中,玩家使用语音指令来经营一块虚拟土地。例如,您可以说 "在最上面一排种向日葵并浇水",模型会将此指令分解为具体的应用函数,比如 "种植作物 (plantCrop)" 或 "给作物浇水 (waterCrop)",并针对特定的网格坐标进行操作。这证明,270M 模型能够在手机上处理多轮逻辑,驱动自定义游戏机制,而无需连接服务器。

FunctionGemma Physics Playground

使用自然语言交互来解决有趣的物理模拟谜题吧!这个游戏完全在您的浏览器中本地运行,由 FunctionGemma 和 Transformers.js 提供支持!

致谢: @xenovacom (来自 X)

如何立即体验 FunctionGemma

我们正从 "聊天机器人时代" 迈向 "行动时代"。有了 FunctionGemma,这种强大的能力便触手可及。

下载: 前往Hugging Face或Kaggle获取模型。

学习: 阅读相关指南,了解函数调用模板、如何将模型与函数响应序列化以及微调指南。

探索: 下载新版Google AI Edge Gallery,体验相关演示。

构建: 通过Colab Notebook和配套数据集,使用 Mobile Actions指南训练您的专属智能体。

部署: 使用LiteRT-LM轻松将模型部署到移动设备,或将其接入 Vertex AI 或 NVIDIA RTX PRO、DGX Spark 等设备,与更大的模型搭配使用。

我们迫不及待地想看到,您将如何在设备上开启独特、私密且极致响应的全新体验。也欢迎您持续关注 "谷歌开发者" 微信公众号,及时了解更多开发技术和产品更新等资讯动态。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3810

    浏览量

    52253
  • 智能体
    +关注

    关注

    1

    文章

    551

    浏览量

    11642

原文标题:从 "对话" 迈向 "行动": 利用 FunctionGemma 打造下一代端侧智能体

文章出处:【微信号:Google_Developers,微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Kapsch TrafficCom借助TomTom Traffic打造下一代智能出行产品

    TomTom,地图与定位技术领域的专家,今天宣布全球交通管理和收费站解决方案领导者 Kapsch TrafficCom(KTCG)已选用 TomTom Traffic 来为其下一代智能出行产品提供
    的头像 发表于 04-01 15:26 371次阅读

    【2025夏季班正课】大模型Agent智能开发实战 课分享

    关键环,通过在输入与输出植入基于规则或小模型的过滤机制,确保智能在极端情况下依然能够保持
    发表于 03-29 16:12

    NVIDIA开放模型助力构建下一代数字健康智能

    NVIDIA Nemotron 系列开放模型和 NVIDIA NeMo 库正在为临床医生、研究人员和开发者提供开放权重和方法,使他们能够在自有的基础设施上构建和部署定制化的数字健康智能
    的头像 发表于 03-25 09:46 381次阅读

    理想汽车发布下一代自动驾驶基础模型MindVLA-o1

    2026年3月17日,理想汽车基座模型负责人詹锟出席NVIDIA GTC 2026,发表主题演讲《MindVLA-o1:开启全能范式——下一代视觉-语言-动作自动驾驶大模型探索》,
    的头像 发表于 03-18 11:51 1464次阅读
    理想汽车发布<b class='flag-5'>下一代</b>自动驾驶基础<b class='flag-5'>模型</b>MindVLA-o1

    理想汽车发布模型软硬协同设计定律

    近日,理想汽车联合国创决策智能技术研究所正式发布模型“软硬协同设计定律”,提出面向车载与边缘场景的大模型软硬
    的头像 发表于 03-04 16:00 888次阅读
    理想汽车发布<b class='flag-5'>端</b><b class='flag-5'>侧</b>大<b class='flag-5'>模型</b>软硬协同设计定律

    软通动力基于OpenClaw开源框架深度自研智能平台

    为核心能力,原生搭载软通天机OS,构建起“OpenClaw生态+智能+天机OS+终端硬件”一体化的全栈
    的头像 发表于 02-27 11:48 840次阅读

    解锁谷歌FunctionGemma模型的无限潜力

    智能 AI 领域,工具调用能力是将自然语言转化为可执行软件操作的关键。此前,我们发布了专门针对函数调用而特别优化的 Gemma 3 270M 模型版本 FunctionGemma
    的头像 发表于 02-04 11:30 427次阅读
    解锁<b class='flag-5'>谷歌</b><b class='flag-5'>FunctionGemma</b><b class='flag-5'>模型</b>的无限潜力

    借助谷歌LiteRT构建下一代高性能AI

    ) 框架。虽然 TFLite 为传统机器学习设定了标准,但我们的使命是让开发者能够像过去集成传统机器学习样,无缝地在设备
    的头像 发表于 01-30 11:23 3090次阅读
    <b class='flag-5'>借助</b><b class='flag-5'>谷歌</b>LiteRT<b class='flag-5'>构建</b><b class='flag-5'>下一代</b>高性能<b class='flag-5'>端</b><b class='flag-5'>侧</b>AI

    晶晨携手谷歌,助力模型Gemini的硬件落地

    电子发烧友网报道 在科技飞速发展的当下,智能技术正以前所未有的速度渗透到各个领域。1月28日,晶晨股份透露,公司与谷歌有着长达十余年的深度合作基础。作为
    的头像 发表于 01-29 10:44 2361次阅读

    模型上车:从“语音助手”到“车内 AI 智能”的跃迁革命

    2025年,智能汽车的座舱不再只是“语音助手”的舞台,而是个搭载生成式AI和大语言模型(LLM)的智能。从云端示范到车内落地,这
    的头像 发表于 01-13 09:10 686次阅读

    高算力、低功耗!下一代AI芯片排队进场

    电子发烧友网报道(文/李弯弯)随着人工智能技术的飞速发展,AI正成为推动智能硬件变革的核心动力。在汽车、机器人、AI眼镜、可穿戴设备等多个领域,具备本地化大
    的头像 发表于 12-12 08:58 9884次阅读

    AI眼镜或成为下一代手机?谷歌、苹果等巨头扎堆布局

    近年来,AI智能眼镜赛道迎来爆发式增长。谷歌、苹果、Meta、亚马逊等科技巨头纷纷加快布局,将AI眼镜视为下一代人机交互的关键入口。从消费级产品到行业专用设备,多样化的AI眼镜正逐步走入现实,甚至业内预测:AI眼镜或将替代
    的头像 发表于 11-05 17:44 912次阅读

    广和通发布情感对话大模型FiboEmo-LLM

    9月,广和通正式发布自主研发的情感对话大模型FiboEmo-LLM。该模型专注于情感计算与自然语言交互融合,致力于为AI玩具、智能陪伴设
    的头像 发表于 09-26 13:37 2011次阅读

    德赛西威模型重塑智能座舱体验

    智能汽车产业发展正从规模扩张向质量跃升转变,其中大模型驱动的智能化升级将成为产业突破的核心引擎。在日前召开的2025上海车展国际汽车关键技术论坛上,德赛西威技术中心人工智能实验室专家张
    的头像 发表于 05-15 09:13 1908次阅读

    英特尔与面壁智能宣布建立战略合作伙伴关系,共同研发端原生智能座舱,定义下一代车载AI

    今日,英特尔与面壁智能签署合作备忘录。双方宣布达成战略级合作伙伴关系,旨在打造端原生智能座舱,定义下一代车载AI。目前,双方已合作推出“英特尔&面壁
    的头像 发表于 04-23 21:46 1321次阅读
    英特尔与面壁<b class='flag-5'>智能</b>宣布建立战略合作伙伴关系,共同研发端<b class='flag-5'>侧</b>原生<b class='flag-5'>智能</b>座舱,定义<b class='flag-5'>下一代</b>车载AI