0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌Pixel Recorder应用用户参与度显著提升

谷歌开发者 来源: Android 开发者 2024-11-15 13:46 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者 / 开发者关系工程师 Terence Zhang 和产品经理 Kristi Bradford

Google Pixel 的 Recorder 应用允许用户录制、转录、保存和共享音频。为了让用户更轻松地管理和回顾自己的录音,Recorder 的开发者将目光锁定在功能强大的设备端大语言模型 (LLM) Gemini Nano 上。这一集成引入了 AI 驱动的音频摘要功能,帮助用户更轻松地找到所需的录音并快速掌握内容要点。

近期,随着引入新的多模态模型,Gemini Nano 实力大增。Recorder 应用已经在利用此升级来提炼更长的录音,并提升了对语法和细节的处理能力。

使用设备端 AI 满足用户需求

Recorder 的开发者最初尝试了基于云端的解决方案,在性能和质量方面取得了卓越的成果。然而,为了优先考虑用户的无障碍和隐私需求,他们转而寻求一种设备端解决方案。Gemini Nano 提供了一个绝佳机会,可以提供用户所需的简洁音频摘要,与此同时还能保持在设备端进行数据处理。

Gemini Nano 是 Google 为设备端任务打造的最高效的模型。Pixel essential 应用产品经理 Kristi Bradford 表示: "在设备端集成 LLM 对用户有很多好处,能为用户提供更高隐私性、更低延迟,而且由于不需要网络,用户在任何地方都能使用。"

为了取得更好的效果,Recorder 还使用与其用例相匹配的数据对模型进行了微调。开发者采用低秩适应 (LoRA) 技术进行微调,从而让 Gemini Nano 能够稳定地输出包含相关发言人姓名、内容要点和主题在内的三点描述。

AICore 是一种 Android 系统服务,可集中管理 LLM 的运行时、交付和关键安全组件,大幅简化了 Recorder 对 Gemini Nano 的使用。借助用于运行 GenAI 工作负载的开发者 SDK,开发团队仅依靠四名开发者,在短短四个月内便开发了转录摘要功能。而这样的效率,正是由于无需维护内部模型所实现的。

自 Recorder 发布以来,用户平均每天使用 2 到 5 次新的 AI 摘要功能,保存的录音总数增加了 24%。这一功能显著提高了应用的总体参与度和用户留存率。Recorder 团队还指出,用户对新功能给予了正面反馈,许多用户表示新的 AI 摘要功能为他们节省了大量时间。

下一项重大进展:

多模态 Gemini Nano

Recorder 的开发者还采用了最新的 Gemini Nano 模型,即多模态 Gemini Nano,以进一步改进该应用在 Pixel 9 设备上的摘要功能。新模型比 Pixel 8 设备上的旧模型大很多,而且功能更强大、结果更准确、扩展能力更出色。新模型还扩展了令牌 (token) 支持,让 Recorder 可以提炼比以前更长的转录文本。

将 Gemini Nano 与多模态集成需要再进行一轮微调。不过,Recorder 的开发者得以利用原始 Gemini Nano 模型的微调数据集作为基础,从而简化了开发过程。

为了充分发挥新模型的功能,Recorder 开发者扩大了数据集,支持更长的录音,实施了完善的评估方法,并建立了侧重于语法和细节的发布标准指标。将语法作为评估推理质量的新指标,完全得益于多模态 Gemini Nano 的增强功能。

使用设备上的 AI 实现更多功能

Kristi 表示:"生成式 AI 是一项新的功能,整个团队都在学习使用它的过程中收获了乐趣。现在,我们有能力在满足用户新需求和把握新机遇的同时,突破极限。生成式 AI 确实为解决问题和开展实验带来了全新的创造力。我们已经演示了至少两项生成式 AI 功能,它们可以帮助人们在公司内部节省时间,以获得早期反馈。我们很期待看到未来的更多可能性。"

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Google
    +关注

    关注

    5

    文章

    1801

    浏览量

    60266
  • Gemini
    +关注

    关注

    0

    文章

    73

    浏览量

    8108
  • 模型
    +关注

    关注

    1

    文章

    3649

    浏览量

    51713
  • Pixel
    +关注

    关注

    1

    文章

    238

    浏览量

    10945

原文标题:Pixel 的 Recorder 应用通过 Gemini Nano 将用户参与度显著提升了 24%

文章出处:【微信号:Google_Developers,微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    在Google Pixel 10上“听诊”蓝牙信道?开源安卓应用实测揭秘

    2025年8月28日迎来转机——谷歌发布了首款支持信道探测技术的Pixel 10手机,预计后续将有更多机型跟进。 今日,适用于Android的nRF Toolbox 应用迎来重大更新,新增信道探测功能,为您
    发表于 11-30 21:09

    AppTest邀请测试---邀请用户参与测试

    测试版本发布,且到达测试时间后,您便可以邀请用户参与测试。AGC提供了多种邀请方式通过邮件或短信邀请用户:测试任务开始,被邀请的用户会收到邮件或短信通知,
    发表于 10-09 10:47

    system view 不能recorder是怎么回事?

    点击recorder按钮弹出下面对话框,不晓得配置问题还是操作问题
    发表于 09-22 06:02

    京东:调用用户画像API实现千人千面推荐,提升转化率

    ​  引言 在电商领域,个性化推荐已成为提升用户粘性和转化率的核心引擎。京东通过深度整合用户画像API,实现了"千人千面"的精准推荐系统。本文将解析其技术逻辑与业务价值,揭示如何通过数据驱动
    的头像 发表于 09-12 15:08 602次阅读
    京东:调<b class='flag-5'>用用户</b>画像API实现千人千面推荐,<b class='flag-5'>提升</b>转化率

    苏宁易购 API 接口:苏宁易购平台促销活动用户参与分析

    ​ 在电商平台的激烈竞争中,促销活动是提升用户粘性和销售转化的核心策略。苏宁易购作为中国领先的零售平台,其API接口为开发者提供了高效的数据访问能力,助力深度分析用户参与
    的头像 发表于 09-01 17:15 495次阅读
    苏宁易购 API 接口:苏宁易购平台促销活动<b class='flag-5'>用户</b><b class='flag-5'>参与</b><b class='flag-5'>度</b>分析

    利用API提升电商用户体验:个性化推荐系统

    的推荐算法,实时为用户提供精准的购物建议。本文将逐步解析如何利用API构建个性化推荐系统,提升用户体验。 1. 个性化推荐系统概述 个性化推荐系统通过分析用户行为数据(如浏览历史、购买
    的头像 发表于 07-14 14:45 380次阅读
    利用API<b class='flag-5'>提升</b>电商<b class='flag-5'>用户</b>体验:个性化推荐系统

    5G网络中,信令测试仪如何帮助提升用户体验?

    在5G网络中,信令测试仪通过全面、深入地测试和分析信令流程,为提升用户体验提供了有力支持。具体来说,信令测试仪在以下几个方面发挥着关键作用:一、高效诊断和优化网络性能 实时捕捉和分析信令信息: 信
    发表于 03-21 14:33

    小程序开发必须知道的5个技巧:提升效率与用户体验的权威指南

    。研究表明,界面简洁的小程序用户留存率可提升30%。 界面简洁化:避免功能堆砌,聚焦核心需求。例如餐饮类小程序应突出点餐与菜单功能,而非冗余的社交模块。 加载速度优化:采用懒加载策略,减少首屏资源体积,每
    发表于 03-14 14:51

    谷歌AI智能体执行复杂任务能力大幅提升

    自然语言描述任务,随后由AI智能体代替用户执行并最终完成任务,极大地提升工作效率和便捷性。 为了推进这一技术的实现,谷歌正在积极开发两个相关项目。其中备受瞩目的是名为“Mariner”的浏览器扩展程序。通过该程序,AI智能体能够
    的头像 发表于 02-17 14:39 992次阅读

    DeepSeek用户量超越谷歌Gemini

    在聊天AI领域的竞争中,中国AI产品DeepSeek展现出了强劲的增长势头。据最新数据显示,1月底,DeepSeek的用户量已经成功超越了谷歌的Gemini。 具体来看,1月31日这一天
    的头像 发表于 02-07 14:59 785次阅读

    Android16 Beta 1来袭,谷歌Pixel 6用户抢先体验

    近日,Android操作系统迎来重大更新,Android 16 Beta 1正式发布,版本号为BP22.250103.008。 目前,谷歌Pixel 6及更新机型的用户已可检查OTA更新。 根据
    的头像 发表于 01-24 10:36 1450次阅读

    苹果为谷歌支付数十亿美元辩护,参与搜索案反垄断审判

    近日,苹果公司已正式要求参与谷歌即将在美国举行的在线搜索反垄断审判,此举旨在为其与谷歌之间的收入分成协议进行辩护。该协议使得谷歌成为Safari浏览器的默认搜索引擎,而
    的头像 发表于 12-26 10:41 716次阅读

    TMS320C3x通用应用用户指南

    电子发烧友网站提供《TMS320C3x通用应用用户指南.pdf》资料免费下载
    发表于 12-24 16:18 1次下载
    TMS320C3x通用应<b class='flag-5'>用用户</b>指南

    Meta发布新AI模型Meta Motivo,旨在提升元宇宙体验

    Meta公司近日宣布,将推出一款名为Meta Motivo的全新人工智能模型。该模型具备控制类似人类的数字代理动作的能力,有望为元宇宙的用户体验带来显著提升。 Meta Motivo的发布,标志着
    的头像 发表于 12-16 10:34 1351次阅读

    谷歌正式发布Gemini 2.0 性能提升近两倍

    在智能体时代,谷歌再次引领技术潮流,正式发布了其最新力作——Gemini 2.0。这款AI模型不仅在性能上实现了显著提升,更是在多模态表现和原生工具应用方面展现了前所未有的强大功能。 Gemini
    的头像 发表于 12-12 14:22 1117次阅读