0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

CastFox利用Google开放模型Gemma 3n重塑播客互动体验

谷歌开发者 来源:谷歌开发者 2026-02-09 14:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Guru Network Limited 是一家全球化的娱乐与游戏公司,其开发的 CastFox 彻底改变了用户与播客的交互方式,应用上线仅 3 周下载量就突破 100 万次。

通过将传统的被动长音频转化为互动式知识库,CastFox 意在打造比简单播放更丰富的体验。为了达成这一目标,CastFox 工程团队需要一个高效稳健的 AI 模型来支撑其语义检索、智能亮点提取和节目内聊天功能。基于初创团队的预算考量,他们果断选择 Gemma 3n 作为这些核心功能的技术引擎,从而快速推进自身愿景的规模化进程。

面临的挑战

CastFox 团队的目标是重塑播客体验,从孤立的单集式收听转变为更丰富的主题式探索。这意味着,用户可以在应用的播客目录中基于语义概念 (而不仅是关键词) 进行搜索,先快速生成主题概览再深入收听完整剧集,甚至可以与音频内容本身进行交互对话。

为将这一愿景转化为现实,团队需要一种兼具可扩展性与经济高效的方式来处理海量的英语、日语和韩语音频。这种处理能力对于摘要、亮点和问答的生成至关重要,而这些正是驱动应用核心功能的基石。早期测试表明,许多基于 API 的模型要么在面对大规模需求时成本过高,要么缺乏团队特定多语言用例所需的灵活性。

解决方案

在评估了 GPT 和 Claude 等大规模专有模型以及 Whisper 流水线后,CastFox 开发者最终选择了 Gemma 3n E4B,因为它达到了精确度、速度和性价比这三者的最佳平衡。Gemma 能够处理多语言内容并可靠地返回 JSON 等结构化输出,这是赢得团队青睐的关键。另外,它的开放也是一个强大优势: 由于该模型成本低且易于自托管,开发者可以快速构建原型并持续优化。Guru Network Limited 的 AI 负责人吴充表示: "Gemma 成本低且易于部署,助力团队实现了快速迭代与低成本规模化。这是真实场景下 AI 集成的理想切入点。"

该团队在轻量级 GPUCPU 基础设施上使用 Ollama 运行 Gemma 3n,这种架构有效规避了模型再训练的高成本与复杂性。开发者发现,他们无需微调模型,仅通过提示工程和轻量级后处理 (例如验证 JSON 架构和平滑处理时间戳),就能实现高精度结果。

Guru Network Limited 的 AI 负责人吴充:“Gemma 3n 高效、开放并且在多语言环境下表现卓越,是初创公司构建 AI 富集型应用的理想之选。”

如今,这一架构支撑起了 CastFox 的整个音频理解后端。在预处理期间,系统首先对节目音频进行转录,随后解析文本并生成摘要、自动分段和候选问答,所有这些内容都存储为 JSON 格式,以备日后检索。这样,Gemma 3n 就成为 CastFox 语义搜索和交互功能的幕后核心引擎。吴充表示: "AI 让我们能够将播客等被动的媒体转变为主动学习的体验。如果没有它,CastFox 将仅仅是一个普通的播客播放器。"

影响

Gemma 3n 在英语、韩语和日语方面均展现出稳定和准确的理解能力,同时兼顾了高效的处理速度: 处理 30 秒的音频片段大约需要 40 秒,处理 300-400 个字符的文本摘要大约需要 6 秒,从长文本中生成推荐问题大约需要 12 秒。

Guru Network Limited 的 AI 负责人吴充:“Gemma 3n 不仅具备强大的英语、韩语和日语理解能力,而且响应能力快速稳定。一款紧凑型模型能达到这种水平,确实令人赞叹。”

这种自托管的方法同时实现了极高的成本效益。每个请求的成本只有大约 0.0007 美元,因此团队可以轻松地大规模处理内容。为此,他们在 AWS Spot 实例上使用可抢占容量运行预处理,而不是使用更昂贵的预留节点,从而将日均处理成本降至仅 10 美元左右。

用户对 AI 功能的参与度很高,无论是出色的留存率指标,还是强调 "与播客聊天" 功能的用户好评,都有力地证实了这一点。在 Gemma 的支持下,CastFox 上线仅 3 周下载量就突破 100 万次,成功吸引了一批高度活跃且粘性极强的用户群体。

吴充认为结果不言而喻: "Gemma 3n 证明了小规模开放模型也能产生切实影响力。"

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Google
    +关注

    关注

    5

    文章

    1819

    浏览量

    60693
  • AI
    AI
    +关注

    关注

    91

    文章

    41972

    浏览量

    303061
  • 模型
    +关注

    关注

    1

    文章

    3873

    浏览量

    52337

原文标题:CastFox 利用 Google 开放模型 Gemma 3n 重塑播客互动体验

文章出处:【微信号:Google_Developers,微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    GoogleGemma 4系列发布MTP草稿模型

    上个月,我们推出了 Gemma 4 —— 我们迄今为止最强大的开放模型。在发布之初的短短几周内,Gemma 4 的全球下载量便突破了 6,000 万次。它为开发者工作站、移动设备以及云
    的头像 发表于 05-20 14:43 343次阅读
    <b class='flag-5'>Google</b>为<b class='flag-5'>Gemma</b> 4系列发布MTP草稿<b class='flag-5'>模型</b>

    e络盟探讨人工智能、脑科学与以人为本创新的下一个前沿

    安富利旗下全球电子元器件产品与解决方案分销商e络盟《发现顶尖技术之声》第二季强势回归,新推出的两期节目将探讨神经科学、人工智能与健康技术如何重塑人们的思维、行为及生活方式。
    的头像 发表于 05-14 10:37 679次阅读
    e络盟<b class='flag-5'>播</b><b class='flag-5'>客</b>探讨人工智能、脑科学与以人为本创新的下一个前沿

    Google AI Edge Gallery中探索Gemma 4的Agent Skills

    前不久,Google DeepMind 推出了 Gemma 4,这是一系列业界领先的开放模型重塑了端侧 AI 的可能性。
    的头像 发表于 04-23 09:19 636次阅读

    Google正式推出最新开放模型Gemma 4

    今天,我们正式推出 Gemma 4 —— 这是我们迄今为止最智能的开放模型Gemma 4 专为高级推理和智能体 (Agentic) 工作流而设计,实现了单位参数下前所未有的智能水平。
    的头像 发表于 04-08 10:06 712次阅读
    <b class='flag-5'>Google</b>正式推出最新<b class='flag-5'>开放</b><b class='flag-5'>模型</b><b class='flag-5'>Gemma</b> 4

    谷歌推出TranslateGemma全新开放翻译模型系列

    我们已正式推出 TranslateGemma,这一全新的开放翻译模型系列基于 Gemma 3 构建,并提供 4B、12B 和 27B 三种参数规模。TranslateGemma 的问世
    的头像 发表于 02-26 10:22 831次阅读

    谷歌正式发布Gemma Scope 2模型

    Scope 工具包推动了可解释性科学的发展,该工具旨在帮助研究人员理解我们轻量级开放模型系列 Gemma 2 的内部运作机制。
    的头像 发表于 01-24 14:01 821次阅读

    借助谷歌FunctionGemma模型构建下一代端侧智能体

    对于 Gemma 模型系列而言,2025 年是充满变革的一年。我们的下载量已从 1 亿次增长到超过 3 亿次,同时还展现了开放模型的变革潜力
    的头像 发表于 01-20 09:11 906次阅读
    借助谷歌FunctionGemma<b class='flag-5'>模型</b>构建下一代端侧智能体

    NVIDIA 推出 Nemotron 3 系列开放模型

    新闻摘要: ● Nemotron 3 系列开放模型包含 Nano、Super 和 Ultra 三种规模,具有极高的效率和领先的精度,适用于代理式 AI 应用开发。 ● Nemotron 3
    的头像 发表于 12-16 09:27 920次阅读
    NVIDIA 推出 Nemotron <b class='flag-5'>3</b> 系列<b class='flag-5'>开放</b><b class='flag-5'>模型</b>

    进迭 | Vol.3对话孙彦邦:用胡子赌一个未来,RISC-V是AI时代的“终极答案”

    进迭「RISC-V圆桌白话录」「RISC-V圆桌白话录」第三期上线!本期我们邀请到对
    的头像 发表于 11-07 20:26 990次阅读
    进迭<b class='flag-5'>播</b><b class='flag-5'>客</b> | Vol.<b class='flag-5'>3</b>对话孙彦邦:用胡子赌一个未来,RISC-V是AI时代的“终极答案”

    谷歌推出AI模型Gemma 3 270M

    过去几个月,Gemma 开放模型系列的发展是激动人心的。我们推出了 Gemma 3Gemma
    的头像 发表于 09-11 15:09 1406次阅读

    代码如何重塑硬件设计,AI如何加速创新?

    ,方便大家学习。 ” 以下是的详细简报文档,回顾了主要主题和最重要的观点/事实,并引用了原文: 主题:  本节目探讨了代码在电子产品设计中的未来作用,重点关注如何通过软件驱动的
    的头像 发表于 09-06 11:19 1023次阅读

    谷歌Gemma 3n模型的新功能

    从第一个 Gemma 模型于去年年初推出以来,已逐渐发展为生机勃勃的 Gemmaverse 生态系统,累计下载量突破 1.6 亿。这个生态系统包括十余款专业模型系列,涵盖从安全防护到医疗应用的各领
    的头像 发表于 07-25 10:16 1783次阅读
    谷歌<b class='flag-5'>Gemma</b> <b class='flag-5'>3n</b><b class='flag-5'>模型</b>的新功能

    NVIDIA RTX AI加速FLUX.1 Kontext现已开放下载

    NVIDIA RTX 与 NVIDIA TensorRT 现已加速 Black Forest Labs 的最新图像生成和编辑模型;此外,Gemma 3n 现可借助 RTX 和 NVIDIA Jetson 加速运行。
    的头像 发表于 07-16 09:16 2265次阅读

    谷歌Gemma 3n预览版全新发布

    Gemma 3Gemma 3 QAT 的成功发布之后,我们的先进开放模型系列具备了在单
    的头像 发表于 06-26 17:18 1175次阅读

    树莓派5上的Gemma 2:如何打造高效的边缘AI解决方案?

    从数学基础到边缘实现,研究团队:Conecta.ai(ufrn.br)摘要1.引言2.GEMMA2:通用集成机器模型算法2.1模型架构2.2预训练2.3后训练3.边缘AI实现1.引言
    的头像 发表于 06-20 16:57 1873次阅读
    树莓派5上的<b class='flag-5'>Gemma</b> 2:如何打造高效的边缘AI解决方案?