0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm与Stability AI携手合作加快文本转音频的响应速度

Arm社区 来源:Arm社区 2025-03-25 15:54 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:Arm 终端事业部产品管理总监 Ronan Naughton

想象一下,你正在智能手机上编辑视频,需要为其添加合适的音效;或是你想要生成自定义声音,用于设置铃声、闹钟或发布社交媒体帖子。你无需在网上搜索或购买音频片段,只需输入一段描述,例如“日落时的轻柔海浪声”,几秒钟后,你的设备就会为你生成合适的声音,甚至无需联网就可实现。得益于 Arm 和 Stability AI 的新合作,这种完全在端侧直接生成音频的技术已变为现实。

Arm 与 Stability AI 携手合作,加快文本转音频的响应速度

Stability AI 是一家专注于图像、视频、3D 和音频领域人工智能 (AI) 模型开发的公司。而 Arm KleidiAI 能够提供专门针对 Arm CPU 的经优化的性能关键例程(即微内核)。通过 KleidiAI 与 XNNPack 库和 ExecuTorch 框架的集成,以及 Stability AI 自身的优化,为 Stability AI 的文本转音频开放模型“Stable Audio Open”带来了显著的 AI 性能提升。

令人惊叹的结果包括文本转音频的 AI 生成时间从几分钟大幅缩短至几秒钟,响应速度提高了 30 倍。Stable Audio Open 模型完全在基于 Arm CPU 的智能手机上运行,且无需联网,对于文本转音频 AI 来说是首创之举。

Stability AI 利用 KleidiAI 自动加速功能,加快模型的响应速度,从而在不影响质量的情况下提升了端侧 AI 性能。KleidiAI 带来的性能提升,无需 Stable Audio Open 模型用户额外投入开发精力,节省了时间和成本。Arm 和 Stability AI 将继续合作,以实现更多性能的跃升,带来更为出色的 AI 用户体验。

显著的性能提升表明,具有针对性的硬件和软件集成,使过往无法实现的 AI 应用在移动端变得可行,从而推动了未来的创新机遇。Arm 技术驱动了全球 99% 的智能手机,这也意味着数十亿智能手机用户现可取得先进的 AI 音频功能。

共同应对复杂的 AI 挑战

Stable Audio Open 模型具备出色的效率,但在智能手机的 CPU 上直接由端侧运行该模型仍非易事。在初期尝试时,单个音频样本的生成时间超过四分钟,这对终端用户而言不太能接受。

通过与 Arm 合作,Stability AI 将模型的训练参数量蒸馏到适合移动端的规模。然后,通过新的蒸馏模型,并利用 XNNPack 与 ExecuTorch 集成带来的 KleidiAI 性能加速,实现了在移动端 Arm CPU 上几秒内就生成音频片段。

Stability AI 首席执行官 Prem Akkaraju 表示:随着越来越多的专业创意工作者和企业采用生成式 AI 来帮助提升其生产流程,我们的模型和工作流必须随处可得,以供构建者和创作者使用,这一点至关重要。我们很高兴能就此与 Arm 合作。从服务器到智能手机,Arm 平台在整个生态系统中应用普及,并且 Arm 通过将 Arm Kleidi 集成到软件栈中,致力于加速各类主流框架中的 AI 模型,因此 Arm 是我们的不二之选。

文本转音频 AI 的兴起

自 2022 年以来,Stability AI 始终立于生成式 AI 发展的前沿,曾凭借行业领先的图像模型 Stable Diffusion 引起轰动。依托 Stable Diffusion 的成功,该公司随后推出了 Stable Audio,这是首个完全获得授权的音频模型之一,专为通过文本提示词生成高质量的音乐和音效而设计。这些 AI 模型在 Hugging Face 等主要平台上均排名前茅,拥有多达数百万规模的用户数,构成了一个活跃的技术社区。

人人皆可享先进的音频 AI 体验

这一成果仅仅只是双方合作的开始,Arm 和 Stability AI 已规划了更多的性能优化举措,旨在为用户带来更加出色的使用体验。通过携手合作,Arm 正在为音频、图像、视频和 3D 领域的端侧 AI 打好基础,重塑每个人创作内容和与数字媒体互动的方式。通过蒸馏先进的模型并利用经过优化的软件,部署到人们常用的硬件设备上,从而为未来铺平道路,实现人人都能通过口袋里的设备直接享受先进的 AI 应用、模型和体验。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9501

    浏览量

    388812
  • 音频
    +关注

    关注

    31

    文章

    3135

    浏览量

    84939
  • AI
    AI
    +关注

    关注

    89

    文章

    38163

    浏览量

    296857
  • 人工智能
    +关注

    关注

    1813

    文章

    49750

    浏览量

    261621

原文标题:加快 30 倍!Arm Kleidi 赋能端侧音频生成提速

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    大家好! 叠层工艺相比传统工艺,在响应速度上具体快在哪里?

    大家好!叠层固态电容工艺相比传统的电容工艺,在响应速度上具体快在哪里?
    发表于 11-15 10:03

    新技术可提升紫外线传感器响应速度

    研究示意图 澳大利亚麦考瑞大学科学家开发了一项新技术,将紫外线传感器的响应速度提高了128000倍。该成果有望催生更高效、更灵活的可穿戴设备。相关论文发表于新一期《Small》杂志。 研究团队指出
    的头像 发表于 11-07 09:13 232次阅读
    新技术可提升紫外线传感器<b class='flag-5'>响应速度</b>

    高电压/高响应速度调光/低纹波线性恒流驱动芯片SS9202

    SS9202高电压/高响应速度调光/低纹波线性恒流驱动芯片目前调光类的照明要求越来越高,既要求输出直流无纹波电流,又要求调光性能高,还需要高电压输入,可市场上的各种品牌的产品,要么就是可以实现直流无
    的头像 发表于 11-06 09:39 266次阅读
    高电压/高<b class='flag-5'>响应速度</b>调光/低纹波线性恒流驱动芯片SS9202

    Arm与Meta深化战略合作

    近日,Arm 与 Meta 宣布一项战略合作项目,双方将围绕人工智能 (AI) 软件与数据中心基础设施两大核心领域,全面提升各计算层面的 AI 效率,为全球数十亿用户打造更丰富的体验。
    的头像 发表于 10-24 17:54 1494次阅读

    3D打印机器人堵头预警:加热器NTC热敏电阻响应速度测试

    本文通过分析NTC热敏电阻在3D打印机器人加热器中的响应速度测试,探讨其如何预防堵头故障并应用于智能家居、工业及医疗等跨界场景,强调平尚科技元件的技术适配性与可靠性。
    的头像 发表于 09-26 16:26 570次阅读

    如何在基于Arm架构的边缘AI设备上部署飞桨模型

    Arm 与领先的开源深度学习平台强强联合,会带来什么?那就是推动创新的“火箭燃料”。Arm 携手百度,利用双方在高能效计算平台与 AI 模型的技术积累,助力广大开发者
    的头像 发表于 09-06 14:07 831次阅读

    Arm 洞察与思考:为什么 AI 向边缘迁移的速度超乎想象

    人工智能 (AI) 正在以惊人的速度发展。企业不再仅仅是探索 AI,而是积极推动 AI 的规模化落地,从实验性应用转向实际部署。随着生成式模型日益精简和高效,
    的头像 发表于 08-11 14:43 4.2w次阅读

    SOLIDWORKS2025在性能和响应速度方面进行了大幅提升

    在工程设计领域,软件的性能和响应速度是衡量其效率与用户体验的重要指标。SOLIDWORKS作为CAD软件之一,始终致力于为用户提供更有效、更稳定的设计平台。随着solidworks2025版本的发布,其在性能和响应速度方面实现了显著提升,为全球设计师和工程师们带来了流畅设
    的头像 发表于 08-06 10:25 753次阅读

    涂鸦OmniAI Foundation 2.2版本正式发布:AI智能体全面升级,响应速度迅猛提高40%

    助手能够更自然、更精准地理解并响应用户意图。同时,我们联合阿里云带来了涂鸦私有版Qwen模型,为用户打造更快的AI对话响应时间,为各业务场景提供更加强大、灵活、贴近
    的头像 发表于 07-18 19:00 868次阅读
    涂鸦OmniAI Foundation 2.2版本正式发布:<b class='flag-5'>AI</b>智能体全面升级,<b class='flag-5'>响应速度</b>迅猛提高40%

    Arm 与微软合作,为基于 Arm 架构的 PC 和移动设备应用提供超强 AI 体验

    ArmKleidiAI与ONNXRuntime的集成,为Windows和安卓操作系统带来了显著的AI性能优化,实现高达2.6倍的AI推理速度提升,从而加速应用体验。联合作者:
    的头像 发表于 06-03 16:47 728次阅读
    <b class='flag-5'>Arm</b> 与微软<b class='flag-5'>合作</b>,为基于 <b class='flag-5'>Arm</b> 架构的 PC 和移动设备应用提供超强 <b class='flag-5'>AI</b> 体验

    Arm与微软合作加速边缘设备上的AI体验

    随着人工智能 (AI) 成为当今个人电脑 (PC) 和移动设备使用体验(从聊天机器人到生产力提升)中不可或缺的一部分,这些设备对 CPU 高效、可扩展的推理需求也在持续增长。Arm 与微软正携手
    的头像 发表于 05-28 13:54 674次阅读

    WT588F语音芯片响应时间深度解析:从指令触发到音频播放的技术全貌

    在智能语音交互设备开发中,系统响应速度直接影响用户体验。广州唯创电子WT588F系列语音芯片凭借其灵活的架构设计,在响应效率方面表现出色。本文将深入解析该芯片从接收指令到音频输出的全过程,并揭示
    的头像 发表于 03-31 09:24 735次阅读
    WT588F语音芯片<b class='flag-5'>响应</b>时间深度解析:从指令触发到<b class='flag-5'>音频</b>播放的技术全貌

    Banana Pi 与瑞萨电子携手共同推动开源创新:BPI-AI2N

    与嵌入式系统的优势,该联合解决方案旨在打造更开放、更灵活的软硬件平台。 “此次合作将提升瑞萨在开源社区的知名度。基于 RZ/V2N 的突破性 BPI-AI2N SOM 有望对多个行业产生重大影响,为工程师
    发表于 03-12 09:43

    AI Agent 应用与项目实战》阅读心得3——RAG架构与部署本地知识库

    分析模型在不同类型数据上的表现,来优化文本分割策略和检索参数,使系统在保持响应速度的同时,能够提供更准确的查询结果。 经过对第6-7章的深入学习,我对RAG技术在工程实践中的应用有了更系统的认识。这一
    发表于 03-07 19:49

    LG AI Research使用亚马逊云科技开发AI模型 加快癌症诊断速度

    LG集团旗下AI智库利用亚马逊云科技进行癌症早期风险识别 Amazon SageMaker助力LG AI Research将基因测试时间从两周缩短至不到一分钟,加快患者诊断速度 北京2
    的头像 发表于 12-16 15:13 625次阅读
    LG <b class='flag-5'>AI</b> Research使用亚马逊云科技开发<b class='flag-5'>AI</b>模型 <b class='flag-5'>加快</b>癌症诊断<b class='flag-5'>速度</b>