0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于Arm架构的NVIDIA DGX Spark平台构建离线语音助手系统

Arm社区 来源:Arm社区 2026-04-09 15:51 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:Arm 首席解决方案架构师 沈纶铭

基于云的人工智能 (AI) 占据了大多数关注焦点,但真正实现响应和隐私保护的交互则发生在边缘侧。本文将展示如何基于 Arm 架构的 NVIDIA DGX Spark 平台,构建一个完全离线、实时运行的语音助手系统。该系统集成了诸如 faster-whisper 和 vLLM 等开源组件,在无需将数据发送到本地环境之外的情况下,实现低延迟、接近人类对话体验的交互。

技术挑战

对云的依赖困境

在许多企业环境中,技术人员需要快速访问内部文档或获得实时支持。然而,依赖云端 API 会带来三个关键瓶颈:

延迟:与云端 API 的往返通信会打断语音对话的自然节奏。

隐私:将敏感数据发送到外部服务器会带来合规风险,尤其是在涉及专有内容时。

成本与可控性:基于 API 的计费模式和使用限制,会限制系统的扩展能力以及针对特定行业需求的定制化能力。

解决方案

异构的开源流水线

为了应对上述问题,我们在 DGX Spark 上设计了一套流水线,DGX Spark 基于 NVIDIA GB10 Grace Blackwell 构建。在该方案中,CPU 被定位一个主动的、以低延迟为优化目标的计算引擎。

软件栈

为了实现最大的灵活性与性能,整个系统运行在以下开源工具上:

09805778-3268-11f1-90a1-92fbcf53809c.png

关键组件与系统设计

实时音频与语音活动检测

系统以 16kHz 单声道音频进行采集,并使用 WebRTC 的语音活动检测 (VAD) 在 30 毫秒的帧级别上检测语音信号。该方法能够确保系统只处理有效的语音输入,同时忽略背景噪声和静音间隔。

基于 Arm 架构 CPU 的高速语音转写

对于短时、对延迟敏感的任务,系统并未将其分流到 GPU 上,而是使用高性能的 Arm CPU 集群(Arm Cortex-X 和 Cortex-A 系列核心)来处理。

为什么选择 Arm:Arm 架构针对实时搜索、小批量推理任务等延迟关键型工作负载进行了优化,

性能表现:在 Arm CPU 上运行 faster-whisper 可以满足低延迟需求,在交互式系统中,语音转写时间约为 70 至 90 毫秒。

基于 GPU 加速的推理 (vLLM)

在完成语音转写后,文本会被传递至 vLLM 进行处理。DGX Spark 采用统一内存 (Unified Memory),使 CPU 与 GPU 共享同一内存空间。该设计允许 GPU 直接访问 CPU 的输出数据,从而无需显式的数据传输或消除通过 PCIe 进行拷贝所带来的额外开销。

系统架构流程图

以下流程图展示了在 DGX Spark 上构建的一个高性能异构流水线。系统将任务分配给最合适的计算单元,以降低整体延迟。

09ef7a22-3268-11f1-90a1-92fbcf53809c.png

图:DGX Spark 异构流水线。Arm CPU 负责 STT 转录,

GPU 负责生成响应,从而显著降低交互延迟。

在该流水线中,Cortex-X 和 Cortex-A CPU 核心用于处理对延迟敏感的任务,例如音频采集和语音转写。这种方式可以实现低于 100 毫秒的响应时间。系统采用统一内存,使 GPU 能够直接访问共享 DRAM 中的转写数据,从而消除了传统 PCIe 数据传输带来的开销。整个流程的最后,由 NVIDIA GPU 运行 vLLM 引擎生成智能响应,从而实现高吞吐量且具备隐私保护的对话体验。

演示:

本地语音交互与性能指标

我们通过一个多轮“订阅取消”场景对系统进行了验证。系统能够生成经过验证、基于事实的回答,并且未出现幻觉 (hallucination) 问题。

性能指标:延迟拆解

以下数据记录了从用户语音结束到大语音模型开始生成响应之间的精确时间(即响应延迟)。

0a518e60-3268-11f1-90a1-92fbcf53809c.png

观察结果:所有对话轮次的平均响应延迟约为四秒。该性能表现可与基于云的解决方案相媲美,同时在无需网络连接的情况下提供了更强的隐私保护。

构建你自己的系统?

理解 Arm 架构 AI 能力的最佳方式是亲自实践。为此,我们准备了一套完整的、循序渐进的 Learning Path,帮助你部署这一流水线。快来动手实践吧!

该 Learning Path 将指导以下内容:

如何为边缘设备配置专业级麦克风采集系统;

如何针对 Arm Cortex-X 优化 faster-whisper;

如何使用量化模型部署 vLLM,以最大化本地吞吐性能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9583

    浏览量

    393487
  • NVIDIA
    +关注

    关注

    14

    文章

    5682

    浏览量

    110096
  • 语音助手
    +关注

    关注

    7

    文章

    243

    浏览量

    27642

原文标题:在边缘侧重新思考语音 AI:基于 Arm 架构的 DGX Spark 的实用离线流水线

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA DGX Spark平台上对NVIDIA ConnectX-7 200G网卡配置教程

    NVIDIA DGX Spark 平台上对 NVIDIA ConnectX-7 200G 网卡进行配置时,会遇到“4 个逻辑端口”现象。
    的头像 发表于 11-21 09:19 5983次阅读
    在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b><b class='flag-5'>平台</b>上对<b class='flag-5'>NVIDIA</b> ConnectX-7 200G网卡配置教程

    NVIDIA DGX Spark系统恢复过程与步骤

    在使用 NVIDIA DGX Spark 的过程中,可能会出现配置故障,而导致开发中断的问题,本篇教程将带大家了解如何一步步完成系统恢复。
    的头像 发表于 11-28 09:46 5866次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b><b class='flag-5'>系统</b>恢复过程与步骤

    NVIDIA DGX Spark快速入门指南

    NVIDIA DGX Spark 已正式向 AI 开发者交付,对于刚入手的全新 DGX Spark,该如何进行初始化设置?本篇文章将引导您完
    的头像 发表于 11-17 14:11 6975次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b>快速入门指南

    Microchip发布专为NVIDIA DGX Spark而设计的MEC1723嵌入式控制器定制固件

    DGX Spark个人AI超级计算机定制设计的 MEC1723嵌入式控制器(EC)固件 ,进一步优化MEC1723 EC在NVIDIA DGX平台
    的头像 发表于 01-15 18:51 6.6w次阅读
    Microchip发布专为<b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b>而设计的MEC1723嵌入式控制器定制固件

    NVIDIA 宣布推出 DGX Spark 个人 AI 计算机

    台式超级计算机由 NVIDIA Grace Blackwell 驱动,为开发者、研究人员和数据科学家提供加速 AI 功能;系统由头部计算机制造商(包括华硕、Dell Technologies、HP
    发表于 03-19 09:59 865次阅读
       <b class='flag-5'>NVIDIA</b> 宣布推出 <b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b> 个人 AI 计算机

    NVIDIA GTC2025 亮点 NVIDIA推出 DGX Spark个人AI计算机

    和联想)提供。 NVIDIA 发布了由 NVIDIA Grace Blackwell 平台驱动的 DGX 个人 AI 超级计算机。 DGX
    的头像 发表于 03-20 18:59 1769次阅读
    <b class='flag-5'>NVIDIA</b> GTC2025 亮点  <b class='flag-5'>NVIDIA</b>推出 <b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b>个人AI计算机

    NVIDIA发布AI优先DGX个人计算系统

    NVIDIA 宣布,多家行业领先系统制造商将打造 NVIDIA DGX Spark
    的头像 发表于 05-22 09:39 1241次阅读

    NVIDIA DGX Spark桌面AI计算机开启预订

    DGX Spark 现已开启预订!丽台科技作为 NVIDIA 授权分销商,提供从产品到服务的一站式解决方案,助力轻松部署桌面 AI 计算机。
    的头像 发表于 09-23 17:20 1505次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b>桌面AI计算机开启预订

    NVIDIA DGX Spark新一代AI超级计算机正式交付

    NVIDIA 创始人兼首席执行官黄仁勋在 SpaceX 向埃隆·马斯克交付 DGX Spark
    的头像 发表于 10-21 10:41 1448次阅读

    NVIDIA DGX Spark助力构建自己的AI模型

    2025 年 1 月 6 日,NVIDIA 正式宣布其 Project DIGITS 项目,并于 3 月 18 日更名为 NVIDIA DGX Spark,进一步公布了产品细节。
    的头像 发表于 11-21 09:25 1493次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b>助力<b class='flag-5'>构建</b>自己的AI模型

    如何在DGX Spark上运行NVIDIA Omniverse

    首先感谢 Vigor 同学第一时间的分享,以下是具体如何在 DGX Spark 上运行 Omniverse 的方法。
    的头像 发表于 12-17 10:13 895次阅读
    如何在<b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b>上运行<b class='flag-5'>NVIDIA</b> Omniverse

    NVIDIA DGX Spark桌面级AI超级计算机助力开发者构建AI模型

    开源 AI 正在加速各行各业的创新,NVIDIA DGX Spark 将帮助开发者将创新转化为影响力。
    的头像 发表于 01-09 09:49 672次阅读

    全新软件与模型优化为NVIDIA DGX Spark注入强大动力

    自发布以来,NVIDIA 通过持续的软件优化以及与软件合作伙伴和开源社区的紧密协作,不断提升基于 Grace Blackwell 架构DGX Spark 的性能。这些举措在推理、训
    的头像 发表于 01-09 10:17 817次阅读

    NVIDIA DGX Spark助力高等教育领域重大项目

    在全球各地的顶尖高校,NVIDIA DGX Spark 桌面超级计算机正将数据中心级的 AI 能力带到实验室台前、教师办公室里和学生的终端设备上。在地球最南端的南极,也有一台 DGX
    的头像 发表于 03-09 16:33 650次阅读

    首届中国NVIDIA DGX Spark黑客松大赛开启报名

    NVIDIA 前沿技术生态,聚焦 DGX Spark 平台的全栈开发能力,以代码为刃,以算力为锋,共同探索 DGX
    的头像 发表于 03-14 16:39 2698次阅读