0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何应对边缘设备上部署GenAI的挑战

新思科技 来源:新思科技 2025-04-30 13:48 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

边缘生成式人工智能(GenAI)的兴起

过去十年间,人工智能(AI)和机器学习(ML)领域发生了巨大的变化。卷积神经网络(CNN)和循环神经网络(RNN)逐渐被Transformer和生成式人工智能(GenAI)所取代,这标志着该领域进入了一个全新的发展阶段。这一转变源于人们需要更准确、高效且具备上下文理解能力、能处理复杂任务的模型。

起初,AI和ML模型在执行音频、文本、语音和视觉处理等任务时,高度依赖数字信号处理器DSP)。这些模型虽有一定成效,但在准确性和可扩展性方面存在局限。神经网络,尤其是CNN的出现,带来了重大突破,大幅提升了模型的准确率。比如,AlexNet作为开创性的CNN,在图像识别方面的准确率达到了65%,超越了DSP的50%。

Transformer的诞生带来了又一次重大突破。2017年,谷歌在论文《Attention is All You Need》中提出了该模型,凭借更高效的序列数据处理方式,在该领域掀起了一场革命。与局部处理数据的CNN不同,Transformer使用注意力机制来评估输入数据不同部分的重要性,能够捕捉数据中的复杂关系与依赖,在自然语言处理(NLP)和图像识别等任务中展现出卓越的性能。

Transformer推动了GenAI的兴起。GenAI借助这些模型,可以依据学习到的模式生成新数据,例如文本、图像甚至音乐。Transformer能够理解和生成复杂数据,因此成为ChatGPT和DALL-E等热门AI应用的基础。这些模型已展现出卓越能力,比如生成逻辑连贯的文本、根据文字描述生成图像,充分彰显了GenAI的巨大潜力。

为何要在边缘设备上部署GenAI

对于实时处理、隐私和安全要求极高的应用来说,在边缘设备上部署GenAI具有显著优势。智能手机物联网设备和自动驾驶汽车等边缘设备,都能从GenAI的强大能力中获益。

在边缘设备上部署GenAI的主要原因之一,是对低延迟处理的需求。自动驾驶、实时翻译、语音助手等应用需要即时响应,云端处理的延迟会严重影响其响应速度。直接在边缘设备上运行GenAI模型,能最大限度地减少延迟,确保响应快速可靠。

隐私和安全也是重要的考虑因素。将敏感数据传到云端进行处理,存在数据泄露和未经授权访问的风险。通过在边缘设备上部署GenAI,数据处理始终在设备本地进行,这既能增强隐私保护,又能降低安全漏洞风险。这在数据处理需格外谨慎的应用中尤为关键,例如医疗健康应用中的患者数据处理。

网络连接受限也是推动在边缘设备上部署GenAI的因素。在互联网接入不可靠的偏远或欠发达地区,搭载GenAI的边缘设备可以脱离云连接独立运行,确保功能持续可用。这对灾难救援等可能缺乏可靠通信基础设施的应用场景至关重要。

应对边缘设备上部署GenAI的挑战

在边缘设备上部署GenAI好处众多,但也面临多种挑战,必须克服这些挑战,才能确保其有效实施与运行。这些挑战主要涉及计算复杂性、数据要求、带宽限制、功耗和硬件约束。

GenAI模型的计算复杂性是一大挑战。Transformer作为GenAI模型的基础,因其注意力机制和大规模矩阵乘法运算,计算量极大。这些运算需要强大的处理能力和大量内存,给边缘设备有限的计算资源带来沉重压力。此外,边缘设备常常需要实时处理,尤其是在自动驾驶或实时翻译等应用中。GenAI模型对算力的高要求,使得在边缘设备上实现所需的速度和响应能力困难重重。

242aa084-21bf-11f0-9310-92fbcf53809c.png

▲表1:GenAI模型(包括大语言模型(LLM)和图像生成器)的参数量明显大于CNN

数据要求也带来了巨大挑战。训练GenAI模型需要海量数据。例如,GPT-4等模型训练使用了数TB的数据,要在存储和内存容量有限的边缘设备上处理和存储这些数据,根本不现实。即便在推理阶段,为生成准确且相关的输出,GenAI模型也可能需要大量数据。受存储限制,在边缘设备上管理和处理这些数据颇具挑战性。

带宽限制让GenAI在边缘设备上的部署变得更为复杂。边缘设备通常使用低功耗内存接口,如低功耗双倍数据速率(LPDDR)内存,其带宽低于数据中心使用的高带宽内存(HBM)。这会限制边缘设备的数据处理能力,从而影响GenAI模型的性能。在内存和处理单元之间高效传输数据,对GenAI模型的性能至关重要。有限的带宽会妨碍这一过程,导致处理时间延长、效率降低。

功耗是在边缘设备上部署GenAI的又一关键问题。GenAI模型因计算需求大,耗电量高。这对依靠电池供电的边缘设备,如智能手机、物联网设备和自动驾驶汽车等,是个严重问题。高功耗会导致发热增加,因此需要有效的热管理解决方案。在紧凑的边缘设备进行散热管理难度大,还可能影响设备寿命和性能。

硬件约束同样是在边缘设备上部署GenAI的一大挑战。与数据中心服务器相比,边缘设备的处理能力通常有限。选择既能满足GenAI的需求、又能兼顾低功耗和高性能的合适处理器至关重要。边缘设备有限的内存和存储容量,限制了可部署GenAI模型的规模和复杂性。因此,必须开发能在这些约束条件下运行且性能不受影响的优化模型。

模型优化对于应对这些挑战至关重要。模型量化(降低模型参数精度)和剪枝(去除冗余参数)等技术,可帮助降低GenAI模型的计算和内存需求。不过,在采用这些技术时需要谨慎,以保证模型的准确性和功能性。开发专门针对边缘部署优化的模型,能帮助应对部分挑战。这需要创建GenAI模型的轻量级版本,使其能在边缘设备上高效运行,同时不降低性能。

软件和工具链支持也很关键。在边缘设备上高效部署GenAI,离不开支持模型优化、部署和管理的强大软件工具和框架。确保与边缘硬件兼容并提供高效的开发流水线至关重要。优化推理过程以缩短延迟并提高效率,对实时应用非常重要。这涉及微调模型并利用硬件加速器实现最佳性能。

安全和隐私问题也必须得到妥善解决。确保边缘设备所处理数据的安全性极为重要。采用鲁棒的加密技术和安全的数据处理做法,是保护敏感信息的关键。在边缘设备上本地处理数据,可最大限度地减少将敏感数据传到云端的需求,有助于解决隐私问题。但同时,也要确保GenAI模型本身不会无意中泄露敏感信息。

通过精心挑选硬件、优化模型并利用先进软件工具来应对这些挑战,可让边缘设备部署GenAI变得更加可行和有效。这将使众多应用受益于GenAI的强大能力,同时保留边缘计算的优势。

边缘GenAI的处理器选择

在边缘设备上运行GenAI,选择合适的嵌入式处理器对于克服上述挑战至关重要。选择时必须兼顾计算能力、功耗和处理各种AI工作任务的灵活性。

GPUCPU灵活性高且可编程,适用于广泛的AI应用。但从功耗角度看,它们可能并非边缘设备的最佳选择。尤其是GPU,耗电量大,对电池供电的设备不太友好。

ASIC是针对特定任务优化的硬连线解决方案,具有高能效和高性能。然而,它缺乏灵活性,难以适应不断发展的AI模型和工作任务。

神经处理单元(NPU)在灵活性和能效之间取得了平衡。NPU(包括新思科技ARC NPX NPU IP)专为AI工作任务设计,针对矩阵乘法和张量运算等运行GenAI模型的关键任务,能实现优化的性能。NPU解决方案可编程且功耗低,适合边缘设备。

244e71da-21bf-11f0-9310-92fbcf53809c.png

▲图2:CPU、GPU、NPU和ASIC在边缘AI/ML中的表现比较。NPU除了可编程性和易于使用之外,还拥有最高效的处理能力。

例如,在NPU上运行Stable Diffusion等GenAI模型仅需2瓦电力,而在GPU上运行则需200瓦,节能效果显著。NPU还支持混合精度算法和内存带宽优化等高级功能,对满足GenAI模型的计算需求至关重要。

结语

向Transformer和生成式人工智能(GenAI)的过渡,是人工智能(AI)和机器学习(ML)领域的重大进步。这些模型性能卓越、功能多样,支持从自然语言处理到图像生成的广泛应用。在边缘设备上部署GenAI能够开启新的可能,提供低延迟、安全、可靠的AI能力。

然而,要充分发挥边缘GenAI的潜力,必须克服计算复杂性、数据要求、带宽限制和功耗等挑战。选择NPU等合适的处理器,能为边缘应用提供兼顾性能与能效的平衡解决方案。

随着AI持续发展,GenAI在边缘设备上的集成将发挥关键作用,有助于推动创新并扩大智能技术的应用范围。通过克服这些挑战并利用先进处理器的优势,我们将为AI全面融入日常生活的美好未来铺平道路。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11216

    浏览量

    222933
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261504
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136233
  • Transformer
    +关注

    关注

    0

    文章

    154

    浏览量

    6814

原文标题:为何要在边缘设备上部署GenAI?

文章出处:【微信号:Synopsys_CN,微信公众号:新思科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    求一套听声辩位的算法,并在板机上部署

    求一套听声辩位的算法,并在板机上部署。有谢。
    发表于 11-10 23:07

    如何快速在云服务器上部署Web环境?

    如何快速在云服务器上部署Web环境
    的头像 发表于 10-14 14:16 309次阅读

    如何在基于Arm架构的边缘AI设备上部署飞桨模型

    当 Arm 与领先的开源深度学习平台强强联合,会带来什么?那就是推动创新的“火箭燃料”。Arm 携手百度,利用双方在高能效计算平台与 AI 模型的技术积累,助力广大开发者加快边缘 AI 解决方案的开发和部署
    的头像 发表于 09-06 14:07 826次阅读

    部署边缘计算设备时需要考虑哪些问题?

    应对边缘场景的复杂挑战。以下是关键注意事项,按核心维度分类说明: 一、硬件选型:匹配边缘场景的 “环境适应性” 与 “资源平衡” 边缘设备
    的头像 发表于 09-05 15:38 721次阅读
    <b class='flag-5'>部署</b><b class='flag-5'>边缘</b>计算<b class='flag-5'>设备</b>时需要考虑哪些问题?

    Arm方案 基于Arm架构的边缘设备(树莓派或 NVIDIA Jetson Nano)上部署PyTorch模型

    本文将为你展示如何在树莓派或 NVIDIA Jetson Nano 等基于 Arm 架构的边缘设备上部署 PyTorch 模型。
    的头像 发表于 07-28 11:50 2497次阅读

    打通边缘智能之路:面向嵌入式设备的开源AutoML正式发布----加速边缘AI创新

    北京 2025年7月17日 /美通社/ -- 随着AI迅速向边缘领域挺进,对智能边缘器件的需求随之激增。然而,要在小尺寸的微控制器上部署强大的模型,仍是困扰众多开发者的难题。开发者需要兼顾数据预处理
    的头像 发表于 07-17 16:08 377次阅读
    打通<b class='flag-5'>边缘</b>智能之路:面向嵌入式<b class='flag-5'>设备</b>的开源AutoML正式发布----加速<b class='flag-5'>边缘</b>AI创新

    无法运行Whisper Asr GenAI OpenVINO™ Notebook怎么解决?

    冉小 声说-asr-genai OpenVINO™笔记本。 遇到的错误: Port for tensor name cache_position was not found.
    发表于 06-25 07:41

    stm32N657上部署cubeAI生成代码,编译出错的原因?怎么解决?

    你好,要怎么在stm32N657上部署cubeAI生成代码呢,编译出错,我使用cubeAI生成的手写数字模型的代码,编译报错 要怎么配置呢,我看其他AI demo都是分了两个文件,这里要怎么烧录进去使用呢?
    发表于 06-20 06:31

    边缘AI实现的核心环节:硬件选择和模型部署

    边缘AI的实现原理是将人工智能算法和模型部署到靠近数据源的边缘设备上,使这些设备能够在本地进行数据处理、分析和决策,而无需将数据传输到远程的
    的头像 发表于 06-19 12:19 1045次阅读
    <b class='flag-5'>边缘</b>AI实现的核心环节:硬件选择和模型<b class='flag-5'>部署</b>

    STM32F769是否可以部署边缘AI?

    STM32F769是否可以部署边缘AI
    发表于 06-17 06:44

    RAKsmart企业服务器上部署DeepSeek编写运行代码

    在RAKsmart企业服务器上部署并运行DeepSeek模型的代码示例和详细步骤。假设使用 Python + Transformers库 + FastAPI实现一个基础的AI服务。主机推荐小编为您整理发布RAKsmart企业服务器上部署DeepSeek编写运行代码。
    的头像 发表于 03-25 10:39 540次阅读

    边缘部署GenAI机遇与挑战并存,NPU成破局关键

    过去十年里,人工智能 (AI) 和机器学习 (ML) 经历了重大变革——卷积神经网络 (CNN) 和循环神经网络 (RNN) 正在向Transformer和生成式人工智能 (GenAI) 过渡。这一
    发表于 03-20 10:57 480次阅读
    <b class='flag-5'>边缘</b><b class='flag-5'>部署</b><b class='flag-5'>GenAI</b>机遇与<b class='flag-5'>挑战</b>并存,NPU成破局关键

    研华推出GenAI Studio边缘AI软件平台 助力本地端大语言模型开发,推动边缘AI创新

    模型(LLM)解决方案日益增长的需求。   加速人工智能发展,应对行业挑战 作为研华边缘AI软件开发工具包(Edge AI SDK)的一部分,GenAI Studio致力于解决行业痛点
    发表于 02-19 11:13 296次阅读
    研华推出<b class='flag-5'>GenAI</b> Studio<b class='flag-5'>边缘</b>AI软件平台 助力本地端大语言模型开发,推动<b class='flag-5'>边缘</b>AI创新

    AI模型部署边缘设备的奇妙之旅:目标检测模型

    网络(DenseNet)等创新设计都是为了克服深层网络训练中的挑战而提出的。 3 边缘设备部署边缘
    发表于 12-19 14:33

    AI模型部署边缘设备的奇妙之旅:如何在边缘部署OpenCV

    的能力。 本文章主要讲述如何在边缘设备上使用OpenCV。本次使用的边缘设备是凌智电子开发的凌智视觉模块,具体如下: 如对该边缘
    发表于 12-14 09:31