0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

恩智浦如何在边缘设备上部署LLM

NXP客栈 来源:NXP客栈 2024-11-29 09:39 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近来,与AI相关的周期性热点几乎都围绕着大语言模型 (LLM) 和生成式AI模型,这样的趋势反映出这些话题近年来日益增强的影响力和普及程度。与大语言模型和生成式AI模型相关的应用涵盖了广泛的领域,从开放式聊天机器人到任务型助手。虽然LLM主要聚焦基于云和服务器端的应用,但人们对在嵌入式系统和边缘设备中部署这些模型的兴趣也在不断增加。

嵌入式系统 (如家用电器、工业设备、汽车等设备中的微处理器) 需要在成本和功耗受限的情况下,适应有限的计算能力和内存可用性。这使得在边缘设备上部署高精度和高性能的语言模型极具挑战性。

在边缘设备上部署LLM

在嵌入式解决方案中,利用LLM的一个关键领域是操作员与机器之间的自然对话交互,即人机界面 (HMI)。

嵌入式系统可以简化各种输入选项,如麦克风、摄像头或其他传感器,但大多数系统不会像个人电脑、笔记本电脑和手机那样,配备完整的键盘与LLM模型进行交互。因此,嵌入式系统在使用音频和视觉作为LLM输入时,必须具备实用性。这需要一个自动语音识别 (ASR) 或图像识别和分类的预处理模块。

同样,交互的输出选项也有限。嵌入式解决方案能没有屏幕,或者不方便用户阅读屏幕信息。因此,在生成式AI模型之后,需要一个后处理步骤,使用文本到语音 (TTS) 算法将模型输出转换为音频。

恩智浦正在构建eIQ GenAI Flow,通过添加必要的预处理和后处理模块,使其成为一个模块化流程,从而使边缘生成式AI更加实用。

生成式AI正在改变嵌入式应用。阅读恩智浦关于检索增强生成 (RAG) 的白皮书,了解这种方法如何简化LLM的开发过程,点击这里>>

通过LLM革新应用

通过集成基于LLM的语音识别、自然语言理解和文本生成功能,嵌入式设备能够提供更直观和对话式的用户体验。这包括响应语音命令的智能家居设备、通过自然语言控制的工业机械,以及能够进行免提对话的汽车娱乐中控系统,以指导用户或操作车内功能等。

LLM还在健康应用中的嵌入式预测分析和决策支持系统中发挥作用。设备可以嵌入使用特定领域数据训练的语言模型,然后利用自然语言处理分析传感器数据、识别模式并生成见解,同时在边缘实时运行并保护患者隐私,无需将数据发送到云端。

应对生成式AI挑战

在嵌入式环境中部署准确且功能强大的生成式AI模型面临许多挑战。需要优化模型的大小和内存使用,使LLM能够适应目标硬件的资源限制。具有数十亿个参数的模型需要数千兆字节的存储空间,而在边缘系统中,这可能会带来高成本且难以实现。量化和修剪等模型优化技术不仅适用于卷积神经网络,也适用于转换器模型——这是生成式AI克服模型大小问题的重要方法。

像LLM这样的生成式AI模型也有知识局限性。例如,它们的理解是有限的,通常会提供不一致的答案,也称为“幻觉”(hallucination),而且它们的知识受限于训练数据的时效性。训练模型或通过再训练来微调模型可以提高准确性和上下文感知,但这可能在数据收集和所需的训练计算方面花费巨大。

幸运的是,有需求就有创新;通过检索增强生成 (RAG) 可以解决这个问题。RAG方法使用特定上下文数据创建知识数据库,LLM可以在运行时参考这些数据来准确回答查询。

eIQ GenAI Flow将生成式AI和LLM的优势以实用的方式应用于边缘场景。通过将RAG整合到该流程中,我们为嵌入式设备提供特定领域的知识,而不会将用户数据暴露给原始AI模型的训练数据。这样可以确保对LLM的任何更改都是私密的,并且仅在边缘本地使用。

本文作者

Ali Ors,恩智浦半导体边缘处理AI机器学习战略技术主管。Ali专门负责领导各跨职能团队,为机器学习和视觉处理领域提供创新产品和平台。他目前在恩智浦负责全球AI机器学习战略和技术工作。Ali曾在恩智浦汽车业务部负责ADAS和自主产品的AI战略、战略伙伴关系和平台设计。加入恩智浦之前,Ali曾担任CogniVue公司的工程副总裁,负责开发视觉SoC解决方案和认知处理器IP内核。Ali持有加拿大渥太华卡尔顿大学的工程学学位。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 嵌入式
    +关注

    关注

    5212

    文章

    20763

    浏览量

    338765
  • 恩智浦
    +关注

    关注

    14

    文章

    6141

    浏览量

    155285
  • LLM
    LLM
    +关注

    关注

    1

    文章

    351

    浏览量

    1408
  • 生成式AI
    +关注

    关注

    0

    文章

    538

    浏览量

    1144

原文标题:在嵌入式应用中部署生成式AI,恩智浦有个好方法!

文章出处:【微信号:NXP客栈,微信公众号:NXP客栈】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    发布全新i.MX 93W,融合边缘计算与安全无线连接,加速物理AI部署

    首款将AI NPU与安全三频无线连接集成于一体的应用处理器,可用单一封装取代多达60个分立元件 集成边缘计算与安全连接,并辅以软件及eIQ® AI工具支持,加速协同AI智能体的部署
    发表于 03-10 11:14 1675次阅读
    <b class='flag-5'>恩</b>智<b class='flag-5'>浦</b>发布全新i.MX 93W,融合<b class='flag-5'>边缘</b>计算与安全无线连接,加速物理AI<b class='flag-5'>部署</b>

    携手COMPREDICT加速边缘AI在汽车应用落地

    携手COMPREDICT将边缘AI带入汽车应用领域,降低车辆物料清单 (BoM) 成本,助力汽车制造商与一级供应商加速迈向更智能、软件驱动出行的转型。
    的头像 发表于 02-27 14:31 2258次阅读
    <b class='flag-5'>恩</b>智<b class='flag-5'>浦</b>携手COMPREDICT加速<b class='flag-5'>边缘</b>AI在汽车应用落地

    与GE医疗在边缘AI领域达成战略合作

    半导体宣布与GE医疗达成合作,依托在安全高性能边缘处理领域的长期技术积淀与GE医疗在医疗技术创新方面的深厚经验,共同推动
    的头像 发表于 01-13 11:16 3904次阅读

    推出全新eIQ Agentic AI框架

    半导体宣布推出全新eIQ Agentic AI框架,进一步巩固其在安全实时边缘AI领域的领导地位。该工具支持在边缘设备上直接实现自主智
    的头像 发表于 01-13 11:15 1660次阅读

    何在NVIDIA Jetson AGX Thor上部署1200亿参数大模型

    上一期介绍了如何在 NVIDIA Jetson AGX Thor 上使用 Docker 部署 vLLM 推理服务,以及使用 Chatbox 作为前端调用 vLLM 运行的模型(上期文章链接)。本期
    的头像 发表于 12-26 17:06 5383次阅读
    如<b class='flag-5'>何在</b>NVIDIA Jetson AGX Thor<b class='flag-5'>上部署</b>1200亿参数大模型

    迅为如何在RK3576上部署YOLOv5;基于RK3576构建智能门禁系统

    迅为如何在RK3576开发板上部署YOLOv5;基于RK3576构建智能门禁系统
    的头像 发表于 11-25 14:06 2078次阅读
    迅为如<b class='flag-5'>何在</b>RK3576<b class='flag-5'>上部署</b>YOLOv5;基于RK3576构建智能门禁系统

    完成两笔重要收购

    日前,半导体宣布已完成对Aviva Links和Kinara的收购,进一步推进智能边缘的汽车连接和人工智能创新。
    的头像 发表于 11-04 09:36 1346次阅读

    如何快速在云服务器上部署Web环境?

    如何快速在云服务器上部署Web环境
    的头像 发表于 10-14 14:16 965次阅读

    DeepSeek模型如何在云服务器上部署

    随着大型语言模型(LLM)的应用日益普及,许多开发者和企业希望将像DeepSeek这样的优秀模型部署到自己的云服务器上,以实现私有化、定制化服务并保障数据安全。本文将详细阐述部署DeepSeek模型
    的头像 发表于 10-13 16:52 1244次阅读

    产品如何赋能边缘智能发展

    边缘智能飞速发展,我们需要什么样的技术引擎加速工业和物联网创新应用的落地?日前,在深圳举办的elexcon深圳国际电子展暨嵌入式展,和IOTE 2025国际物联网展两大行业盛会上,与生态合作伙伴携手,通过一系列创新方案的展
    的头像 发表于 09-09 16:58 2271次阅读

    何在基于Arm架构的边缘AI设备上部署飞桨模型

    当 Arm 与领先的开源深度学习平台强强联合,会带来什么?那就是推动创新的“火箭燃料”。Arm 携手百度,利用双方在高能效计算平台与 AI 模型的技术积累,助力广大开发者加快边缘 AI 解决方案的开发和部署
    的头像 发表于 09-06 14:07 1571次阅读

    i.MX 95系列MPU如何赋能边缘计算

    在本系列博文的第一部分,我探讨了i.MX 95系列如何将新功能安全技术应用于工业环境、汽车领域及其他边缘应用。在接下来的文章中,我将进一步阐述i.MX 95系列如何赋能边缘计算,
    的头像 发表于 07-30 11:08 3165次阅读
    <b class='flag-5'>恩</b>智<b class='flag-5'>浦</b>i.MX 95系列MPU如何赋能<b class='flag-5'>边缘</b>计算

    Arm方案 基于Arm架构的边缘设备(树莓派或 NVIDIA Jetson Nano)上部署PyTorch模型

    本文将为你展示如何在树莓派或 NVIDIA Jetson Nano 等基于 Arm 架构的边缘设备上部署 PyTorch 模型。
    的头像 发表于 07-28 11:50 3181次阅读

    何在魔搭社区使用TensorRT-LLM加速优化Qwen3系列模型推理部署

    TensorRT-LLM 作为 NVIDIA 专为 LLM 推理部署加速优化的开源库,可帮助开发者快速利用最新 LLM 完成应用原型验证与产品部署
    的头像 发表于 07-04 14:38 2542次阅读

    eIQ Time Series Studio简介

    在当今时代,每个传感器的微小变动和振动峰值都蕴含着重要信息,时间序列数据正成为智能边缘应用的新前沿。然而,要充分利用这些数据,包括清理、建模和部署,往往需要深厚的专业知识和数周的反复试验。eIQ
    的头像 发表于 07-02 14:59 2084次阅读