0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

边缘AI应用越来越普遍,AI模型在边缘端如何部署?

Carol Li 来源:电子发烧友网 作者:李弯弯 2023-07-04 00:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)在人工智能时代,越来越多的AI应用需要从云端扩展到边缘端,比如智能耳机、智能摄像机、智能手环、物流机器人等,在边缘端部署AI已经成为趋势。如今AI大模型迅猛发展,AI大模型在端侧的部署也成了业界关注的焦点。

如何把AI模型在边缘端部署

首先得软硬件适配,硬件方面,适配的AI芯片越多越好,这样对于工程师来说,就降低了端侧模型适配迁移的难度,即使换一个设备也可以轻松部署上去;软件方面,主要的操作系统需要做适配,包括Linux、Windows、AndroidiOS等,这样无论是手机、PC都可以部署。还有框架适配,也是越全越好,比如PaddlePaddle、TensorFlow、PyTorch、Caffe、MXNet等。

其次是需要对模型进行压缩,在保证高精度的同时,最好也能够让模型跑得更快更省内存,这里需要采用模型压缩技术,比如模型量化、剪枝和蒸馏技术。尤其是如今AI大模型迅猛发展,未来大模型在端侧的部署也少不了要用到压缩技术。

可以说,模型压缩技术是实现AI大模型在边/端部署的核心技术。模型压缩技术可在保有大模型原有性能和精度基本不变前提下降低对推理算力的需求。

具体来看,量化,即将浮点计算转成低比特定点计算;网络剪枝,即去除神经网络中冗余的通道、神经元节点等;知识蒸馏,即将大模型作为教师模型,用其输出训练性能接近、结构更简的模型。

以清华大学唐杰教授团队2022年8月发布的1300亿参数模型 GLM-130B 为例,原模型支持在一台 A100 40G*8或 V100 32G*8 服务器上进行推理,而将模型量化至 INT 4精度后,相较INT 8精度其所需 GPU 内存降低50%,且可在一台4×RTX 3090(24G)或 8×RTX 2080Ti (11G )服务器上进行推理。

众多厂商实现AI大模型的端侧部署

谷歌、高通、华为等厂商已经实现AI大模型在端侧的部署。今年5月份,在Google/O开发者大会上,Google宣布了一个专门针对移动设备优化系统的TensorFlow新版本TensorFlowLite。这款被称为TensorFlowLite的软件库,是可在移动设备上运行的深度学习工具,它允许开发人员在用户的移动设备上实时地运行人工智能应用。

该软件库在设计上追求高速度和小储存,支持iOS和Android系统。如果开发者使用其他系统,也可以经过一系列复杂而冗长的编译流程,将TensorFlow编译成移动操作系统所支持的软件库,这样并不会改变TensorFlow的功能。

TensorFlowLite还提供了有限的预训练人工智能模型,包括MobileNet和InceptionV3物体识别计算机模型,以及SmartReplay自然语言处理模型。开发者用自己的数据集做的定制模型也可以部署在上面。TensorFlowLite使用Android神经网络应用程序界面(API),可以在没有加速硬件时直接调用CPU来处理,确保其可以兼容不同设备。

高通技术公司产品管理高级副总裁兼AI负责人Ziad Asghar此前表示,随着生成式AI的飞速普及,混合处理的重要性空前突显。混合处理AI的重要性空前突显,正如传统计算从大型主机和瘦客户端演变为当前云端和边缘终端相结合的模式,AI处理必须在云端和终端混合进行才能发挥其最大潜能。

根据高通的演示,将手机设置成“飞行模式”,再通过手机端全栈AI优化,这一模型能够完全在终端侧运行,实现在15秒内完成20步推理,生成饱含细节的图像。很重要的是,即便在飞行模式下,这些AI能力都可以得到实现,例如将Stable Diffusion的能力集成到相机应用中之后,用户在任何一个地点拍摄照片,再要求AI将照片背景改为夕阳之下的万里长城。

Ziad Asghar透露,如果在云端运行一个超过10亿参数的生成式AI模型,可能需要数百瓦的功耗,而在终端侧运行需要的功耗仅有几毫瓦。这赋予了高通在生成式AI领域的独特优势。不久的将来,拥有 100 亿或更高参数的模型将能够在终端上运行。

在今年3月春季旗舰新品发布会上,华为带来全新智慧搜图功能,基于多模态大模型技术,在手机端侧对模型进行小型化处理,在业界率先实现了首创的、精准的自然语言手机图库搜索体验。用户可以像与人对话一样,通过语音唤醒小艺,使用自然语言在手机图库中搜索出匹配如 “山顶看日出”、“围炉煮茶”、“蓝色珊瑚中的小丑鱼”等描述的照片。

相较于传统图库使用标签进行照片搜索,存在准确率低、响应速度慢等问题,智慧搜图更加“聪明”。结合多模态大模型技术,智慧搜图对亿级的图文数据进行预训练,增加了对泛化通用语义的理解,支持包含颜色、形状、物体、行为、时间和地点等多信息组合的自然语言搜索,同时还实现了端侧轻量化应用。

小结

由于AI在边缘或者端侧的部署具有诸多优势,近年来AI在边缘侧的应用渗透率也越来越高。AI大模型迅猛发展,未来在终端的部署也是必然趋势,众多厂商已经对此进行探索,并有所突破,期待AI大模型未来能够是实实在在赋能各行各业。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41198

    浏览量

    302629
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【幸狐Omni3576边缘计算套件试用体验】OpenClaw 板部署

    插件后,扫码绑定微信 微信弹出 ClawBot 对话框 总结 本文介绍了幸狐Omni3576边缘计算套件实现 OpenClaw 板部署,实现智能对话和终端控制的项目设计,包括环境搭建、OpenClaw
    发表于 04-19 20:56

    论马斯克的预言:AI使人类边缘

    当地时间3月11日,“Abundance Summit”科技峰会上,马斯克谈及AI进展时表示,AI已经进入自我改进阶段,超高量级AI面前
    发表于 03-14 05:27

    边缘AI算力临界点:深度解析176TOPS香橙派AI Station的产业价值

    。openEuler作为华为主导的服务器操作系统,ARM生态、内核优化和实时性方面有深厚积累,这对于将AI Station作为服务器或工业控制器使用至关重要。 真实的开发者案例:ACT模型
    发表于 03-10 14:19

    意法半导体STM32 AI模型库助力边缘AI落地应用

    开发边缘AI(Edge AI)时,可以说“理解问题本身”就已成功了一半。然而,随着AI模型持续
    的头像 发表于 01-14 11:07 859次阅读

    如何利用NPU与模型压缩技术优化边缘AI

    AI 模型体积庞大,部署 NPU上常常面临困难,这凸显了模型压缩技术的重要性。要实现高效的实时边缘
    的头像 发表于 11-07 15:26 1430次阅读
    如何利用NPU与<b class='flag-5'>模型</b>压缩技术优化<b class='flag-5'>边缘</b><b class='flag-5'>AI</b>

    工业视觉网关:RK3576赋能多路检测与边缘AI

    ,将 “多路检测 + 硬编硬解 + 边缘AI + MES集成” 融为一体:保障画质与时延的同时,显著降低系统复杂度与总体成本,并以数据闭环驱动良率持续提升。
    发表于 10-16 17:56

    此芯科技发布“合一”AI加速计划,赋能边缘AI创新

    产品组合,覆盖从1.5B至32B参数规模的AI模型推理需求,满足工业、消费电子、智能终端等多样化场景的部署需求,推动AI技术从云端向
    的头像 发表于 09-15 11:53 2011次阅读
    此芯科技发布“合一”<b class='flag-5'>AI</b>加速计划,赋能<b class='flag-5'>边缘</b>与<b class='flag-5'>端</b>侧<b class='flag-5'>AI</b>创新

    如何在基于Arm架构的边缘AI设备上部署飞桨模型

    当 Arm 与领先的开源深度学习平台强强联合,会带来什么?那就是推动创新的“火箭燃料”。Arm 携手百度,利用双方高能效计算平台与 AI 模型的技术积累,助力广大开发者加快边缘
    的头像 发表于 09-06 14:07 1336次阅读

    AI 边缘计算网关:开启智能新时代的钥匙​—龙兴物联

    在数字化浪潮的当下,AI 边缘计算网关正逐渐崭露头角,成为众多行业转型升级的关键力量。它宛如一座智能桥梁,一紧密连接着各类物理设备,如传感器、摄像头、工业机器等,负责收集丰富的数据信息;另一
    发表于 08-09 16:40

    边缘智能网关在水务行业中的应用—龙兴物联

    :‌ 减少海量抄表数据上行压力,仅上传关键信息或日/月汇总数据。 防洪排涝与雨水管理‌ 应用:‌ 雨水井、河道、排水管网部署液位、流速、雨量传感器,边缘网关实时监控。 优势:‌ 内涝实时预警:‌
    发表于 08-02 18:28

    为何边缘设备正成为AI的新重心

    人工智能 (AI) 正在以惊人的速度发展。企业不再仅仅是探索 AI,而是积极推动 AI 的规模化落地,从实验性应用转向实际部署。随着生成式模型
    的头像 发表于 07-30 09:12 1012次阅读

    边缘AI实现的核心环节:硬件选择和模型部署

    边缘AI的实现原理是将人工智能算法和模型部署到靠近数据源的边缘设备上,使这些设备能够本地进行数
    的头像 发表于 06-19 12:19 1678次阅读
    <b class='flag-5'>边缘</b><b class='flag-5'>AI</b>实现的核心环节:硬件选择和<b class='flag-5'>模型</b><b class='flag-5'>部署</b>

    STM32F769是否可以部署边缘AI

    STM32F769是否可以部署边缘AI
    发表于 06-17 06:44

    边缘AI实现的核心环节:硬件选择和模型部署

    电子发烧友网综合报道 边缘AI的实现原理是将人工智能算法和模型部署到靠近数据源的边缘设备上,使这些设备能够
    发表于 05-26 07:09 1582次阅读

    Deepseek海思SD3403边缘计算AI产品系统

    海思SD3403边缘计算AI框架,提供了一套开放式AI训练产品工具包,解决客户低成本AI系统,针对差异化AI 应用场景,自己采集样本数据,进
    发表于 04-28 11:05