0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

边缘AI应用越来越普遍,AI模型在边缘端如何部署?

Carol Li 来源:电子发烧友网 作者:李弯弯 2023-07-04 00:11 次阅读

电子发烧友网报道(文/李弯弯)在人工智能时代,越来越多的AI应用需要从云端扩展到边缘端,比如智能耳机、智能摄像机、智能手环、物流机器人等,在边缘端部署AI已经成为趋势。如今AI大模型迅猛发展,AI大模型在端侧的部署也成了业界关注的焦点。

如何把AI模型在边缘端部署

首先得软硬件适配,硬件方面,适配的AI芯片越多越好,这样对于工程师来说,就降低了端侧模型适配迁移的难度,即使换一个设备也可以轻松部署上去;软件方面,主要的操作系统需要做适配,包括Linux、Windows、AndroidiOS等,这样无论是手机、PC都可以部署。还有框架适配,也是越全越好,比如PaddlePaddle、TensorFlow、PyTorch、Caffe、MXNet等。

其次是需要对模型进行压缩,在保证高精度的同时,最好也能够让模型跑得更快更省内存,这里需要采用模型压缩技术,比如模型量化、剪枝和蒸馏技术。尤其是如今AI大模型迅猛发展,未来大模型在端侧的部署也少不了要用到压缩技术。

可以说,模型压缩技术是实现AI大模型在边/端部署的核心技术。模型压缩技术可在保有大模型原有性能和精度基本不变前提下降低对推理算力的需求。

具体来看,量化,即将浮点计算转成低比特定点计算;网络剪枝,即去除神经网络中冗余的通道、神经元节点等;知识蒸馏,即将大模型作为教师模型,用其输出训练性能接近、结构更简的模型。

以清华大学唐杰教授团队2022年8月发布的1300亿参数模型 GLM-130B 为例,原模型支持在一台 A100 40G*8或 V100 32G*8 服务器上进行推理,而将模型量化至 INT 4精度后,相较INT 8精度其所需 GPU 内存降低50%,且可在一台4×RTX 3090(24G)或 8×RTX 2080Ti (11G )服务器上进行推理。

众多厂商实现AI大模型的端侧部署

谷歌、高通、华为等厂商已经实现AI大模型在端侧的部署。今年5月份,在Google/O开发者大会上,Google宣布了一个专门针对移动设备优化系统的TensorFlow新版本TensorFlowLite。这款被称为TensorFlowLite的软件库,是可在移动设备上运行的深度学习工具,它允许开发人员在用户的移动设备上实时地运行人工智能应用。

该软件库在设计上追求高速度和小储存,支持iOS和Android系统。如果开发者使用其他系统,也可以经过一系列复杂而冗长的编译流程,将TensorFlow编译成移动操作系统所支持的软件库,这样并不会改变TensorFlow的功能。

TensorFlowLite还提供了有限的预训练人工智能模型,包括MobileNet和InceptionV3物体识别计算机模型,以及SmartReplay自然语言处理模型。开发者用自己的数据集做的定制模型也可以部署在上面。TensorFlowLite使用Android神经网络应用程序界面(API),可以在没有加速硬件时直接调用CPU来处理,确保其可以兼容不同设备。

高通技术公司产品管理高级副总裁兼AI负责人Ziad Asghar此前表示,随着生成式AI的飞速普及,混合处理的重要性空前突显。混合处理AI的重要性空前突显,正如传统计算从大型主机和瘦客户端演变为当前云端和边缘终端相结合的模式,AI处理必须在云端和终端混合进行才能发挥其最大潜能。

根据高通的演示,将手机设置成“飞行模式”,再通过手机端全栈AI优化,这一模型能够完全在终端侧运行,实现在15秒内完成20步推理,生成饱含细节的图像。很重要的是,即便在飞行模式下,这些AI能力都可以得到实现,例如将Stable Diffusion的能力集成到相机应用中之后,用户在任何一个地点拍摄照片,再要求AI将照片背景改为夕阳之下的万里长城。

Ziad Asghar透露,如果在云端运行一个超过10亿参数的生成式AI模型,可能需要数百瓦的功耗,而在终端侧运行需要的功耗仅有几毫瓦。这赋予了高通在生成式AI领域的独特优势。不久的将来,拥有 100 亿或更高参数的模型将能够在终端上运行。

在今年3月春季旗舰新品发布会上,华为带来全新智慧搜图功能,基于多模态大模型技术,在手机端侧对模型进行小型化处理,在业界率先实现了首创的、精准的自然语言手机图库搜索体验。用户可以像与人对话一样,通过语音唤醒小艺,使用自然语言在手机图库中搜索出匹配如 “山顶看日出”、“围炉煮茶”、“蓝色珊瑚中的小丑鱼”等描述的照片。

相较于传统图库使用标签进行照片搜索,存在准确率低、响应速度慢等问题,智慧搜图更加“聪明”。结合多模态大模型技术,智慧搜图对亿级的图文数据进行预训练,增加了对泛化通用语义的理解,支持包含颜色、形状、物体、行为、时间和地点等多信息组合的自然语言搜索,同时还实现了端侧轻量化应用。

小结

由于AI在边缘或者端侧的部署具有诸多优势,近年来AI在边缘侧的应用渗透率也越来越高。AI大模型迅猛发展,未来在终端的部署也是必然趋势,众多厂商已经对此进行探索,并有所突破,期待AI大模型未来能够是实实在在赋能各行各业。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26458

    浏览量

    264072
收藏 人收藏

    评论

    相关推荐

    NVIDIA与恩智浦联手,在边缘设备上部署AI模型

    恩智浦工业及IoT边缘高级副总裁Charles Dachs表示,人工智能的创新将塑造智能互联世界的未来,融入Nvidia先进的AI培训技术以及恩智浦在工业及物联网边缘科研实力,将产生协同效益,让用户能更迅速地将自家
    的头像 发表于 03-25 16:05 498次阅读

    英特尔发布全新边缘计算平台,解决AI边缘落地难题

    电子发烧友网报道(文/李弯弯)AI越来越多地在边缘部署。Gartner最新预测数据显示,到2025年,50%以上的企业管理数据将在数据中心或云之外创建和处理。随着
    的头像 发表于 03-12 09:06 2658次阅读

    NanoEdge AI的技术原理、应用场景及优势

    ,可以减少数据传输过程中被窃取或篡改的风险,提高数据安全性。 - 低能耗:通过优化神经网络模型和硬件设计,NanoEdge AI 可以在有限的资源下实现高效的计算,降低设备的能耗。
    发表于 03-12 08:09

    什么是AI边缘计算,AI边缘计算的特点和优势介绍

    随着人工智能的迅猛发展,AI边缘计算成为了热门话题。那么什么是AI边缘计算呢?简单来说,它是将人工智能技术引入边缘计算的新兴领域,旨在将计算
    的头像 发表于 02-01 11:42 334次阅读

    通用Tensilica软件堆栈提供最佳边缘AI性能

    开发敏捷的软件堆栈对 AI边缘侧的成功部署非常重要。
    的头像 发表于 01-18 13:39 498次阅读
    通用Tensilica软件堆栈提供最佳<b class='flag-5'>边缘</b><b class='flag-5'>AI</b>性能

    AI边缘计算机应用场景广泛!大语言模型与数字人结合方案在边缘侧落地

    。   当下,AI边缘侧的部署正在成为趋势,包括近年来备受瞩目的大语言模型,在边缘侧的应用也是业界探索的焦点,
    的头像 发表于 01-16 01:11 1558次阅读

    边缘AI它到底是什么?能做什么?

    边缘AI它到底是什么?能做什么? 边缘人工智能是一种新兴的人工智能技术,它将人工智能的计算和决策能力移动到离数据生成源和终端设备更近的边缘节点上。与传统的云计算方式相比,
    的头像 发表于 01-11 14:44 664次阅读

    边缘部署模型优势多!模型量化解决边缘设备资源限制问题

    电子发烧友网报道(文/李弯弯)大模型边缘部署是将大模型部署边缘设备上,以实现更快速、更低延迟
    的头像 发表于 01-05 00:06 1558次阅读

    算力强劲的AI边缘计算盒子# 边缘计算

    AI边缘计算
    成都华江信息
    发布于 :2023年11月24日 16:31:06

    走向边缘智能,美格智能携手阿加犀成功在高算力AI模组上运行一系列大语言模型

    近日,美格智能发挥软硬件一体协同开发能力,融合阿加犀卓越的AI优化部署技术,在搭载高通QCS8550平台的高算力AI模组上,成功运行了一系列大语言模型,包括LLaMA-2、通义千问Qw
    的头像 发表于 11-14 14:39 525次阅读

    走向边缘智能,美格智能携手阿加犀成功在高算力AI模组上运行一系列大语言模型

    模型、RedPajama、ChatGLM2、Vicuna,展现出卓越的边缘端大模型部署能力。▌构建智算底座,加速大模型端侧
    的头像 发表于 11-14 14:34 214次阅读
    走向<b class='flag-5'>边缘</b>智能,美格智能携手阿加犀成功在高算力<b class='flag-5'>AI</b>模组上运行一系列大语言<b class='flag-5'>模型</b>

    什么是边缘计算盒子(AI算法盒子)?

    边缘计算盒子是一种基于边缘计算和人工智能技术的智能设备,它内置了灵活可配的多样化AI算法库,所以也被称为AI算法盒子或智能边缘分析一体机,可
    的头像 发表于 10-31 14:29 1273次阅读
    什么是<b class='flag-5'>边缘</b>计算盒子(<b class='flag-5'>AI</b>算法盒子)?

    边缘计算ai技术是什么?

    边缘计算ai技术是什么? 边缘计算AI技术是指将人工智能技术应用于边缘计算中的一种新兴技术。边缘
    的头像 发表于 08-24 15:49 742次阅读

    AI边缘计算是什么意思?边缘ai是什么?AI边缘计算应用

    AI边缘计算是什么意思?边缘ai是什么?AI边缘计算应用  随着人工智能技术的不断发展,
    的头像 发表于 08-24 15:18 1494次阅读

    AI边缘计算盒子是如何推动边缘AI应用落地的

    AI边缘计算盒子(AI Edge Computing Box)是一种集成了边缘计算和AI算法处理能力的设备,可以用于推动
    的头像 发表于 05-26 14:08 698次阅读