0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm平台赋能移动端生成式AI

Arm社区 来源:Arm社区 2024-04-26 11:09 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

生成式人工智能 (Generative AI) 涵盖了当下广为人知,且备受关注的大语言模型 (LLM),如今也已落地边缘侧的移动设备。这意味着,无论是生成图像和视频,还是理解上下文语义,AI 的生成式推理将开始由移动设备进行全权处理,而非交由云端处理后返回结果。

Arm 作为基石技术,使得无处不在的 AI 成为可能,其中就包括移动端的生成式 AI。无论是支持 AI 功能的新款旗舰智能手机,还是直接在 Arm CPU 上处理 LLM,这些振奋人心的开发成果都展现了 Arm 作为基石技术的实际应用价值。

AI 赋能的新款智能手机

采用 Armv9 架构的 CPU 和 GPU 技术的高性能 AI 智能手机现已问世,其中包括搭载 MediaTek 天玑 9300 的 vivo X100 和 X100 Pro 智能手机、三星 Galaxy S24 以及谷歌 Pixel 8。

这些旗舰移动设备兼顾性能与效率,为 AI 创新提供了前所未有的机遇。事实上,在过去十年间,得益于 Arm CPU 和 GPU 的性能提升,在移动平台上的 AI 处理能力每两年实现翻番。

未来,我们会将更多 AI 性能、技术和功能加入到我们坚实的消费技术路线图中,推动这一趋势不断发展。同样起助推作用的还有当下的边缘侧 AI 推理热潮,以及使用 LLM 等经过训练的模型来驱动基于 AI 的应用,随着更多的 AI 支持和专用指令的加入,CPU 将成为满足这一需求的理想选择。

一切始于 CPU

大多数情况下,移动设备的 AI 功能都始于 CPU,例如对面部、手部和身体动作的追踪,高级的相机效果和滤镜,以及许多社交应用中的细分功能。此类 AI 工作负载的处理可能全权交由 CPU,或是结合 GPU 或 NPU 等协处理器一起提供支持。Arm 的 CPU 设计广泛应用于当今全球数十亿人使用的智能手机系统级芯片 (SoC) 中,对于在终端设备实现 AI 工作负载至关重要。

目前,70% 的第三方应用所使用的 AI 均基于 Arm CPU 运行,包括新发布的社交类、健康类和基于相机功能的应用等。除了设计的普及性,Arm CPU 还具有灵活性和 AI 功能,因此成为了移动设备领域开发者首选的应用 AI 工作负载处理器。

就灵活性而言,Arm CPU 能够以多种数据格式运行各类神经网络。展望未来,未来的 Arm CPU 将在指令集中加入更多 AI 功能,惠及行业领先的 Arm 生态系统,例如适用于 Armv9-A 架构的可扩展矩阵扩展 (Scalable Matrix Extension, SME),帮助全球开发者为其 AI 应用提供更高的性能、创新功能和可扩展性。

Arm 将领先的硬件水平与软件生态系统支持相结合,打造出高性能计算平台,推动边缘生成式 AI 的兴起,让游戏迭代、图像增强、语言翻译、文本生成和虚拟助手等功能成为可能。我们在今年二月的 2024 世界移动通信大会 (MWC 2024)上展示了部分新一代 AI 工作负载的示例。

Arm 计算平台上的移动端 LLM

我们制作了一个虚拟助手演示,在移动端聊天类应用上使用了 Meta 的 LLAMA2-7B LLM。基于 Arm CPU,无需加速器,即可完全在边缘侧移动设备上运行生成式 AI 工作负载。利用现有的针对 AI 的 CPU 指令,结合 Arm 计算平台(包括 Arm AI 软件库)针对 LLM 的专门的软件优化,我们实现了出色的性能表现。

从上面的视频中可以看出,词元 (Token) 首次响应时间表现优异,文本生成速率接近每秒 10 个词元,高于人们的平均阅读速度。这得益于经过高度优化的 CPU 例程,它来自于由 Arm 工程团队开发的软件库;与 LLAMA2-7B LLM 中的原生实现相比,词元首次响应时间缩短 50%,文本生成速率提高 20%。

此外,AI 开发者也可在 Arm CPU 上利用自己的技术,进一步优化软件,让 LLM 变得更小、更高效、更快速。

LLM 越小、越快,就意味着 AI 处理可以在边缘侧进行。用户可以享受到响应更快、更灵敏的 AI 体验。此外,由于用户数据仅在移动设备本地处理,隐私保护也能做得更好。同时,对于移动端生态系统而言,这种成本更低、可扩展性更强的选择,也更有利于在数十亿移动设备上部署 AI。

推动移动设备上的生成式 AI

作为最为普及的移动端计算平台和高效计算领域的领导者,Arm 担负着在边缘侧实现高效、高性能生成式 AI 的责任。我们已经展示了完全基于我们领先的 CPU 技术所运行的 LLM 的卓越性能。而这仅仅只是开始。

更小、更高效的 LLM,Arm CPU 为移动设备带来的更高性能,以及由业界领先的生态系统所提供的创新软件优化,三者的结合将继续推动移动端生成式 AI 的普及。

鉴于 Arm CPU 是移动端生成式 AI 创新的核心,作为 AI 的运行基础,Arm 将持续赋能每位开发者,实现无处不在的 AI。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    836

    浏览量

    39712
  • ARM技术
    +关注

    关注

    0

    文章

    22

    浏览量

    7646
  • 人工智能
    +关注

    关注

    1813

    文章

    49735

    浏览量

    261532
  • 大模型
    +关注

    关注

    2

    文章

    3440

    浏览量

    4967
  • 生成式AI
    +关注

    关注

    0

    文章

    537

    浏览量

    1021

原文标题:Arm 平台赋能移动端生成式 AI

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    生成AI虚拟调试——fe.screen-sim的架构价值

    生成AI虚拟调试——fe.screen-sim的架构价值
    的头像 发表于 12-04 14:59 514次阅读
    <b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b><b class='flag-5'>赋</b><b class='flag-5'>能</b>虚拟调试——fe.screen-sim的架构价值

    全新Arm C1 CPU集群推动移动AI转型

    随着用户期待在不连接云端服务的情况下,能在移动设备上享有更好的即时响应、更智能的个性化服务,更加实时处理的体验,使其正迅速成为人工智能 (AI) 的强大载体。与此同时,随着移动
    的头像 发表于 09-15 14:27 1097次阅读
    全新<b class='flag-5'>Arm</b> C1 CPU集群推动<b class='flag-5'>移动</b><b class='flag-5'>端</b>侧<b class='flag-5'>AI</b>转型

    负载减少50%!ArmAI重新定义移动图形渲染

    电子发烧友网报道(文 / 吴子鹏)在移动互联网与游戏产业深度融合的当下,用户对移动游戏体验的期待持续攀升 —— 更清晰的画质、更流畅的帧率、更长的续航能力。然而,要在移动
    发表于 08-20 08:00 3838次阅读
    负载减少50%!<b class='flag-5'>Arm</b>用<b class='flag-5'>AI</b>重新定义<b class='flag-5'>移动</b><b class='flag-5'>端</b>图形渲染

    Arm率先适配腾讯混元开源模型,助力AI创新开发

    共同侧人工智能 (AI) 部署,助力本土开发者实现 AI 应用创新! 这次的首日开源适配是双方再次携手提升
    的头像 发表于 08-08 09:16 1150次阅读
    <b class='flag-5'>Arm</b>率先适配腾讯混元开源模型,助力<b class='flag-5'>端</b>侧<b class='flag-5'>AI</b>创新开发

    浙江移动携手华为全面推进AI+应用百花齐放

    AI作为新质生产力的核心驱动力,正加速浙江移动自有业务的数智化转型。浙江移动携手华为,全面推进AI+
    的头像 发表于 07-28 10:07 593次阅读

    利用NVIDIA 3D引导生成AI Blueprint控制图像生成

    AI 的图像生成技术突飞猛进,从早期模型会生成手指过多的人类图像,到现在创造出令人惊叹的逼
    的头像 发表于 06-05 09:24 737次阅读

    Arm 公司面向移动市场的 ​Arm Lumex​ 深度解读

    面向移动市场的 ​ Arm Lumex ​ 深度解读 ​ Arm Lumex ​ 是 Arm 公司面向
    的头像 发表于 05-29 09:54 4054次阅读

    IBM如何基于SAP平台和数据推动生成AI的成功应用

    “近日,IBM 商业价值研究院(IBV)与 SAP 研究洞察中心联合开展了一项大规模调研,覆盖全球 1200余位全球企业高管,其中 200位来自大中华区,以深入洞察组织如何基于 SAP 平台和数据推动生成
    的头像 发表于 04-17 10:20 819次阅读

    Banana Pi 发布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 计算与嵌入开发

    架构,多场景应用 BPI-AI2N 采用 RZ/V2N 处理器,集成 4 核 Arm® Cortex®-A55(1.8GHz)与 Cortex®-M33(200MHz),提供强劲的
    发表于 03-19 17:54

    MWC2025亮点放送 探索Arm如何塑造移动技术未来

    ,彰显了人工智能 (AI) 和移动技术之间的共生关系。  Arm 计算平台能从云到边的
    的头像 发表于 03-14 15:40 1275次阅读
    MWC2025亮点放送 探索<b class='flag-5'>Arm</b>如何塑造<b class='flag-5'>移动</b><b class='flag-5'>端</b>技术未来

    富士通如何解锁生成AI红利 从人才进化到业务

    生成AI技术正以每周迭代一次的速度重塑商业世界。利用生成AI,营销部门10分钟就可以产出百张
    的头像 发表于 02-25 17:32 1078次阅读

    生成AI工具好用吗

    当下,生成AI工具正以其强大的内容生成能力,为用户带来了前所未有的便捷与创新。那么,生成
    的头像 发表于 01-17 09:54 819次阅读

    联发科技携手Cocos共建生成AI游戏开发生态,推动行业升级

    全球领先的半导体公司联发科技与知名游戏引擎开发商Cocos正式宣布达成深度合作!这一合作将把联发科技在生成AI领域的尖端技术,与Cocos在游戏开发领域的深厚积累深度结合,为开发
    的头像 发表于 01-10 09:24 714次阅读

    基于Arm Neoverse平台的处理器革新生成AI体验

    Llama 是一个专为开发者、研究人员和企业打造的开源大语言模型 (LLM) 库,旨在推动生成 AI 的创新、实验及可靠地扩展。
    的头像 发表于 01-03 15:31 1156次阅读
    基于<b class='flag-5'>Arm</b> Neoverse<b class='flag-5'>平台</b>的处理器革新<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>体验

    Google两款先进生成AI模型登陆Vertex AI平台

    新的 AI 模型,包括最先进的视频生成模型Veo以及最高品质的图像生成模型Imagen 3。近日,我们在 Google Cloud 上进一步推动这一势头,客户可以在Vertex AI
    的头像 发表于 12-30 09:56 979次阅读