0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

通过Transformer架构赋能新一代边缘AI应用

Arm社区 来源:Arm社区 2024-04-08 10:45 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工智能 (AI) 和机器学习 (ML) 的加速发展既得益于基础硬件的不断改进,也离不开软件领域的发展成果。

以 Transformer 架构为例。2017 年,谷歌在一篇研究论文中[1]首次提出这一架构,它采用自注意力机制 (self-attention),使模型能够在进行预测时对不同的输入词元 (token) 赋予不同权重。利用自注意力机制,Transformer 模型能够捕捉数据中的远程依赖关系,因此在执行语言翻译、图像处理、文本生成和情感分析等任务时非常高效。例如,生成式预训练模型 (GPT) 就是当前流行训练有素的 Transformer 模型。这些模型已经在语音助手和 AI 图像生成工具中得到应用。

这之于感知器 (perceptron) 还是存在很大的差别。感知器是早期的一种神经网络,由单层人工神经元组成,可在模式识别任务(例如,识别手写数字)中做出二元决策。相较于卷积神经网络 (CNN),Transformer 架构已开始受到更多青睐。CNN 对数据架构方式会进行内置假设,它关注附近的关系,以及观察图像或视频中的对象移动或变化方式。

而 Transformer 架构则不会做出这些假设。相反地,它利用自注意力来理解序列的不同部分如何相互关联,而忽略其位置信息。得益于这种灵活性,基于 Transformer 的模型能够更加轻松地适应不同的任务。

这是如何实现的?Transformer 架构及其采用的注意力机制彻底改变了 AI 应用的格局,因为注意力机制具备的相关功能可以为诸多用例提供支持。文本(及语言)本身就是编码信息,图像、音频以及其他形式的串行数据同样如此。由于编码信息可以解读为一种语言,因此 Transformer 模型可以广泛应用于不同的用例中。这种适应性对于理解视频、填充图像的缺失部分或同时分析来自多个摄像头的数据或多模态数据来源(参见下文示例)等任务非常有效。

2020 年问世的 Vision Transformer (ViT) 是将 Transformer 架构成功应用于图像分类的最早一批神经网络技术[2]之一。ViT 将图像划分为多个图块,并使用自注意力机制对这些图块之间的交互进行建模。

自此,Transformer 模型被迅速应用于各类视觉任务中,例如:

图像分类

目标检测

语义分割

图像超分辨率

图像生成

视频分类

在硬件上优化模型

那么,硬件与这一切有什么关系呢?关系相当密切!而且硬件将是未来发展的关键因素。

GPU、TPU 或 NPU(甚至 CPU)都可以处理 Transformer 模型所需的密集矩阵运算和并行计算。同时,Transformer 架构可使更复杂的模型运行于资源更为受限的边缘设备上。

主要有以下三个原因:

与 CNN 或循环神经网络 (RNN) 相比,Transformer 架构从本质上而言更具可并行性。这一特性能更有效地利用硬件,从而可以在计算资源受限的边缘设备上部署基于 Transformer 的模型。

自注意力机制意味着通过较小的 Transformer 模型所带来的性能表现,可以媲美基于 CNN 或 RNN 的较大模型,从而降低边缘部署的算力与内存需求。

模型压缩技术(例如剪枝、量化、知识提炼和注意力稀疏)的提升可进一步缩小 Transformer 模型的大小,同时又不会造成性能或准确性的明显下降。

Transformer 架构提升

现在,不妨想象一下功能更强大的计算资源,毕竟这一切并不遥远。通过优化支持 Transformer 架构的硬件,创新者可充分发掘这些强大神经网络的全部潜力,并为跨不同领域和模式的 AI 应用带来全新的可能性。

例如,硬件性能和效率的提升可以:

加快 Transformer 模型的推理速度,从而提高响应能力,并改善用户体验。

部署更大的 Transformer 模型,从而在语言翻译、文本生成和图像处理等任务中获得更佳表现。

提高在一系列应用和部署场景中的边缘设备、云服务器或专用 AI 加速器中部署 Transformer 解决方案的可扩展性。

探索全新架构,并不断优化 Transformer 模型。这其中包括尝试不同的层配置、注意力机制和正则化技术,以进一步提高模型的性能和效率。

显著提高能效,鉴于某些模型的规模增长,这一点至关重要。

试想一下,当你打开手机或智能眼镜上[3]的某个视觉应用,它可以识别某个款式的衬衫,并从你的衣柜中推荐与之搭配的下半身穿着。或者由于算力提升而出现的新的图像生成功能[4]。

增加计算资源并不困难。集成子系统可提供经过验证的各种处理单元块,包括 CPU、NPU、互连、内存和其他组件。而软件工具可以根据处理器来优化 Transformer 模型,以获得性能和效率的最大化。

拥抱未来

通过硬件优化,Transformer 模型架构有望推动一些令人惊叹的新应用。借助优化的硬件配置以及集成子系统、互连和软件开发,无论是更快的推理速度,为更大的模型提供更好的性能,还是更出色的可扩展性等等,这一切都将成为可能。这条通往创新和探索的全新旅程,正在蓬勃发展,引领我们走向更远的未来。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4842

    浏览量

    108152
  • 人工智能
    +关注

    关注

    1820

    文章

    50314

    浏览量

    266868
  • 机器学习
    +关注

    关注

    67

    文章

    8562

    浏览量

    137209
  • AI加速器
    +关注

    关注

    1

    文章

    73

    浏览量

    9535

原文标题:大咖观点 | 通过 Transformer 架构赋能新一代边缘 AI 应用

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    第二AMD VERSAL AI EDGE系列全面汽车ADAS系统

    选择 AMD 自适应 SoC 和 FPGA 第二 AMD Versal AI Edge 系列自适应 SoC 带来种高性能单芯片解决方案,为自动驾驶
    的头像 发表于 03-27 16:30 898次阅读
    第二<b class='flag-5'>代</b>AMD VERSAL <b class='flag-5'>AI</b> EDGE系列全面<b class='flag-5'>赋</b><b class='flag-5'>能</b>汽车ADAS系统

    恩智浦创新模拟前端新一代热量式流量计

    从确保医疗设备的精准给药,到监测环境系统、优化工业流程,精确的流体测量在各行各业都至关重要。恩智浦NAFE13144 AFE新一代热量式流量计,具备更高的可靠性与性能,适用于多种严苛的应用场景。
    的头像 发表于 03-16 09:47 780次阅读
    恩智浦创新模拟前端<b class='flag-5'>赋</b><b class='flag-5'>能</b><b class='flag-5'>新一代</b>热量式流量计

    论马斯克的预言:AI使人类边缘

    依据 马斯克认为AI已进入“递归式自我改进”阶段,新一代AI模型由上一代模型参与训练,人类监督的角色正在被边缘化。他预计完全自动化的
    发表于 03-14 05:27

    Transformer 入门:从零理解 AI 大模型的核心原理

    Normalization) Transformer 使用的是层归化,它在每层对数据进行标准化: 计算步骤 ini 体验AI代码助手 代码解读 复制代码 输入向量:x = [
    发表于 02-10 16:33

    AI 边缘计算 + EtherCAT 实时控制:新一代 EMS 控制器架构演进

    正在成型—— AI 边缘计算 + 储 EMS + EtherCAT 实时控制 。 而这,也正是新一代控制器正在走的方向。
    的头像 发表于 01-22 11:04 480次阅读

    DPU新一代边缘数据中心算力革新

    场景中,对数据采集和处理的时效性、连续性、安全性、隐私性,以及数据价值的挖掘和利用,都有更高的要求。因此,未来几年是构建新一代智能数据中心基础设施的关键时期,数据中心将从“云+端”转变为“云+边+端”三层架构
    的头像 发表于 01-21 09:27 651次阅读
    DPU<b class='flag-5'>赋</b><b class='flag-5'>能</b><b class='flag-5'>新一代</b><b class='flag-5'>边缘</b>数据中心算力革新

    MIPS 推出软件优先的 S8200 RISC-V NPU,自主边缘物理 AI

    日,中国上海 —— 格罗方德(GlobalFoundries)旗下公司 MIPS 正式发布 MIPS S8200 处理器 IP 的详细信息,旨在新一代嵌入式平台的 AI 工作负载
    的头像 发表于 01-14 10:26 6.6w次阅读
    MIPS 推出软件优先的 S8200 RISC-V NPU,<b class='flag-5'>赋</b><b class='flag-5'>能</b>自主<b class='flag-5'>边缘</b>物理 <b class='flag-5'>AI</b>

    生成式AI虚拟调试——fe.screen-sim的架构价值

    生成式AI虚拟调试——fe.screen-sim的架构价值
    的头像 发表于 12-04 14:59 1189次阅读
    生成式<b class='flag-5'>AI</b><b class='flag-5'>赋</b><b class='flag-5'>能</b>虚拟调试——fe.screen-sim的<b class='flag-5'>架构</b>价值

    正式推出新一代边缘AI芯片KL1140

    总部位于圣迭戈的 AI 科技企业 Kneron 耐今日正式发表新一代 AI 系列芯片,并由全新旗舰产品 KL1140 领衔,全面构建从终端到云端的完整
    的头像 发表于 11-28 15:01 844次阅读

    Nordic新一代NRF54高性能蓝牙, 更多穿戴戒指行业客户产品

    智能可穿戴设备公司陆续推出智能戒指产品,而Nordic Semiconductor新一代超低功耗无线SoC芯片NRF54L15,重新定义了健康与健身追踪可穿戴技术的可能性。 基于Nordic
    发表于 11-26 17:19

    AI管理系统,通过AI模型提高能耗管理

    AI管理系统,通过AI模型提高能耗管理 在能源转型成为全球共识的今天,储
    的头像 发表于 11-05 17:52 972次阅读

    工业视觉网关:RK3576多路检测与边缘AI

    ~150ms6TOPS NPU 边缘AI推理易对接 MES / 追溯系统 、产线痛点:从“人看”到“机判”的转变· 多工位/多角度同步:单机位覆盖不足,典型项目需 8~12 路并发,且画面时序
    发表于 10-16 17:56

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    Transformer 模型的后继者 二、用创新方法实现深度学习AI芯片 1、基于开源RISC-V的AI加速器 RISC-V是种开源、模块化的指令集
    发表于 09-12 17:30

    芯原可扩展的高性能GPGPU-AI计算IP汽车与边缘服务器AI解决方案

    芯原股份 (芯原,股票代码:688521.SH) 日前宣布其 高性能、可扩展的GPGPU-AI计算IP的最新进展,这些IP现已为新一代汽车电子和边缘服务器应用提供强劲
    的头像 发表于 06-16 10:44 1520次阅读

    Transformer架构概述

    由于Transformer模型的出现和快速发展,深度学习领域正在经历场翻天覆地的变化。这些突破性的架构不仅重新定义了自然语言处理(NLP)的标准,而且拓宽了视野,彻底改变了AI的许多
    的头像 发表于 06-10 14:24 1443次阅读
    <b class='flag-5'>Transformer</b><b class='flag-5'>架构</b>概述