0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

通过Transformer架构赋能新一代边缘AI应用

Arm社区 来源:Arm社区 2024-04-08 10:45 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工智能 (AI) 和机器学习 (ML) 的加速发展既得益于基础硬件的不断改进,也离不开软件领域的发展成果。

以 Transformer 架构为例。2017 年,谷歌在一篇研究论文中[1]首次提出这一架构,它采用自注意力机制 (self-attention),使模型能够在进行预测时对不同的输入词元 (token) 赋予不同权重。利用自注意力机制,Transformer 模型能够捕捉数据中的远程依赖关系,因此在执行语言翻译、图像处理、文本生成和情感分析等任务时非常高效。例如,生成式预训练模型 (GPT) 就是当前流行训练有素的 Transformer 模型。这些模型已经在语音助手和 AI 图像生成工具中得到应用。

这之于感知器 (perceptron) 还是存在很大的差别。感知器是早期的一种神经网络,由单层人工神经元组成,可在模式识别任务(例如,识别手写数字)中做出二元决策。相较于卷积神经网络 (CNN),Transformer 架构已开始受到更多青睐。CNN 对数据架构方式会进行内置假设,它关注附近的关系,以及观察图像或视频中的对象移动或变化方式。

而 Transformer 架构则不会做出这些假设。相反地,它利用自注意力来理解序列的不同部分如何相互关联,而忽略其位置信息。得益于这种灵活性,基于 Transformer 的模型能够更加轻松地适应不同的任务。

这是如何实现的?Transformer 架构及其采用的注意力机制彻底改变了 AI 应用的格局,因为注意力机制具备的相关功能可以为诸多用例提供支持。文本(及语言)本身就是编码信息,图像、音频以及其他形式的串行数据同样如此。由于编码信息可以解读为一种语言,因此 Transformer 模型可以广泛应用于不同的用例中。这种适应性对于理解视频、填充图像的缺失部分或同时分析来自多个摄像头的数据或多模态数据来源(参见下文示例)等任务非常有效。

2020 年问世的 Vision Transformer (ViT) 是将 Transformer 架构成功应用于图像分类的最早一批神经网络技术[2]之一。ViT 将图像划分为多个图块,并使用自注意力机制对这些图块之间的交互进行建模。

自此,Transformer 模型被迅速应用于各类视觉任务中,例如:

图像分类

目标检测

语义分割

图像超分辨率

图像生成

视频分类

在硬件上优化模型

那么,硬件与这一切有什么关系呢?关系相当密切!而且硬件将是未来发展的关键因素。

GPU、TPU 或 NPU(甚至 CPU)都可以处理 Transformer 模型所需的密集矩阵运算和并行计算。同时,Transformer 架构可使更复杂的模型运行于资源更为受限的边缘设备上。

主要有以下三个原因:

与 CNN 或循环神经网络 (RNN) 相比,Transformer 架构从本质上而言更具可并行性。这一特性能更有效地利用硬件,从而可以在计算资源受限的边缘设备上部署基于 Transformer 的模型。

自注意力机制意味着通过较小的 Transformer 模型所带来的性能表现,可以媲美基于 CNN 或 RNN 的较大模型,从而降低边缘部署的算力与内存需求。

模型压缩技术(例如剪枝、量化、知识提炼和注意力稀疏)的提升可进一步缩小 Transformer 模型的大小,同时又不会造成性能或准确性的明显下降。

Transformer 架构提升

现在,不妨想象一下功能更强大的计算资源,毕竟这一切并不遥远。通过优化支持 Transformer 架构的硬件,创新者可充分发掘这些强大神经网络的全部潜力,并为跨不同领域和模式的 AI 应用带来全新的可能性。

例如,硬件性能和效率的提升可以:

加快 Transformer 模型的推理速度,从而提高响应能力,并改善用户体验。

部署更大的 Transformer 模型,从而在语言翻译、文本生成和图像处理等任务中获得更佳表现。

提高在一系列应用和部署场景中的边缘设备、云服务器或专用 AI 加速器中部署 Transformer 解决方案的可扩展性。

探索全新架构,并不断优化 Transformer 模型。这其中包括尝试不同的层配置、注意力机制和正则化技术,以进一步提高模型的性能和效率。

显著提高能效,鉴于某些模型的规模增长,这一点至关重要。

试想一下,当你打开手机或智能眼镜上[3]的某个视觉应用,它可以识别某个款式的衬衫,并从你的衣柜中推荐与之搭配的下半身穿着。或者由于算力提升而出现的新的图像生成功能[4]。

增加计算资源并不困难。集成子系统可提供经过验证的各种处理单元块,包括 CPU、NPU、互连、内存和其他组件。而软件工具可以根据处理器来优化 Transformer 模型,以获得性能和效率的最大化。

拥抱未来

通过硬件优化,Transformer 模型架构有望推动一些令人惊叹的新应用。借助优化的硬件配置以及集成子系统、互连和软件开发,无论是更快的推理速度,为更大的模型提供更好的性能,还是更出色的可扩展性等等,这一切都将成为可能。这条通往创新和探索的全新旅程,正在蓬勃发展,引领我们走向更远的未来。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4829

    浏览量

    106809
  • 人工智能
    +关注

    关注

    1813

    文章

    49749

    浏览量

    261613
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136236
  • AI加速器
    +关注

    关注

    1

    文章

    73

    浏览量

    9434

原文标题:大咖观点 | 通过 Transformer 架构赋能新一代边缘 AI 应用

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    生成式AI虚拟调试——fe.screen-sim的架构价值

    生成式AI虚拟调试——fe.screen-sim的架构价值
    的头像 发表于 12-04 14:59 538次阅读
    生成式<b class='flag-5'>AI</b><b class='flag-5'>赋</b><b class='flag-5'>能</b>虚拟调试——fe.screen-sim的<b class='flag-5'>架构</b>价值

    正式推出新一代边缘AI芯片KL1140

    总部位于圣迭戈的 AI 科技企业 Kneron 耐今日正式发表新一代 AI 系列芯片,并由全新旗舰产品 KL1140 领衔,全面构建从终端到云端的完整
    的头像 发表于 11-28 15:01 349次阅读

    Nordic新一代NRF54高性能蓝牙, 更多穿戴戒指行业客户产品

    智能可穿戴设备公司陆续推出智能戒指产品,而Nordic Semiconductor新一代超低功耗无线SoC芯片NRF54L15,重新定义了健康与健身追踪可穿戴技术的可能性。 基于Nordic
    发表于 11-26 17:19

    AI管理系统,通过AI模型提高能耗管理

    AI管理系统,通过AI模型提高能耗管理 在能源转型成为全球共识的今天,储
    的头像 发表于 11-05 17:52 506次阅读

    工业视觉网关:RK3576多路检测与边缘AI

    ~150ms6TOPS NPU 边缘AI推理易对接 MES / 追溯系统 、产线痛点:从“人看”到“机判”的转变· 多工位/多角度同步:单机位覆盖不足,典型项目需 8~12 路并发,且画面时序
    发表于 10-16 17:56

    【内测活动同步开启】这么小?这么强?新一代大模型MCP开发板来啦!

    【内测活动同步开启】这么小?这么强?新一代大模型MCP开发板来啦! 聆思全新一代六合芯片「LS26系列」,搭载WIFI / BLE & BT / NPU,与「小聆AI」强强
    发表于 09-25 11:47

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    Transformer 模型的后继者 二、用创新方法实现深度学习AI芯片 1、基于开源RISC-V的AI加速器 RISC-V是种开源、模块化的指令集
    发表于 09-12 17:30

    广和通发布新一代AI语音智能体FiboVista

    近日,2025火山引擎Force原动力大会正式开幕。广和通发布新一代AI语音智能体FiboVista,并已率先应用于车联网,成为智能驾驶的“用车伙伴”和“出行伴侣”。通过创新AI大模型
    的头像 发表于 06-17 09:22 1002次阅读

    芯原可扩展的高性能GPGPU-AI计算IP汽车与边缘服务器AI解决方案

    芯原股份 (芯原,股票代码:688521.SH) 日前宣布其 高性能、可扩展的GPGPU-AI计算IP的最新进展,这些IP现已为新一代汽车电子和边缘服务器应用提供强劲
    的头像 发表于 06-16 10:44 1117次阅读

    Transformer架构概述

    由于Transformer模型的出现和快速发展,深度学习领域正在经历场翻天覆地的变化。这些突破性的架构不仅重新定义了自然语言处理(NLP)的标准,而且拓宽了视野,彻底改变了AI的许多
    的头像 发表于 06-10 14:24 970次阅读
    <b class='flag-5'>Transformer</b><b class='flag-5'>架构</b>概述

    宝马发布全新一代智能电子电气架构

    "超级大脑"宝马新世代车型智能驾驶乐趣 全新一代电子电气架构搭载新世代车型,覆盖全动力系统和全细分车型 全新一代电子电气
    的头像 发表于 03-13 15:42 553次阅读

    华为发布新一代站点能源架构AI数据中心建设原则

    在MWC25巴塞罗那期间举办的产品与解决方案发布会上,华为数据中心能源及关键供电产品线总裁何波发布新一代站点能源架构“Single SitePower”及AI数据中心建设原则RASTM,旨在加速运营商成为能源产消者,打造更优IC
    的头像 发表于 03-06 11:16 918次阅读

    AI边缘网关:开启智能时代的新蓝海

    。这变革不仅带来了技术架构的革新,更为产业发展开辟了新的增长空间。 传统边缘网关受限于计算能力和算法支持,往往只能完成数据采集和简单处理,大量原始数据需要回传云端处理,导致响应延迟和带宽压力。
    发表于 02-15 11:41

    德州仪器发布新一代汽车芯片,边缘AI与音频体验

    尤为引人注目。这款传感器通过单个芯片即可运行边缘AI算法,实现占用检测、车内儿童检测和入侵检测等多重功能,为驾乘人员营造了个更加安全的驾驶环境。其精准的检测能力和高效的算法运行,无疑
    的头像 发表于 01-13 11:34 1282次阅读

    芯原发布新一代Vitality架构GPU IP系列

    芯原股份近日宣布,正式推出全新Vitality架构的图形处理器(GPU)IP系列。这一新一代GPU架构以其卓越的计算性能和广泛的应用领域,吸引了业界的广泛关注。 Vitality GPU架构
    的头像 发表于 12-24 10:55 1287次阅读