0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人工智能资源利用率的问题如何解决?

我快闭嘴 来源:爱集微 作者:嘉德IPR 2020-10-26 10:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

华为发明的卷积运算芯片,能够在提高阵列资源利用率的同时降低RAM访问次数,进而减小RAM的访问压力。

目前,深度神经网络技术已经成为人工智能领域的代表性算法,基于深度神经网络技术的字符识别、图像分类或语音识别等关键技术,已经广泛应用于搜索引擎和智能手机等产品中。

其中,当前最为有效且应用最为广泛的神经网络算法是卷积神经网络算法,简称“卷积运算”。在现有技术中,CNN算法的核心计算单元是乘加运算,乘法累加器阵列常用于矩阵乘法运算,而卷积运算可以转换为矩阵乘法运算。因此业界广泛采用MAC(乘累加器)阵列为计算核心的专用加速硬件,例如:现场可编程门阵列(FPGA)、专用集成电路ASIC)等,以加速卷积运算的运算速度。

但是目前卷积计算也存在着一些问题,一方面,当MAC阵列中存在多个卷积窗口同时进行卷积运算时,这些卷积窗口分布在MAC阵列中的不同位置,使得MAC阵列的利用率非常低。另一方面,存在大量重复数据被从RAM输入到MAC阵列,这样会增加RAM的访问次数。

为了解决这样的问题,华为发明了将CPU、RAM和卷积运算芯片集成在同一数据总线上的AI芯片,2016年12月29日,华为发明了一项名为“卷积运算芯片和通信设备”的发明专利(申请号:201611243272.X),申请人为华为机器有限公司。

根据该专利目前公开的资料,让我们一起来看看华为的这项新架构AI芯片吧。


人工智能资源利用率的问题如何解决?

如上图,为该专利中发明的硬件设备的示意性框架图,硬件架构中包括中央处理器100、双倍速率同步动态随机存储器(DDR SDRAM)200以及卷积运算芯片300。CPU用来控制卷积运算芯片启动卷积运算,DDR SDRAM用于向卷积运算芯片的数据缓存模块输入多个卷积数据和多个卷积参数,然后卷积运算芯片根据这些数据来完成卷积运算。

当得到运算结果后,就会将运算结果写回到DDR SDRAM事先设定好的内存地址中,并同时通知CPU完成运算,以从内存地址中提取结果数据。

人工智能资源利用率的问题如何解决?

如上图,为上面框架中的卷积运算芯片的结构示意图,这种卷积运算芯片包括数据缓存模块310、M*N乘法累加器阵列320、输出控制模块330和阵列控制模块340。

数据缓存模块用于向乘法累加器中的第一乘法累加窗口传输用于卷积运算的多个卷积数据和卷积参数,卷积参数由数据缓存模块根据第一卷积参数矩阵确定,而该控制器也是通过在运算器内集成这样的数据缓存器,从而减少了RAM的访问次数,进而减少了RAM的访问压力。

其中M*N乘法累加器是该运算芯片的核心运算部件,而这种M*N的结构设计方式也是为了进行卷积运算而特意设计的,其具体结构如下图所示。


可以看到,这种乘法累加器包括M*N个处理单元,并且每两行的处理单元之间还存在斜向的数据传输通道,这相比于传统的矩阵式数据传输通道,具有更加灵活的数据传输方式,可以更好的适用于AI芯片进行多种类型的运算。

第一乘法累加窗口可以将数据进行乘法运算,并接着进行加法运算以获得卷积结果,最后由输出控制模块输出卷积神经网络的运算结果,进而完成AI芯片中的任务。

值得一提的是,在该专利中,为了尽可能地提高MAC阵列的利用率以及卷积运算效率,阵列控制模块会根据第一卷积参数矩阵的行数和第一卷积数据阵列的行数来确定第一乘法累加窗口的列数。

以上就是华为发明的卷积运算芯片,这种卷积运算芯片能够在提高阵列资源利用率的同时降低RAM访问次数,进而减小RAM的访问压力。而例如华为发明的昇腾AI芯片也正是基于这样的技术之上,才能实现极高的算力,不管多么复杂的模型都可以轻松训练,且实现极低的功耗。

关于嘉德


深圳市嘉德知识产权服务有限公司由曾在华为等世界500强企业工作多年的知识产权专家、律师、专利代理人组成,熟悉中欧美知识产权法律理论和实务,在全球知识产权申请、布局、诉讼、许可谈判、交易、运营、标准专利协同创造、专利池建设、展会知识产权、跨境电商知识产权、知识产权海关保护等方面拥有丰富的经验。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    463

    文章

    54429

    浏览量

    469358
  • AI
    AI
    +关注

    关注

    91

    文章

    41115

    浏览量

    302602
  • 人工智能
    +关注

    关注

    1820

    文章

    50325

    浏览量

    266959
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于Arm架构服务器释放更高CPU利用率

    在大型云服务提供商的数据中心中,CPU 利用率长期偏低,造成了大量资源闲置。根据 CAST AI 的分析,超过 1,000 个 CPU 的大型集群平均占用率仅约 17%[1],不同云服务商之间略有差异,但这一数据仍具有一定代表性
    的头像 发表于 03-24 10:19 526次阅读

    浅谈人工智能(2)

    接前文《浅谈人工智能(1)》。 (5)什么是弱人工智能、强人工智能以及超人工智能? 弱人工智能(Weak AI),也称限制领域
    的头像 发表于 02-22 08:24 347次阅读
    浅谈<b class='flag-5'>人工智能</b>(2)

    GPU 利用率<30%?这款开源智算云平台让算力不浪费 1%

    作为 AI 开发者,你是否早已受够这些困境:花数百万采购的 GPU 集群,利用率常年低于 30%,算力闲置如同烧钱;跨 CPU/GPU/NPU 异构资源调度难如登天,模型训练卡在资源分配环节;部署
    的头像 发表于 01-26 14:20 282次阅读

    华为发布AI容器技术Flex:ai,算力平均利用率提升30%

    决方案。   当前,AI产业正处于高速发展的黄金时期,海量算力需求如潮水般涌来。然而,算力资源利用率偏低的问题却成为了产业发展的关键桎梏。具体表现为,小模型任务常常独占整卡,导致大量资源闲置;大模型任务又因单机算力不足而难以支撑
    的头像 发表于 11-26 08:31 7785次阅读

    【艾为视角】保证大方向正确!利用人工智能解决一线实际问题

    保证大方向正确,加快迭代,小步快跑。聚焦内部效率提升,利用人工智能改变作业模式、简化管理,结合业务场景解决一线实际问题。——任总在GTS人工智能实践进展汇报会上的讲话1聚焦内部效率提升,利用人工智能
    的头像 发表于 09-26 19:03 821次阅读
    【艾为视角】保证大方向正确!<b class='flag-5'>利用人工智能</b>解决一线实际问题

    从 “被动维修” 到 “主动管理”:这套系统让设备利用率提升 30%

    从 “被动维修” 到 “主动管理”,是设备管理模式的转变,更是数字化转型的关键一步。在激烈的市场竞争中,能让设备稳定高效运行的企业,才能在效率与成本上占据优势。这套提升设备利用率 30% 的系统,为企业高质量发展提供了有效路径。
    的头像 发表于 09-04 10:04 1004次阅读
    从 “被动维修” 到 “主动管理”:这套系统让设备<b class='flag-5'>利用率</b>提升 30%

    利用超微型 Neuton ML 模型解锁 SoC 边缘人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们将介绍这对开发人员意味着什么,以及使用 Neuton 模型如何改进您的开发和终端
    发表于 08-31 20:54

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    家人们,最近在研究人工智能相关设备,挖到了一款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!可☎(壹捌伍 柒零零玖 壹壹捌陆) 一、开箱即学,便捷拉满 这个实验箱真的是为使用者
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    家人们,最近在研究人工智能相关设备,挖到了一款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!可☎(壹捌伍 柒零零玖 壹壹捌陆) 一、开箱即学,便捷拉满 这个实验箱真的是为使用者
    发表于 08-07 14:23

    拼版怎么拼好,板厂经常说利用率太低,多收费用?

    做板的时候,板厂经常说我拼版利用率太低,要多收取费用,哪位大神知道怎么算利用率
    发表于 05-14 13:42

    mes工厂管理系统:如何让设备利用率提升50%?

    在制造业竞争日益激烈的今天,设备利用率直接决定了企业的盈利能力。许多工厂管理者都在思考同一个问题:如何在不增加设备投资的情况下,让现有产能发挥出最大价值?MES工厂管理系统正是解决这一难题的金钥匙
    的头像 发表于 05-09 15:55 968次阅读
    mes工厂管理系统:如何让设备<b class='flag-5'>利用率</b>提升50%?

    提升AI训练性能:GPU资源优化的12个实战技巧

    人工智能与机器学习技术迅速发展的背景下,GPU计算资源的高效利用已成为关键技术指标。优化的GPU资源分配不仅能显著提升模型训练速度,还能实现计算成本的有效控制。根据AI基础设施联盟2
    的头像 发表于 05-06 11:17 1680次阅读
    提升AI训练性能:GPU<b class='flag-5'>资源</b>优化的12个实战技巧

    DeepSeek MoE架构下的网络负载如何优化?解锁90%网络利用率的关键策略

    、All-to-All等),网络面临高并发、低延迟、无损传输的严苛需求。然而,传统以太网的网络利用率长期徘徊在35%~40%,成为制约AI算力释放的关键瓶颈。
    的头像 发表于 04-28 12:04 1021次阅读
    DeepSeek MoE架构下的网络负载如何优化?解锁90%网络<b class='flag-5'>利用率</b>的关键策略

    梯度科技助力客户破解算力调度难题

    在数字经济与人工智能深度融合的新阶段,算力已成为支撑人工智能发展的核心生产力。梯度科技基于云原生技术架构研发的算力调度平台,以“算力弹性调度、异构资源兼容、业务智能运维”为核心能力,为
    的头像 发表于 04-27 16:32 1507次阅读