0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人工智能芯片趋向于软硬件协同设计的模式

工程师邓生 来源:Semi Connect 作者:Belle 2022-08-25 10:23 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

目前,人工智能领域已成为最受关注的热点之一。人工智能领域是通过对计算机的研究与开发,使得其具备类似于人类智能的,对环境的输入做出有意义的判断反应的研究应用领域。决定人工智能质量的因素往往是计算能力以及数据量的大小,而实现人工智能的方式则是机器学习,让机器通过训练和学习逐渐逼近我们希望其实现的效果。随着处理器能力以及数据量的飞速增长,机器学习的方式也在发生革命性的变化,深度学习的概念被引入。深度学习由于其多层次形态,从而增强了其非线性程度,可以带来更强的拟合能力。此外,其类似于仿生学的逐层自动提取特征的过程,保证了所提取特征的质量与丰富性,使得其性能相较于传统的机器学习算法有了质的提升。

随着模型算法的发展,模型所能实现的性能逐步提升, 而模型本身的深度和复杂度也大大增加。以大规模图像识别竞赛(ILSVRC)为例,2012年多伦多大学的Alex Krizhecsky 随同其倒是Geoffrey Hinton 发布的 AlexNet 以83.0%的Top5分类准确率夺得冠军,相较于之前传统模型的最佳性能提升了百分之十几。AlexNet 本身是一个具有5层卷积层和3层全连接层的卷积神经网络,包含有6100万个权重参数和7.24亿次乘加运算。2017年为止,最复杂的网络模型层数已超过1000层,权重参数及乘加运算次数都比AlexNet提升了几个数量级,而所能实现的识别准确率也已经超越人眼。

对于最近打败众多人类围棋高手的阿尔法围棋(AlphaGo),在其打败李在石的第一版分布式实现版本中,其复杂的决策算法模型需要1300多个CPU和280个GPU来提供算力的支撑。由此可见,面对日益复杂的人工智能算法,要满足严格的功耗与实时性需求,需要有强大的处理器作为支持;因此对处理器芯片的精细化设计,成为提升芯片计算功能,满足应用需求的必要条件。

通常来讲,无论是对于人工智能的模型训练还是前向推断应用过程,处理器芯片的计算速度都是需要首先考虑的指标;而在某些诸如嵌入式移动端的低功耗场景中,对于硬件计算的功耗也需要加以严格的控制。传统的CPU由于其串行执行的方式,在应对数据与计算密集型的人工智能算法时显得捉襟见肘。因此,增加处理器计算的并行度成为性能提升的一个主要方向。英伟达提出了通用计算GPU(GPGPU)的概念,将具有大量可并行计算流处理器的GPU运用到人工智能算法的研发过程中, 并提供了成熟而稳定的诸如CUDA和cuDNN的软件环境支持。由于GPU强大的计算能力,在关注模型准确度和以数据中心及服务器环境为主的模型训练场景中,GPU得到了广泛的应用。但同时我们也注意到,常见的GPU板卡功耗高达200-300W,这使得其在需要低功耗场景中的应用受到局限。因此,针对应用场景和算法类型,对芯片内部结构进行定制化的设计,从而提升芯片整体的能效比,成为人工智能芯片发展的另一主流方向。

通常而言,对于某一类型的人工智能算法,其往往具备可划分的特性,并且划分的子算法块具有一定的相似性。以图像应用中常见的卷积神经网络为例,运算最密集的卷积层就可以抽象为滑窗类型的乘加操作,而滑窗的大小及步幅,计算通道数的大小等均可以被抽象为可配置的参数。在硬件结构的设计过程中,往往会针对算法划分及抽象的方式,在计算通路和存储结构上进行定制化,可配置的设计。大部分研究者会采用FPGA芯片实现的方式,快速地迭代开发出加速硬件结构。多家研究机构已纷纷在顶级学术会议上发布了基于FPGA的加速结构设计,而业界企业也都开始将常见的算法模型通过FPGA加速器实现的形式部署到应用端,并且实现了较好的性能和较低的功耗。下一步,我们也可以将计算及存储核心部分进行电路固化,以专用集成电路ASIC)的方式实现,以达到更高的能效比。目前已知的优秀ASIC芯片设计,已能在实现数百GOPS(每秒十亿次运算数)级别计算能力的情况下将功耗控制在毫瓦级别。ASIC在具备广泛应用市场的前提下,具有高能效比,量产成本低的诸多优势,但其一次性的工程费用及较大的开发成本,在快速的算法演进过程中往往会具有一定风险。因此,针对不同的研发及市场需求,应该选取不同的平台予以实现。

近年来,针对硬件实现的算法优化也在不断发展,包括数据量化,模型稀疏化等多项技术都取得了进展;而这些技术都有助于降低人工智能芯片的片上计算资源及存储带宽限制,以更低的硬件代价实现更高的吞吐速率。而数据位宽变化以及模型稀疏带来的不规则性,则对硬件结构的实现提出了挑战。未来的人工智能芯片设计,将更趋向于软硬件协同设计的模式,从软硬件两个方向分别进行限制条件的考量以及优化路径的选取,从而实现更优化,更通用的解决方案。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

原文标题:人工智能芯片设计

文章出处:【微信号:Semi Connect,微信公众号:Semi Connect】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    中科曙光首批加入上海人工智能实验室AI全环节软硬件验证平台工作组

    近日,上海人工智能实验室DeepLink团队组织召开首次验证平台推进交流会,中科曙光受邀出席并加入“AI全环节软硬件验证平台工作组”,成为首批共建成员单位,旨在共同构建全链路技术自主生态社区,推动验证平台从技术自研向产业共创升级。
    的头像 发表于 05-21 16:51 423次阅读

    摩尔线程首批加入上海人工智能实验室AI全环节软硬件验证平台工作组

    第二届浦江AI学术年会期间,上海人工智能实验室(上海AI实验室)联合多家科研机构、运营商和大模型企业,共同发起AI全环节软硬件验证合作计划,并拟于今年发布AI全环节软硬件验证平台(验证平台),分场景建设自主AI
    的头像 发表于 05-20 09:36 439次阅读

    燧原科技首批加入上海人工智能实验室AI全环节软硬件验证平台工作组

    2026年5月14日,上海人工智能实验室(上海AI实验室)组织召开了AI全环节软硬件验证平台首次推进交流会,并正式成立验证平台工作组。燧原科技已作为首批成员加入工作组,并成为生态社区首批共建成员单位。
    的头像 发表于 05-19 16:24 374次阅读

    沐曦股份首批加入上海人工智能实验室AI全环节软硬件验证平台工作组

    近日,上海人工智能实验室DeepLink团队组织召开首次验证平台推进交流会,沐曦股份受邀出席并加入“AI全环节软硬件验证平台工作组”,成为生态社区首批共建成员单位。
    的头像 发表于 05-19 10:39 535次阅读
    沐曦股份首批加入上海<b class='flag-5'>人工智能</b>实验室AI全环节<b class='flag-5'>软硬件</b>验证平台工作组

    嵌入式人工智能课程(华清远见)

    )的生命周期。当某个中间变量不再使用时,其占用的内存会被立即原地复用,将整个模型的运行时内存峰值压榨到最低。 4. 硬件后端定制:软硬协同的真谛 不同芯片的指令集各异(如 ARM SI
    发表于 04-16 18:47

    兆易创新与涂鸦智能合作:软硬协同破局 AIoT

    )正式达成深度合作。双方将依托各自在硬件芯片与软件生态领域的核心优势,实现技术、资源与场景的全方位协同,共同推动 AI+IoT 领域的生态共建,为全球开发者与终端客户打造一站式软硬件
    的头像 发表于 03-04 09:41 2286次阅读

    万里红核心参编多项人工智能领域重要标准

    近日,由中国人工智能产业发展联盟(AIIA)主办、人工智能大模型及软硬件评测工业和信息化部重点实验室承办的人工智能服务产业高质量发展论坛在北京成功举办。
    的头像 发表于 02-06 14:01 597次阅读

    智能开关的软硬件协同,让复杂场景下的用电计量更稳定

    基于用电管理实践,蓝奥声推出的系列智能触摸开关面板(以下简称“智能触摸开关”),通过灵活安装与组网设计,实现了设备用电控制、电能计量、用电监测和安全保护等主要功能,并通过软硬件协同保障
    的头像 发表于 01-31 09:53 783次阅读
    <b class='flag-5'>智能</b>开关的<b class='flag-5'>软硬件</b><b class='flag-5'>协同</b>,让复杂场景下的用电计量更稳定

    利用 NucleiStudio IDE 和 vivado 进行软硬件联合仿真

    ,使用NucleiStudio IDE 和 vivado对蜂鸟E203+demo协处理器的软硬件协同仿真实验已经完成。根据以上步骤可以方便地对E203 SoC进行软硬件仿真调试。
    发表于 11-05 13:56

    软硬件协同技术分享 - 任务划分 + 自定义指令集

    Level , ESL)得到催生,然而ESL设计依赖于复杂的高层次建模以及庞大的数据支持,且其工具链的发展仍不是十分完善。 在现阶段的开发氛围中,软硬件协同开发是一种能够缩短开发周期,并提升总体性能的高效
    发表于 10-28 08:03

    RFID 软硬件协同:重塑医疗与学校领域的智能化管理新生态

    + 场景化软件” 的深度协同 —— 硬件负责 “数据采集”,软件承担 “数据处理与应用”,二者结合为医疗、学校领域打造从 “信息采集” 到 “决策优化” 的完整管理闭环,推动其从传统人工管理向
    的头像 发表于 10-21 12:09 566次阅读

    兆芯加入基础软硬件产品漏洞生态联盟

    近日,CCS 2025成都网络安全技术交流系列活动——国家漏洞库(CNNVD)基础软硬件产品漏洞治理生态大会在成都成功举办。来自国家关键基础设施单位、基础软硬件企业、高校科研机构的数百名代表齐聚一堂,共商网络安全发展大计。
    的头像 发表于 09-22 13:50 1085次阅读

    电动工具EMC测试整改:软硬件协同方案

    深圳南柯电子|电动工具EMC测试整改:软硬件协同方案
    的头像 发表于 08-12 17:02 1125次阅读
    电动工具EMC测试整改:<b class='flag-5'>软硬件</b><b class='flag-5'>协同</b>方案

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    ,技术自主可控 在如今这个科技竞争激烈的时代,国产化硬件的重要性不言而喻。比邻星人工智能综合实验箱就做到了这一点,采用国产化硬件,积极推进全行业产业链上下游环节的国产化进程,把国产自主可控的
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    ,技术自主可控 在如今这个科技竞争激烈的时代,国产化硬件的重要性不言而喻。比邻星人工智能综合实验箱就做到了这一点,采用国产化硬件,积极推进全行业产业链上下游环节的国产化进程,把国产自主可控的
    发表于 08-07 14:23