0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

用于人工智能训练的硬件芯片设计

我快闭嘴 来源: 爱集微 作者:嘉德IPR 2020-10-22 10:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

赛灵思发明的基于FPGA人工智能芯片,整合了深度神经网络计算所需要的必要元素,保证了其可以高效、快速的完成所需要进行的AI训练任务。

集微网消息,18年10月,全球FPGA芯片巨头赛灵思在中国展示了其基于ACAP架构的7nm首款人工智能芯片Versal。ACPA架构是赛灵思在18年3月推出的新一代芯片架构,目的就是为了推动其人工智能芯片的发展。

这种人工智能芯片提供了多个为AI推断和高级信号处理工作负责而优化的AI引擎,其基于ARM架构打造,具有高性能以及低时延的优良性能,尤其是针对于云端、网络、自动驾驶技术等做了优化。

而在同年18年8月30日,赛灵思则申请了一项名为“在集成电路中实现神经网络的系统和方法”的发明专利(申请号:201880061751.0),申请人为赛灵思公司,这是一项用于人工智能训练的硬件芯片设计方案。

根据该专利目前公开的资料,让我们一起来看看这项基于FPGA设计的人工智能芯片吧。


用于人工智能训练的硬件芯片设计

如上图,展示了FPGA架构的芯片结构,其中包括大量不同的可编程片块,包括多千兆位收发器101、可配置逻辑块102、随机存取存储器块103、配置和时钟逻辑块102、数字信号处理块106和其他可编程逻辑块108。

该专利中,这个图示是为了展示可用于实现可编程电路的IC示例性架构,例如,一行中逻辑块的数量、行的相对宽度、行的数量和顺序、行中包含的逻辑块的类型、逻辑块的相对大小在不同的任务中都可以进行相应的调整以及改变。

那么对于人工智能芯片而言,为了完成神经网络的功能,这种IC如何搭建神经网络系统呢?具体方案如下图所示。


用于人工智能训练的硬件芯片设计

该图中展示了神经网络系统200,其中包括预处理单元202、多个神经网络层及损失计算单元210,这些层单元均可以通过FPGA或者DSP等模块实现。预处理单元可以接收输入训练集220,也可以在输入训练集中人工的增加批次(例如,通过执行失真、着色、旋转、缩放等其他操作增加训练集的数量)。

借助于这套系统,可以实现各种各样的训练算法,包括加权、反向传播、前向传播等,而且由于是在硬件层面实现的,因此这种人工智能芯片会比采用软件仿真的方式更加快捷并且具有更小的硬件以及软件上的开销。


用于人工智能训练的硬件芯片设计

如上图,为这种使用多个计算单元实现的神经网络系统的框图,该图展示了使用多个FPGA及这些可编程芯片之间的通信的流接口的流式架构。流式架构指的是每个芯片之间通过流接口来实现,数据就在这些接口之中传递,当主机1104将训练集发送到神经网络系统1102之后,可以从神经网络系统中接收学习后的权重。

而下图则展示了使用单个可编程脉动阵列的单个可编程IC架构。


用于人工智能训练的硬件芯片设计

可以看到,其中使用单个处理阵列1204(也就是单个FPGA)来实现神经网络系统,其中单个处理阵列也被称为脉冲阵列,其可以用于计算神经网络系统的全连接层、卷积层和最大池化层上的前向以及反向传播计算,每个层的权重将被保存在I/O缓冲器中。

而单个FPGA虽然在算力上比不上多FPGA结构,但是对于一些小型任务,单个FPGA依旧是游刃有余,这样通过设计多套处理器结构,可以从容的应对各种不同的任务,既减少了硬件的消耗,也使得方案设计的更加合理。

以上就是赛灵思发明的基于FPGA实现的神经网络系统,从该系统的结构中可以看出,系统整合了深度神经网络计算所需要的必要元素,这样就保证了多种不同的任务均可以应用在这样的芯片上。同时,该专利设计了单个以及多个处理器阵列,可以应对不同的情况,节省了硬件开销。

关于嘉德


深圳市嘉德知识产权服务有限公司由曾在华为等世界500强企业工作多年的知识产权专家、律师、专利代理人组成,熟悉中欧美知识产权法律理论和实务,在全球知识产权申请、布局、诉讼、许可谈判、交易、运营、标准专利协同创造、专利池建设、展会知识产权、跨境电商知识产权、知识产权海关保护等方面拥有丰富的经验。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1656

    文章

    22305

    浏览量

    630840
  • 芯片
    +关注

    关注

    462

    文章

    53598

    浏览量

    459881
  • 人工智能
    +关注

    关注

    1813

    文章

    49785

    浏览量

    261927
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    人工智能+消费:技术赋能与芯片驱动未来

    电子发烧友网站提供《人工智能+消费:技术赋能与芯片驱动未来.pptx》资料免费下载
    发表于 11-26 14:50 6次下载

    利用超微型 Neuton ML 模型解锁 SoC 边缘人工智能

    我们所有的 SoC 都能用于边缘人工智能。例子包括: 预测性维护和楼宇自动化系统 在每个节点上进行本地数据分析的智能传感器网络 遥控器和可穿戴设备的动作和手势识别 用于
    发表于 08-31 20:54

    人工智能+”,走老路难赚到新钱

    昨天的“人工智能+”刷屏了,这算是官方第一次对“人工智能+”这个名称定性吧?今年年初到现在,涌现出了一大批基于人工智能的创业者,这已经算是AI2.0时代的第三波创业潮了,第一波是基础大模型,第二波
    的头像 发表于 08-27 13:21 548次阅读
    “<b class='flag-5'>人工智能</b>+”,走老路难赚到新钱

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    ,技术自主可控 在如今这个科技竞争激烈的时代,国产化硬件的重要性不言而喻。比邻星人工智能综合实验箱就做到了这一点,采用国产化硬件,积极推进全行业产业链上下游环节的国产化进程,把国产自主可控的软
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    ,技术自主可控 在如今这个科技竞争激烈的时代,国产化硬件的重要性不言而喻。比邻星人工智能综合实验箱就做到了这一点,采用国产化硬件,积极推进全行业产业链上下游环节的国产化进程,把国产自主可控的软
    发表于 08-07 14:23

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是一家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们将介绍
    发表于 07-31 11:38

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能
    发表于 07-14 11:23

    AI芯片:加速人工智能计算的专用硬件引擎

    人工智能(AI)的快速发展离不开高性能计算硬件的支持,而传统CPU由于架构限制,难以高效处理AI任务中的大规模并行计算需求。因此,专为AI优化的芯片应运而生,成为推动深度学习、计算机视觉、自然语言
    的头像 发表于 07-09 15:59 982次阅读

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模
    发表于 07-04 11:10

    开售RK3576 高性能人工智能主板

    ,HDMI-4K 输出,支 持千兆以太网,WiFi,USB 扩展/重力感应/RS232/RS485/IO 扩展/I2C 扩展/MIPI 摄像头/红外遥控 器等功能,丰富的接口,一个全新八核拥有超强性能的人工智能
    发表于 04-23 10:55

    【「芯片通识课:一本书读懂芯片技术」阅读体验】从deepseek看今天芯片发展

    的: 神经网络处理器(NPU)是一种模仿人脑神经网络的电路系统,是实现人工智能中神经网络计算的专用处理器,主要用于人工智能深度学习模型的加速训练
    发表于 04-02 17:25

    NXP技术白皮书:AIoT人工智能物联网 将人工智能与现实世界相连

      分析师将人工智能物联网 (AIoT) 大致定义为人工智能 (AI) 与物联网(IoT)的融合,利用AI让物联网设备变得更智能、更具自主性。但这是一个以设备为中心的“小数据”的定义。从战略层面
    的头像 发表于 03-28 11:53 1851次阅读
    NXP技术白皮书:AIoT<b class='flag-5'>人工智能</b>物联网 将<b class='flag-5'>人工智能</b>与现实世界相连

    人工智能与显卡的强劲动力源:高效能电源解决方案LGS3605A(20V/5A同步降压稳压器)

    人工智能(AI)与高性能显卡(GPU)的浪潮中,算力的爆发式增长对电源提出了前所未有的挑战。无论是训练复杂的深度学习模型,还是渲染高精度图形,核心硬件的稳定运行都离不开一个“隐形英雄”——高效
    发表于 02-21 10:22

    【「具身智能机器人系统」阅读体验】+数据在具身人工智能中的价值

    嵌入式人工智能(EAI)将人工智能集成到机器人等物理实体中,使它们能够感知、学习环境并与之动态交互。这种能力使此类机器人能够在人类社会中有效地提供商品及服务。 数据是一种货币化工具 数据是互联网
    发表于 12-24 00:33

    人工智能推理及神经处理的未来

    人工智能行业所围绕的是一个受技术进步、社会需求和监管政策影响的动态环境。机器学习、自然语言处理和计算机视觉方面的技术进步,加速了人工智能的发展和应用。包括医疗保健、金融和制造业在内的各个行业对自动化
    的头像 发表于 12-23 11:18 885次阅读
    <b class='flag-5'>人工智能</b>推理及神经处理的未来