0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为什么不把每一个类似的解决方案都构建为ASIC呢?

SSDFans 来源:未知 作者:李倩 2018-09-03 11:04 次阅读

众所周知,对于某些特定的应用程序(如人工智能),换不同硬件平台后性能会有显著进展。进展取决于应用程序可以使用专门的硬件加速而不是软件运行的多少,因为硬件可以比在不太专业的平台上运行的软件更快,消耗的能量也更少。

如下图,排在性能底端是通用cpu,应用程序完全在软件中,然后是GPUFPGADSP,最高级的是定制芯片ASIC——比如谷歌TPU。

那么为什么不把每一个类似的解决方案都构建为ASIC呢?有两个原因,首先,底层算法可能正在快速变化(就像人工智能),其次,设计ASIC可能需要花费大量时间,这就很难保证和快速变化的需求保持同步。你必须努力寻找比AI应用(竞争对手:Facebook, 苹果, 亚马逊,谷歌,百度,阿里巴巴,腾讯,ADAS/自动驾驶供应商)和数据中心(竞争对手:亚马逊, 微软,谷歌等)更具竞争力的市场。他们都在快速发展的赢家通吃的市场中工作。在这些领域,时间不仅仅是金钱,还意味着生存。

这就是为什么eSilicon将平台方法引入目标应用的原因。这些ASIC平台增加了针对AI应用和数据中心网络需求的库和基础设施。每一项都建立在7nm技术上,并作为一个整体优化进行PPA优化,以满足这些领域的具体需求。

让我们从网络平台开始介绍。它提供了:

56G和112G的SerDes采用了56G的长范围和短范围架构,以非常高的数据速率支持许多通道,同时可以实现最低的功耗

TCAM内存,用于加速路由查找、数据包分类、数据包转发和ACL命令

PHY连接到包中的高带宽内存(HBM2)堆栈。值得注意的是,eSilicon在芯片和封装级别的3D和2.5D系统构建方面拥有丰富的经验,包括在模具和封装级别。因此,系统包的解决方案变得非常简单。

专为pseudo-2端口、pseudo-4端口等特定于应用程序的内存提供内存/内存编译器,用更少的功耗和面积提供高带宽,还有一系列I/O缓冲区。

人工智能平台(又被称为neuASIC)有点复杂。这里的目标是首先提供您在标准SoC (CPU、本地SRAM、NoC互连、到外部内存I/O缓冲区的接口)中期望的所有IP组件,这里称为ASIC底座。神经网络(NN)部分的设计是在底座上方的堆叠层上实现的,与3D互连连接到AI层。同样,这利用了eSilicon在3D封装中的经验。

如果您只是直接把您的人工智能架构变成硬件,它将具有很好的PPA(Performance,Power,Area),但一旦竞争对手跳过您,您可能需要替换它(构建一个新的ASIC)。neuASIC结构经过优化,可以减少对算法更改的重新设计需求。首先,底座硬件应该对NN算法的更改不敏感。接下来,人工智能层被分成块。这种宏单元划分要求即使NN算法改变,也要报纸底层硬件的耐久性,这要归功于NN设计的自然模块化风格。每个块都是围绕常用的宏AI函数构建的,比如卷积或池函数,有些是由eSilicon预先设计的,有些可能是第三方的,有些可能是由ASIC客户设计的。

截至今年5月,neuASIC提供了一个包含MAC块、卷积引擎和内存转置函数的库,作为预先构建的宏函数(它们将继续工作),从而加速了常见NN结构的组装。因为内存和操作必须在NN中紧密地耦合以降低总功率,他们也为神经元提供pseudo-4-port记忆支持(2神经元数据输入,1重量输入,一个神经元输出)和一个专门记忆为weight-all-zero-power-saving(WAZPS)将零输出较低的权力,如果权重为零,则在较低功率下降输出归零,这在具有稀疏权重矩阵的NN中很常见。

设计是通过一个他们称为底座构建器的建模系统来支持的,通过这个系统可以对NN的功能操作建模,同时还可以提取PPA估计值来指导优化设计到您的目标。

对于这两个平台,目标都是提供一个快速的解决方案路径,同时满足您的PPA目标。这样做需要的不仅仅是一个标准的ASIC平台。你需要能够使用预定义的I/O环,互连和高带宽内存访问,您必须拥有的IP /宏原语,这些IP应该一起优化应用程序,您必须能够配置和描述你对PPA计划型设计目标。这些平台看起来是一个良好的开端,也是在加速这些领域高性能、低功耗ASIC设计的长期前景。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • asic
    +关注

    关注

    34

    文章

    1141

    浏览量

    119246
  • 人工智能
    +关注

    关注

    1775

    文章

    43713

    浏览量

    230488
  • AI芯片
    +关注

    关注

    17

    文章

    1641

    浏览量

    34355

原文标题:3D封装+SoC降低AI芯片门槛

文章出处:【微信号:SSDFans,微信公众号:SSDFans】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    智能租车解决方案

    搭建。开发快可为客户提供软、硬、云一体化解决方案类似的智能解决方案a)智能工程机械 b)智慧农机c)智能无人机智能硬件方案定制开发快淘宝网址:https://item.taobao.
    发表于 04-06 10:09

    如何构建更好的视频桥接解决方案

    接口或其中可用接口已经专门用于其他功能,如何向这些新兴应用提供支持?图 1:视频桥接解决方案可用于在传统应用处理器上扩展端口数量,或提高带宽及整体性能。 (来源:Lattice
    发表于 04-06 13:48

    看效果像是控制很多LED一个个亮起来,请教下大家有没有做过得或者额类似的方案

    `看效果像是控制很多LED一个个亮起来,请教下大家有没有做过得或者额类似的方案~谢谢啦`
    发表于 05-29 11:54

    如果自己写flashburn类似的软件,请问有参考资料可以提供吗?

    如果自己写flashburn类似的软件,有参考资料可以提供吗?谢谢!
    发表于 08-01 07:24

    用srand((unsigned)time(NULL));rand函数提供不同的种子,但是编译器好像没有封装实现C的time();有什么类似的解决方案吗?

    用srand((unsigned)time(NULL));rand函数提供不同的种子,但是编译器好像没有封装实现C的time();有什么类似的解决方案吗?
    发表于 09-13 14:09

    SynplicityHAPS ASIC原型设计系统增添新成员

    创新型IC设计与验证解决方案供应商Synplicity有限公司日前宣布HAPS(High-performance ASIC Prototyping System)产品系列增添新成员HAPS-51
    发表于 11-20 15:49

    怎么通过printf和类似的函数打印浮点和双变量?

    你好,有些关于通过printf和类似的函数打印浮点和双变量的主题,但是我找不到什么有用的。我在XC32下打印双变量有问题,我的测试代码是这样的:有“-fno-.-double”选项,不能将双变量
    发表于 10-08 10:36

    FreeRTOS每一个任务占用的资源该如何去找?

    如何看每一个任务的内存占用,我只看到了剩余内存,我想看看每一个任务占用的资源该如何去找?
    发表于 07-29 02:51

    为什么每一个程序员需要学习C语言

    序言在互联网蓬勃发展的时代,有类人做出了巨大的贡献,这群人被大家称之为程序员,怎样才能成为名优秀的程序员,为什么每一个程序员
    发表于 07-20 06:07

    充电桩构建套基于互联网+的基础解决方案

    增加,电动公交车也是大力的提倡,电动小车也随处可见。针对以上的问题,6108方案依托自己在互联网+行业丰富的经验,借助丰富的网络接入产品,充电桩构建套基于互联网+的基础
    发表于 09-14 08:46

    如何在Core-1126-JD4上搭建类似的服务完成云人脸识别

    如何在Core-1126-JD4上搭建类似的服务完成云人脸识别
    发表于 02-21 07:19

    分享单板解决方案

    描述Commodore 64 诊断加密狗(5 合 1)这个项目是单板解决方案,它取代了运行 Commodore 64 诊断盒 586220 所需的 5 部件。
    发表于 07-07 07:29

    在STM32 CPU上创建尺寸与Arduino pro mini类似的

    描述STM32 Pro 迷你版这个想法是在 STM32 CPU 上创建尺寸与 Arduino pro mini 类似的板。
    发表于 08-11 06:45

    VL53L4CD能否实现~50uA@1Hz类似的功耗?

    我正在尝试 1Hz 频率的近距离(低至 1mm)接近检测找到低功耗解决方案。看起来 VL53L4CD 可以很好地完成这项工作,但我没有在数据表中找到低功耗模式的功耗详细信息。我还发现有
    发表于 12-07 08:39

    ISSP结构化ASIC解决方案

    ISSP结构化ASIC解决方案 结构化专用集成电路(structured ASIC)对设计工程师而言还是一个新名词,然而目前已经有多家公司正计划涉足这一领域。快速硅
    发表于 12-27 13:32 1187次阅读
    ISSP结构化<b class='flag-5'>ASIC</b><b class='flag-5'>解决方案</b>