0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使具有AI功能的开关芯片产品多样化需要多长时间?

我快闭嘴 来源:半导体行业观察 作者:半导体行业观察 2020-10-28 14:40 次阅读

长期以来人们一直对晶圆级架构持怀疑态度,这种怀疑可以追溯到几十年前。出于商业或技术原因,仅有少数人做过相关尝试,但他们都毫不例外地失败了,当中包括著名的Gene Amdah)。但是,除了适当建立的半导体技术基础之外,也许还缺少合适的时机。

如果您问Andrew Feldman,为什么晶圆级方法不那么普遍,他的回答很简单:他在Cerebras Systems的团队是唯一弄清楚如何真正做到这一点的人。在他看来,没有人能够或将要尝试这个,至少短期内不会。

“我认为没有人能做到。我们花了五年的时间,我们还拥有庞大的专利产品组合。AI这一工作量将占总计算量的约三分之一。如果您看一下Google,他们已经完成了大部分工作,看起来像是AI工作负载。此外,用于解决AI问题的计算量正以惊人的速度增长。在接下来的三到五年中,数据中心中的更多工作将是AI或类似AI的工作,更多的难题将围绕如何在数据中寻找见解。”

如果我们巧妙地越过专利组合的那薄弱的威胁,以及它对 Cerebras 的可能性证明所鼓舞的潜在初创公司意味着什么,那么还会出现其他一些问题。首先,为什么以前没有这项工作,其次,如果现在可能的话,为什么专业人士不这样做呢?

“我们观察了1984年Amdahl所做的晶圆级芯片,事实是,人们对此记忆犹新的的是芯片是如此之大,但他们其实从未真正看过它。当时我们的行业还不那么成熟,所以肯定围绕芯片制造工艺。但自那时以来,我们已经制造了成千上万的芯片。流程和体系结构要好得多。我们为晶圆规模选择了一种架构,但Gene Amdahl没有。我们试图采用他喜欢的架构并将其推广到晶圆级。

他继续说道:“我们能够利用我们的架构设计芯片并物理现实。我们要做的一件事是用超过40万个相同的块构建重复的图块设计。如果发生故障,我们可以解决。这是一个新发现,它是如何结合已知的事实,即存在缺陷的已知事实。这不是新事物;DRAM将位单元的行和列放在一边,这就是他们获得高良率的方式。但是直到我们这样做之前,没有人使用计算机来做到这一点。”

诀窍可能是做到这一点并拥有一个功能齐全、高效的系统,但是,您不能只出售独立的设备,并不是每个芯片制造商都希望负担(尽管Nvidia的DGX机器可能反映出不同的东西)。从编译器到冷却的完整堆栈是唯一有意义的方法。这正是Feldman的公司Cerebras Systems正在推广其CS-1系统的原因。回想一下,Cerebras今年通过其Wafer Scale Engine方法应用于AI获得了一些动力,特别是在以研究为中心的站点上进行了安装,包括Lawrence Livermore国家实验室,Argonne国家实验室和匹兹堡超级计算中心。很难说出它们可能在企业或超大规模系统中的位置,但就目前而言,即使在纯AI训练和推理之外。

我们必须假设英特尔和Nvidia的大量研究预算至少使该主题有了一些想法,尤其是在看到Cerebras证明了这一概念之后。也许他们确实找到了使所有片上电路都变得更重要的方法,更重要的是,编译器成功地解决了这一问题,并发现尽管实用,但从经济上讲不合算。也许那是因为您不能仅仅构建要在2020-2025年的晶圆级游戏中使用的设备:整个系统必须以人类已知的最复杂的代码签名练习之一来构建。大多数芯片制造商和加速器初创公司都不希望(或实际上不能)从事系统业务,并且该设备的集成也不是典型的集成过程。

具有大量内核且可以超快速度通信的芯片有很多机会,而这些都不是新鲜事物。除了AI,HPC领域(包括计算流体动力学)具有广泛的商业价值,适合大规模使用信号处理等工作。开关芯片的想法更加萌芽,如果该行业已经在使用一些最大的硅片,那么在更广泛的可行范围内,它可以轻松地改变晶片规模。那只是近期。我们甚至可以更进一步,提出一个系统的概念,该系统将晶圆级引擎与裸露在机架上的硅光子相连,能够保持凉爽并真正处理大量工作负载,而无需离开设备或横向扩展而无需全部多余的热量和性能损失。但这是另一个长远的故事。

对于石油和天然气以及超级计算级科学法规中HPC等高价值应用领域,新架构的挑战始终是相同的。这些代码基本上是一成不变的,只有最近才可以从GPU加速中受益。但是,对于那些愿意大力投资的人来说,人工智能的故事显而易见。我们从未能够了解晶圆级方法的成本,以及与使用相同晶圆进行切片和切块以单独出售的方式有何不同。使所有部件连接起来的所有额外网络可能会带来可观的成本开销。

对于那些定义狭窄的应用程序集,是否有足够的市场需要解决,以使所有这些都值得呢?以及其中一家开关芯片制造商和集成商得到暗示并为其工程购买Cerebras以及使具有AI功能的开关芯片产品多样化需要多长时间?

“如果您看一下Nvidia和Intel的研究,他们正在发表论文说无法做到。我们解决了70年来一直未解决的问题。这些拥有数万名工程师的巨型公司一直说这是不可能的,而我们位于洛斯阿尔托斯(Los Altos)房地产市场的小团队做到了。他的断言是,由于天生缺乏技术,大公司没有追求晶圆规模。“ Nvidia和其他公司知道更大的芯片更适合这种工作负载。如果您从2013年开始绘制GPU的图表,它的大小将增加一倍以上。为什么?因为他们知道更大的筹码会更好。但是他们不知道怎么做,仍然不知道,是如何变得大50到60倍,这就是我们所做的。”他补充道。

即使可以甚至确实存在硅片规模,也无论如何都无法解决所有问题。但是对于需要小型,密集计算和低功耗,低延迟和超高带宽的大规模通信的AI工作负载,这种方法很有意义。尽管其他加速器和基于加速器的系统提供了此功能,但仍然存在外部网络无法解决的问题。

但是,如果晶圆级的概念被证明是有效的,我们是否可以看到其他初创公司采用类似的方法?对自己的工厂进行严格控制的公司可以轻松实现这一飞跃。Feldman说,他们之所以没有这样做,是因为他们不知道如何做,但他们这样做的原因可能更加复杂,并且与关注点,半导体经济和需求有关。如果是这样,他们将不得不用一种价格便宜的产品来应对潜在的市场吗?例如,考虑到像英特尔这样的拥有全部网络,晶圆厂和市场专业知识的公司并没有走这条路,那么,肯定有些事情要么不值得努力,要么根本无法完成。

那么,要回答标题中的问题,是否有至少一个或两个以上的初创公司,也许还有一个专业进入该行业的晶圆级芯片行业 ?也许。这就是为什么我们保持密切关注Cerebras机器的原因。不仅是为了查看它是否有效,还在于编程模型如何运行以及它是否真的可以承担起不仅仅限于AI的任务。

如上所述,基于大型晶圆的 机架和硅光子技术相结合的系统的未来发展并非无道理,这种技术可以解决热量问题,并具有可分割,可扩展且在合理的功率预算内的真实通信。然后事情就变得有趣了,特别是如果魔术编译器可以真正地在HPC和大规模分析中使用并行代码以及AI工作负载演变成的任何东西。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    447

    文章

    47788

    浏览量

    409135
  • 晶圆
    +关注

    关注

    52

    文章

    4524

    浏览量

    126439
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4417

    浏览量

    126705
  • AI
    AI
    +关注

    关注

    87

    文章

    26443

    浏览量

    264052
收藏 人收藏

    评论

    相关推荐

    围坝胶需要多长时间才能固化?

    围坝胶需要多长时间才能固化?在电子封装领域,围坝胶是一种常用的粘合剂,主要用于PCB板上电子元件的密封、填补和粘合各种材料。然而,对于围坝胶固化所需的时间,许多人可能并不十分清楚。本文将详细介绍
    的头像 发表于 02-29 14:21 159次阅读
    围坝胶<b class='flag-5'>需要</b><b class='flag-5'>多长时间</b>才能固化?

    PSOC4 EEPROM写操作需要多长时间?为了增加EEPROM擦写次数,组件需要如何配置?

    PSOC4 EEPROM 写操作需要多长时间,为了增加EEPROM擦写次数,写操作是在一开辟的空间内滚动操作吗,组件需要如何配置
    发表于 02-21 07:22

    PSOC Creator仿真时如何看程序执行用了多长时间

    Psoc Creator 是否支持仿真时查看某一部分代码执行用了多长时间时间(例如设置两个断点,运行后查看断点间代码执行用了多长时间),谢谢。
    发表于 02-18 07:17

    MA35D1 buildroot编译大概要多长时间

    请问一下,buildroot编译大概要多长时间? yocto编译大概要多长时间
    发表于 01-15 06:17

    请问ADIS16375这款传感器能保持多长时间位置不漂?

    你好,请问ADIS16375这款传感器能保持多长时间位置不漂?我从代理商买了三个,正在测试,发现位置漂的很厉害。 请问正常情况下,静态和动态下,位置能够保持多长时间不漂移? 谢谢!!!
    发表于 12-29 07:21

    一般变压器过载多少能使用多长时间啊?

    一般变压器过载多少能使用多长时间啊? 比如过载10%能持续使用多长时间? 过载100%能持续使用多时间最? 有没有个公式呢?
    发表于 12-20 07:04

    AD9788数据从输入到输出需要多长时间

    麻烦各位! 想咨询一下AD9788这个芯片,数据从输入到输出这个过程需要多长时间!
    发表于 12-15 06:44

    AAD5941从0.015hz到200赫兹扫描EIS需要多长时间

    我想知道AAD5941从0.015hz到200赫兹扫描EIS需要多长时间
    发表于 12-01 08:11

    三相稳压器充电需要多长时间才能使用?三相稳压器的充电时间及注意事项

    三相稳压器充电需要多长时间才能使用?三相稳压器的充电时间及注意事项  三相稳压器是现代工业生产中常用的一种电气设备,用于稳定电压,保障电力设备的正常运行。在使用三相稳压器之前,我们首先需要
    的头像 发表于 11-20 14:19 440次阅读

    ds18b20在写程序时如何确定写的延时函数是多长时间

    像ds18b20这种对延时要求比较高的芯片,在写程序时如何确定写的延时函数是多长时间
    发表于 11-03 07:00

    使用STC8a8K64s12A单片机编程一个_nop_()函数需要多长时间

    使用STC8a8K64s12A单片机编程一个_nop_()函数需要多长时间
    发表于 10-30 06:52

    实时系统的时间片一般是多长时间

    实时系统的时间片一般是多长时间
    发表于 10-23 06:17

    为了规避毛刺,UART的start bit至少需要拉低多长时间

    请问,为了规避毛刺,UART的start bit至少需要拉低多长时间
    的头像 发表于 09-25 09:45 388次阅读
    为了规避毛刺,UART的start bit至少<b class='flag-5'>需要</b>拉低<b class='flag-5'>多长时间</b>?

    MA35D1 buildroot/yocto编译大概要多长时间

    请问一下,buildroot编译大概要多长时间? yocto编译大概要多长时间
    发表于 08-31 10:12

    安全启动需要多长时间才能给出结果?

    安全启动需要多长时间才能给出结果?示例:S32k144 引导加载程序 128k。
    发表于 05-11 07:38