0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

7nm DPU内部揭密

NJ90_gh_bee81f8 来源:未知 作者:胡薇 2018-08-04 10:38 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Wave Computing着眼于成为第一家开发7奈米(nm)处理器并部署于其人工智能(AI)系统的AI新创公司。

据《EE Times》目前掌握到的消息,Wave Computing的7nm开发计划将采用博通(Broadcom Inc.)的ASIC芯片设计。Wave和Broadcom这两家公司将采用台积电(TSMC)的7nm制程技术,共同开发Wave的下一代数据流处理器(Dataflow Processing Unit;DPU)。

新的7nm DPU将由Broadcom方面提供,但时间表未定。据Wave执行长Derek Meyer证实,这款7nm DPU将会“设计于我们自家的AI系统中。”他还补充说,“如果市场其他公司有此需求的话,也可以提供相同的芯片。”

Derek Meyer

市场研究公司Tirias Research首席分析师Kevin Krewell表示,“Wave希望能够以此7nm设计在新创公司中脱颖而出。目前,大多数的新创公司都还不具备打造7nm组件的专业技术与能力。”他解释说,Wave在Broadcom的协助下,使这一切成为可能。他指出,Broadcom“由于收购了LSI Logic,确实拥有更先进的ASIC电路设计经验。”

Wave目前的DPU世代是基于16nm制程的设计。

“在设计新型AI加速器的同业中,我们将率先获得7nm实体IP——例如56Gbps和112Gbps SerDes,这可归功于Broadcom的协助。”Meyer指出,Broadcom带来了先进的设计平台、量产技术以及经验证可行的7nm IP,协助我们实现了这项7nm产品开发计划。

Wave目前的DPU世代基于16nm制程节点,主要由Wave自家设计人员以及承包商的协助共同完成。至于7nm DPU,Meyer表示,“在Broadcom和Wave之间,我们已经拟定好[ASIC]设计前端和后端所需的技术和资源了,同时相应地制定了合作计划。”

目前,这项7nm合作计划已经展开并持续进行好几个月了。Broadcom将负责7nm芯片的实体部份。尽管7nm设计非常复杂,但Meyer表示,“我相信Broadcom将第一次就推出合适的芯片。”然而,Wave并未透露其7nm DPU何时上市,也未对7nm DPU架构多加说明。

7nm DPU内部揭密

然而,Meyer解释说,新的芯片将“以数据流架构为基础”。它将会是第一款具有“64位(64-bit) MIPS多线程CPU”的DPU。Wave于今年6月收购了MIPS。

Meyer还指出,Wave的7nm芯片将在内存中搭载新功能,但他并未透露究竟增加了哪些新功能。

不过,Meyer表示,MIPS的多线程技术将在新一代DPU中发挥关键作用。透过Wave的数据流处理,“当我们为机器学习代理加载、卸除和重载数据时,硬件多线程架构将会十分有效率。”此外,MIPS的缓存一致性也会是Wave新DPU的另一项重要特性。他说,“因为我们的DPU是64-bit架构,所以只有在MIPS和DPU同时在64-bit地址空间中与相同内存通讯才有意义。”

针对Wave将在内存中增加的新功能,Krewell说,“Wave的现有芯片使用美光(Micron)的混合内存立方体(Hybrid Memory Cube;HMC)。而且我认为Wave未来的芯片将会转向高带宽内存(HBM)。”他并补充说:“HBM的未来发展蓝图更好。不断变化的内存架构将会对整体系统架构造成影响。”

Moor Insights & Strategy资深分析师Karl Freund对此表示赞同。他说:“针对内存部份,我猜想他们将将会放弃混合内存立方体,而改采用高带宽内存,因为这种方式更具有成本效益。”

Meyer在接受采访时宣称,新的7nm DPU可望提供较其现有芯片更高10倍的性能。

他说,“不要忘记,我们之前就已经将DPU架构中的频率与芯片分开来了。”他指出,在主机间来回移动将会造成瓶颈,而在DPU中,嵌入式微控制器可以加载指令,减少传统加速器浪费的功率和延迟。“我们可以有效发挥7nm芯片上的晶体管能力,以提高性能。”

不过,Krewell对此持保留看法。他说:“至于Wave是否可在性能方面实现10倍的进展,这毕竟是一个漫长的旅程,必须取决于如何测量机器学习的性能……以及Derek [Meyer]是在谈训练还是推论。”他还补充说,“推论方面发生了许多变化,也以较低精度(8-bit或更低)的算法进行部署。训练的性能主要取决于内存架构。”不过,他也坦承,“我其实并不知道Wave所盘算的细节。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • DPU
    DPU
    +关注

    关注

    0

    文章

    408

    浏览量

    26249
  • 7nm
    7nm
    +关注

    关注

    0

    文章

    267

    浏览量

    36221

原文标题:首款7nm AI芯片蓄势待发

文章出处:【微信号:gh_bee81f890fc1,微信公众号:面包板社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和 NVIDIA DOCA 微服务为 AI 数据存储、网络和安全带来突破性的加速。
    的头像 发表于 11-03 14:48 635次阅读

    “汽车智能化” 和 “家电高端化”

    一、先搞懂:7nm 良率提升到底意味着什么?​ 很多人觉得 “7nm 芯片” 是手机、电脑的专属,其实不然!良率简单说就是 “合格芯片的产出比例”,中芯国际 7nm 良率提高,核心意义是:高端芯片能
    发表于 10-28 20:46

    国产AI芯片真能扛住“算力内卷”?海思昇腾的这波操作藏了多少细节?

    最近行业都在说“算力是AI的命门”,但国产芯片真的能接住这波需求吗? 前阵子接触到海思昇腾910B,实测下来有点超出预期——7nm工艺下算力直接拉到256 TFLOPS,比上一代提升了40%,但功耗
    发表于 10-27 13:12

    白光干涉仪在EUV光刻后的3D轮廓测量

    EUV(极紫外)光刻技术凭借 13.5nm 的短波长,成为 7nm 及以下节点集成电路制造的核心工艺,其光刻后形成的三维图形(如鳍片、栅极、接触孔等)尺寸通常在 5-50nm 范围,高度 50-500
    的头像 发表于 09-20 09:16 552次阅读

    AMD 7nm Versal系列器件NoC的使用及注意事项

    AMD 7nm Versal系列器件引入了可编程片上网络(NoC, Network on Chip),这是一个硬化的、高带宽、低延迟互连结构,旨在实现可编程逻辑(PL)、处理系统(PS)、AI引擎(AIE)、DDR控制器(DDRMC)、CPM(PCIe/CXL)等模块之间的高效数据交换。
    的头像 发表于 09-19 15:15 2210次阅读
    AMD <b class='flag-5'>7nm</b> Versal系列器件NoC的使用及注意事项

    利用NVIDIA DPU重塑网络安全格局

    在第三届 NVIDIA DPU 黑客松竞赛中,我们见证了开发者与 NVIDIA 网络技术的深度碰撞。在 23 支参赛队伍中,有 5 支队伍脱颖而出,展现了在 AI 网络、存储和安全等领域的创新突破。
    的头像 发表于 08-20 14:31 1053次阅读

    一文详解Advanced IO wizard异步模式

    7nm Versal系列相对于16nm Ultrascale plus系列,IO做了升级,U+系列的HPIO在Versal升级为XPIO。Versal系列每一个XPIO bank包含54个IO管脚
    的头像 发表于 07-11 09:52 1247次阅读
    一文详解Advanced IO wizard异步模式

    基于AMD Versal器件实现PCIe5 DMA功能

    Versal是AMD 7nm的SoC高端器件,不仅拥有比16nm性能更强的逻辑性能,并且其PS系统中的CPM PCIe也较上一代MPSoC PS硬核PCIe单元强大得多。本节将基于AMD官方开发板展示如何快速部署PCIe5x8及DMA功能。
    的头像 发表于 06-19 09:44 1478次阅读
    基于AMD Versal器件实现PCIe5 DMA功能

    Inphi借助Cadence技术完成7nm全芯片扁平化设计流片

    Inphi 是高速数据移动互连领域的领导者,致力于在全球范围内、数据中心之间以及数据中心内部快速传输大数据。
    的头像 发表于 06-06 09:47 1115次阅读

    第三届NVIDIA DPU黑客松开启报名

    第三届 NVIDIA DPU 中国虚拟黑客松(Hackathon)将于 6 月 28 日 - 6 月 30 日正式开启!作为备受广大开发者期待的年度赛事,它将提供与 NVIDIA 加速网络技术深度
    的头像 发表于 05-27 10:16 754次阅读

    DPU232—高度集成USB到UART桥接控制器 国产替代方案

    ~5.25V;内部框图驱动支持Windows 11 64-bitWindows 10 32,64-bitWindows 8/8.1 32,64-bitWindows 7 32,64
    发表于 04-01 10:53

    中科驭数受邀参与华泰证券春季投资峰会 分享DPU在AI领域的应用

    华泰证券2025年春季投资峰会以“破局、重构、裂变”为主题,探讨全球变局下的新趋势。中科驭数高级副总裁张宇受邀参与,分享DPU的产业应用。
    的头像 发表于 03-29 16:50 768次阅读

    在NVIDIA BlueField-3 DPU上运行WEKA客户端的实际优势

    WEKA是可扩展软件定义数据平台的先驱,NVIDIA 正在与其合作,将 WEKA 先进的数据平台解决方案与功能强大的NVIDIA BlueField DPU相结合。
    的头像 发表于 01-07 09:43 1069次阅读
    在NVIDIA BlueField-3 <b class='flag-5'>DPU</b>上运行WEKA客户端的实际优势

    中科驭数凭借在DPU芯片领域的积累被认定为北京市知识产权优势单位

    近日北京市知识产权局公布了2024年拟认定北京市知识产权优势单位名单,中科驭数凭借在DPU芯片领域积累的知识产权成果以及在知识产权创造、运用、保护和管理等方面的优势,被认定为北京市知识产权优势单位
    的头像 发表于 12-31 18:49 1055次阅读
    中科驭数凭借在<b class='flag-5'>DPU</b>芯片领域的积累被认定为北京市知识产权优势单位