0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

美国正在开发用于图处理的下一代ASIC

我快闭嘴 来源:半导体行业观察 作者:David Schor 2020-09-28 15:52 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

现代微处理器通常能够通过分层缓存来隐藏计算与内存之间的大部分差距。这是因为许多负载表现出相对可预测的一般内存模式,可以通过空间局部性和时间局部性加以利用。有些负载还尴尬地并行。例如,人工智能负载往往表现出这种行为。只要你持续为机器提供数据,更多计算就相当于更高性能。人工智能负载往往具有非常可预测的内存模式以及较高的数据重新利用能力,这有助于实现上述所有目标。

不幸的是,并非所有算法都具有这些理想的特性。图就是这样一个例子。企业广泛地使用图来处理大数据。这些数据结构往往有上万亿个边缘,并采用特殊的图算法对数据进行操作。图算法采用非常随机的内存访问模式,导致负载受到内存延迟的高度限制,迫使计算元素在很多时候陷入停滞。它本质上是一个非常大的指针追逐问题,表现出与运行在GPUCPU上的大多数负载相矛盾的行为。

更糟的是,图算法往往具有非常差的次线性缩放特性。你根本无法通过投入更多处理器来解决这个问题。由于数据的稀疏性和不规则性,下一个数据访问通常是在一个完全不同的节点上,传输数据最终会导致整个系统出现瓶颈。

美国国防部分层识别验证及利用计划(DARPA HIVE)

分层识别验证及利用(HIVE)计划是美国国防部正在开展的一项计划,目标是解决这些缺点。HIVE采用软硬件双管齐下的方式。针对该计划的硬件部分,正在开发用于图处理的下一代ASIC。针对软件部分,正在开发一个新的全栈图框架。美国国防部希望通过专门的图处理器和优化的软件栈,实现比当前同类最佳的GPU高1000倍的性能效率。

在上个月底举行的DARPA ERI峰会上,Peter Wang介绍了该项目的最新进展。Wang是Anaconda公司的联合创始人兼首席技术官。他也是HIVE软件架构的首席研究员。

介绍英特尔PUMA团队

英特尔负责HIVE的硬件架构部分,他们正在开发一个新的架构来解决这些问题。在英特尔的数据中心事业部内部有一个名为PUMA的秘密团队。他们负责图分析(GA)处理器的开发。这是他们正在秘密开发的一个完整产品,英特尔打算最终将其商业化。

新的图处理器基于一种新开发的架构,被称为可编程统一内存架构或PUMA。这是一种新的架构,用于整个全局统一内存空间的小型不规则内存访问。在这种架构下,芯片放弃了现代CPU和GPU所使用的许多基本假设——它并不假设自己拥有附近所有内存,它并不假设内存访问会在不久的将来重复执行,它也不假设对特定地址的内存访问意味着附近的内存地址也将被访问。Wong说:“通过抛弃这些基本假设,你可以围绕对全局统一数据的小访问而构建一个完全不同的硬件架构。然后,在每个阶段,每当有一个有线互联或者任何把一个计算单元连接到其它一些数据单元或其它计算单元的东西,每一个点都针对延迟进了优化。” PUMA从根本上改变了与内存访问相关的行为,使内存访问更小、更有效,并使访问这些内存的延迟更长,但在整个系统中实现扁平化。

PUMA实现机箱级完全集成,可以跨处理元件和内存进行良好的通信。它旨在扩展到大型系统,在多个机架和多个集群上使用。

Wang根据英特尔的内部模拟结果给出了一些初步性能数据。他说:“节点缩放确实是一个关键问题。当我们讨论上万亿个边缘的时候,我们知道这些数字会变得更大。”为此,Wang报告了超过80%的缩放效率。他补充道:“这实际上让我们能够并行化解决图问题的方法。”

软件基础设施

HIVE的第二阶段是构建软件基础设施。新软件不仅必须与新硬件兼容,而且必须与现有CPU和GPU兼容。此外,新软件必须支持数据科学届使用的大量现有软件。现有的大量软件都是为了以某种方式解决特定的图问题而开发的。该计划的部分目标是能够将现有的软件和库连接到HIVE软件框架中,以便使其更易于投入使用。

当前的软件包括通过API公开的算法、数据的内部图表示以及硬件后端(GPU、CPU、FPGA或ASIC)。Wang解释说,在当前平台下,必须做出重大取舍,无论是针对某种类型的硬件进行优化还是针对某些算法进行优化。Wang说: “如果你专门从事图表示,那么你就会与数据科学生态系统脱节,因为你被切断了与一些重要库的联系。”

作为HIVE第二阶段一部分,他们正在开发模块化架构框架。现有软件正在重新纳入它们的组成部分,以便可以根据该软件最佳功能将其插入到框架中。该结构包括Workflow Scheduler和Dispatch Engine,用于把User API负载任务路由到后端。他们利用DASK任务调度程序来执行此操作。这也是他们进行后端切换和调度的方式。顺便说一句,值得注意的是,虽然他们正在与英特尔密切合作,共同开发这个框架,以便能够通过PUMA架构实现其性能目标,但是软件框架并不是专门为PUMA设计的。事实上,它们完全针对广泛的硬件,以便数据科学家立即能够跨越CPU、GPU和FPGA,充分利用相同的软件基础设施。并最终使用相同的基础架构,利用PUMA图处理器来加速相同的负载。

值得一提的是,如果有必要,在后端,框架可包含一组能够转换不同格式数据的转换器

这种设计有两大好处——集成新硬件意味着设计了一个新的硬件后端,如果数据模型与现有模型不同,则添加对数据模型的支持,并添加一个可以从现有数据模型转换到新数据模型的转换器。同样,集成一个新的User API只需要在其中一个硬件上添加一个接口并至少采用一种算法。

最终,HIVE的总体目标就是统一和简化“让图软件与硬件进行优化通信的”流程,只需让硬件厂商提供其硬件并为其集成一个良好的后端,同时让数据科学家能够通过自己的API和算法来充分利用该硬件。

Wang透露,从明年开始,用户有望看到开源的初始源代码。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1664

    文章

    22519

    浏览量

    639770
  • asic
    +关注

    关注

    34

    文章

    1278

    浏览量

    125002
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11343

    浏览量

    226048
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5296

    浏览量

    136121
  • 微处理器
    +关注

    关注

    11

    文章

    2440

    浏览量

    86200
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    电装战略注资NCT并携手开发下一代高效能电机

    近日,电装株式会社(以下简称“电装”)正式宣布,已完成对Next Core Technologies株式会社(以下简称“NCT”)的注资,双方将围绕电机铁芯*1领域共同开发,并聚焦关键材料——铁基非晶系合金*2的产业化应用,旨在进步强化
    的头像 发表于 04-29 10:11 163次阅读

    IRP6VRM1:下一代处理器DC/DC转换器的理想之选

    ,它为下一代处理器的DC/DC转换器设计提供了站式的解决方案。 文件下载: IRP6VRM1-EV.pdf 产品概述 IRP6VRM1采用了200kHz同步降压调节器拓扑结构,能够实现出色的效率,同时具备快速的负载响应和精确
    的头像 发表于 03-29 10:20 225次阅读

    FT 5000 Smart Transceiver:下一代智能网络芯片的卓越之选

    Transceiver 是 Echelon 公司推出的下一代智能网络芯片,它是 LONWORKS® 2.0 平台的关键产品。该平台旨在大幅提升 LONWORKS 设备的性能和功能,同时降低开发和节点成本。FT 5000 集成了高性能的 Neuron®
    的头像 发表于 03-28 09:05 309次阅读

    DSP Concepts与AMD助力打造下一代汽车音频

    DSP Concepts 与 AMD 正在将 Audio Weaver 嵌入式音频框架引入 AMD 锐龙 AI 嵌入式 P100 系列处理器——从而实现下一代沉浸式车载音频与数字座舱体验。
    的头像 发表于 03-19 09:40 4664次阅读

    理想汽车发布下一代自动驾驶基础模型MindVLA-o1

    2026年3月17日,理想汽车基座模型负责人詹锟出席NVIDIA GTC 2026,发表主题演讲《MindVLA-o1:开启全能范式——下一代视觉-语言-动作自动驾驶大模型探索》,发布下一代
    的头像 发表于 03-18 11:51 1551次阅读
    理想汽车发布<b class='flag-5'>下一代</b>自动驾驶基础模型MindVLA-o1

    英飞凌下一代电磁阀驱动器评估套件使用指南

    英飞凌下一代电磁阀驱动器评估套件使用指南 引言 作为电子工程师,我们在开发电磁阀驱动相关项目时,款好用的评估套件能大大提高我们的开发效率。英飞凌的
    的头像 发表于 12-21 15:50 751次阅读

    英飞凌下一代电磁阀驱动器评估套件使用指南

    英飞凌下一代电磁阀驱动器评估套件使用指南 、前言 在电子工程师的日常工作中,电磁阀驱动器的评估和开发项重要任务。英飞凌推出的下一代电磁
    的头像 发表于 12-21 11:30 1166次阅读

    Amphenol 4 端口千兆以太网交换机:适用于下一代无人机、机器人和嵌入式应用

    Amphenol 4 端口千兆以太网交换机:适用于下一代无人机、机器人和嵌入式应用 在电子工程领域,为下一代无人机、机器人和嵌入式应用开发先进的网络解决方案至关重要。Amphenol
    的头像 发表于 12-10 15:25 634次阅读

    Telechips与Arm合作开发下一代IVI芯片Dolphin7

    Telechips宣布,将在与 Arm的战略合作框架下,正式开发下一代车载信息娱乐系统(IVI)系统级芯片(SoC)“Dolphin7”。
    的头像 发表于 10-13 16:11 1504次阅读

    用于下一代 GGE 和 HSPA 手机的多模式/多频段功率放大器模块 skyworksinc

    电子发烧友网为你提供()用于下一代 GGE 和 HSPA 手机的多模式/多频段功率放大器模块相关产品参数、数据手册,更有用于下一代 GGE 和 HSPA 手机的多模式/多频段功率放大器
    发表于 09-08 18:33
    <b class='flag-5'>用于</b><b class='flag-5'>下一代</b> GGE 和 HSPA 手机的多模式/多频段功率放大器模块 skyworksinc

    用于下一代 GGE 和 HSPA 手机的多模/多频段 PAM skyworksinc

    电子发烧友网为你提供()适用于下一代 GGE 和 HSPA 手机的多模/多频段 PAM相关产品参数、数据手册,更有适用于下一代 GGE 和 HSPA 手机的多模/多频段 PAM的引脚
    发表于 09-05 18:34
    适<b class='flag-5'>用于</b><b class='flag-5'>下一代</b> GGE 和 HSPA 手机的多模/多频段 PAM skyworksinc

    四维新加速打造基于地平线征程6B的下一代辅助驾驶系统

    近日,四维新基于地平线征程6B芯片研发的下一代辅助驾驶系统方案,已顺利完成底层平台开发,伴随工程化落地进程加速,该方案已正式进入到客户行泊体量产项目的联合研发阶段,并预计在2026
    的头像 发表于 08-25 17:35 2098次阅读

    安森美携手英伟达推动下一代AI数据中心发展

    安森美(onsemi,美国纳斯达克股票代号:ON)宣布与英伟达(NVIDIA)合作,共同推动向800V直流(VDC)供电架构转型。这变革性解决方案将推动下一代人工智能(AI)数据中心在能效、密度及可持续性方面实现显著提升。
    的头像 发表于 08-06 17:27 1758次阅读

    下一代高速芯片晶体管解制造问题解决了!

    ,10埃)开始直使用到A7。 从这些外壁叉片晶体管的量产中获得的知识可能有助于下一代互补场效应晶体管(CFET)的生产。 目前,领先的芯片制造商——英特尔、台积电和三星——正在利用
    发表于 06-20 10:40

    下一代PX5 RTOS具有哪些优势

    许多古老的RTOS设计至今仍在使用,包括Zephyr(1980年)、Nucleus(1990年)和FreeRTOS(2003年)。所有这些旧设计都有专有的API,通常更大、更慢,并且缺乏下一代RTOS的必要安全认证和功能。
    的头像 发表于 06-19 15:06 1335次阅读