还未设置个性签名
成为VIP会员 享9项特权: 开通会员

完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>

3天内不再提示

MEEP打造HPC生态系统的数字实验室

星星科技指导员 来源:嵌入式计算设计 作者:John Davis 2022-06-30 14:49 次阅读

我们正在迅速接近百亿亿次计算时代,但几乎没有工具和基础设施来帮助我们为未来构建软件/硬件共同设计的生态系统。我们不能再等待新硬件来开发软件。同样,为了满足这些百亿亿级及以上系统的性能和功率目标,我们必须以协同设计系统的形式利用专业化,这意味着硬件和软件必须一起设计,而不是孤立地设计。

专业化还将开源生态系统扩展到具有开放式 ISA 的硬件,例如 RISC-V,它定义了软件级别互操作性的基本标准,同时还可以灵活地将架构专业化以包括新的应用程序功能和硬件支持。这种新功能正在开启一个令人兴奋的系统设计新时代,全栈研发,包括构建专用硬件。MareNostrum Exascale 实验平台 (MEEP) 是实现灵活硬件平台的第一步,我们可以使用该平台来映射或模拟各种不同的开发架构,包括硬件和软件。

BSC 正在构建各种软件和硬件组件,以支持开源软件和硬件 HPC 生态系统。我们正在构建开源软件的丰富历史,并将其扩展到基于 RISC-V 指令集架构 (ISA) 的开源硬件。MEEP 支持使用 FPGA 快速评估硬件架构。这是通往开放 HPC 生态系统(包括硬件和软件)的众多步骤之一。此外,与软件模拟不同,MEEP 还是一个软件开发工具,它允许我们以合理的速度运行整个软件堆栈以进行交互式开发。MEEP 是我们的数字实验室,用于设计、测试和评估未来的百亿亿次加速器和系统,真正的软件/硬件协同设计。

与软件不同,硬件开发成本非常昂贵,错误也非常昂贵,尤其是在芯片制造中。MEEP 提供了一种以灵活性换取性能的机制。我们正在使用 FPGA 构建 MEEP,FPGA 是一种灵活的硬件组件或结构,可以一遍又一遍地重新编程。它使我们能够像对待软件一样对待硬件,具有与软件相同的灵活性,我们可以重新编译硬件描述语言来创建新的硬件设计以映射到 FPGA 架构上。MEEP 基础设施软件和 FPGA 使硬件仿真更像传统的软件开发。此外,MEEP 不仅可以用于单个仿真项目,例如,MEEP 的第一个演示器,一个百亿亿次加速器。MEEP 可以模拟其他加速器设计以及 CPU

构建一个 Exascale 加速器模拟器

MEEP 结合了软件、架构和 RTL 三个主要组件以及硬件组件,形成了一个完整的系统仿真平台。第一个部署将是用于 HPC 和高性能数据分析 (HPDA) 应用程序的 exascale 加速器。因此,我们组装了一组 HPC、AI、ML 和 DL 应用程序,以实现加速。

基于此基准套件,我们分析应用程序并定义针对这些应用程序优化的架构。通过定义的架构,我们可以编写 RTL,即描述硬件的代码。在真正的协同设计实践中,我们可以灵活地在堆栈的任何级别、软件堆栈的任何层和硬件上进行更改。这是一个新的灵活性水平,可以为问题提供最佳的整体解决方案,而不是受限于仅软件更改和/或仅模拟验证。

最后,我们将软件和架构以及 RTL 结合起来,并将其映射到模拟器上。这是一个由大约 100 个 CPU 和 FPGA 组成的系统。这种规模可以实现超出正常单芯片评估的更大规模系统研究。CPU 和 FPGA 的组合为将逻辑仿真器映射到物理资源提供了额外的灵活性。我们可以用 exascale 加速器或我们映射到 MEEP 的任何其他系统的逻辑定义来模糊物理硬件的界限。此外,我们正在使用传统的加速器架构,该架构可用于在这个初始项目之外的大规模研究。FPGA 是提供这种灵活性的基本构建块。我们基本上以两种不同的方式部署 FPGA:FPGA Shell 和 FPGA Emulator。我们将 FPGA Shell 定义为与内存和 I/O 的 FPGA 接口。FPGA Shell 包含所有 FPGA 设计中的所有通用基础设施。FPGA 架构其余部分中剩余的 FPGA 资源可用于仿真和/或加速器设计。图1,下图说明软件堆栈和运行描述硬件架构的 RTL 代码的 FPGA 仿真器。

pYYBAGK9R7aAQUNdAAHYytwvog4292.png

HPC 应用程序包括新兴的 AI、ML 和 DL 工作负载。MEEP 将使我们能够展望未来,并在新硬件可用之前演示事情是如何工作的。这种硅前验证将通过提高 RTL 的质量和消除错误来节省大量资金。

MEEP 为新硬件及其相关硬件的系统级软件开发提供了独特的机会。我们正在构建一个紧密耦合的加速器,它超越了传统的 HPC 应用程序,包括新兴的 AI、ML 和 DL 工作负载。MEEP 将使我们能够展望未来,并在新硬件可用之前演示事情是如何工作的。这种硅前验证将通过提高 RTL 的质量和消除错误来节省大量资金。MEEP 还将支持新系统的软件开发,实现新硬件和软件的并行开发。这对于必须等待新硬件可用的软件开发尤其重要。在这两种情况下。

审核编辑:郭婷

  • 加速器
    +关注

    关注

    2

    文章

    388

    浏览量

    33870
  • AI
    AI
    +关注

    关注

    85

    文章

    20408

    浏览量

    238589
  • HPC
    HPC
    +关注

    关注

    0

    文章

    113

    浏览量

    21144
收藏 人收藏

    评论

    相关推荐

    3D设计协作和世界仿真平台NVIDIA Omniverse的更新内容

    在全球最大的计算机图形盛会 SIGGRAPH 上,NVIDIA 宣布要为使用实时 3D 设计协作和世....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-14 11:00 63次 阅读

    通过NVIDIA DeepSearch工具提升天空制作效果

    知名工作室利用 Omniverse AI 助力的搜索工具筛选庞大的 3D 场景数据库。
    的头像 NVIDIA英伟达企业解决方案 发表于 08-14 11:00 55次 阅读

    NVIDIA发布NeuralVDB 可将内存占用量减少高达100倍

    NeuralVDB 可将烟雾、云和其他稀疏体积数据的内存占用量减少多达 100 倍。
    的头像 NVIDIA英伟达企业解决方案 发表于 08-14 10:58 61次 阅读

    NVIDIA通过Vid2Vid Cameo演示表演捕捉技术

    Derivative、Notch 和 Pixotope 等公司使用 NVIDIA Vid2Vid C....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-14 10:49 73次 阅读

    采用百度飞桨EasyDL完成指定目标识别

    EasyDL从2017年11月中旬起,在国内率先推出针对AI零算法基础或者追求高效率开发的企业用户的....
    的头像 DS小龙哥-嵌入式技术 发表于 08-14 10:30 32次 阅读

    百度飞桨及文心大模型赋能千行百业

    2021中国自动化大会2022年8月11日至13日在云南昆明举办,多位院士、专家参会并做特邀报告。中....
    发表于 08-14 09:31 28次 阅读

    培育20家亿元合作伙伴!华为点燃机器视觉赛道 新战略和新品火爆登场

     电子发烧友原创 章鹰   近期,机器视觉赛道升温,主要有两家公司传来好消息。首先,华为在8月8日正....
    的头像 章鹰观察 发表于 08-14 00:00 405次 阅读
    培育20家亿元合作伙伴!华为点燃机器视觉赛道 新战略和新品火爆登场

    穿梭于货架之间的AI:数百家日本便利店开始使用机器人补货

      总部位于东京的初创企业 Telexistence 本周宣布将在日本数百家全家(FamilyMar....
    发表于 08-12 17:54 58次 阅读
    穿梭于货架之间的AI:数百家日本便利店开始使用机器人补货

    设计师指南:为嵌入式设计选择 AI 芯片

    通过提出四个关键问题,开发人员将能够针对其特定的嵌入式 AI 项目确定最佳 AI 处理器候选者
    发表于 08-12 17:08 24次 阅读
    设计师指南:为嵌入式设计选择 AI 芯片

    边缘AI推理将覆盖60%设备,莱迪思FPGA+sensAI 4.1组合拳如何打?

    ABI的研究调查表明,预计到2024年设备端的AI推理功能将覆盖近60%的设备。FPGA作为实现边缘....
    的头像 花茶晶晶 发表于 08-12 16:39 444次 阅读
    边缘AI推理将覆盖60%设备,莱迪思FPGA+sensAI 4.1组合拳如何打?

    英伟达AI技术 助体育运动大数据分析和收集提升内容价值

    人工智能在大数据分析应用的作用越来越大,更多的专业数据分析也开始采用上基于英伟达AI 技术来大幅提升....
    的头像 电子麦克风 发表于 08-12 16:32 492次 阅读
    英伟达AI技术 助体育运动大数据分析和收集提升内容价值

    医学影像中值得关注的五种人工智能技术趋势

    人工智能公司不断改进和训练他们的算法,以改进医学诊断成像中的疾病检测。
    发表于 08-12 15:13 79次 阅读
    医学影像中值得关注的五种人工智能技术趋势

    机器学习更接近您附近的微控制器

    广泛应用于基于云的人工智能,机器学习即将开始出现在微处理器和微控制器硬件中
    发表于 08-12 12:00 9次 阅读
    机器学习更接近您附近的微控制器

    NVIDIA SIGGRAPH的最新发布与重要更新

    在今年的 SIGGRAPH 2022 上,NVIDIA 宣布,为基于通用场景描述(USD)连接和构建....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-12 11:14 111次 阅读

    NVIDIA谈引发图形革命的三大驱动力

    AI、虚拟世界和数字人正在推动视觉设计进入更宽广的轨道。
    的头像 NVIDIA英伟达企业解决方案 发表于 08-12 11:12 111次 阅读

    Kneron的3D AI解决方案满足安全防范和现代化管理需求

    Kneron创办人暨执行长刘峻诚表示:“Kneron致力于发展人工智能在终端装置上的应用,3D AI....
    发表于 08-12 10:15 45次 阅读

    瑞为智慧机场解决方案覆盖全国2/3的千万级机场

    扎根租住行业的7年,深圳市优电智能有限公司(以下简称“优电智能”)的创始团队对这句话的理解应该更加深....
    的头像 瑞为技术Reconova 发表于 08-12 09:02 122次 阅读

    为什么智能医院的医疗级平板电脑

      具有 3D 医学成像功能的 MXM 显卡还将医学成像提升到一个新的水平,并且还允许集成网络摄像头....
    的头像 星星科技指导员 发表于 08-11 15:59 245次 阅读

    智能驾驶域控制器的SoC芯片选型

    1、智能驾驶域控制器的SoC芯片选型 随着智能驾驶行业的发展,智能驾驶功能日益复杂,领航高速辅助、领航城区辅助、跨层记忆泊...
    发表于 08-11 15:55 1538次 阅读

    通信周动态

    行业相关 1、筑路数字经济 中兴通讯携创新终端产品亮相2022世界5G大会 8月10日,中兴通讯亮相....
    的头像 研精毕智 发表于 08-11 15:33 157次 阅读

    虹科Spectrum的数字化仪方案

    虹科Spectrum的数字化仪和任意波形发生器采用最新的基于PC的技术,是声学系统开发、测试和操作的....
    的头像 广州虹科电子科技有限公司 发表于 08-11 15:05 112次 阅读

    下一代人工智能基础设施的特征

    自动驾驶领域在近两年被大家所熟悉,主要的市场诱导因素是Tesla在辅助智能驾驶和采用全视觉技术的影子....
    发表于 08-11 10:02 70次 阅读

    零距离了解昇腾AI的软硬件能力

    旅行中的我们,总是在看一些关于过去的东西,比如自然的造化,历史的遗存。但或许你也会偶尔有个想法,想在....
    的头像 华为数字中国 发表于 08-11 09:54 369次 阅读

    基于昇腾AI的MoloSight针对不同的使用场景提供3种不同版本选择

    近日,基于昇腾AI,摩赛恩与华为携手推出质谱智能计算系统MoloSight,并正式加入昇腾万里伙伴计....
    的头像 华为计算 发表于 08-11 09:49 257次 阅读

    2024年设备端AI推理功能将覆盖近60%的设备

    去年莱迪思发布了sensAI 4.1解决方案,当时介绍的一个典型案例是用于PC智能和感知体验。如今,....
    的头像 电子发烧友网 发表于 08-11 09:32 187次 阅读

    NVIDIA Jetson TX2 NX GPU助力微链DaoAI加速数据处理

    微链 DaoAI是市场领先的3D 视觉和 AI 机器人系统供应商,拥有全球领先的 3D 视觉认知技术....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-11 09:31 135次 阅读

    NVIDIA发布Omniverse重要版本

    NVIDIA 新发布的工具和功能包括:Avatar Cloud Engine;DeepSearch ....
    的头像 NVIDIA英伟达 发表于 08-11 09:29 87次 阅读

    全新NVIDIA Omniverse ACE加速虚拟形象开发工作

    Omniverse Avatar Cloud Engine(ACE)为游戏、聊天机器人、数字孪生和虚....
    的头像 NVIDIA英伟达 发表于 08-11 09:24 136次 阅读

    NVIDIA 将为StreamLake释放更多视频云计算能力

    8 月 10 日,快手 StreamLake 品牌发布会正式举办,以“云启共生·水润万象”为主题,推....
    的头像 NVIDIA英伟达 发表于 08-11 09:19 146次 阅读

    参天生长大模型:昇腾AI如何强壮模型开发与创新之根?

    自2018年谷歌发布BERT以来,预训练大模型经过几年的发展,以强大的算法效果,席卷了以NLP为代表....
    的头像 脑极体 发表于 08-11 09:10 365次 阅读

    MediaTek APU以DLA VPU为核心 高能效AI赋能全场景体验

    为新趋势而生 MediaTek APU 以深度学习加速器(DLA)、视觉处理单元(VPU),以及基于....
    发表于 08-10 19:30 106次 阅读

    小成本的V853 AI小开发板DIY设计

    全志最新发布的V853芯片拥有1T的NPU算力,还有Arm+RISC-V+NPU三核异构和丰富的音视....
    的头像 全志在线 发表于 08-10 17:36 97次 阅读

    AI+边缘计算,让城市治理难题“看得见”

    国家“十四五”规划纲要强调“加快数字化发展,建设数字中国”,提出“以数字化助推城乡发展和治理模式创新....
    的头像 英码科技 发表于 08-10 16:59 145次 阅读
    AI+边缘计算,让城市治理难题“看得见”

    基于NI USRP高思科技通感一体科研平台 赋能更多细分应用

    随着6G行至深处,作为其关键技术之一的通信感知一体化(ISAC)的研究获得了高度关注。通信感知一体化....
    的头像 恩艾NI知道 发表于 08-10 14:22 353次 阅读

    DesignCon芯片和电路板盛会强调合规性和 AI 辅助测试

    从汽车到物联网,从芯片到电路板等等,降低成本和提高测试可预测性的目标取得了实质性进展
    发表于 08-10 11:33 5次 阅读
    DesignCon芯片和电路板盛会强调合规性和 AI 辅助测试

    沈阳人工智能计算中心正式上线并网投入运行

    【中国,沈阳,2022年8月9日】东北首座人工智能计算中心——沈阳人工智能计算中心(简称“沈阳智算”....
    发表于 08-10 09:53 60次 阅读

    Nimbix云提供的技术支持

    MiNO Marine使用由JARVICE提供支持的Nimbix云来加速仿真的执行,并使用Star-....
    的头像 广州虹科电子科技有限公司 发表于 08-10 09:35 164次 阅读

    带着昇腾去旅行:一日看尽金陵城里的AI胜景

    旅行中的我们,总是在看一些关于过去的东西,比如自然的造化,历史的遗存。但或许你也会偶尔有个想法,想在....
    的头像 脑极体 发表于 08-10 09:32 346次 阅读

    智能遥感:AI赋能遥感技术

    随着人工智能的发展和落地应用,以地理空间大数据为基础,利用人工智能技术对遥感数据智能分析与解译成为未....
    发表于 08-10 09:06 65次 阅读

    商汤元萝卜AI下棋机器人发布

    科技与人文,在此交融。   今天,商汤首个家庭消费级人工智能产品——“元萝卜SenseRobot” ....
    发表于 08-09 20:01 136次 阅读

    意法半导体发布STM32Cube.AI开发工具

    意法半导体(ST)发布了STM32Cube.AI version 7.2.0,这是微控制器厂商推出的....
    的头像 半导体芯科技SiSC 发表于 08-09 17:56 198次 阅读

    普强AI智能工牌解决方案亮相GENESYS生态大会活动

    8月4日普强于湖南长沙参加GENESYS 生态大会活动,GENESYS作为普强重要合作伙伴,双方始终....
    的头像 普强信息 发表于 08-09 15:09 294次 阅读

    基于AI算法的智能工牌解决方案

    AI智能工牌解决方案以AI算法中心实时数字化分析为依托,结合声源收录、声音信息转写与提取、数据分析等....
    发表于 08-09 15:07 59次 阅读

    IBM范斌参加2022全球数字经济大会数字金融论坛

    IBM副总裁、IBM Consulting高级合伙人、中国区金融行业总经理范斌先生应邀参加2022全....
    的头像 IBM中国 发表于 08-09 14:03 209次 阅读

    人工智能可解释性规制面临的问题分析

    在实践中,人工智能的规模化应用推广,在很大程度上依赖于用户能否充分理解、合理信任并且有效管理人工智能....
    的头像 city_prolove 发表于 08-09 10:04 157次 阅读

    研究者提出了一项新的视听分割任务

    视听表征学习(audio-visual learning)已经催生了很多有趣的任务,比如视听通信(A....
    的头像 city_prolove 发表于 08-08 16:45 163次 阅读

    讯飞翻译机4.0发布,曾在消博会亮相的黑科技有多厉害?

    六边形战士,网络流行语,源于日本媒体《东京乒乓球新闻》。该媒体从速度、力量等六个方面,分析各大乒乓选....
    的头像 科技见闻网 发表于 08-08 15:05 226次 阅读
    讯飞翻译机4.0发布,曾在消博会亮相的黑科技有多厉害?

    一文解析HPC存储系统的挑战

    功率:超级计算机已接近100千瓦/架,其中大部分被数据移动所消耗 随着HPC应用数据集的增长,在数据....
    发表于 08-08 14:30 61次 阅读

    AI 工作负载的电源

    AI 无处不在的性质不仅限于数据中心,也不在 MIT Python 程序员的头脑中。它可以在我们当地....
    的头像 李芳 发表于 08-08 11:14 72次 阅读

    一项新的视听分割任务

    来自合肥工业大学、商汤、澳国立、北航、英伟达、港大和上海人工智能实验室的研究者提出了一项新的视听分割....
    的头像 OpenCV学堂 发表于 08-08 10:23 84次 阅读

    全球首款Eoy云耳机上市!当耳机加入AI交互功能,会激起什么样的水花?

    在“洗牌”之后,一个行业的发展会趋向健康 ,每一款新品都在“洗牌”的过程中表现得更加有竞争力,就像T....
    的头像 Monika观察 发表于 08-08 08:00 919次 阅读
    全球首款Eoy云耳机上市!当耳机加入AI交互功能,会激起什么样的水花?

    基于Fast Model的加速器软件开发

    随着arm生态系统的发展壮大,各种各样的应用场景层出不穷。为了更好地在特定场景下得到更好的性能,能耗比等指标,针对特定应用场...
    发表于 07-29 15:38 2163次 阅读

    加速计算卡设计资料第389篇:基于KU5P的双路100G光纤网络加速计算卡

    [table=91%] [tr][td]基于KU5P的双路100G光纤网络加速计算卡[/td][/tr] [tr][td][table=94%] [tr][td] 一、板卡概...
    发表于 07-13 10:05 1948次 阅读

    一款低端14 MHz加速器Spitfire 500

    描述 Spitfire 500,一款低端 14 MHz 加速器,带有 IDE 和用于 Amiga 500 的 4/8 MB 快速 RAM。 代码 ...
    发表于 07-05 06:01 566次 阅读

    STM32F411芯片有哪些功能呢

    STM32F411芯片的性能有哪些? STM32F411芯片有哪些功能呢? ...
    发表于 10-25 08:40 743次 阅读

    STM32F413/STM32F423微控制器有哪些性能

    STM32F413/STM32F423微控制器是什么? STM32F413/STM32F423微控制器有哪些性能? ...
    发表于 10-18 06:02 863次 阅读

    RTL8192ER单芯片有何功能

    RTL8192ER是什么? RTL8192ER单芯片有何功能?
    发表于 10-15 09:40 2340次 阅读

    使用UMC 28HPC工艺进行MC仿真有什么问题吗?

    最近在使用UMC 28HPC工艺进行MC仿真,发现两个问题: 1. MC仿真结果的std(标准差)和实测结果不match,实测结果大概...
    发表于 06-25 06:40 1078次 阅读

    GraphSAGEGNN算法的数学原理是什么?

    本文深入讨论了GraphSAGEGNN算法的数学原理,并从多个维度分析了GNN加速器设计中的技术挑战。 ...
    发表于 06-17 08:56 658次 阅读

    请问怎样去设计一种MPEG-4 加速器?

    如何去选择并优化IDCT快速算法? 怎样去设计一种MPEG-4加速器? 如何对MPEG-4加速器进行仿真验证? ...
    发表于 06-04 07:20 1244次 阅读