0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于 ODLA 的异构 AI 硬件对接方案介绍

lhl545545 来源:与非网 作者:与非网 2020-09-25 17:25 次阅读

在刚刚结束的 2020 云栖大会上,阿里云宣布对行业开源业界首个深度学习开放接口标准 ODLA(Open Deep Learning API)。阿里云在今年 5 月份的 OCP 全球峰会上首次对外公布 ODLA 接口标准,并宣布已率先在 Graphcore 等生态伙伴上获得支持。IPU 是 Graphcore 为机器智能从零设计的 AI 处理器,通过 ODLA 接口,开发者可以在 IPU 上快速跑通 AI Matrix 的各类模型。

基于 ODLA 的异构 AI 硬件对接方案介绍

张伟丰博士在 2020 OCP 全球峰会上公布 ODLA 接口标准

ODLA 是一个为加速深度学习的统一异构硬件编程接口。ODLA 规范了深度学习计算任务的定义和执行,实现上层应用和底层异构硬件平台的解耦,让 AI 异构计算更简单,实践代码“生成一次,随时链接,随处执行”的愿景。

“令人兴奋的新应用程序意味着我们对数据中心的期望比以往任何时候都要更高。我们希望通过使用更广泛的硬件选择,以更大的规模,扩大操作类型范围。ODLA 使我们能够管理这种复杂性,并挖掘出这些出色的新技术的全部潜力。”Graphcore 高级副总裁兼中国区总经理卢涛表示。

阿里云开发 ODLA 是为了解决异构计算中存在许久的一个核心挑战。ODLA 是轻量高效的异构硬件统一接口标准,可在异构计算环境中实现效率最大化。在异构计算环境中,软件框架需要从专业芯片中获得最高性能,需要多种类型处理器在一个通用平台上协同工作,而每种处理器都需要针对其架构和专业知识领域进行某种程度的优化,例如 AI 的稀疏性。API 提供的抽象级别可以适应芯片架构之间的差异。

基于 ODLA 的异构 AI 硬件对接方案

通过 ODLA,在 Graphcore IPU 上技术适配和应用部署的工作量可以实现大幅度降低,且实现效率大幅提升。另外,通过 ODLA 可以更好的与 AI 计算框架进行软硬协同,快速利用现有的编译优化技术,达到最佳性能。对于异构任务,ODLA 充当该系统范围通用语言与特定于架构的优化之间的接口或转换器,该优化可从 Graphcore 的 IPU 等设备实现最佳性能。

对于数据中心运营商而言,除了简化了新微处理器技术的集成之外,ODLA 还带来了其他一系列好处。它支持通用和高性能的数据中心设置,并为高级应用程序提供统一的加速框架。对于应用程序开发人员来说,它减少了对不同架构进行重复优化的需求,并应该可以减少开发成本,缩短产品上市时间。

ODLA 在 2020 云栖大会上宣布的主要特性及优势包含:

透明接口层,零损耗。

接口抽象和统一,软硬件解耦:通过面向 AI 的多粒度算子抽象,定义统一的接口,解耦具体软硬件,平滑迁移业务;实现代码复用,提升开发和部署效率。

多模态执行方式:支持多种执行模式,覆盖解释执行、编译执行、载入预编译代码等场景,兼容各种硬件的运行模式。

AI 全场景支持:支持推理和训练,适配云、边、端全场景 AI 业务;拥有广泛的算子定义和丰富的接口(设备管理、会话管理、执行管理、事件同步 / 异步、资源查询、性能监控等)。

卓越的扩展性,支持 AI 芯片厂家独特属性和自定义算子。

张伟丰博士在云栖大会上宣布开源 ODLA

Graphcore 公司相信,IPU 将成为下一代数据中心 AI 工作负载的核心。我们深知,我们的愿景需要 ODLA 在内的诸多框架和工具,这些框架和工具能使我们的产品与其他同类最佳技术协同工作。

Graphcore 的联合创始人兼首席执行官 Nigel Toon 表示:“ODLA 优雅地满足了 Graphcore 新用户的两个最大需求。一是他们希望轻松地将我们的技术集成到现有的数据中心,二是他们希望确保最终的设置在从各个组件到整个系统的每个层级都能得到高度优化。”
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    18257

    浏览量

    222079
  • AI
    AI
    +关注

    关注

    87

    文章

    26413

    浏览量

    264021
  • 阿里云
    +关注

    关注

    3

    文章

    883

    浏览量

    42607
收藏 人收藏

    评论

    相关推荐

    开发者手机 AI - 目标识别 demo

    。 NNRt host 实现了NNRt HDI接口功能,通过对接底层AI芯片接口为上层应用提供NPU硬件推理的能力。 功能实现 JS从相机数据流获取一张图片,调用Native的接口进行目标识别的处理
    发表于 04-11 16:14

    迈尔微视重磅推出高精度对接相机M4 Mega

    为移动机器人、人形机器人货物抓取、高精度对接提供3D视觉+AI一体化解决方案
    的头像 发表于 03-19 10:14 414次阅读
    迈尔微视重磅推出高精度<b class='flag-5'>对接</b>相机M4 Mega

    高通NPU和异构计算提升生成式AI性能 

    异构计算的重要性不可忽视。根据生成式AI的独特需求和计算负担,需要配备不同的处理器,如专注于AI工作负载的定制设计的NPU、CPU和GPU。
    的头像 发表于 03-06 14:15 213次阅读

    CES AI硬件层出不穷:你愿为AI的溢价买单吗?

    硬件AI
    电子发烧友网官方
    发布于 :2024年01月30日 16:36:00

    新火种AI|“赌城”上演“科技春晚”,AI硬件将在2024年大爆发

    如果说2023年是生成式AI元年,那么2024年将会是AI硬件的元年。
    的头像 发表于 01-12 18:26 621次阅读
    新火种<b class='flag-5'>AI</b>|“赌城”上演“科技春晚”,<b class='flag-5'>AI</b><b class='flag-5'>硬件</b>将在2024年大爆发

    异构专用AI芯片的黄金时代

    异构专用AI芯片的黄金时代
    的头像 发表于 12-04 16:42 280次阅读
    <b class='flag-5'>异构</b>专用<b class='flag-5'>AI</b>芯片的黄金时代

    赋能“AI+行业”应用!广州高企高质量发展对接会(人工智能场景供需对接专场)成功举办

    赋能“AI+行业”应用!广州高企高质量发展对接会(人工智能场景供需对接专场)成功举办 为促进人工智能产业链上下游以及与其他产业链的融合发展,共同推动民营企业实现高质量发展,持续壮大企业科技创新
    的头像 发表于 11-13 10:19 701次阅读
    赋能“<b class='flag-5'>AI</b>+行业”应用!广州高企高质量发展<b class='flag-5'>对接</b>会(人工智能场景供需<b class='flag-5'>对接</b>专场)成功举办

    北京君正X2600处理器亮相ELEXCON 2023,打造多核异构跨界新价值

    伴随下游应用持续丰富,细节需求不断增多,标准化产品已越来越难以满足市场需求,芯片方案提供商需要不断深入行业,根据市场需求推出适配的产品。在这样的背景下,北京君正迅速推出X2600系列多核异构跨界
    发表于 11-03 18:17

    昇腾AI框架全栈深度介绍

    澎湃算力,同步推出针对AI场景的异构计算架构CANN(Compute Architecture for Neural Networks)
    的头像 发表于 10-22 16:19 1731次阅读
    昇腾<b class='flag-5'>AI</b>框架全栈深度<b class='flag-5'>介绍</b>

    CPU+xPU的异构方案解析 cpu和gpu有啥区别

    CPU+xPU 的异构方案成为大算力场景标配,GPU为应用最广泛的 AI 芯片。目前业内广泛认同的AI 芯片类型包括GPU、FPGA、NPU 等。由于 CPU 负责对计算机的
    的头像 发表于 09-03 11:47 1175次阅读
    CPU+xPU的<b class='flag-5'>异构</b><b class='flag-5'>方案</b>解析 cpu和gpu有啥区别

    阿里平头哥发布首个 RISC-V AI 软硬全栈平台

    平台通过软硬件深度协同,较经典方案提升超 8 成性能,支持运行 170 余个主流 AI 模型,推动 RISC-V 进入高性能 AI 应用时代。 平头哥表示,他们通过更新自研一站式
    发表于 08-26 14:14

    新一代计算架构超异构计算技术是什么 异构走向超异构案例分析

    异构计算架构是一种将不同类型和规模的硬件资源,包括CPU、GPU、FPGA等,进行异构集成的方法。它通过独特的软件和硬件协同设计,实现了计算资源的灵活调度和优化利用,从而大大提高了计
    发表于 08-23 09:57 451次阅读
    新一代计算架构超<b class='flag-5'>异构</b>计算技术是什么 <b class='flag-5'>异构</b>走向超<b class='flag-5'>异构</b>案例分析

    AI芯片 CPU+xPU的异构方案全面解析

    CPU+xPU 的异构方案成为大算力场景标配,GPU为应用最广泛的 AI 芯片。目前业内广泛认同的AI 芯片类型包括GPU、FPGA、NPU 等。由于 CPU 负责对计算机的
    发表于 08-22 10:11 855次阅读
    <b class='flag-5'>AI</b>芯片 CPU+xPU的<b class='flag-5'>异构</b><b class='flag-5'>方案</b>全面解析

    异构计算场景下构建可信执行环境

    令集、不同功能的算力单元,组合起来形成一个混合的计算系统,使其具有更强大、更高效的功能。如何在异构计算场景下构建可信执行环境呢?华为可信计算首席科学家、IEEE硬件安全与可信专委会联席主席金意儿教授在第一届
    发表于 08-15 17:35

    中国首颗ARM+RISC-V异构多核MCU伴随IAR在上海国际嵌入式展亮相

    ARM+RISC-V异构多核MCU硬件平台。“嵌入式多核系统可分为同构多核和异构多核,航顺芯片HK32U3009采用ARM+RISC-V异构多核架构,在国产嵌入式MCU中属于国内首创!
    发表于 06-15 18:32