0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于 ODLA 的异构 AI 硬件对接方案介绍

lhl545545 来源:与非网 作者:与非网 2020-09-25 17:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在刚刚结束的 2020 云栖大会上,阿里云宣布对行业开源业界首个深度学习开放接口标准 ODLA(Open Deep Learning API)。阿里云在今年 5 月份的 OCP 全球峰会上首次对外公布 ODLA 接口标准,并宣布已率先在 Graphcore 等生态伙伴上获得支持。IPU 是 Graphcore 为机器智能从零设计的 AI 处理器,通过 ODLA 接口,开发者可以在 IPU 上快速跑通 AI Matrix 的各类模型。

基于 ODLA 的异构 AI 硬件对接方案介绍

张伟丰博士在 2020 OCP 全球峰会上公布 ODLA 接口标准

ODLA 是一个为加速深度学习的统一异构硬件编程接口。ODLA 规范了深度学习计算任务的定义和执行,实现上层应用和底层异构硬件平台的解耦,让 AI 异构计算更简单,实践代码“生成一次,随时链接,随处执行”的愿景。

“令人兴奋的新应用程序意味着我们对数据中心的期望比以往任何时候都要更高。我们希望通过使用更广泛的硬件选择,以更大的规模,扩大操作类型范围。ODLA 使我们能够管理这种复杂性,并挖掘出这些出色的新技术的全部潜力。”Graphcore 高级副总裁兼中国区总经理卢涛表示。

阿里云开发 ODLA 是为了解决异构计算中存在许久的一个核心挑战。ODLA 是轻量高效的异构硬件统一接口标准,可在异构计算环境中实现效率最大化。在异构计算环境中,软件框架需要从专业芯片中获得最高性能,需要多种类型处理器在一个通用平台上协同工作,而每种处理器都需要针对其架构和专业知识领域进行某种程度的优化,例如 AI 的稀疏性。API 提供的抽象级别可以适应芯片架构之间的差异。

基于 ODLA 的异构 AI 硬件对接方案

通过 ODLA,在 Graphcore IPU 上技术适配和应用部署的工作量可以实现大幅度降低,且实现效率大幅提升。另外,通过 ODLA 可以更好的与 AI 计算框架进行软硬协同,快速利用现有的编译优化技术,达到最佳性能。对于异构任务,ODLA 充当该系统范围通用语言与特定于架构的优化之间的接口或转换器,该优化可从 Graphcore 的 IPU 等设备实现最佳性能。

对于数据中心运营商而言,除了简化了新微处理器技术的集成之外,ODLA 还带来了其他一系列好处。它支持通用和高性能的数据中心设置,并为高级应用程序提供统一的加速框架。对于应用程序开发人员来说,它减少了对不同架构进行重复优化的需求,并应该可以减少开发成本,缩短产品上市时间。

ODLA 在 2020 云栖大会上宣布的主要特性及优势包含:

透明接口层,零损耗。

接口抽象和统一,软硬件解耦:通过面向 AI 的多粒度算子抽象,定义统一的接口,解耦具体软硬件,平滑迁移业务;实现代码复用,提升开发和部署效率。

多模态执行方式:支持多种执行模式,覆盖解释执行、编译执行、载入预编译代码等场景,兼容各种硬件的运行模式。

AI 全场景支持:支持推理和训练,适配云、边、端全场景 AI 业务;拥有广泛的算子定义和丰富的接口(设备管理、会话管理、执行管理、事件同步 / 异步、资源查询、性能监控等)。

卓越的扩展性,支持 AI 芯片厂家独特属性和自定义算子。

张伟丰博士在云栖大会上宣布开源 ODLA

Graphcore 公司相信,IPU 将成为下一代数据中心 AI 工作负载的核心。我们深知,我们的愿景需要 ODLA 在内的诸多框架和工具,这些框架和工具能使我们的产品与其他同类最佳技术协同工作。

Graphcore 的联合创始人兼首席执行官 Nigel Toon 表示:“ODLA 优雅地满足了 Graphcore 新用户的两个最大需求。一是他们希望轻松地将我们的技术集成到现有的数据中心,二是他们希望确保最终的设置在从各个组件到整个系统的每个层级都能得到高度优化。”
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20388

    浏览量

    255672
  • AI
    AI
    +关注

    关注

    91

    文章

    42134

    浏览量

    303130
  • 阿里云
    +关注

    关注

    3

    文章

    1053

    浏览量

    45960
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    异构算力赋能边侧智能,大联大诠鼎携手此芯科技推动智能体终端落地

    大联大控股旗下诠鼎集团宣布,联合此芯科技(CIX Technology)举办“此芯P1:异构AI算力赋能OpenClaw龙虾盒子和AI NAS解决方案”主题线上研讨会。此次研讨会聚焦业
    的头像 发表于 05-25 17:16 328次阅读

    企业如何突破AI算力困局?2026 年异构算力管理平台推荐

    随着 AI 大模型爆发式增长,异构算力管理已成为企业 AI 基础设施建设的核心挑战。本文从行业现状出发,分析异构算力管理的核心痛点与选型要点,并结合典型产品实践,为企业技术决策者提供参
    的头像 发表于 05-20 12:53 111次阅读

    AI硬件浪潮来袭,移远如何打通AI硬件落地的“最后一公里”

    硬件开发中普遍面临的困境,并全方位展示AIOpenPlatform如何系统性解决AI硬件产品落地的核心挑战,为行业提供可落地的工具化方案AI
    的头像 发表于 05-08 19:03 459次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>硬件</b>浪潮来袭,移远如何打通<b class='flag-5'>AI</b><b class='flag-5'>硬件</b>落地的“最后一公里”

    OpenClaw对接聊天APP及AI助手工具

    OpenClaw对接聊天APP及AI助手工具 1、对接飞书聊天APP openclaw配置 此处以飞书为例,输入插件下载安装命令: openclaw plugins install
    的头像 发表于 02-06 16:13 2161次阅读
    OpenClaw<b class='flag-5'>对接</b>聊天APP及<b class='flag-5'>AI</b>助手工具

    定制AI智能眼镜_带摄像头翻译导航大模型的ai眼镜硬件方案

    AI眼镜硬件方案能满足高性能、低功耗、全场景交互需求,采用联发科(MTK)专属智能穿戴芯片方案作为核心算力支撑,整合1600万高清摄像头与2/3/5通道可定制麦克风阵列,搭载自研优化的
    的头像 发表于 02-02 19:46 410次阅读
    定制<b class='flag-5'>AI</b>智能眼镜_带摄像头翻译导航大模型的<b class='flag-5'>ai</b>眼镜<b class='flag-5'>硬件</b><b class='flag-5'>方案</b>

    FPGA+GPU异构混合部署方案设计

    为满足对 “纳秒级实时响应” 与 “复杂数据深度运算” 的双重需求,“FPGA+GPU”异构混合部署方案通过硬件功能精准拆分与高速协同,突破单一硬件的性能瓶颈 ——FPGA聚焦低延迟实
    的头像 发表于 01-13 15:20 584次阅读

    纯4G?血版AI小智产品方案 #小智AI #AI方案商 #4G通话 #AI终端产品

    AI
    不太正经的攻城狮
    发布于 :2025年12月21日 14:36:55

    芯导科技AI智能交互硬件方案介绍

    AI智能交互硬件是通过集成人工智能技术(如大语言模型、多模态交互、机器学习等),赋予传统玩具智能化交互能力的新型产品。其核心特点是‌拟人化交互和自适应学习‌,能够理解用户语言、动作甚至情绪,并提供个性化响应。‌‌
    的头像 发表于 12-03 17:00 2773次阅读
    芯导科技<b class='flag-5'>AI</b>智能交互<b class='flag-5'>硬件</b><b class='flag-5'>方案</b><b class='flag-5'>介绍</b>

    工业视觉网关:RK3576赋能多路检测与边缘AI

    IPC+独显的组合。 二、方案核心:多路检测 + 编解码 + 边缘AI + MES对接多路并发采集RK3576 提供 3×4-lane MIPI-CSI,配合视频转换模块可并发接入 12路
    发表于 10-16 17:56

    AI芯片:科技探索与AGI愿景》—— 深入硬件核心的AGI指南

    AI芯片:科技探索与AGI愿景》一书如同一张详尽的“藏宝图”,为读者指明了通往下一代人工智能的硬件之路。作者没有停留在空洞的概念层面,而是直击核心,从冯·诺依曼架构的“内存墙”瓶颈切入,清晰阐述了
    发表于 09-17 09:29

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件AI湿件

    生物化学计算机,它通过离子、分子间的相互作用来进行复杂的并行计算。因而未来可期的前景是AI硬件将走向AI湿件。 根据研究,估算出大脑的功率是20W,在进行智力活动时,其功率会增大到25~50W。在大脑进化
    发表于 09-06 19:12

    商汤大装置发布基于DeepLink的异构混合调度方案

    日前,在2025世界人工智能大会(WAIC)期间,商汤大装置发布基于DeepLink的异构混合调度方案,将DeepLink深度融入商汤大装置核心能力体系。该方案针对当前国产算力资源碎片化、异构
    的头像 发表于 08-05 10:01 1307次阅读

    最新人工智能硬件培训AI基础入门学习课程参考2025版(离线AI语音视觉识别篇)

    端侧离线 AI 智能硬件作为 AI 技术的重要载体之一,凭借其无需依赖网络即可实现智能功能的特性,在一些网络条件受限或对数据隐私有较高要求的场景中,发挥着不可或缺的作用。本章基于CSK6大模型语音
    发表于 07-04 11:14

    异构计算解决方案(兼容不同硬件架构)

    异构计算解决方案通过整合不同类型处理器(如CPU、GPU、NPU、FPGA等),实现硬件资源的高效协同与兼容,满足多样化计算需求。其核心技术与实践方案如下: 一、
    的头像 发表于 06-23 07:40 1158次阅读

    【教程】使用NS1串口服务器对接智普清言免费AI大语言模型

    AI大语言模型可以帮助我们解决各种问题,如翻译、写文案、创作诗歌、解决数学问题、情感陪伴等等。今天教大家如何使用NS1串口服务器模块实现对接智普清言AI大语言模型,实现与大语言模型的对话。NS1模块
    的头像 发表于 06-12 19:33 1020次阅读
    【教程】使用NS1串口服务器<b class='flag-5'>对接</b>智普清言免费<b class='flag-5'>AI</b>大语言模型