0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

IBM开发“混合精度内存计算”,能耗降低了80倍

DPVg_AI_era 来源:未知 作者:胡薇 2018-04-27 17:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

IBM Research 称,已经开发出了一种内存计算新方法,可以为微软和谷歌寻求的高性能和机器学习应用的硬件加速器提供答案。

在近日 Nature Electronics 期刊上发表的一篇论文中,IBM 研究人员描述了这种新的 “混合精度内存计算” 方法。

IBM 关注传统计算体系结构的不同看法,在这种体系结构中,软件需要在单独的 CPURAM 单元之间进行数据传输。

据 IBM 称,这种被称为 “冯·诺依曼” 的体系结构设计,为数据分析和机器学习应用制造了一个瓶颈,这些应用需要在处理单元和内存单元之间进行更大的数据传输。传输数据也是一个耗能的过程。

应对这一挑战,IBM 给出的一种方法是模拟相变内存(PCM)芯片,该芯片目前还处于原型阶段,500 万个纳米级 PCM 器件组成 500×2000 交叉阵列。

PCM 的一个关键优势是可以处理大多数密集型数据处理,而无需将数据传输到 CPU 或 GPU,这样以更低的能量开销实现更快速的处理。

IBM 的 PCM 单元将作为 CPU 加速器,就像微软用于加速 Bing 和加强机器学习的 FPGA 芯片一样。

据 IBM 称,研究表明在某些情况下,其 PCM 芯片能够以模拟的方式进行操作,执行计算任务,并提供与 4 位 FPGA 存储器芯片相当的准确度,但能耗降低了 80 倍。

模拟 PCM 硬件并不适合高精度计算。所幸的是,数字型 CPU 和 GPU 是适合的,IBM 认为混合架构可以实现更高性能、更高效率和更高精度的平衡。

这种设计将大部分处理留给内存,然后将较轻的负载交给 CPU 进行一系列的精度修正。

根据 IBM 苏黎世实验室的电气工程师、也是该论文的主要作者 Manuel Le Gallo 称,这种设计有助于云中的认知计算,有助于释放对高性能计算机的访问。

Le Gallo 表示:“凭借我们现在的精确度,我们可以将能耗降低到是使用高精度 GPU 和 CPU 的 1/6。”

“所以我们的想法是,为了应对模拟计算中的不精确性,我们将其与标准处理器结合起来。我们要做的是将大量计算任务转移到 PCM 中,但同时得到最终的结果是精确的。”

这种技术更适合于如数字图像识别等应用,其中误解少数像素并不会妨碍整体识别,此外还有一些医疗应用。

“你可以用低精度完成大量计算——以模拟的方式,PCM 会非常节能——然后使用传统处理器来提高精度。”

对于只有 1 兆字节大小的 IBM 原型内存芯片,现在还处于初期阶段。为了适用于现代数据中心的规模化应用,它需要达到千兆字节的内存量级,分布在数万亿个 PCM 中。

尽管如此,IBM 认为可以通过构建更大规模的 PCM 设备或使其中 PCM 并行运行来实现这一目标。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • IBM
    IBM
    +关注

    关注

    3

    文章

    1888

    浏览量

    77190
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11370

    浏览量

    226407
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5321

    浏览量

    136211

原文标题:IBM 取得内存计算新突破,AI 训练能耗降低 80 倍

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    全球唯一?IBM更新量子计算路线图:2029年交付!

    电子发烧友网报道(文/梁浩斌)近年来,量子计算似乎正在取得越来越多突破,国内外都涌现出不少的技术以及产品突破。作为量子计算领域的先驱之一,IBM近日公布了其量子计算路线图,宣布将在20
    的头像 发表于 06-15 00:01 9557次阅读
    全球唯一?<b class='flag-5'>IBM</b>更新量子<b class='flag-5'>计算</b>路线图:2029年交付!

    IBM推出AI驱动开发工具IBM Bob

    IBM近日宣布在全球范围内正式推出IBM Bob,一款面向企业团队的AI驱动开发工具。与目前市场上常见的AI编程助手不同,Bob的定位不仅是辅助写代码,而是覆盖从需求规划、代码编写、测试验证到部署上线和遗留系统改造的完整软件
    的头像 发表于 05-09 10:34 524次阅读

    IBM正式发布2025年度报告

    的平台型公司。公司立足于混合云、人工智能(AI)、基础架构和量子计算四大平台,是唯一能够在混合云环境中构建、部署并管理企业级 AI 的科技公司,通过贯穿软件、咨询与基础架构的一体化能力,为客户创造差异化价值,同时驱动自身业务协同
    的头像 发表于 03-17 16:32 610次阅读

    深度解析REF80:超精密电压参考的卓越之选

    的温度漂移和出色的长期稳定性,为各类高精度应用提供了可靠的解决方案。 文件下载: ref80.pdf 1. REF80的核心特性 1.1 超精密输出与低元件需求 REF80提供7.6V
    的头像 发表于 03-02 10:15 320次阅读

    内存条崩了?涨了十内存颗粒卖给谁?内存芯片接下来怎么玩?

    内存
    芯广场
    发布于 :2026年01月26日 17:48:21

    如何使用EtherCAT总线网关与福TwinCAT3系列PLC通讯

    01 概述 EtherCAT (以太网控制自动化技术) 是由德国福公司开发的、基于以太网的开放现场总线系统,EtherCAT为系统的实时性能和拓扑的灵活性树立了新的标准,同时,它还符合甚至降低了
    的头像 发表于 01-15 13:51 3544次阅读
    如何使用EtherCAT总线网关与<b class='flag-5'>倍</b>福TwinCAT3系列PLC通讯

    为什么FPU在MCU中很重要呢?

    模式,从而降低了整体能耗。虽然 FPU 本身工作时功耗比普通逻辑高,但快速完成任务带来的节能效果通常更显著。 提高精度和确定性: 专用硬件设计通常能更精确地遵循 IEEE 754 标准,并提供更可预测
    发表于 11-18 07:05

    一文了解Mojo编程语言

    和 MLIR(多级中间表示)技术,Mojo 的性能接近 C++,甚至在某些任务中比 Python 快数万。 支持直接操作硬件资源,如内存管理和 SIMD(单指令多数据)指令,适合高性能计算需求。 系统级
    发表于 11-07 05:59

    IBM与Anthropic达成战略合作

    近日,在面向全球开发者与技术专家的年度盛会 TechXchange 2025 期间,IBM(纽约证券交易所代码:IBM)与Anthropic 宣布达成战略合作:IBM 将 Anthro
    的头像 发表于 10-15 17:55 854次阅读

    能耗数据采集能够计算碳排放吗

    能耗数据采集 能够 为计算碳排放提供关键基础,但需结合额外的参数和转换模型才能实现精准计算。以下是具体分析: 一、能耗数据与碳排放的直接关联 碳排放的核心来源是能源消耗过程中化石燃料的
    的头像 发表于 09-12 17:42 2057次阅读

    长电科技光电合封解决方案降低数据互连能耗

    今年以来,光电合封(Co-packaged Optics,CPO)技术加速迈向产业化:国际巨头推出交换机CPO方案降低数据互连能耗;国内企业则在集成光引擎等产业领域实现突破。作为先进封装技术的领军
    的头像 发表于 09-05 15:46 4776次阅读

    计算精度对比:FP64、FP32、FP16、TF32、BF16、int8

    、BF16、int8以及混合精度等。本文将浅显易懂地介绍这些精度计算方式及其差别。什么是精度精度
    的头像 发表于 06-26 11:09 3367次阅读
    <b class='flag-5'>计算精度</b>对比:FP64、FP32、FP16、TF32、BF16、int8

    曝华为Mate80系列定制超大内存 王炸是大内存与麒麟9030通过SiP封装技术集成

    华为Mate 80一直被业界关注,陆续也爆出了很多新料,据博主数码闲聊站的暗示爆料,华为Mate 80系列手机将首发全新的麒麟旗舰手机芯片,新款芯片的能效再度提升,而且史无前例的定制了超大内存,估计
    的头像 发表于 06-17 11:50 3985次阅读

    芯原超低能耗NPU可为移动端大语言模型推理提供超40 TOPS算力

    AI需求而设计,不仅能够为AI PC等终端设备提供强劲算力支持,而且能够应对智慧手机等移动终端对低能耗更为严苛的挑战。 芯原的超低能耗NPU IP具备高度可配置、可扩展的架构,支持混合精度
    的头像 发表于 06-11 10:47 1056次阅读

    Matlab与MWORKS软件计算精度对比

    MWORKS软件作为同元开发的Matlab替代产品,目前正在军工企业及部分院校开始试用。结合去年开发算例,对两个软件在计算精度方面进行了对比,请各位大神指导。 以《轨道交通系统动力学与Matlab
    发表于 06-07 16:57