0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

IBM开发“混合精度内存计算”,能耗降低了80倍

DPVg_AI_era 来源:未知 作者:胡薇 2018-04-27 17:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

IBM Research 称,已经开发出了一种内存计算新方法,可以为微软和谷歌寻求的高性能和机器学习应用的硬件加速器提供答案。

在近日 Nature Electronics 期刊上发表的一篇论文中,IBM 研究人员描述了这种新的 “混合精度内存计算” 方法。

IBM 关注传统计算体系结构的不同看法,在这种体系结构中,软件需要在单独的 CPURAM 单元之间进行数据传输。

据 IBM 称,这种被称为 “冯·诺依曼” 的体系结构设计,为数据分析和机器学习应用制造了一个瓶颈,这些应用需要在处理单元和内存单元之间进行更大的数据传输。传输数据也是一个耗能的过程。

应对这一挑战,IBM 给出的一种方法是模拟相变内存(PCM)芯片,该芯片目前还处于原型阶段,500 万个纳米级 PCM 器件组成 500×2000 交叉阵列。

PCM 的一个关键优势是可以处理大多数密集型数据处理,而无需将数据传输到 CPU 或 GPU,这样以更低的能量开销实现更快速的处理。

IBM 的 PCM 单元将作为 CPU 加速器,就像微软用于加速 Bing 和加强机器学习的 FPGA 芯片一样。

据 IBM 称,研究表明在某些情况下,其 PCM 芯片能够以模拟的方式进行操作,执行计算任务,并提供与 4 位 FPGA 存储器芯片相当的准确度,但能耗降低了 80 倍。

模拟 PCM 硬件并不适合高精度计算。所幸的是,数字型 CPU 和 GPU 是适合的,IBM 认为混合架构可以实现更高性能、更高效率和更高精度的平衡。

这种设计将大部分处理留给内存,然后将较轻的负载交给 CPU 进行一系列的精度修正。

根据 IBM 苏黎世实验室的电气工程师、也是该论文的主要作者 Manuel Le Gallo 称,这种设计有助于云中的认知计算,有助于释放对高性能计算机的访问。

Le Gallo 表示:“凭借我们现在的精确度,我们可以将能耗降低到是使用高精度 GPU 和 CPU 的 1/6。”

“所以我们的想法是,为了应对模拟计算中的不精确性,我们将其与标准处理器结合起来。我们要做的是将大量计算任务转移到 PCM 中,但同时得到最终的结果是精确的。”

这种技术更适合于如数字图像识别等应用,其中误解少数像素并不会妨碍整体识别,此外还有一些医疗应用。

“你可以用低精度完成大量计算——以模拟的方式,PCM 会非常节能——然后使用传统处理器来提高精度。”

对于只有 1 兆字节大小的 IBM 原型内存芯片,现在还处于初期阶段。为了适用于现代数据中心的规模化应用,它需要达到千兆字节的内存量级,分布在数万亿个 PCM 中。

尽管如此,IBM 认为可以通过构建更大规模的 PCM 设备或使其中 PCM 并行运行来实现这一目标。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • IBM
    IBM
    +关注

    关注

    3

    文章

    1853

    浏览量

    76779
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11216

    浏览量

    222914
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134447

原文标题:IBM 取得内存计算新突破,AI 训练能耗降低 80 倍

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    全球唯一?IBM更新量子计算路线图:2029年交付!

    电子发烧友网报道(文/梁浩斌)近年来,量子计算似乎正在取得越来越多突破,国内外都涌现出不少的技术以及产品突破。作为量子计算领域的先驱之一,IBM近日公布了其量子计算路线图,宣布将在20
    的头像 发表于 06-15 00:01 8630次阅读
    全球唯一?<b class='flag-5'>IBM</b>更新量子<b class='flag-5'>计算</b>路线图:2029年交付!

    为什么FPU在MCU中很重要呢?

    模式,从而降低了整体能耗。虽然 FPU 本身工作时功耗比普通逻辑高,但快速完成任务带来的节能效果通常更显著。 提高精度和确定性: 专用硬件设计通常能更精确地遵循 IEEE 754 标准,并提供更可预测
    发表于 11-18 07:05

    IBM与Anthropic达成战略合作

    近日,在面向全球开发者与技术专家的年度盛会 TechXchange 2025 期间,IBM(纽约证券交易所代码:IBM)与Anthropic 宣布达成战略合作:IBM 将 Anthro
    的头像 发表于 10-15 17:55 526次阅读

    能耗数据采集能够计算碳排放吗

    能耗数据采集 能够 为计算碳排放提供关键基础,但需结合额外的参数和转换模型才能实现精准计算。以下是具体分析: 一、能耗数据与碳排放的直接关联 碳排放的核心来源是能源消耗过程中化石燃料的
    的头像 发表于 09-12 17:42 1482次阅读

    长电科技光电合封解决方案降低数据互连能耗

    今年以来,光电合封(Co-packaged Optics,CPO)技术加速迈向产业化:国际巨头推出交换机CPO方案降低数据互连能耗;国内企业则在集成光引擎等产业领域实现突破。作为先进封装技术的领军
    的头像 发表于 09-05 15:46 4060次阅读

    RK3588核心板在边缘AI计算中的颠覆性优势与场景落地

    与低功耗。相比传统四核A72方案(如RK3399),单线程性能提升80%,多线程任务处理能力翻倍。 6TOPS独立NPU: 支持INT8/INT16混合精度计算,可直接部署YOLOv
    发表于 04-15 10:48

    边缘网关如何降低能耗数据延迟?

    边缘计算网关在能耗数据采集场景中可以通过以下方式降低数据延迟: 1. 分布式计算架构:边缘计算网关采用分布式
    的头像 发表于 04-10 17:55 449次阅读

    NRF54系列蓝牙芯片的DK开发板工具介绍

    , Thread和Matter。 集成了频率为128MHz的Arm Cortex-M33处理器,处理能力比nRF52840提高了一,同时降低了功耗。拥有1.5MB非易失性存储器和256KB RAM,可同时
    发表于 03-26 22:24

    如何通过电源滤波器的优化设计来降低其自身的能耗

    电源滤波器是电子设备稳定运行的重要组件,但其自身能耗问题不容忽视。通过选择低损耗的电感和电容,优化散热设计和布局,可以显著降低元件的损耗。此外,合理调整参数也有助于降低能耗
    的头像 发表于 03-16 16:53 556次阅读
    如何通过电源滤波器的优化设计来<b class='flag-5'>降低</b>其自身的<b class='flag-5'>能耗</b>?

    IBM完成对 HashiCorp 的收购,打造全面的端到端混合云平台

    (纽约证券交易所代码:IBM)日前宣布已完成对 HashiCorp 的收购。HashiCorp 的产品可自动化和保护支撑混合云应用程序和生成式 AI 的基础设施。两家公司的能力将共同帮助客户加速创新
    的头像 发表于 03-12 11:37 817次阅读
    <b class='flag-5'>IBM</b>完成对 HashiCorp 的收购,打造全面的端到端<b class='flag-5'>混合</b>云平台

    恩智浦讲解如何在低算力MCU平台上优雅的计算均值和方差

    本文主要探讨如何在有限的计算能力和内存条件下,优雅地实现高效的均值和方差计算。通过优化算法、减少计算复杂度、利用递推公式和定点数运算,文章提供了一系列使用技巧,帮忙
    的头像 发表于 03-06 08:56 1390次阅读
    恩智浦讲解如何在低算力MCU平台上优雅的<b class='flag-5'>计算</b>均值和方差

    Nordic开发工具之NRF54L15-DK

    128MHz的Arm Cortex-M33处理器,处理能力比nRF52840提高了一,同时降低了功耗。拥有1.5MB非易失性存储器和256KB RAM,可同时运行多个无线协议。 提供安全启动、安全固件
    发表于 03-05 10:39

    如何降低颠转仪在运行过程中的能耗

    源于其独特的结构和工作原理,永磁同步电机无需励磁电流,从而减少了励磁损耗,在相同的运行条件下,能够将更多的电能转化为机械能,有效降低了电能的损耗。例如,在一些对能耗要求较高的工业生产场景中,采用永磁同步电机的
    的头像 发表于 02-13 09:26 575次阅读
    如何<b class='flag-5'>降低</b>颠转仪在运行过程中的<b class='flag-5'>能耗</b>

    安科瑞能耗管理系统:工厂能耗问题的克星

    在工业生产中,工厂能耗问题一直是企业运营成本的重要组成部分。如何有效管理和降低能耗,不仅关系到企业的经济效益,还与环保和可持续发展息息相关。今天,我们就来聊聊工厂里经常遇到的能耗问题,以及安科瑞
    的头像 发表于 02-11 15:53 682次阅读

    ADS1248一旦配置Burnout Current,检测到的值精度降低了很多,为什么?

    跪求指点,据芯片手册里介绍,Burnout Current是用来检测前端传感器失效的,但是现在设计RTD检测模块时,不配置Burnout Current检测精度很高,但是一旦配置Burnout Current,检测到的值精度降低了
    发表于 01-10 13:52