0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为大家介绍促进存算一体芯片快速发展的各类原因

后摩智能 来源:后摩智能 作者:日就月将的 2022-10-19 14:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作为后摩尔时代突破芯片性能瓶颈的主流技术方向之一,存算一体正在被更多人关注和认可。

存算一体直接将数据存储单元和计算单元融合为一体,能够大幅减少数据搬运带来的功耗损失,同时,也减少了等待数据读取时的算力浪费,极大提高了计算并行度和能效。这一架构设计直接打破“存储墙”和“功耗墙”,可以从根本上解决冯·诺伊曼的架构瓶颈。

存算一体的概念并不难理解,这一设计思路的出现甚至可以追溯到20 世纪 60 年代。但直至最近几年,存算一体才真正从概念走向产品。此前,为什么存算一体没有被业内广泛应用?

Q

存算一体为什么之前没有被广泛应用?

实际上,“存算一体”并非横空出世的新鲜事物,设计人员很早就有了存算一体的设计思路,从上世纪70年代就一直持续有相关的研究工作在发表。

69fe642e-4f76-11ed-a3b6-dac502259ad0.png

图1. 相关文献整理

但是,这方面工作一直不温不火,直到2012年后又逐渐受到学术界和工业界的重视,主要原因可以概括为几个方面:

1)处理器计算吞吐和内存带宽差距增大。早期处理器的计算吞吐和内存带宽的差距并不明显,但是随着 CMOS 工艺的快速发展、以及多核/众核处理器架构成为主流,处理器的计算吞吐能力增长的速度远超内存带宽的增长速度。因此,存储墙的问题愈发严重;

2)应用访存数据量增大、数据局部性变差。传统的处理器设计通过增加多级的片上缓存(cache)来缓解内存带宽不足的问题,但是由于深度学习、图计算、推荐系统等大数据应用的访存数据量愈来愈大、数据局部性变差,导致处理器的缓存架构难以发挥作用;

3)新兴应用包含大量、可并行的、乘累加计算。以深度学习应用为例,主流模型80%以上的计算都是可并行的乘累加(MAC)操作,面向这类“简单”的操作,使得计算单元和存储单元的深度融合(即CIM),无论以数字还是模拟方式都变得可行;

4)STT-MRAM、RRAM 等新型存储器的发展。一方面,新型存储器有潜力提升片上存储的密度,从而缓解存储墙的问题。另一方面,这类新型存储器为 MAC 计算单元和存储单元的融合提供了新的机遇;

5)领域定制计算架构的兴起。最后值得一提的是,随着摩尔定律的放缓,领域定制计算架构的优势愈发明显,而存算一体正是一种适合AI、图计算、推荐系统等领域的定制计算架构。

未来将是存算一体应用的爆发期,将会被广泛应用。但是我们也认为存算一体架构并不会全面取代现有架构的 AI 芯片(如GPU等),而是会长期共存,不同的架构有各自更加擅长的场景,多样化架构的并存,甚至异构结合、优势互补,才是更加更合理的情形。选择架构需要综合考虑应用场景、模型数量/功能/大小、存储工艺、集成方式、计算精度等多方面因素,具体分析可以参考前述几问的阐述。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20148

    浏览量

    246941
  • CMOS
    +关注

    关注

    58

    文章

    6184

    浏览量

    241541
  • 存储器
    +关注

    关注

    39

    文章

    7714

    浏览量

    170797
  • CIM
    CIM
    +关注

    关注

    1

    文章

    96

    浏览量

    16647

原文标题:存算十问|(六)存算一体为什么之前没有被广泛应用?

文章出处:【微信号:后摩智能,微信公众号:后摩智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    载誉而归 | 苹芯科技斩获AABI火炬技术转移奖,一体技术探索跨境创新合作

    (PimchipTechnology)凭借在一体芯片领域的技术突破与跨境技术转化成果,成功斩获2025年AABI火炬技术转移奖。这荣誉
    的头像 发表于 11-04 10:03 473次阅读
    载誉而归 | 苹芯科技斩获AABI火炬技术转移奖,<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>技术探索跨境创新合作

    一体AI芯片公司九天睿芯完成超亿元B轮融资

    全球领先的一体AI芯片公司九天睿芯(英文:Reexen Technology)近日宣布,公司已完成B轮融资,规模超亿元人民币。
    的头像 发表于 10-10 11:41 700次阅读

    后摩尔定律时代,3D-CIM+RISC-V打造国产一体新范式

    力、能效与带宽瓶颈成为行业前行的关键阻碍,而美西方的技术禁运更让中国芯片产业面临严峻挑战。   在这大背景下,
    发表于 09-17 09:31 5307次阅读
    后摩尔定律时代,3D-CIM+RISC-V打造国产<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>新范式

    科技荣获2025半导体市场创新表现奖

    8月26日,第22届深圳国际电子展(elexcon2025)现场正式揭晓聚焦行业技术突破与价值创造的“2025半导体市场创新表现奖” ,知科技凭借WTM系列一体
    的头像 发表于 08-28 17:09 1248次阅读

    在TR组件优化与一体架构中构建技术话语权

    电磁兼容性、热管理在内的12项专业能力评估。\"这种评估体系,正是行业对技术人才的分级认证标准。 1.2 异构计算架构下的能力矩阵 一体架构的普及正在重构工程师的知识体系: 近内存计算
    发表于 08-26 10:40

    文看懂“一体

    今天这篇文章,我们来聊个最近几年很火的概念——一体。为什么会提出“
    的头像 发表于 08-18 12:15 931次阅读
    <b class='flag-5'>一</b>文看懂“<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>”

    一体技术加持!后摩智能 160TOPS 端边大模型AI芯片正式发布

    ,同步推出力擎™系列M.2卡、力谋®系列加速卡及计算盒子等硬件组合,形成覆盖移动终端与边缘场景的完整产品矩阵。这系列动作标志着后摩智能在一体技术领域的突破性进展,更预示着端边智能
    的头像 发表于 07-30 07:57 7603次阅读
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>技术加持!后摩智能 160TOPS 端边大模型AI<b class='flag-5'>芯片</b>正式发布

    缓解高性能一体芯片IR-drop问题的软硬件协同设计

    在高性能计算与AI芯片领域,基于SRAM的一体(Processing-In-Memory, PIM)架构因兼具计算密度、能效和精度优势成为主流方案。随着
    的头像 发表于 07-11 15:11 861次阅读
    缓解高性能<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b><b class='flag-5'>芯片</b>IR-drop问题的软硬件协同设计

    苹芯科技 N300 一体 NPU,开启端侧 AI 新征程

    随着端侧人工智能技术的爆发式增长,智能设备对本地力与能效的需求日益提高。而传统冯·诺依曼架构在数据处理效率上存在瓶颈,“内存墙”问题成为制约端侧AI性能突破的关键掣肘。在这背景下,
    的头像 发表于 05-06 17:01 860次阅读
    苹芯科技 N300 <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b> NPU,开启端侧 AI 新征程

    【「芯片通识课:本书读懂芯片技术」阅读体验】从deepseek看今天芯片发展

    和计算是分开的。一体化是近年来计算技术上的重大创新。 现如今的npu,如rk3588上的版本,力已经达到6TOPS,足以运行眼下最流行的DeepSeek(1.5B版本)!笔者移植
    发表于 04-02 17:25

    PIMCHIP S300 全球首款28nm节点实现存一体产品化AI芯片

    PIMCHIP-S300 芯片是苹芯科技基于一体技术打造的多模态智慧感知决策 AI 芯片。其搭载基于静态随机存取存储器(SRAM)的
    的头像 发表于 03-28 17:06 1978次阅读
    PIMCHIP S300 全球首款28nm节点实现存<b class='flag-5'>算</b><b class='flag-5'>一体</b>产品化AI<b class='flag-5'>芯片</b>

    济南市中区一体化智中心上线DeepSeek

    济南市中未来产业发展有限公司(简称“市中产发”)联合华为、北京昇腾和清昴智能基于市中区一体化智中心(国家大学科技园节点)昇腾
    的头像 发表于 02-19 10:38 1162次阅读

    梯度科技推出DeepSeek智一体

    近日,梯度科技搭载DeepSeek大模型的智一体机正式发布。该产品基于“国产服务器+国产GPU+自主算法”核心架构,搭载梯度科技人工智能应用开发平台,形成了软硬一体解决方案。
    的头像 发表于 02-17 09:53 1309次阅读

    一体行业2024年回顾与2025年展望

    2024年,大模型技术的迅猛发展成为人工智能领域的核心驱动力,其对硬件力和存储效率的极致需求,促使一体技术在全球范围内迎来前所未有的关
    的头像 发表于 01-23 11:24 1674次阅读

    于芯 · 智启未来 — 2024苹芯科技产品发布会盛大召开

    8月8日,国际领先的一体芯片开拓者——苹芯科技在北京召开“于芯智启未来——2024苹芯科
    的头像 发表于 12-18 15:31 2344次阅读
    <b class='flag-5'>存</b><b class='flag-5'>算</b>于芯 · 智启未来 — 2024苹芯科技产品发布会盛大召开