0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么是AI芯片“存储墙”的解决方案?

SSDFans 来源:yxw 2019-06-18 15:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

最近刚刚看了唐杉博士的《AI芯片的“冷”与“热”》,第一句就是“ 参加过去年硅谷的AI Hardware Summit的朋友,普遍反映这次在北京的会议没有那么火了”。记得,自己在2016年威海参加中国体系结构年会的时候,孙所也说了一句调侃的话:“现在的AI很火,大家都往那边去,没有人太关心体系结构了,我要告诉那些追AI热点的,它都死了三回了!” 的确,作为从小学马列的中国人,我们最熟悉螺旋式上升的概念。对于计算和I/O来讲,和中国经济调控一样,都是“ 水多了加面,面多了加水”螺旋式上升。

Google在2017年发布了TPU V1之后,现在已经有越来越多的AI startup的芯片出现,大家基本上都是用标准的Resnet50,Googlenetv3 等网络为benchmark, 一次一次地刷新性能和功耗比,个人觉得很有可能在一天,AI芯片的性能和功耗比在特定的imagenet的任务上超过人脑,现在AI在准确率和性能上都超过了。对于AI的芯片来讲,有一个指标也是大家讨论比较多的。Roofline model

Y轴是P,代表算力,用来FLOP/s来表示,现在新出的AI ASIC往往在FLOP/s并不发力,因为从功耗比的角度上,算力肯定不是越高越好,而且大家都很难高过老黄的核弹。

代表了一个特定的计算平台的peak performance,就是最大算力。

就是特定的计算平台的I内存/O带宽,这个和该计算平台使用的DDR类型有关。

X轴是I,代表计算强度,就是在一个Byte上的计算量。因为对于一个特定的平台,我可以知道它的最大算力和带宽,我们就可以知道它的最大的计算强度。

因此,和图上显示的一样,在点(Imax,),这个计算平台达到了完美。在它的左边,说明memory受限,在它的右边说明计算受限。

因为对于每一次访存都是32位的Float Point,因此整个内存的占用就是 260MB左右,而计算量是724MFLOPs,因此Alexnet的计算强度就是724/260=2.7 operation/byte。

对于一个特定的平台,比如老黄家的新的GTX2080Ti 系列来讲:

对于计算性能,先不管老黄加各种Tensor Core,RTcore,从CUDA Core本身来讲,他是100TLOP/s,

它的内存带宽如下:

因此,作为2080Ti, 它的Imax就是166Operation/Byte.

可能到这个,就可以看出,对于Alex的2.7 来讲,远远没有达到2080ti的计算强度,主要是受限于内存带宽了。

在Google的TPU中,有一个图经常被大家引用。

大家基本上可以看到,google的Imax差不多在1000左右,基本上没有什么网络可以完全用满TPU的peak performance。

怎么办,内存带宽的解决方案就是HBM,HBM2, HBM3不断加大带宽。记得在2017年的CNCC上,谢源教授讲,他在2010年左右提出了HBM的概念,他很快就看到了AMD,Nvidia以及Xilinx和Intel都在芯片上使用了HBM,证明了这条道路的正确性。他认为目前应该在AI芯片上摆脱这种”水多了加面,面多了加水“,in-memory 计算应该是下一个方向。

这个就引出了在Memory+会议上来自平头哥的段立德博士的topic,”Processing Near or In memory for deep learning".

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    463

    文章

    54429

    浏览量

    469371
  • 存储
    +关注

    关注

    13

    文章

    4889

    浏览量

    90289
  • AI
    AI
    +关注

    关注

    91

    文章

    41115

    浏览量

    302606
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    得一微电子携全场景AI存力芯片解决方案亮相CFMS MemoryS 2026

    技术革新,全面展现了行业正从价格周期向价值周期深度转型的蓬勃图景。在这场产业变革的浪潮中,得一微电子(YEESTOR)携覆盖移动终端、智能汽车、智慧工业及数据中心的全场景AI存力芯片解决方案亮相,深刻诠释了存力作为
    的头像 发表于 04-08 15:31 483次阅读

    Atmel AT88SC0104CA CryptoMemory芯片:高性能安全存储解决方案

    Atmel AT88SC0104CA CryptoMemory芯片:高性能安全存储解决方案 在电子设计领域,安全存储一直是至关重要的环节。Atmel的AT88SC0104CA作为
    的头像 发表于 04-05 15:40 700次阅读

    德明利亮相CFMS 2026,全栈AI+存储方案拓展智能场景应用边界

    2026年3月27日,MemoryS 2026峰会在深圳圆满落幕。本届峰会汇聚全球存储产业链的核心厂商,德明利围绕“全栈AI+存储解决方案”,以面向
    的头像 发表于 04-03 17:42 1392次阅读
    德明利亮相CFMS 2026,全栈<b class='flag-5'>AI</b>+<b class='flag-5'>存储</b>解<b class='flag-5'>方案</b>拓展智能场景应用边界

    慧荣科技携全系列主控芯片及创新存储解决方案亮相CFMS MemoryS 2026

    科技重磅展出了面向三大核心产品领域的全系列主控芯片及创新存储解决方案,全面展示了在AI浪潮下的深厚技术沉淀与前瞻布局。同时,慧荣科技总经理苟嘉章(Wallace C. Kou)先生受邀
    的头像 发表于 03-31 14:20 1719次阅读

    海康存储亮相CFMS 2026 全场景解决方案赋能AI存储新生态

    与生态重构等多重挑战。海康存储携覆盖消费级、企业级、工规级、车规级的全场景存储解决方案亮相,并重点展示其在数据中心、工业控制、智能汽车、智慧终端等领域的创新技术与落地实践。
    的头像 发表于 03-28 11:28 615次阅读
    海康<b class='flag-5'>存储</b>亮相CFMS 2026 全场景<b class='flag-5'>解决方案</b>赋能<b class='flag-5'>AI</b><b class='flag-5'>存储</b>新生态

    美光内存和存储解决方案驱动智能未来

    从端侧到云端,美光内存和存储解决方案广泛覆盖智驾、移动端应用、机器人、生成式AI和数据中心等领域,驱动智能未来。
    的头像 发表于 03-23 10:37 297次阅读

    伟创力携手博通,推进下一代AI液冷解决方案落地

    近日,伟创力宣布旗下先进液冷解决方案公司 JetCool 与 博通(Broadcom)展开合作,为博通 下一代 AI XPU(定制化 AI 计算加速芯片) 提供创新液冷
    的头像 发表于 03-17 10:44 686次阅读
    伟创力携手博通,推进下一代<b class='flag-5'>AI</b>液冷<b class='flag-5'>解决方案</b>落地

    慧荣科技于Embedded World 2026展示AI优化的启动存储与企业级解决方案

    的启动存储(Boot Storage)解决方案。与会者可前往1号馆385号展位,了解其面向工业、嵌入式、汽车及数据中心应用的启动存储和主控芯片解决方
    的头像 发表于 03-11 14:09 259次阅读
    慧荣科技于Embedded World 2026展示<b class='flag-5'>AI</b>优化的启动<b class='flag-5'>存储</b>与企业级<b class='flag-5'>解决方案</b>

    如何突破AI存储?深度解析ONFI 6.0高速接口与Chiplet解耦架构

    1. 行业核心痛点:AI存储”危机在大模型训练与推理场景中,算力演进速度远超存储带宽,计算与存储之间的性能鸿沟(
    发表于 01-29 17:32

    国内分布式AI存储方案商港股IPO!

    据港交所1月27日披露,北京星辰天合科技股份有限公司(简称“星辰天合”)向港交所主板递交上市申请书。   星辰天合专注于提供企业级AI存储解决方案,助力企业大规模高效整合数据、决策及运营。两类主要
    的头像 发表于 01-29 13:44 8881次阅读
    国内分布式<b class='flag-5'>AI</b><b class='flag-5'>存储</b><b class='flag-5'>方案</b>商港股IPO!

    VS680 HDMI AI分析解决方案 #目标识别 #视频翻译 #AI #芯片

    AI
    深蕾半导体
    发布于 :2025年11月12日 10:29:33

    佰维存储AI时代的存储解决方案

    电子发烧友网报道(文/李弯弯)在GMIF2025大会上,佰维存储CEO何瀚表示,端侧AI存储的尺寸和功耗有着更为极致的要求。随着在端侧部署更大参数规模的AI模型成为趋势,需要更大容量
    的头像 发表于 09-30 08:40 1.2w次阅读
    佰维<b class='flag-5'>存储</b>:<b class='flag-5'>AI</b>时代的<b class='flag-5'>存储</b><b class='flag-5'>解决方案</b>

    AI 芯片浪潮下,职场晋升新契机?

    、新架构不断涌现。能够在工作中提出创新性的解决方案,推动 AI 芯片性能、功耗、成本等关键指标的优化,将极大提升在职称评审中的竞争力。例如,在芯片设计中引入新的计算范式,如存算一体技术
    发表于 08-19 08:58

    【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》

    :科技探索与 AGI 愿景》。 这本新书针对大模型技术浪潮,详细讲解了AI芯片的主流技术、挑战与创新解决方案,并介绍了下一代芯片工艺和颠覆性AI
    发表于 07-28 13:54

    佰维存储亮相COMPUTEX 2025,全场景存储方案赋能“AI +”未来生态

    近日,台北国际电脑展(COMPUTEX 2025)以“AI NEXT”为主题启幕,作为领先的存储与内存解决方案厂商,佰维存储展示了其涵盖消费级、嵌入式
    的头像 发表于 05-26 09:43 1338次阅读
    佰维<b class='flag-5'>存储</b>亮相COMPUTEX 2025,全场景<b class='flag-5'>存储</b><b class='flag-5'>方案</b>赋能“<b class='flag-5'>AI</b> +”未来生态