0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大数据和AI以及存储芯片的未来

SSDFans 来源:fqj 2019-05-28 16:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作为ICT的从业人员,大家都知道有两个公司是有点臭名昭著,因为他们和SUN Micro公司不一样,好IT公司养工程师,“坏”公司养律师。Qualcomm和Oracle都是以律师而著名。最近特别是Oracle,更加不养中国的工程师了。

在memory界,也有一个公司有类似的名气,那就是Rambus。在2019年的Memory+的会议上,他们居然吃了豹子胆,给自己挖了一个深深的坑,《Big Data, AI and the future of Memory》。对于AI来讲,目前从应用,到框架,再到底层语言和硬件,这是一个百家争鸣的时代。Nvidia在巩固了自己在训练上的地位之后,向推理进攻,各家初创公司在利用开源框架,占领推理市场,并伺机向训练进攻。[1]

因此,对于任何一种神经网络来讲,实现对于资源的需求的影响还是比较大的,一个神经网络在不同的框架(Caffe/Pytroch/TensorFlow)上,在不同的硬件平台上(CPU/GPU/FPGA/ASIC)的需求都多多少少不同。更不要讲有成千上万的AI炼丹师在各种调参,生成各种定制的网络,因此Rambus这种行为和我今天一样都是一种“无知者无畏”的行动。

从2015年的Resnet之后,大家都认为在神经网络的深度学习方面,特别是标杆性的ImageNet的上,大家没有太明显的进展了。[2]

大数据和AI以及存储芯片的未来

因此从2012年以来的ImageNet优胜网络模型来看,大家的趋势很明显,Top-5的错误率逐年下降,网络的层数也越来越厚。当然还有就是网络的parameter,也就是weight和bias 也越来越多。

大数据和AI以及存储芯片的未来

计算和I/O是目前占主导地位的冯氏体系的核心,和之前在2018年流行的争论一样,“深度学习的进步是(看上图,YannLeCun的10位数识别是1998)因为算法的进步,还是算力的进步”,计算和I/O的那个作用大也是一个“鸡蛋问题”。
很有意思的是,很多东西抛开现象看本质会有一个别样的视角。举个上周学习到观点,对于数据库领域来讲,目前workload就是OLTP和OLAP。OLTP的交易的本质就是数据的I/O,对!就是把你的软妹币从你口袋中搬运到淘宝卖家的口袋中去。OLAP的本质就是计算,在知道你买了尿布,奶粉之后算出来应该给你推送婴儿车的广告。

那对于目前比较流行的深度学习来讲,也可以从同样的话来总结。基于卷积计算的CNN,他的本质就是计算,也算出你到底有多少个预先训练好的元素,这些元素包含形状,颜色等等。比如,如果你有一个嘴巴,两个眼睛,和一个鼻子,那就是一个人脸。
还有一种是RNN,RNN的本质也是计算和I/O,和CNN的计算上线文无关,RNN的具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中。当初,Google不顾版权协会的反对,数字化人类的书籍,本质上就是理解大家的语言。比如在天朝,如果有一个名词,开始是“历害”,大家肯定知道下一个就是“国”了。

因此,不过CNN和RNN,大家都是需要参数了,也就是“Weights” 和“Bias” 。两者对于这些参数的share的方式也很大不同。

大数据和AI以及存储芯片的未来

CNN是在空间上共享,RNN在时间上共享。因此,问题就来了,这些参数是怎么出来的呢?他们的大小和性能的要求是多少呢?

先来讲对于大小的要求。这里就要从最基本的CNN网络 Alexnet说起。

大数据和AI以及存储芯片的未来

仔细介绍每一层的东西:(对于stride 和padding不熟的,请看CS231n,不知道CS231n的,请打赏,并到此为止)

input:彩色的图片 227X227X3

Conv-1:第一层的卷积有96个kernel。kernel的大小是11X11,卷积的stride是4,padding是0

MaxPool-1 :第一层卷积的最大值。Pooling的size是3X3,stride是2

Conv-2:256个kernel,kernel的size是5X5,stride是1,padding是2.

MaxPool-2:第二层卷积的最大值,Pooling是3X3, stride是2

Conv-3: 384个kernel。kernel大小是3X3, stride是1 ,padding是1.

Conv-4:和第三层类似。384 个kernel。3X3,strdie和padding是1.

Conv-5:256个kernel。kernel size 3X3,stride和padding是1.

MaxPool-3:第五层卷积的最大值,Pooling是3X3, stride是2

FC-1:第一个全连接层,有4096个神经元

FC-2:第二个全连接,有4096个神经元

FC-3: 第三个全连接层,有1000个神经元

对于CNN来讲,上一层的输出是这一层的输入。因此需要把每一层的输出算清楚。从上面看,每一层的网络类型有Input,Conv,Maxpool和FC四类,因此下面的计算也是按四类开始的。

O=(I-K+2P)/S+1

其中:O是输出的宽度,I是输入的宽度,K是Kernel的宽度,N是Kernel的数量,S是stride, P是Padding。N是kernel的数量。

因此,输出的image的size就是OXOXN

Output的规模的计算:

Conv 层的计算:定义如下:

作死用中文解释一下,就是一个227X277的图上,我用11X11的小方案从左到右,从上到小描红一边。这个描红,这个11X11小框子每次跳4格,如果跳到边上没对齐的话,我用多一行的0来补齐。因此227X227X3的第一层卷积的输出就是:(227-11+2X0)/4+1=55. image size=55X55X96

MaxPool 的计算:定义如下:

O=(I-ps)/S+1

其中:O是输出的宽度,I是输入的宽度, S是stride,ps是Pool size

因此,对于第一层卷积的Maxpooling就是(55-3)/2+1=27 , image就是27X27X96

FC的计算:一个全连接层的输出就是一个向量,这个向量的单元数是它神经元的数量。比如FC-1就是一个4096的向量。

因此,对于一个包含227X227X3的图片,它的历程如下:

一开始是227X227X3,过了第一层卷积,就是55X55X96, 之后的MaxPool就是27X27X96. 第二次卷积之后是27X27X256,之后的MaxPooling就是 13X13X256,第三层卷积是13X13X384,之后的第4和5 卷积变成:27X27X256,第3个Maxpooling 变成 6X6X256,之后的FC-1就是4096X1,FC-2不变,最后就是一个1000X1 的向量了。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4842

    浏览量

    108178
  • 大数据
    +关注

    关注

    64

    文章

    9096

    浏览量

    144057

原文标题:大数据、AI和存储芯片的未来

文章出处:【微信号:SSDFans,微信公众号:SSDFans】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    汉思新材料:存储芯片“高烧、震动、掉速”?底部填充胶才是破局关键!

    最近存储芯片火到出圈,不管是AI服务器的HBM高带宽内存、数据中心的企业级SSD,还是消费电子的高密度闪存,都在往更高容量、更快速度、更小体积冲刺。但行业里藏着一个扎心真相:存储芯片
    的头像 发表于 04-17 15:43 315次阅读
    汉思新材料:<b class='flag-5'>存储芯片</b>“高烧、震动、掉速”?底部填充胶才是破局关键!

    成都汇阳投资关于AI 算力引爆需求,存储芯片涨价周期来袭

    AI 算力黑洞来袭 ,存储需求呈爆炸式增长 AI算力基础设施的爆发成为存储芯片需求的核心驱动力,单台 AI服务器 DRAM 用量是普通服务器
    的头像 发表于 03-27 17:12 431次阅读

    Arduino Nano实测SDNAND模块,焊接即用扩展存储#存储 #存储芯片 #Arduino

    存储芯片
    雷龙Lucca
    发布于 :2026年03月20日 17:48:10

    NETSOL代理Parallel STT-MRAM系列存储芯片

    STT-MRAM系列存储芯片,专为需要快速数据存取与长期稳定保存的严苛应用而设计,是替代传统NOR Flash、FeRAM与nvSRAM等方案的理想选择。
    的头像 发表于 02-09 16:45 310次阅读

    嵌入式存储芯片AI智能后视镜中的应用

    在汽车智能化浪潮中,传统后视镜正加速迭代为“AI智能终端”——它不再只是简单的光学反射装置,而是集成了高清摄像、ADAS预警、AR导航、语音交互等多重功能的行车安全核心。而这一切智能体验的背后,都离不开嵌入式存储芯片的“记忆支撑”。
    的头像 发表于 01-22 14:01 3839次阅读
    嵌入式<b class='flag-5'>存储芯片</b>在<b class='flag-5'>AI</b>智能后视镜中的应用

    什么是DRAM存储芯片

    在现代存储芯片领域中,主要有两大类型占据市场主导:DRAM(动态随机存取存储器)和NAND闪存。二者合计占据了全球存储芯片市场的95%以上份额,其他存储类型则多用于特定或辅助场景。
    的头像 发表于 01-13 16:52 1801次阅读

    剖析存储芯片及技术在AI领域的应用

    。在此背景下,深入理解驱动 AI 革命的存储技术变得至关重要。本文将系统梳理与 AI 紧密相关的核心存储芯片及技术,剖析它们如何在不同场景下支撑起智能计算的海量
    的头像 发表于 12-29 15:24 3029次阅读
    剖析<b class='flag-5'>存储芯片</b>及技术在<b class='flag-5'>AI</b>领域的应用

    近期热疯了都在收内存芯片,囤存储芯片风险点有这些?

    存储芯片
    芯广场
    发布于 :2025年11月28日 11:27:22

    瑞之辰:存储芯片价格飙升,国产半导体行业的连锁反应

    现在“有钱也买不到存储芯片”,当前全球存储芯片正遭遇严峻的供需失衡——AI、云端数据中心与高速运算(HPC)需求爆发式增长,叠加原厂产能调整(部分NANDFlash产能转至毛利更高的D
    的头像 发表于 11-26 11:34 2044次阅读
    瑞之辰:<b class='flag-5'>存储芯片</b>价格飙升,国产半导体行业的连锁反应

    存储芯片(焕发生机)

    01产业链全景图02存储芯片定义存储芯片也叫半导体存储器,是电子设备里负责存数据、读数据的关键零件。半导体产品主要有四大类:分立器件、光电器
    的头像 发表于 11-17 16:35 3820次阅读
    <b class='flag-5'>存储芯片</b>(焕发生机)

    雷军都喊贵!存储芯片涨价风暴,手机电脑集体涨价#芯片#存储芯片#AI

    存储芯片
    jf_15747056
    发布于 :2025年10月28日 19:07:52

    2025年中国存储芯片行业市场前景预测研究报告

    2025年中国存储芯片行业市场前景预测研究报告 存储芯片作为半导体行业的重要组成部分,涵盖动态随机存储器(DRAM)和NAND闪存两大核心领域。在人工智能(AI)、云计算、
    的头像 发表于 10-27 08:54 6554次阅读

    【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》

    和管理人员、创投从业者以及相关专业学生等,都可以从这两本书中把握AI芯片的技术动向,为产业落地提供关键洞察。 立足当下,洞察趋势,《AI芯片
    发表于 07-28 13:54

    半导体存储芯片核心解析

    记忆(存储) 和 运算(处理)。CPU(中央处理器)是大脑,负责高速运算;但CPU处理的数据和指令需要临时存放的地方,运算结果也需要保存起来。存储芯片就是计算机系统的“记忆仓库”,负责数据
    发表于 06-24 09:09

    划片机在存储芯片制造中的应用

    划片机(DicingSaw)在半导体制造中主要用于将晶圆切割成单个芯片(Die),这一过程在内存储存卡(如NAND闪存芯片、SSD、SD卡等)的生产中至关重要。以下是划片机在存储芯片
    的头像 发表于 06-03 18:11 1550次阅读
    划片机在<b class='flag-5'>存储芯片</b>制造中的应用