0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于In-suite processing的概念在存储控制上集成了计算加速的单元

SSDFans 来源:未知 作者:李倩 2018-08-22 14:54 次阅读

在创业公司NGD的Keynote中,我们看到了他们和微软研究院完成的原型概念验证。基于In-suite processing的概念在存储控制上集成了计算加速的单元。这个概念和大部分在存储上做加速的方案类似,利用与数据存储比较靠近的优势来实现计算的offlaoding,从而降低延时。

NGD加速的应用是目前比较热门的CNN,类似Image的分类,人脸识别,以及车辆牌照识别之类的Edge端的应用。和以云端数据中心的形式存在的Google的TPU Pod不同,在Edge端的应用对于实时性要求更加严格,在5G出现之前,从端设备发送原始数据到云端处理的路径还是过长,因此Edge 计算和所谓的雾计算还是有很强大的生命了。使用Edge端的处理能力的好处主要是:1. 延时端,2. 减少了数据的传输量,不需要原始数据,特征数据就够了。

在FMS 2018上,类似的方案还有Marvell,Marvell宣布了一个概念芯片,他们把SSD控制器和Nvidia的NVDLA结合在一起,推了了一个在端设备可以做深度学习推理的设备。

NVDLA的信息都在这个http://nvdla.org/primer.html,在2017年发布的时候,大家都惊呼可能要终结很多AI的创业公司的ASIC计划,因为NVDLA利用Nvidia在深度学习上的技术优势,开源这样一个Deep Learning Accelerator的设计,Nvidia的之前的大部分投入都在训练市场,对于推理来讲,需要通过新的硬件和架构来适配。从占领市场的角度,开源这个加速器的设计,对于增加话语权有着重要的意义。

在Marvell的展台上貌似没有看到这个概念芯片的具体信息。只是 在FMS2018的新闻稿来看到了一些信息。目前这种AI SSD关注的领域是数据分析市场,在具体的云端或者edge端大数据分析以及数据标注的应用上,可以使用AI SSD的加速功能。从NVDLA的内部框图上可以看出,NVDLA主要只是针对CNN的图像应用。

并不是Marvell这个一家公司这样,很多企业级控制器的厂家都在考虑这个方向;来自PMC加拿大班底的Netint.ca在FMS也展示了他们PCIE4.0 的SSD 控制器。

在SSD控制中集成了Video的处理单元。对于高清的H.265的处理,以为目前主流的方案还是CPU为主,因此单个Intel的X86的服务器级别的方案都在4-6路之间,而使用硬件加速可以在性能和功耗比上完胜。

之前在武汉存储半导体峰会上,A股上市公司国科微也提出了near data计算的概念,如何在SSD的设计中体现对AI workload的优化。目前在我天朝,AI发展最热的,也是各级领导最重视的就是安防了,人脸识别,行为判断,数人头,等等是安定团结的技术手段。其中的技术挑战也很多。

作为存储大数据分析加速,不能不谈一下BlueDBM,这个项目的韩国人从MIT毕业了,到了UIC Irvien,还是在谈大数据分析加速,在原有的框架上增加了很多的内容。

已经在做图计算以及Vertex的计算了,下一步是啥,参加过机器学习入门的人应该不陌生了。建议大家技术关注这个明星项目。之前在MIT的时候有广达的中研院支持,现在不知道会不有samsung的支持了。

和之前之四讲的计算加速类似,我们可以看到一个明显的趋势就是在SSD控制器中增加对near data计算的支持,把一些相对成熟的方案集成进去,这可能是企业级SSD控制器的新方向。最后,用一个韩国公司的SSD 控制器作为FMS 2018的结束了。他们是目前第一家使用RISC-V做SSD控制器,而且他们的性能和架构上和传统的控制器有很大的区别,值得学习。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 控制器
    +关注

    关注

    112

    文章

    15152

    浏览量

    170942
  • 人脸识别
    +关注

    关注

    76

    文章

    3953

    浏览量

    80530
  • 深度学习
    +关注

    关注

    73

    文章

    5220

    浏览量

    119863

原文标题:FMS 2018 之六:在存储中做AI

文章出处:【微信号:SSDFans,微信公众号:SSDFans】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    关于存储器的选片及总线的概念

    还是低电平所以我们必须让它们分离办法当然也简单当外面的线接到集成电路的引脚上来后不直接接到各单元去而是在中间加一组开关这组开关就是前面提到的控制器看前面的图平时我们让开关打开着如果确实是要向这个
    发表于 03-07 15:38

    EVAL-ADuCM360QSPZ,在单芯片上集成了双通道,高性能多通道sigma-delta ADC

    EVAL-ADuCM360QSPZ,用于ADuCM361低功耗全集成24位数据采集系统的QuickStart Plus套件,在单芯片上集成了双通道,高性能多通道sigma-delta ADC,ARM
    发表于 08-01 06:01

    EVAL-ADuCM360QSPZ,在单芯片上集成了双通道,高性能多通道Σ-ΔADC

    EVAL-ADuCM360QSPZ,用于ADuCM360低功耗全集成24位数据采集系统的QuickStart Plus套件,在单芯片上集成了双通道,高性能多通道Σ-ΔADC,ARM Cortex
    发表于 08-01 08:44

    单芯片微型计算机是由哪些部分组成的

    第一节、机基础知识一、单片机概念1、单片机:在一片集成电路芯片上集成微处理器(CPU)、存储器(ROM和RAM)、I/O接口电路,从而构成了
    发表于 07-13 09:18

    单片机的概念是什么

    第一节、机基础知识一、单片机概念1、单片机:在一片集成电路芯片上集成微处理器(CPU)、存储器(ROM和RAM)、I/O接口电路,从而构成了
    发表于 07-13 07:54

    51单片机理解 精选资料推荐

    外部:单片机:在一片集成电路芯片上集成微处理器(CPU)、存储器(ROM和RAM)、I/O接口电路,从而构成了单芯片微型计算机,即单片机(s
    发表于 07-15 07:01

    单片机基础教程

    单片机基础教程一、单片机概念 1、单片机:在一片集成电路芯片上集成微处理器(CPU)、存储器(ROM和RAM)、I/O接口电路,从而构成了
    发表于 07-15 10:00

    嵌入式系统的概念

    系统最核心的层次是中央处理单元(CPU)部分,它包含运算器和控制器模块,在CPU的基础上进一步配上存储器模块、电源模块、复位模块等就构成了通常所说的最小系统。由于技术的发展,
    发表于 10-27 08:36

    单片机定义介绍

    一、单片机介绍定义概念在一片集成电路芯片上集成微处理器、存储器、I/O接口电路,从而构成了单芯片微型计算
    发表于 12-01 06:27

    基于芯片上集成温度和湿度的设计应用

    本文档内容介绍了基于芯片上集成温度和湿度的设计应用,包含了电路图以系统框架图。
    发表于 09-18 10:08 8次下载
    基于芯片<b class='flag-5'>上集成</b>温度和湿度的设计应用

    上集成A/D转换器分析

      片上集成A/D转换器是CMOS图像传感器的关键部件,文章分析和比较了三类不同集成方式:芯片级,列级和象素级的原理,性能和特点。最后,展望了CMOS图像传感器上集成A/D转换器的未来发展趋势。
    发表于 09-20 12:25 6次下载
    片<b class='flag-5'>上集成</b>A/D转换器分析

    关于计算机组成原理与单片机原理

    计算机有五大部件组成,即 运算器 控制存储器 输入设备 输入设备,单片机是集成在一个IC芯片上的,IC芯片上集成了运算器
    发表于 11-14 14:26 3592次阅读

    SiLC宣布在单芯片上集成1550nm调频连续波LiDAR功能

    SiLC在单芯片上集成了1550nm调频连续波(FMCW)激光雷达(LiDAR)功能。
    的头像 发表于 12-23 13:57 4324次阅读

    加速大数据和计算存储应用

    电子发烧友网站提供《加速大数据和计算存储应用.pdf》资料免费下载
    发表于 09-15 15:05 0次下载
    <b class='flag-5'>加速</b>大数据和<b class='flag-5'>计算</b><b class='flag-5'>存储</b>应用

    在SoC中实现的计算单元

    在SoC中实现的计算单元 当前的自动驾驶/先进驾驶辅助系统片上系统(SoC)通过集成不同计算特性的计算元件构建了
    的头像 发表于 10-04 10:34 288次阅读
    在SoC中实现的<b class='flag-5'>计算</b><b class='flag-5'>单元</b>