0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

当机器学习遇上SSD,会擦出怎样的火花呢?

VIBT_dputech 来源:大普微 2020-09-07 16:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近年来人工智能和大数据的迅速发展正在深刻改变着这个世界和我们的生活方式。人工智能的核心是机器学习(Machine Learning) 算法,自 2006 年以来,在机器学习领域,以深度学习(Deep Lerning) 为代表的机器学习算法取得了突破性的进展,在2017年AlphaGo大战围棋冠军李世石后这一技术加速走向市场、落地应用。而SSD作为大数据的一种存储介质,正在取代HDD成为主流的存储设备。那么当机器学习遇上SSD,会擦出怎样的火花呢?

一、什么是机器学习?

·机器学习是让计算机具有学习的能力,无需进行明确编程。—— 亚瑟·萨缪尔,1959

·计算机程序利用经验 E 学习任务 T,性能是 P,如果针对任务 T 的性能 P 随着经验 E 不断增长,则称为机器学习。—— 汤姆·米切尔,1997

机器学习是一类算法的总称,这些算法从大量历史数据中挖掘出其中隐含的规律,并用于预测或者分类,更具体的说,机器学习可以看作是寻找一个函数,输入是样本数据,输出是期望的结果,只是这个函数过于复杂,以至于不太方便形式化表达。需要注意的是,机器学习的目标是使学到的函数很好地适用于“新样本”,而不仅仅是在训练样本上表现很好。学到的函数适用于新样本的能力,称为泛化(Generalization)能力。

二、机器学习步骤

通常学习一个好的函数,分为以下三步:

1、选择一个合适的模型,这通常需要依据实际问题而定,针对不同的问题和任务需要选取恰当的模型,模型就是一组函数的集合。

2、判断一个函数的好坏,这需要确定一个衡量标准,也就是我们通常说的损失函数(Loss Function),损失函数的确定也需要依据具体问题而定,如回归问题一般采用欧式距离,分类问题一般采用交叉熵代价函数。

3、找出“最好”的函数,如何从众多函数中最快的找出“最好”的那一个,这一步是最大的难点,做到又快又准往往不是一件容易的事情。常用的方法有梯度下降算法,最小二乘法等和其他一些技巧(tricks)。

学习得到“最好”的函数后,需要在新样本上进行测试,只有在新样本上表现很好,才算是一个“好”的函数。

三、机器学习的类型

机器学习主要有三种基本类型:监督学习、非监督学习和强化学习。

1监督学习

监督学习是使用已知正确答案的示例来训练模型。已知数据和其一一对应的标签,训练一个智能算法,将输入数据映射到标签的过程,它的常见应用场景如分类问题和回归问题。常见的算法有K近邻算法、线性回归、逻辑回归、支持向量机(SVM)、决策树和随机森林、神经网络

分类

在分类中,机器被训练成将一个组划分为特定的类。分类的一个简单例子是电子邮件帐户上的垃圾邮件过滤器。过滤器分析你以前标记为垃圾邮件的电子邮件,并将它们与新邮件进行比较。如果它们匹配一定的百分比,这些新邮件将被标记为垃圾邮件并发送到适当的文件夹。那些比较不相似的电子邮件被归类为正常邮件并发送到你的邮箱。

也许你会问这个分类算法对于SSD有什么用呢?SSD中的一个典型的分类问题是IO模式识别,判断IO是纯读、纯写或者混合读写的,这是一个三分类的问题;判断IO是顺序的还是随机的,这是一个二分类的问题。可以根据实际情况选择相应的相应的机器学习分类算法识别出不同的IO模式,然后针对不同的模式FTL就可采取不同策略,进而提升SSD的性能。

回归

回归问题通常是用来预测一个值,它的预测结果是连续的,如预测房价、未来的天气情况等,例如一个产品的实际价格为500元,通过回归分析预测值为499元,我们认为这是一个比较好的回归分析。

回归算法在SSD中能用在什么地方呢?回归算法在SSD的一个应用是IO强度预测,在一定模式下IO强度在时序上是有一定规律的,可以根据前一段时间的IO强度预测下一段时间的IO强度,Smart-IO技术采用长短期记忆人工神经网络LSTM对IO强度进行预测。提前预测出IO强度后就可优化FTL策略、合理分配GC占用资源、合理调度、提高数据命中率等,进而提升SSD性能。

2非监督学习

在无监督学习中,数据是无标签的。学习模型是为了推断出数据的一些内在结构。无监督学习主要分为聚类和降维。

聚类用于根据属性和行为对象进行分组。这与分类不同,因为这些组不是你提供的。聚类的一个例子是将一个组划分成不同的子组(例如,基于年龄和婚姻状况),然后应用到有针对性的营销方案中。大多数大数据可视化使用降维来识别趋势和规则。主要算法: K-means、层次聚类分析(HCA)、DBSCAN

高维数据中很容易出现样本稀疏、距离计算困难等问题,即“维度灾难”,为了缓解维度灾难,常用的就是降维。降维的主要方法有主成分分析(PCA)、线性判别分析(LDA)、局部线性嵌入(LLE)。如图所示,通过PCA的方法可以把一个三位的数据降维成一个二维数据。

无监督学习由于没有标签,相比监督学习来说相当于少了一些输入信息,实际应用中相对监督学习学习会困难一些,那么在SSD是否就无用武之地了呢?非也非也。Smart-IO数据分组技术用K-means算法对IO进行冷热数据分组,然后把不同组的数据写到不同的block或者die上,那么就可以减小,可减小WA,延长SSD使用寿命。

3强化学习

强化学习算法的思路非常简单,以游戏为例,如果在游戏中采取某种策略可以取得较高的得分,那么就进一步「强化」这种策略,以期继续取得较好的结果。这种策略与日常生活中的各种「绩效奖励」非常类似。我们平时也常常用这样的策略来提高自己的游戏水平。AlphaGo下围棋也是这个原理,只告诉机器围棋的基本规则,但是不告诉它人类摸索了上千年才总结出来的定式等围棋战术,让机器完全依靠自学,打败人类。

强化学习感觉和SSD很难沾上边,不过熟悉SSD(固态硬盘)的人都知道,垃圾回收(GC,Garbage Collection)是SSD固件设计中的重要一环,也是影响SSD主控性能的重要因素。一般的GC机制都是只根据当前硬盘空闲空间状态来做GC的:当有空闲空间的时,不启动GC;反之,当没有空闲空间的情况下,执行GC任务。这种策略的缺点是如果在用户操作的时候进行GC会造成SSD性能明显下降,可以在主控空闲时提前进行GC,但是GC过于频繁会造成WA写放大过大,所以需要一个平衡,需要一种算法来自动确定何时GC,强化学习正好可以排上用场,给定一定的衡量标准,然后让机器通过强化学习的方法训练来自动学习GC的时机,得到更优的GC的策略。

四、DapuStor机器学习技术

DapuStor已基于SSD开发出Smart-IO Data Grouping和Smart-IO Intensities Prediction等先进技术,把机器学习的先进算法用到了SSD中,提升了SSD的产品性能。同时自研的带有计算和智能的数据存储处理器芯片(简称DPU),可以在芯片层面实现更多的智能功能和硬件加速,实现存算一体,满足高端存储和边缘计算市场的需求。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • SSD
    SSD
    +关注

    关注

    21

    文章

    3061

    浏览量

    121749
  • 人工智能
    +关注

    关注

    1813

    文章

    49733

    浏览量

    261391
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136215

原文标题:当机器学习遇上SSD

文章出处:【微信号:dputech,微信公众号:DapuStor】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何在香橙派5 Plus上移植deepin 25操作系统

    当开源生态遇上极客硬件,碰撞出怎样火花?当 deepin 25 遇上香橙派 5 Plus 开发板,又会带来什么样的实践体验?
    的头像 发表于 10-11 10:29 497次阅读

    当EtherCAT高速I/O模块遇上蓝牙耳机生产线,擦出怎样火花

    蓝牙耳机作为现代科技的热门产品,其生产流程的高效与精准至关重要。本文将深入剖析蓝牙耳机的生产流程,并重点介绍一套兼顾稳定、快速与性价比的系统搭建方案,带您领略科技生产背后的精细工艺与智慧选择。蓝牙耳机生产流程蓝牙耳机的生产流程主要包括以下几个关键阶段,而组装测试线系统则涵盖了生产过程中的各个环节,确保生产的高效与精准。1.生产流程SMT段:负责电子元件的表面
    的头像 发表于 09-04 11:39 418次阅读
    当EtherCAT高速I/O模块<b class='flag-5'>遇上</b>蓝牙耳机生产线,<b class='flag-5'>会</b><b class='flag-5'>擦出</b><b class='flag-5'>怎样</b>的<b class='flag-5'>火花</b>?

    信捷视觉平台全新升级

    当机器视觉的精准遇上AI的智能,碰撞出怎样火花?信捷视觉平台全新升级——XINJE VISION STUDIO 3.7 + Vision
    的头像 发表于 07-28 15:56 614次阅读
    信捷视觉平台全新升级

    声智科技与蚂蚁集团共探声学AI前沿技术

    当声学AI遇上金融科技,碰撞出怎样火花?当声学AI模型赋能AI硬件产品,又将如何重塑人机交互的边界?近日,声智科技受邀参加蚂蚁集团《AI圆桌派》内部分享
    的头像 发表于 07-24 10:18 790次阅读

    当机器遇上“语言障碍”:CCLINKIE转Profinet的“破冰外挂”来啦\\!

    在汽车焊装车间的技术角,工程师小陈的笔记本记满了“跨协议难题”:当搭载Profinet的库卡机器遇上CCLINKIE总线的三菱PLC,数据交互像隔着玻璃喊话——PLC发送的坐标指令要“绕地球半圈
    发表于 06-04 14:31

    明远智睿SSD2351开发板:语音机器人领域的变革力量

    在人工智能快速发展的今天,语音机器人逐渐成为人们生活和工作中的得力助手。明远智睿SSD2351开发板凭借强大性能与丰富功能,为语音机器人的发展注入新动力,成为该领域的变革力量。 SSD
    发表于 05-28 11:36

    触想安卓工控一体机在智慧办公3D打印设备上的应用特点分析

    在科技飞速发展的当下,3D打印技术作为制造业领域的创新力量,正不断改变着产品的设计与制造方式。而安卓工控一体机作为工业自动化领域的重要设备,也在众多行业中展现出强大的适用性。当这两者相遇,又会碰撞出怎样火花呢?
    的头像 发表于 04-27 11:14 485次阅读

    机器学习模型市场前景如何

    当今,随着算法的不断优化、数据量的爆炸式增长以及计算能力的飞速提升,机器学习模型的市场前景愈发广阔。下面,AI部落小编将探讨机器学习模型市场的未来发展。
    的头像 发表于 02-13 09:39 617次阅读

    机器人与火炬手击掌互动!搭载KaihongOS的乐聚“夸父”人形机器人助力亚冬会

    本文转载自:深圳特区报当冰雪盛事遇上人工智能科技新星,将擦出怎样火花?2月3日,在-20℃的亚冬会火炬传递现场,总部位于深圳龙华的企业乐聚生产的“夸父”人形
    的头像 发表于 02-08 15:39 1138次阅读
    <b class='flag-5'>机器</b>人与火炬手击掌互动!搭载KaihongOS的乐聚“夸父”人形<b class='flag-5'>机器</b>人助力亚冬会

    嵌入式机器学习的应用特性与软件开发环境

    作者:DigiKey Editor 在许多嵌入式系统中,必须采用嵌入式机器学习(Embedded Machine Learning)技术,这是指将机器学习模型部署在资源受限的设备(如微
    的头像 发表于 01-25 17:05 1201次阅读
    嵌入式<b class='flag-5'>机器</b><b class='flag-5'>学习</b>的应用特性与软件开发环境

    Flexus 云服务器 X 实例实践:安装 Ward 服务器监控工具

    了强大而灵活的计算能力。而在系统运维管理方面,Ward 这一专为 Linux 系统打造的监控工具功能强大,当我们将其安装在华为云 Flexus 云服务器 X 实例上时,又会擦出怎样火花呢? 一、Flexus 云服务器 X 实例
    的头像 发表于 01-13 15:51 768次阅读
    Flexus 云服务器 X 实例实践:安装 Ward 服务器监控工具

    MVTRF:多视图特征预测SSD故障

    固态硬盘( Solid State Drive,SSD )在大型数据中心中发挥着重要作用。SSD故障影响存储系统的稳定性,造成额外的维护开销。为了提前预测和处理SSD故障,本文提出了
    的头像 发表于 12-30 11:04 977次阅读
    MVTRF:多视图特征预测<b class='flag-5'>SSD</b>故障

    传统机器学习方法和应用指导

    在上一篇文章中,我们介绍了机器学习的关键概念术语。在本文中,我们介绍传统机器学习的基础知识和多种算法特征,供各位老师选择。 01 传统
    的头像 发表于 12-30 09:16 1967次阅读
    传统<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法和应用指导

    快来“一起鸿蒙吧”!体验更出色,智慧再升级

    当鸿蒙遇上脱口秀,擦出什么样的火花?“一起鸿蒙吧”给出了答案。华为邀请了呼兰、贾耗、漫才兄弟、庞博、小鹿等艺人,用脱口秀独有的风趣幽默方式,将原生鸿蒙带入观众的视野。从真实的应用场景
    的头像 发表于 12-25 14:45 625次阅读
    快来“一起鸿蒙吧”!体验更出色,智慧再升级

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习应用的首选。然而,市场上的云原生机器
    的头像 发表于 12-25 11:54 695次阅读