电子发烧友网 > 人工智能 > 正文

机器学习的基本过程及关键要素

2020年11月12日 10:28 次阅读

以下首先阐述机器学习的基本过程,罗列了几个主要流程和关键要素;继而展开介绍机器学习主要的算法框架,包括监督学习算法,无监督学习算法和常用的降维,特征选择算法等;最后在业务实践的过程中,给出了一个可行的项目管理流程,可供参考。

1.基本过程

1.1机器学习的五步流程

如果把机器学习当做一个闭环的工作项来看待的话,会发现其实它的整个流程,跟我们日常生活中做其它的事情是异曲同工的,比如做一个ABtest,做一次竞品分析,或者写一个量化策略。只是在其基本过程里,我们所要考虑的问题点,所采用的工具和方法有所不同而已。

以下参考达里欧的五步流程法,尝试将机器学习的基本过程也简化为五个环节。

01确定目标

机器学习的目标并不在于机器学习,而在于我们将这种方法应用到现实场景,去解决现实的问题点。所以在工作开始之前,我们需要想清楚自己是要实现何种目标,比如是要对流失用户进行风险预警,对潜在付费用户进行意愿评估,还是对信贷用户进行欺诈识别。

02诊断问题

因为明确了所要实现的目标,所以可以根据现实基础来诊断问题。为了实现这个目标,需要机器学习给到怎样的输出,单纯的0-1标签即可,还是需要连续的风险概率;目前的数据量是否能支撑这个项目,业务样本的黑白比例是否不够均衡,这些问题都是需要诊断的。

03方案设计

明确了要实现的目标,也了解了现实基础里存在的问题点,便可以展开方案设计。在这个细分的业务场景下,适合选用哪一类型的算法,不同算法往往是为不同领域而生的;在这个场景下,如果没有明确的黑白样本,需要基于何种方法来进行样本定义。在方案设计的环节,需要给出一个工作开展的大的方向,相当于把时间和精力限制在一个合适的框架中。

04方案执行

在方案执行的过程中遇到问题时,如何进行解决,也是很重要的环节。机器学习算法的执行,一般称之为最优化的过程,即在一个算法框架下,如何最快地达到最优的结果。而针对整个方案的执行,又会包括数据准备,特征工程,算法调试,模型评估等具体事项,每一个事项相互独立,各有各的方法论,但又相互影响,上下游之间的执行效果环环相扣。

05评估迭代

评估的过程,其实就是一个目标量化的过程,因为有了量化,所以有了绝对意义上的效果优劣。只是不同的业务目标,不同的模型框架,对应的评估体系是不一样的。建立一套合适的评估方式,机器学习项目也就实现了闭环,可以在迭代中去逐步逼近要实现的业务目标。

1.2机器学习的关键要素

01机器学习三要素

如同劳动力,资本,土地等是经济学的基本要素一样,其实机器学习也有自己的三要素,即数据,算法和模型,它们缺一不可,相互关联,并贯穿于工作的整个过程。人们说机器学习的过程,就是准备好充足的数据,应用合适的算法,去生成优良的模型的过程。

02其它关键要点

除了机器学习三要素外,其实也有其它的一些点是相当重要的,比如特征处理,优化算法,和模型评估等。缺少了这些内容,其实模型也能生成,但只能是大打折扣地生成。特征处理决定了模型性能的上限,优化算法让我们以最好的方式去逼近模型性能的上限,而模型评估则定义了什么是我们到底在讨论什么样的模型性能,它们是机器学习项目的“加速器”。

2.监督学习

监督学习要处理的是有标签的数据,即业务场景里有绝对的黑白,明确的好坏,比如在信贷风控的场景下,逾期了就是逾期了,在金融市场的场景下,涨跌也都是界限分明的。通过对历史数据的学习,从而给当前的数据一个离散的标签,或者连续的数值结果。

2.1线性模型

线性模型的出发点很简单,就是考虑一个事情成立的多个因素,比如ABCDE五个因素,每个因素又有各自的权重,权衡过各个因素后,才做出最后的决策。将这个想法转化为数学的表达,也就有了因变量,自变量,系数,偏置这些概念,从而组成了线性模型。

线性模型也可以很复杂,有很长的历史,很多的变体。其中最经典的形式,是在线性基础上添加一个Sigmoid函数,从而将线性输出转化为概率,并进一步转化为黑白标签,也就是逻辑回归。在传统金融场景的评分卡领域里,逻辑回归的应用是非常广泛和深入的。

2.2决策树

决策树的思想可以用四个字来概括,即分而治之。线性模型的因素考虑,是相互并列的,权重各异的,但决策树里不是如此。决策树里的因素是串行的,即先考虑A因素,随后针对A因素中的各种情况,继续考虑新的因素,循环往复,形成了一组决策链路,即决策树。

所以决策树里面最重要的问题,便是在当前这个节点,我应该考虑何种因素,去继续推进这个决策的制定。为了解决这个问题,决策树引入了计算机领域里信息熵的概念,经过推演,有了最大增益和增益率这些指标,对应了ID3和C4.5这两种经典的决策树范式。后来又通过引入基尼系数,作为因素选择的判断条件,从而生成了CART决策树。

2.3贝叶斯

贝叶斯学派和频率学派之间的争辩,很像是物理学里波粒之争,数学家们争执于参数到底存不存在,物理学家们则争执于光到底是波还是粒子。波粒之争最终通过波粒二象性的理论而宣告结局,但贝叶斯和频率学派的争执并没有结束,继续在不同的时代里各领风骚。

频率学派相信存在着一个客观实体(参数),所以要做的就是尽可能地去拟合和逼近这个参数,比如最大似然估计。贝叶斯学派则拒绝相信这一套,他们坚持我看见(先验概率),我思考(后验概率),我决策(贝叶斯模型)。贝叶斯理论广泛应用于文本处理的领域,生成了诸多经典模型,根据因素之间的独立性差异,产生了朴素贝叶斯及其它多种贝叶斯算法。

2.4支持向量机

支持向量机是追求极致的,它要在所有的可行解里面,找到唯一的最优解。在二维平面里,这个解是一条唯一的线,在三维空间里,这个解是一个唯一的面,那么,在N维空间里,这个解就是唯一的超平面了。而用于寻找这个解的样本点,就称之为支持向量。

核函数是支持向量机里的大杀器,与人们所说的“降维打击”类似,核函数是要通过升维的方式去解决问题。如果在当下的困境里找不到答案,那就尝试在更高的维度里去破局。

2.5神经网络

神经网络引入了生物学里神经元的概念。每一个神经元都是简单的,有输入和权重,有阈值和输出,但是用众多神经元搭建起多层网络,网络之间又相互联系时,这个问题就变得复杂了。在2006年后,神经网络转身为深度学习,成就了无数或神秘或伟大的商业故事。

在神经网络的训练过程中,有一个很有意思的事情,就是局部最优和全局最优。模型训练中容易陷入局部最优的困境,停止搜索最优解,就像我们很多时候做事情,只是做好了,但是并不够好。为了解决这个问题,人们设计了模拟退火,随机梯度下降等多种训练策略。

2.6集成学习

集成学习的理念,是“好而不同”。对于一个问题,如果通过单一模型始终给不出最优解,不如集成几个好而不同的子模型,可能会获得性能优异的效果。三个臭皮匠,胜过诸葛亮。每个臭皮匠都有不足,但各有各的优点,而诸葛亮作为单一模型已是极致,却仍有局限。

集成学习有两个分支,如果子模型串行生成,则是Boost,如果子模型并行生成,则是Bagging。Boost强调的是一个一个上,针对前一个子模型的缺陷,通过下一个子模型去补足,xgBoost和GBDT都是其中的代表;Bagging强调的则是一起上,群架好过单挑,通过学习不同的样本,生成不同的子模型。Bagging的一个变体随机森林,便是这一类模型的优秀代表。

3.无监督学习

监督学习处理的是有标签的数据,无监督学习要处理的则是无标签的数据。正是因为没有了这个绝对的标签,所以会更侧重与数据本身的信息和结构,对于模型所得结果的合理性,也会有更丰富和更精细的评估。以下主要介绍一些不同类型的聚类算法。

3.1基于原型

基于原型的聚类,强调在数据中存在着某种确定性的结构,不同类别的结构,应该是不一样的。K-means是原型聚类中的经典代表,它相信数据中存在着K个中心点,通过迭代更新这K个中心点的位置,从而将所有样本点划分进K个原型里面,直至迭代结束。

3.2基于密度

基于密度的聚类,强调如果在数据中存在一个类别,那么这个类别里的样本点之间,是存在一定的紧密程度的,如果不具有的话,那就是属于其它类别。DBSCAN是这一类算法中的代表,它与K-means的不同在于,不预先假设K个中心,而是先寻找一个类别,获取这个类别所有的样本点,再在剩余的数据集里,寻找下一个类别,直到所有样本都找到类别。

3.3基于层次

基于层次的聚类,则是从一个更为立体的角度,对样本点进行自底向上的逐层的划分。AGENS是这一种算法里的代表,在第一层里,它将所有样本点当做是一个初始类别,通过计算类别之间的距离,不断的进行合并,从而在最后一层里保留下指定个数的类别。

相对于监督学习,无监督学习没有了标签的羁绊,反而成为了一个更为开放的场景,出现了一大批的形态各异的算法。但这些不同类型的聚类算法,仍要去讨论一些共同的问题,比如如何去度量聚类结果的性能,这里又分为外部指标和内部指标;比如如何去计算样本点之间的距离,基于不同维度,闵氏距离可以分为曼哈顿距离,欧氏距离,和切比雪夫距离。

4.其它算法

除了监督学习和无监督学习外,有一些算法虽不直接生成具体的模型,但仍然是我们在数据探索,模型训练等过程中所必不可少的,比如降维算法,特征选择算法等。

4.1降维

数据之中的方差,被当做是一种信息的表达方式。如果对当前的数据集进行重构,用少量的几个特征来提取数据集所包含的大量信息,便是降维的理念,其中的优秀代表是PCA。为实现一个业务目标,我们从现实世界中收集的数据,往往不是最优的表达,它们可能有重复,有冗余,通过降维的方式,可以对这些原始数据进行重构,生成一个更好的数据表达。

4.2特征选择

机器学习算法,是用来炒菜的,但是你要选择哪些食材去炒,本身也是一个问题点。要做一份扬州炒饭,肯定不会把厨房里的材料全都加上,也不可能拿一把青菜和米饭就下锅翻炒,如何选择食材,便是特征选择的领域。过滤式方法中,特征选择和模型训练是相互独立的,互不干扰;包裹式方法中,模型性能则是特征选择效果的参考,两者相互影响;除此之外,还有嵌入式的选择方法。数据处理和特征选择的效果,往往会决定模型性能的上限值。

5.实践过程

业务实践的过程,往往是一个追求“工业化”的过程,要求所做的事情要契合实际情况,要可实现和可复用。在这个过程里,人们往往喜欢用一套固定的框架去规范自己所做的工作,这个框架的缺点是相对呆板,限制了一些自由度,但好处是能有一个清晰可见的进度条,有利于项目的管理和推进。笔者在此分享一个曾用过的可行的管理框架,可供参考。

5.1场景分析

除了一些火烧眉毛的紧急事项外,对于工作中多数不那么紧迫的事情来说,可以给自己预留一个场景分析的过程。相当于在做一个事情之前,先跳出这个事情,思考其周边与其相互关联,可能决定其是否能成立的种种条件,然后再选择一头扎进这个场景之中。

在场景分析的过程中,要对细分的业务场景进行梳理,基于业务目标,评估机器学习建模的可行性和可复用性。如果业务目标清晰,机器学习的方式也合适的话,就去建模吧。

5.2数据准备

数据是一个机器学习项目的原材料,相当于做菜的食材,盖楼的地基,不可谓不重要。在数据准备的过程中,要看现实中能拥有几个数据来源,它们共同组成了一个怎样的数据广度;要基于业务目标,铺开一套因子指标体系,看其中有哪些是可实现的;同时对于最终获取到的数据,也需要进行质量分析,如完整度,异常值等,并展开基础的数据预处理工作。

5.3模型开发

模型开发的工作,其实才是真正意义上属于生产的过程。首先需要了解所选算法的基本原理,从而展开后续的处理工作,比如通过特征工程把源数据转化为模型可读取的数据;通过成熟的机器学习平台或框架,进行模型训练和生成,并在投产前进行模型评估和验证。

5.4模型应用

模型生成之后,其实只是在技术意义上的生成,并非是业务意义上的可用。比如信用风险模型输出了一个概率,这个概率如何应用到不同的用户群体中,这里就需要结合一套具体的业务策略体系。模型的应用过程,便是在模型输出到业务输出之间的一道桥梁。

5.5模型部署

经过了评估和验收,如果模型性能达到了预期的效果,则可进入模型部署和任务调度的阶段。但模型的部署上线,并不是一劳永逸的事情,在投产之后,仍要进行跟踪和监控,比如模型性能的变化,覆盖人群的稳定性等,如果触发了变更条件,则要进行模型的优化工作。

责任编辑人:CC

下载发烧友APP

打造属于您的人脉电子圈

关注电子发烧友微信

有趣有料的资讯及技术干货

关注发烧友课堂

锁定最新课程活动及技术直播

电子发烧友观察

一线报道 · 深度观察 · 最新资讯
收藏 人收藏
分享:

评论

相关推荐

第一届中国AI与机器学习研讨会

活动内容  人工智能技术将在未来对传统产业产生重大颠覆性影响,人工智能将在各行各业为创新设计带来新的动力,它也将催生新的
发烧友学院发表于 2018-03-29 00:00 1562次阅读
第一届中国AI与机器学习研讨会

美国加大对人工智能和机器学习的研究投资

美国能源部于8月26日宣布投资计划。据悉,这笔资金加上对私营部门和学术部门的3.4亿美元投资,将使未....
发表于 2020-11-13 09:19 60次阅读
美国加大对人工智能和机器学习的研究投资

物联网(IoT)正在多个行业脱颖而出

幸运的是,所需的技能与其他数据科学和分析角色相似——只有少数例外。在该领域中,非常需要传感器数据分析....
发表于 2020-11-12 16:07 321次阅读
物联网(IoT)正在多个行业脱颖而出

物联网解决方案为公交运营商提供更安全的旅行体验

公共交通是城市繁荣和市民福祉不可或缺的一部分。除了提供将人们从A点带到B点的基础设施之外,运输运营商....
发表于 2020-11-12 15:02 171次阅读
物联网解决方案为公交运营商提供更安全的旅行体验

Mac三产品线更新M1芯片

搭载 Apple M1 芯片的 MacBook Air / Pro 以及 Mac mini 和大家见....
发表于 2020-11-12 14:20 105次阅读
Mac三产品线更新M1芯片

谷歌希望通过图片标注来帮助训练其人工智能

谷歌更新了Android上的Google Photos应用,增加了一个新的选项,让用户可以告诉搜索巨....
发表于 2020-11-12 10:45 93次阅读
谷歌希望通过图片标注来帮助训练其人工智能

机器学习过程中的通用步骤

需要什么数据 这个问题:如果公司有大量的数据,可以确定最终的目标是什么;如果没有则需要通过目标来确定....
发表于 2020-11-12 10:23 107次阅读
机器学习过程中的通用步骤

机器学习的范围和算法

什么是机器学习?机器学习是英文名称MachineLearning(简称ML)的直译。机器学习涉及概率....
发表于 2020-11-12 10:19 33次阅读
机器学习的范围和算法

地方政府是如何采用机器学习与AI等技术的?

当下,新闻报道总在介绍AI技术如何给不同行业带来深远影响。从制造业到金融业、从零售业到制药业、从医疗....
发表于 2020-11-11 15:23 267次阅读
地方政府是如何采用机器学习与AI等技术的?

6G将构造一个“无界,有AI”的未来全新世界

潘振岗指出,历史上每一次移动通信技术的更新换代,在大多数性能指标上都会有十倍到百倍的提升,包括峰值速....
发表于 2020-11-11 14:15 215次阅读
6G将构造一个“无界,有AI”的未来全新世界

深度学习与人工智能密不可分 技术已深入生活

经常在网络上看到人工智能、机器学习、深度学习这些词汇,但真正理解它们的人却少之又少,多数人对这词汇的....
发表于 2020-11-11 11:15 297次阅读
深度学习与人工智能密不可分 技术已深入生活

集成模型的原理及创建集成模型的方法

集成学习是功能强大的机器学习技术之一。集成学习通过使用多种机器学习模型来提高预测结果的可靠性和准确性....
发表于 2020-11-11 11:13 116次阅读
集成模型的原理及创建集成模型的方法

苹果首款5纳米集成式芯片登场

11月11日凌晨消息,苹果公司今日举办线上发布会,正式推出首款自研芯片,以及采用这颗芯片的三款电脑产....
发表于 2020-11-11 11:05 350次阅读
苹果首款5纳米集成式芯片登场

Lattice sensAI再获重大更新

作为莱迪思推出的业界第一款用于网络边缘设备端AI处理的完整解决方案集合,sensAITM提供了供开发....
发表于 2020-11-11 09:42 156次阅读
Lattice sensAI再获重大更新

深入讨论GraphSAGE GNN算法的数学原理

GNN的架构在宏观层面有着很多与传统CNN类似的地方,比如卷积层、Polling、激活函数、机器学习....
发表于 2020-11-11 09:26 188次阅读
深入讨论GraphSAGE GNN算法的数学原理

机器学习是什么?帮助机器变得越来越聪明

机器学习(ML)是教导计算机系统根据一组数据进行预测的过程。通过为系统提供一系列的试验和错误场景,机....
发表于 2020-11-10 17:09 181次阅读
机器学习是什么?帮助机器变得越来越聪明

国内首款肌肉外甲公司远也科技宣布完成数百万美元P...

远也科技CEO丁也博士表示:“肌肉外甲是我们自主研发的新型可穿戴机器人,将服务有行动功能障碍的人群,....
发表于 2020-11-10 15:51 228次阅读
国内首款肌肉外甲公司远也科技宣布完成数百万美元P...

在云计算成功使用AI所需的五种机器学习技能

机器学习和人工智能将会继续深入IT服务领域,并为软件工程师开发的应用程序提供补充。如果IT团队想跟上....
发表于 2020-11-10 14:14 141次阅读
在云计算成功使用AI所需的五种机器学习技能

工业物联网边缘设备可应用在哪些行业

使用边缘技术,可以在更靠近边缘的地方运行人工智能和机器学习工作负载,而不必向云端发送大量数据。这些设....
发表于 2020-11-10 14:06 264次阅读
工业物联网边缘设备可应用在哪些行业

将古代地图转换成卫星图像的人工智能

古代地图可以帮助我们了解几个世纪前的风景。但是如果我们用现代的镜头来观察这些古老的地图,我们会看到什....
发表于 2020-11-10 11:53 282次阅读
将古代地图转换成卫星图像的人工智能

Elliptic Labs与MediaTek合力...

据麦姆斯咨询报道,全球AI软件公司Elliptic Labs近日宣布与世界领先的专业半导体公司Med....
发表于 2020-11-09 14:12 253次阅读
Elliptic Labs与MediaTek合力...

AI算力需求的暴增,HBM和GDDR SDRAM...

然而在此过程中,我们除了看到AI对算力的要求以外,内存带宽也是限制AI芯片发展的另一个关键要HBM2....
发表于 2020-11-09 12:45 426次阅读
AI算力需求的暴增,HBM和GDDR SDRAM...

2D材料助力人工智能进阶

机器学习应用程序的日益重要,也推动了技术的开发,而更小、更节能的计算机芯片则一直是研究的重要方向之一....
发表于 2020-11-09 11:16 207次阅读
2D材料助力人工智能进阶

深度学习的发展历程

深度学习是机器学习的一个分支,它除了可以学习特征和任务之间的关联以外,还能自动从简单特征中提取更加复....
发表于 2020-11-09 09:39 124次阅读
深度学习的发展历程

学习人工智能需要掌握什么技术

一提到人工智能,很多人都会想到不简单,头脑一般的人根本学不进去,格物斯坦表示:在学人工智能之前,要掌....
发表于 2020-11-08 10:06 485次阅读
学习人工智能需要掌握什么技术

美国陆军发布小型无人机系统战略

2020年9月,美国陆军发布《小型无人机系统(SUAS)战略》,该战略描述了陆军如何调整资源、管理流....
发表于 2020-11-08 09:22 330次阅读
美国陆军发布小型无人机系统战略

最新的编程语言排行说明Python冲上第二

本月的排行榜出现了自 TIOBE 榜单发布以来,近二十年从未见过的变化:前两名的位置首次出现了一个除....
发表于 2020-11-07 10:54 312次阅读
最新的编程语言排行说明Python冲上第二

机器学习与RFMLS项目详解

随着无线电终端和物联网设备的爆炸性增长,无线电频谱正在变得越来越拥挤,识别、定位和阻断干扰信号变得异....
发表于 2020-11-07 09:45 278次阅读
机器学习与RFMLS项目详解

干货:遇到不同问题或项目应采取的不同机器学习算法

刚开始学习数据科学时,笔者经常面临这样一个问题:遇到具体问题,选择何种算法才合适。也许你也和我一样,....
发表于 2020-11-06 16:31 222次阅读
干货:遇到不同问题或项目应采取的不同机器学习算法

一文详谈机器学习的强化学习

强化学习属于机器学习中的一个子集,它使代理能够理解在特定环境中执行特定操作的相应结果。目前,相当一部....
发表于 2020-11-06 15:33 273次阅读
一文详谈机器学习的强化学习

国内首款肌肉外甲问世:仿生碳纤支架 重量2.5k...

日前,远也科技推出了国内首款肌肉外甲,这是一款自主研发的新型可穿戴机器人,将服务有行动功能障碍的人群....
发表于 2020-11-06 13:20 277次阅读
国内首款肌肉外甲问世:仿生碳纤支架 重量2.5k...

AI如何分析理解人类的思维和行为模式

人工智能在市场营销领域取得的成功,揭示了人类的一些思维和行为模式,这些模式可以转化为其他应用程序。
发表于 2020-11-06 11:38 268次阅读
AI如何分析理解人类的思维和行为模式

芯华章将推出支持国产计算机架构的国产验证EDA工...

据芯华章科技创始人、董事长兼CEO王礼宾透露,芯华章即将推出市场上首款支持国产计算机架构的国产验证E....
发表于 2020-11-05 16:44 134次阅读
芯华章将推出支持国产计算机架构的国产验证EDA工...

人工智能可以被偏见吗

距离全球被乔治·弗洛伊德(George Floyd)被跪害惨案震惊仅仅过了三个月。在美国的集体记忆中....
发表于 2020-11-05 14:59 367次阅读
人工智能可以被偏见吗

Python 在未来十年内仍是机器学习的首选语言

愚者多怨,仁者不言,生活中就是会有很多爱唱反调的人,但不管怎么说Python 在接下来十年仍然会很重....
发表于 2020-11-05 14:38 234次阅读
Python 在未来十年内仍是机器学习的首选语言

能够指挥AI机器的编程网红Python,被誉为“...

在这样的背景之下,我国也非常重视Python的教育:浙江已经把Python列为中学生必修项目;山东、....
发表于 2020-11-05 14:09 467次阅读
能够指挥AI机器的编程网红Python,被誉为“...

机器学习项目失败的十大原因

如今人们总是能听到有关机器学习的新闻,而机器学习技术确实有更多发展潜力。调研机构Gartner公司预....
发表于 2020-11-05 13:55 250次阅读
机器学习项目失败的十大原因

中国科学院院士姚期智:人工智能存在三大技术瓶颈

关于姚期智在2020年浦江创新论坛的演讲,迄今为止只见到头条推送的两篇报道,即图灵奖唯一华人得主PP....
发表于 2020-11-05 10:50 624次阅读
中国科学院院士姚期智:人工智能存在三大技术瓶颈

Google Cloud推出新的Document...

Google承诺使用Document AI Platform来自动化该过程。它在统一的仪表板上将Go....
发表于 2020-11-05 10:30 276次阅读
Google Cloud推出新的Document...

关于机器学习和人工神经网络

在人工神经网络课程之后,有一位同学课下问了一个问题,她这学期也在学习机器学习课程,感觉人工神经网络课....
发表于 2020-11-05 10:02 434次阅读
关于机器学习和人工神经网络

机器学习性能谁来评判?

本期导读 MLPerf 组织最近发布了最新一轮机器学习性能测试结果,首次直接参加此次测试的新力量 赛....
发表于 2020-11-05 09:46 404次阅读
机器学习性能谁来评判?

霍尼韦尔高级量子计算机-H1型系统的权限对CQC...

剑桥量子计算公司 (CQC) 今天宣布了一项与霍尼韦尔量子解决方案的协议。据此协议,CQC将获得访问....
发表于 2020-11-05 09:14 267次阅读
霍尼韦尔高级量子计算机-H1型系统的权限对CQC...

医疗+AI:AI脑电波诊断法 机器学习技术与EE...

原标题:3.5亿抑郁症患者背后,谷歌AI做了什么? 抑郁症,似乎离我们很近又很远。 我们会在社交网络....
发表于 2020-11-04 17:57 420次阅读
医疗+AI:AI脑电波诊断法 机器学习技术与EE...

企业应如何改变创新流程以提高AI成功率?

如今,人工智能的炒作无处不在,很多全球科技厂商都在开发和应用人工智能技术,以获得理想的投资回报率。但....
发表于 2020-11-04 17:05 520次阅读
企业应如何改变创新流程以提高AI成功率?

英特尔收购Cnvrg公司,构建和运行机器学习模型...

据国外媒体报道,英特尔继续通过收购优质的初创公司,深耕机器学习和人工智能领域。该公司近日收购了一家以....
发表于 2020-11-04 16:26 313次阅读
英特尔收购Cnvrg公司,构建和运行机器学习模型...

英伟达 A100 GPU 全面上市,推理性能比 ...

根据英伟达官方的消息,在 AWS 运行 NVIDIA GPU 十周年之际,AWS 发布了采用全新 A....
发表于 2020-11-04 15:34 272次阅读
英伟达 A100 GPU 全面上市,推理性能比 ...

过去十年引人注目的分析和人工智能错误

数据和机器学习算法所带来的洞察可能是无价之宝,但是错误会损害你的声誉,影响你的收入甚至生命安全。这些....
发表于 2020-11-04 10:18 364次阅读
过去十年引人注目的分析和人工智能错误

交友APP:AI和机器能帮助你找到那个“他”吗?

交友APP或许很多人都用过。约会AI的基本目标是为客户配对,直到他们找到理想的伴侣。在很久以前,这个....
发表于 2020-11-03 16:43 290次阅读
交友APP:AI和机器能帮助你找到那个“他”吗?

如何理解人工智能、机器学习和深度学习三者的区别

深度学习、机器学习、人工智能——这些流行词皆代表了分析学的未来。在这篇文章中,我们将通过一些真实世界....
发表于 2020-11-03 15:36 349次阅读
如何理解人工智能、机器学习和深度学习三者的区别

TinyML推动深度学习和人工智能发展

TinyML是深度学习和人工智能领域的最新技术。它带来了在随处可见的微控制器(几乎是最小的电子芯片)....
发表于 2020-11-03 14:58 283次阅读
TinyML推动深度学习和人工智能发展

为了不让AI带有歧视色彩,谷歌操碎了心训练模型

土耳其语的「他」和「她」没有性别的区分,统一用 O 表示。过去 Google Translate 在....
发表于 2020-11-03 10:47 248次阅读
为了不让AI带有歧视色彩,谷歌操碎了心训练模型

AMD下载网站上已经泄漏部分系列显卡的信息

根据AMD此前的介绍,CDNA架构专门针对GPU计算进行优化,专注于计算/张量操作性能,从而加速机器....
发表于 2020-11-03 10:18 384次阅读
AMD下载网站上已经泄漏部分系列显卡的信息

Google为提升机器学习的公平性内部研发对抗训...

看到这个问题后,Google 意识到要想办法更好地训练模型,让它变得更加「中立」。后来 Google....
发表于 2020-11-03 10:01 326次阅读
Google为提升机器学习的公平性内部研发对抗训...

机器学习可以有效的控制物联网应用的安全性

        随着这个智能物联的时代不断前行,不仅仅带来无限的便捷,同时也带来了网络安...
发表于 2020-11-03 09:09 0次阅读
机器学习可以有效的控制物联网应用的安全性

人工智能时代,AI已应用到多个领域

人工智能时代,机器学习,尤其是深度学习,在各行各业中得到了越来越广泛的应用。比如智能交互、人机交流、....
发表于 2020-11-02 17:48 882次阅读
人工智能时代,AI已应用到多个领域

半监督学习最基础的3个概念

导读 今天给大家介绍半监督学习中的3个最基础的概念:一致性正则化,熵最小化和伪标签,并介绍了两个经典....
发表于 2020-11-02 16:14 197次阅读
半监督学习最基础的3个概念

最基础的半监督学习

导读 最基础的半监督学习的概念,给大家一个感性的认识。 半监督学习(SSL)是一种机器学习技术,其中....
发表于 2020-11-02 16:08 251次阅读
最基础的半监督学习

在情感分析中使用知识的一些代表性工作

1.引文 情感分析 知识 当training数据不足以覆盖inference阶段遇到的特征时,是标注....
发表于 2020-11-02 16:05 253次阅读
在情感分析中使用知识的一些代表性工作

深度学习:远程监督在关系抽取中的应用

什么是关系抽取 知识就是力量。使人类及机器能够更好地利用知识是提升工作效率及实现人工智能的关键所在,....
发表于 2020-11-02 15:43 374次阅读
深度学习:远程监督在关系抽取中的应用

运用多种机器学习方法比较短文本分类处理过程与结果...

目标 从头开始实践中文短文本分类,记录一下实验流程与遇到的坑运用多种机器学习(深度学习 + 传统机器....
发表于 2020-11-02 15:37 590次阅读
运用多种机器学习方法比较短文本分类处理过程与结果...

微软 Xbox Series X 的优势可能在于...

随着 Xbox Series X 和 PlayStation 5 距离各自的上市只有两周不到的时间,....
发表于 2020-11-02 15:26 269次阅读
微软 Xbox Series X 的优势可能在于...

人工智能技术将带给企业哪些好处?

毫无疑问,人工智能(AI)和机器学习(ML)正在成为金融科技行业的热门话题。几乎在所有的研讨会和会议....
发表于 2020-11-02 15:13 458次阅读
人工智能技术将带给企业哪些好处?

【AI学习】第2篇--AI 的基础知识

簡介人工智慧(AI) 人工智慧的定義 • 人工智慧(Artificial intelligence,簡稱AI),是指讓電腦能夠表現出與人...
发表于 2020-11-02 11:56 202次阅读
【AI学习】第2篇--AI 的基础知识

【AI学习】AI概论:(Part-C)AI(机器)是如何学习呢?

任务十四:从连连看出发 目标: 1. 前面说明了,许多人认为,在AI领域里的天字第1号术语是:特征(Feature)。 2....
发表于 2020-10-30 15:24 101次阅读
【AI学习】AI概论:(Part-C)AI(机器)是如何学习呢?

机器学习如何解决芯片设计中的NP-hard的问题?

EDA 中的大部分设计问题都属于 NP-hard 问题,由于不存在解决这些问题的多项式时间算法,因此无法通过分析确定最...
发表于 2020-09-03 01:15 910次阅读
机器学习如何解决芯片设计中的NP-hard的问题?

关于机器学习的日志

机器学习日志
发表于 2020-07-08 12:54 119次阅读
关于机器学习的日志

ML之决策树与随机森林

ML--决策树与随机森林
发表于 2020-07-08 12:31 14次阅读
ML之决策树与随机森林

机器学习小白的总结

机器学习小白第一周自我总结
发表于 2020-07-08 08:27 133次阅读
机器学习小白的总结

机器学习之周志华完整版

链接: 提取码:2ja8
发表于 2020-06-28 18:46 728次阅读
机器学习之周志华完整版

吴恩达机器学习之Coursera-week

吴恩达机器学习Coursera-week10
发表于 2020-06-19 11:22 1882次阅读
吴恩达机器学习之Coursera-week

机器学习笔记之BP推导

机器学习笔记:BP推导
发表于 2020-06-15 17:11 187次阅读
机器学习笔记之BP推导