【四旋翼飞行器】76小时吃透四轴算法!史上最强软硬结合实战项目,👉戳此立抢👈

软件巨头Salesforce带来AutoML杀手TransmogrifAI

论智 2018-08-18 11:32 次阅读

如果说去年“机器换人”的舆论来自车间的机器人手,那今年在全球范围内挥舞起“自动化”大棒的,就成了机器学习。上月,李飞飞发布面向商业公司的机器学习库AutoML,技术门槛之低,让不少工程师担忧不已。一波未平,8月月初,美国德州农工大学开源Auto Keras,同样的功能,但是完全免费。而今天,软件巨头Salesforce也入场了,他们带来的TransmogrifAI,才可能是真正的AutoML“杀手”。

软件巨头Salesforce带来AutoML杀手TransmogrifAI

以下内容来自Salesforce Einstein数据科学高级总监Shubha Nabar:

在过去十年中,尽管机器学习取得了巨大进步,但构建可用的机器学习系统却依然是件难事。三年前,当我们着手把机器学习功能部署到Salesforce平台时,大家才发现,原来构建企业级机器学习系统更加困难。为了解决这个问题,我们开发了TransmogrifAI(发音为trans-mog-ri-phi)——一种用于处理结构化数据的端到端自动化机器学习库,它也是现在Einstein平台优化功能的一个工具。

今天,我们把这个项目分享给开源社区。未来,数据科学家和开发人员可以用它快速大规模地构建机器学习解决方案。

TransmogrifAI GitHub:github.com/salesforce/TransmogrifAI

当数据科学家在为商业产品构建机器学习功能时,他们通常会关注易于理解的样本和数据集。相比之下,企业拥有的数据和样本是多样化的,这种多样性使构建企业级机器学习系统成了一项挑战。在Salesforce,我们的客户可能希望预测一系列结果——从客户流失、销售预测、潜在用户转化,到数字广告点击、网购、报价接受、设备故障和延迟付款等,

对于企业客户来说,他们的数据是保密的、不可共享的,这两点至关重要。这意味着我们必须针对客户,用给定的数据样本构建机器学习模型。同时,构建全局模型绝对没有意义,因为每个企业都独立无二,他们有不同的商业模式,也有各自的经营规模和业务渠道,用机器学习的术语讲,就是有不同的偏差。

为了让机器学习真正为客户服务,我们要做的就是构建和部署上千个用不同数据样本训练得到的个性化机器学习模型!而如果不想聘请大批数据科学家,实现这一目标的唯一方法就是自动化。

TransmogrifAI工作流程

通常情况下,如果要构建性能良好的机器学习模型,它需要的研究量和开发量是相当可观的。数据准备、特征工程、模型训练……这些繁琐过程需要不断迭代,为了得到成熟的模型,数据科学家们可能要耗费数周乃至数月的时间。

TransmogrifAI是一个基于Scala和SparkML构建的库,它能承担这个过程中的部分工作。只需几行代码,数据科学家就可以自动完成数据清理、特征工程和模型选择,然后训练出一个高性能模型,进行进一步探索和迭代。

它封装了机器学习过程的五个主要步骤:

软件巨头Salesforce带来AutoML杀手TransmogrifAI

特征推断(Feature Inference)

数据是所有机器学习管道的第一步。数据科学家先收集所有相关数据,再进行整平操作,添加、聚合不同数据源,从中提取可能有助于预测的原始信号。这之后,提取得到的信号会被放进灵活的数据结构中,也就是DataFrame,方便后续操作。虽然这些数据结构简单且易于操作,但其中还是存在一些错误,可能会对下游造成影响,比如存在类型错误和空值错误。

TransmogrifAI可以帮助解决这类问题。它允许用户为其数据指定类型,自动把原始预测变量和响应信号提取为“特征”。除了原始类型,TransmogrifAI的支持面更丰富、更细化,地理位置、电话号码、邮政编码……凡是数据科学家可能频繁遇到的,它都能进行区分。

事实上,即便用户没有指定,TransmogrifAI也可以自行推断。例如,当它检测到数据中的文本特征其实是分类特征时,它会记录这个错误并进行适当处理。不用等到运行时再报错,数据科学家在编译时就能找出大多数错误。

软件巨头Salesforce带来AutoML杀手TransmogrifAI

自动化特征工程(Transmogrification)

虽然找到正确的类型有助于数据推理和减少对下游的不良影响,但最终所有特征都是要被转换成数字表示的。只有这样,机器学习算法才能寻找并利用其中的规律。这个过程被称为特征工程。

举个例子,我们该怎么把美国的各个州(如CA, NY, TX等)转成数字?一种方法是把每个州映射为1到50之间的数字,因为美国一共有50个州。但这种编码方法的缺点在于没有保留州与州之间地理位置上的关系。那么如果我们计算州中心点到美国中心点的距离,并以此为编码依据呢?这确实可以解决之前提到的问题,但它同样无法反映东西南北位置。

所以特征工程的方法有无数种,但是找出正确的一种十分不容易。

TransmogrifAI可以帮数据科学家自动化这个恼人的过程。它为自己支持的所有特征类型提供了无数种编码技术,能做到不仅把数据转成算法可用的格式,还能优化转换,使机器学习算法更容易从数据中学习。例如,同样是年龄数字特征,它能根据特定问题(时尚行业、金融理财)把它们转成最合适的年龄段。

尽管TransmogrifAI已经具备了上述强大能力,但考虑到特征工程是一场无穷无尽的“博弈”,它也支持用户自定义和扩展默认值。

自动化特征验证(Feature Validation)

特征工程可能导致数据维度出现爆炸性增长,而高维数据往往会让模型出现差错!其中最典型的是模型过拟合,另一个容易被忽视但影响巨大的问题是数据泄露。

假设我们手头有一个包含交易信息的数据集,任务是预测最终的交易金额,而数据集上一个条目叫“已结算交易金额”,这是完成交易后才能统计到的信息。如果我们不慎把这个信息也放进训练集里,模型就会发现它的“可参考性”极强,最后成为一个测试时精度极高,实践时一无所用的废品。

事实上,在Salesforce业务中,这种后见之明的偏见尤其成问题,因为大部分客户的数据很复杂,平时也是自动填充的,这使得数据科学家很容易混淆因果关系。

TransgmogrifAI包含执行自动特征验证的算法,可以删除几乎没有预测能力的特征——随着时间的推移而使用的特征,表现出零方差的特征,或者在训练样本中的分布与预测时的分布存在显着不同的特征。在处理含有偏差的高维数据时,这些算法会用一系列基于特征类型的统计测试,结合特征谱系来检测和排除偏差。

自动化模型选择(Model Selection)

完成所有关于数据预处理的工作后,数据科学家就该把机器学习算法应用于准备好的数据以构建预测模型。如果是手动完成,他们往往需要尝试许多不同的算法,并找到合适的参数设置。这是个耗时的工程。

TransmogrifAI的模型选择器可以在数据上运行多种算法,并比较它们的平均验证错误,从中挑出最佳算法。除此之外,它还能通过适当地对数据进行采样并重新校准预测以匹配真实的先验,自动处理不平衡数据的问题,进一步提高模型性能。

超参数优化(Hyperparameter Optimization)

上述自动化步骤的基础都涉及超参数优化,它几乎无处不在。而就是这么一个耗时久、任务量重、让数据科学家望而生畏的操作,它背后的技术原理却不难,可以直接看成一个高性能模型和一个随机数生成器模型。这个任务,TransmogrifAI可以代劳。、

赋予每个人使用ML技术的权利

总的来看,现在TransmogrifAI在Salesforce内部已经成功把训练模型所需的总时间从几周、几个月缩短到了几个小时。而封装所有这些复杂操作的代码却非常简单,只需短短几行就能搞定:

// 读取交易数据

val dealData = DataReaders.Simple.csvCase[Deal](path = pathToData).readDataset().toDF()

// 提取原始信号,预测特征

val (isClosed, predictors) = FeatureBuilder.fromDataFrame[RealNN](dealData, response = "isClosed")

// 自动化特征工程

val featureVector = predictors.transmogrify()

// 自动化特征验证

val cleanFeatures = survived.sanityCheck(featureVector, removeBadFeatures = true)

// 自动化模型选择

val (pred, raw, prob) = BinaryClassificationModelSelector().setInput(isClosed, cleanFeatures).getOutput()

// 设置工作流程,训练模型

val model = newOpWorkflow().setInputDataset(dealData).setResultFeatures(pred).train()

这意味着TransmogrifAI已经成为一个变革。

在我们眼里,这种自动化水平的工具对开发面向企业的机器学习系统至关重要,因此我们也相信,随着机器学习在各行各业的应用场景不断拓宽,对运营方式产生巨大影响,未来企业对机器学习系统的需求会不断增大,而那时,TransmogrifAI这样的自动化机器学习库可以帮助他们实现目标,实现转变。

原文标题:又一个AutoML库:Salesforce开源TransmogrifAI

文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

还原微软AI战略 定义AI未来

微软首席法务官、总裁Brad Smith说,在残废人群体中,只有十分之一使用了辅助技术和产品,科技行....
的头像 两个质子 发表于 02-21 17:52 364次 阅读
还原微软AI战略 定义AI未来

“5G+AI”推动行业革命 我们面临空前的国家战略机遇

“5G+AI”将引领科技立国大时代,曙光已现:在去年政治局集体学习人工智能并将其上升为这一轮科技与
的头像 中山市物联网协会 发表于 02-21 16:48 287次 阅读
“5G+AI”推动行业革命 我们面临空前的国家战略机遇

IBM斥资2000万美元新建AI研究中心落户巴西

美国IBM公司日前宣布,他们将与巴西圣保罗研究基金会(FAPESP)共同合作,在巴西建立一个AI工程....
的头像 机器人技术与应用 发表于 02-21 16:25 205次 阅读
IBM斥资2000万美元新建AI研究中心落户巴西

医疗卫生行业对AI的需求源于以下五个方面

2019年,将是医疗AI突破性发展的一年,基于近两年医疗卫生领域对人工智能研究及临床实践的有益反馈,....
发表于 02-21 14:03 23次 阅读
医疗卫生行业对AI的需求源于以下五个方面

安防人脸识别并不是孤立的系统 “AI换脸”不必担心

近期,GitHub疑似遭到审查,用户在未登录状态下无法访问 deepfake 这个开源项目的代码仓库....
发表于 02-21 13:36 30次 阅读
安防人脸识别并不是孤立的系统 “AI换脸”不必担心

重磅 | e星球发布2019年6大关键词

虽然2018年对于汽车行业来说不是那么的美好,但是随着人们对汽车安全性、舒适性、智能性等方面的需求日....
的头像 人间烟火123 发表于 02-21 10:24 344次 阅读
重磅 | e星球发布2019年6大关键词

2019智能家居五大发展趋势浅析

根据专业调研机构Statista的数据显示,2021年全球智能家居市场规模将达793亿美元,未来智能....
发表于 02-21 09:02 42次 阅读
2019智能家居五大发展趋势浅析

安防行业2018年市场规模 及AI相关软硬件市场规模浅析

谈到人工智能赋能产业,最被大众所熟知的就是AI手机了,语音助手、人脸识别解锁、智能美颜等等,已经成为....
发表于 02-21 08:49 27次 阅读
安防行业2018年市场规模 及AI相关软硬件市场规模浅析

关于AI+IoT创新企业有哪些?

物联网被视为未来发展科技,当AI+IoT融合后,将进一步激活市场,国际亚马逊、微软和IBM积极拥抱,....
的头像 传感物联网 发表于 02-20 17:23 948次 阅读
关于AI+IoT创新企业有哪些?

Arm宣布推出基于M-Profile Vector Extension (MVE)矢量扩充方案的Arm Helium技术

先进的数字信号处理(DSP)可通过 Arm Neon 技术扩展至更多Cortex-A架构组件中。针对....
的头像 安芯教育科技 发表于 02-20 16:51 556次 阅读
Arm宣布推出基于M-Profile Vector Extension (MVE)矢量扩充方案的Arm Helium技术

人工智能行业即将迎来寒冬

深度学习处于所谓的AI革命的前沿至今已有好几年;许多人过去认为,深度学习是神奇的“银弹”,会把我们带....
的头像 人工智能学家 发表于 02-20 14:48 450次 阅读
人工智能行业即将迎来寒冬

如何同时使用Nucleus与TensorFlow解决基因组学领域的机器学习问题

本文中阐述的两种方法均使用深度神经网络,学习将输入映射至输出的函数。神经网络由若干层线性与非线性运算....
的头像 TensorFlow 发表于 02-20 14:38 198次 阅读
如何同时使用Nucleus与TensorFlow解决基因组学领域的机器学习问题

为了帮程序员解决bug问题,Facebook可算是操碎了心!

首先,静态分析工具 Infer,会帮助定位代码中需要修补的点;一旦 Sapienz 和 Infer ....
的头像 电子发烧友网工程师 发表于 02-20 09:20 294次 阅读
为了帮程序员解决bug问题,Facebook可算是操碎了心!

鸿海转投AI 旷视科技成AI项目挂牌企业

鸿海集团投资的新创公司旷视科技传将IPO。外电报道,旷视科技可能在香港上市,外传募资5亿至10亿美元....
的头像 CINNO 发表于 02-19 16:43 580次 阅读
鸿海转投AI 旷视科技成AI项目挂牌企业

AI新贵闯入安防市场 传统豪门走上智能化转型之路

计算机相关技术落地使得各种机器“辨识”及“模仿”能力上了好几个台阶。一时间,相关初创公司也嗅到了诺大....
发表于 02-19 15:54 161次 阅读
AI新贵闯入安防市场 传统豪门走上智能化转型之路

2018年十大关键词盘点 智能家居被越来越多的人关注

作为人工智能与物联网落地的首选之地,智能家居近年来被越来越多的人关注。特别是在2018年,智能家居行....
发表于 02-19 15:50 111次 阅读
2018年十大关键词盘点 智能家居被越来越多的人关注

全球知名创投研究机构CBInsights发布最新的全球AI独角兽公司名单

例如,Indigo Agriculture最初是作为微生物种子处理的开发者,用于玉米、棉花、大米、大....
的头像 1号机器人网 发表于 02-19 15:36 465次 阅读
全球知名创投研究机构CBInsights发布最新的全球AI独角兽公司名单

全球AI100强出炉,中国占领半壁江山

日前,创投研究机构 CB Insights 发布了年度人工智能企业百强榜单——由100个最具前途的 ....
的头像 人工智能头条 发表于 02-19 14:48 680次 阅读
全球AI100强出炉,中国占领半壁江山

基于AI技术提升广东联通在专线市场的竞争力

新一代数字化革命的浪潮已经席卷全球,企业正在积极将其行业专长与新一代数字化技术结合起来,重新塑造其商....
的头像 C114通信网 发表于 02-19 14:47 406次 阅读
基于AI技术提升广东联通在专线市场的竞争力

未来AI在十大领域的发展趋势

作为全球AI的排头兵,中国在人工智能领域非常具备竞争力,不过我们也还存在一些不足。
的头像 重庆人工智能 发表于 02-19 14:09 1668次 阅读
未来AI在十大领域的发展趋势

人工智能在医疗领域的应用表现

医疗领域存在一些长久以来的弊病,现在很多人相信人工智能技术有望为这些问题带来根本性的解决方案。近日,....
的头像 通信信号处理研究所 发表于 02-19 13:59 531次 阅读
人工智能在医疗领域的应用表现

下一代Armv8.1-M架构能够提升最小型边缘设备的机器学习能力

Arm Helium技术作为一种全新的M-Profile Vector Extension矢量扩充方....
发表于 02-19 13:58 191次 阅读
下一代Armv8.1-M架构能够提升最小型边缘设备的机器学习能力

尽管AI+医疗的试点项目成功 但目前的医疗系统仍然不能适应这一技术

2014 年,斯坦福大学启动了“AI100”项目,即“人工智能百年研究”。该项目集结了各领域顶尖的研....
发表于 02-19 13:52 139次 阅读
尽管AI+医疗的试点项目成功 但目前的医疗系统仍然不能适应这一技术

AI医疗公司数坤科技专注心脑血管疾病领域 推动医院的智能升级

据报道,AI医疗公司数坤科技宣布完成2亿元B轮融资,创世伙伴资本领投,A轮投资方晨兴资本、华盖资本,....
发表于 02-19 13:47 117次 阅读
AI医疗公司数坤科技专注心脑血管疾病领域 推动医院的智能升级

使用Net2Vis为CNN创造可直接发布的可视化方案

TensorsCone是ML工程师的福音,因为它可以帮助他们在不牺牲准确性和性能的情况下开发和执行针....
的头像 电子发烧友网工程师 发表于 02-19 13:32 531次 阅读
使用Net2Vis为CNN创造可直接发布的可视化方案

五角大楼向大众解密了其人工智能战略的部分

美国政府和G-MAFIA更倾向于认为他们之间的关系是交易性的,而不是合作性的。在过去几年里,无论是国....
的头像 电子发烧友网工程师 发表于 02-19 11:26 581次 阅读
五角大楼向大众解密了其人工智能战略的部分

2019年人工智能行业的25大发展趋势

知名创投研究机构CB Insights调研了25种最大的AI趋势,以确定2019年该技术的下一步趋势....
的头像 中国人工智能学会 发表于 02-19 11:14 965次 阅读
2019年人工智能行业的25大发展趋势

盘点2019年25种最大的AI趋势

图像识别、自动驾驶、AI诊疗、训练算法......行业的秘密都在这儿了。
的头像 电子发烧友网工程师 发表于 02-19 09:22 342次 阅读
盘点2019年25种最大的AI趋势

从这份薪酬榜单来看,AI人才争夺战正在进行中!

拿到这三份报告后,笔者去国内各大招聘网站验证这一事实,从薪酬招聘网站来看国内平均薪酬为3.5万(含应....
的头像 电子发烧友网工程师 发表于 02-19 09:21 561次 阅读
从这份薪酬榜单来看,AI人才争夺战正在进行中!

100大AI领军人物出炉

近日,深度知识分析公司Deep Knowledge Analytics从最初的500名优秀候选人中,....
的头像 人工智能学家 发表于 02-18 15:54 379次 阅读
100大AI领军人物出炉

深耕AI智能 2019年长虹电视正蓄势待发

2018年已经尘埃落定,是赢家或是输家都将成为过去,但不能否认的是,中国电视行业正处于低迷发展态势,....
发表于 02-18 15:44 623次 阅读
深耕AI智能 2019年长虹电视正蓄势待发

AI在实际生活中究竟带来了哪些体验?

近几年,“AI”这个词的出镜率越来越高,关注科技领域的爱好者们提到 AI ,都能聊上几句,但你真的了....
的头像 Qualcomm中国 发表于 02-18 15:35 385次 阅读
AI在实际生活中究竟带来了哪些体验?

一场人与AI的辩论赛,Debater败了!

简单来说就是,不管你是亚马逊云、微软云、谷歌云、阿里云还是 IBM 云,公有云、私有云还是混合云,W....
的头像 IBM中国 发表于 02-18 15:30 778次 阅读
一场人与AI的辩论赛,Debater败了!

某些生物医药领域使用人工智能技术或将得出一些不准确的结论

北京时间2月18日早间消息,据报道,一组顶尖科学家和医学统计学家上周五警告称,在某些生物医药领域使用....
发表于 02-18 14:56 167次 阅读
某些生物医药领域使用人工智能技术或将得出一些不准确的结论

美用“举国体制”搞AI,何脸批中国?

除此之外,该计划还强调人工智能(AI)技术以及美国确保在此领域领先地位的重要性,指示联邦机构将人工智....
的头像 电子发烧友网工程师 发表于 02-18 14:09 889次 阅读
美用“举国体制”搞AI,何脸批中国?

AI在农村都起到了什么作用?

当时支持与反对方各自罗列出很多观点,但我们或许可以承认,这些讨论都是建立在这样一个前提上:新技术与农....
的头像 电子发烧友网工程师 发表于 02-18 13:55 829次 阅读
AI在农村都起到了什么作用?

场景碎片化驱动着安防产业运作模式不断顺应着市场需求而发生改变

 近几年来,人工智能为安防产业带来了丰富的想象力,安防+AI的组合应用带来了传统安防功能价值的颠覆性....
发表于 02-18 11:04 76次 阅读
场景碎片化驱动着安防产业运作模式不断顺应着市场需求而发生改变

AI芯片首战瞄准安防行业 新品接踵面世

2018年,得益于人工智能的推动,“边缘计算”首次出现在Gartner 发布的“十大战略技术趋势”中....
发表于 02-18 11:02 549次 阅读
AI芯片首战瞄准安防行业 新品接踵面世

美军解禁杀人机器人涉伦理争议

美国军方希望扩大人工智能(AI)在战争中的应用,但表示会注意按照国家价值观部署该技术。
的头像 天津机器人 发表于 02-18 10:36 343次 阅读
美军解禁杀人机器人涉伦理争议

AI正在创造一个独特的虚拟(虚假)信息世界

这一想法最初的来源其实是英伟达最近开源的 StyleGAN 算法,已经证明有不错的灵活性。Phili....
的头像 电子发烧友网工程师 发表于 02-18 09:50 322次 阅读
AI正在创造一个独特的虚拟(虚假)信息世界

探析机器学习核心概念之间的有机关系及知识脉络

机器学习这件事,要学鲁智深倒拔垂杨柳,而不是“狗熊掰棒子”。
的头像 电子发烧友网工程师 发表于 02-18 09:33 1667次 阅读
探析机器学习核心概念之间的有机关系及知识脉络

“公开代码”再次成为焦点,这次你站在哪一边?

实际上,GPT2就是一个自动文本生成器,但鉴于其训练数据量直接影响模型的性能,也使GPT2成为一个更....
的头像 新智元 发表于 02-18 09:09 321次 阅读
“公开代码”再次成为焦点,这次你站在哪一边?

警告:机器学习导致了一场“科学危机”!

科学上的“可复制性危机”指的是当另一组科学家尝试同样的实验时,研究结果没有被重复。这意味着最初的结果....
的头像 新智元 发表于 02-18 09:07 342次 阅读
警告:机器学习导致了一场“科学危机”!

不了解“智能”的运作原理,也完全有可能构建出“智能”

维纳关于机器可能从人类手中夺取控制权的首次警告出现在1949年,当时正值第一代存储程序电子数字计算机....
的头像 新智元 发表于 02-18 09:00 351次 阅读
不了解“智能”的运作原理,也完全有可能构建出“智能”

全球人工智能革命的前20家公司你了解吗

人工智能是计算机科学的一个分支,旨在创建像人类一样学习、工作和反应的计算机和机器。
的头像 机器人大讲堂 发表于 02-17 10:05 844次 阅读
全球人工智能革命的前20家公司你了解吗

探析从贝叶斯到深度学习及各自优缺点

集成方法是由多个较弱的模型集成模型组,其中的模型可以单独进行训练,并且它们的预测能以某种方式结合起来....
的头像 人工智能学家 发表于 02-17 09:56 324次 阅读
探析从贝叶斯到深度学习及各自优缺点

机器学习应用场景拓展翻新

2018年全球人工智能技术支出规模达到240亿美金,其中中国市场达到22亿美金,中国在全球技术支出占....
发表于 02-16 15:01 274次 阅读
机器学习应用场景拓展翻新

2018年以来最重要的10篇计算机视觉/图像生成相关的研究

卷积神经网络(CNN)可以很好的处理二维平面图像的问题。然而,对球面图像进行处理需求日益增加。例如,....
的头像 新智元 发表于 02-16 10:50 333次 阅读
2018年以来最重要的10篇计算机视觉/图像生成相关的研究

2019年伊始 四所著名高校开设人工智能学院

2019年,人工智能依然热度不减。
的头像 电子发烧友网工程师 发表于 02-16 10:34 700次 阅读
2019年伊始 四所著名高校开设人工智能学院

分享机器学习卷积神经网络的工作流程和相关操作

机器学习算法篇--卷积神经网络基础(Convolutional Neural Network)...
发表于 02-14 16:37 59次 阅读
分享机器学习卷积神经网络的工作流程和相关操作

机器学习自学?你应该知道这篇中外结合的计划

一份中外结合的 Machine Learning 自学计划
发表于 02-14 06:43 48次 阅读
机器学习自学?你应该知道这篇中外结合的计划

分享一个机器学习Demo,很受用

TensorFlow入门:第一个机器学习Demo
发表于 02-12 10:13 74次 阅读
分享一个机器学习Demo,很受用

关于labview机器学习的相关例子

1、例程包含了BP神经网络、SVM和其他一些算法的例子 2、有助于学习人工智能与labview的结合应用 3、使用例子需要安装ML...
发表于 01-27 12:11 232次 阅读
关于labview机器学习的相关例子

机器学习实验中图像增强的库imgaug详解

Py之imgaug:Python库之imgaug简介、安装、使用方法之详细攻略...
发表于 12-28 14:30 388次 阅读
机器学习实验中图像增强的库imgaug详解

大数据hadoop入门之hadoop家族产品详解

大数据这个词也许几年前你听着还会觉得陌生,但我相信你现在听到hadoop这个词的时候你应该都会觉得“熟悉”!越来越发现身边从...
发表于 12-26 15:02 425次 阅读
大数据hadoop入门之hadoop家族产品详解

ML之预测:采用机器学习预测小组赛、十六比赛、四决赛、半决赛、决赛以及世界杯总冠军的各个队伍

ML之预测:玩转2018世界杯—采用机器学习预测小组赛、十六比赛、四决赛、半决赛、决赛以及世界杯总冠军的各个队伍...
发表于 12-24 11:51 152次 阅读
ML之预测:采用机器学习预测小组赛、十六比赛、四决赛、半决赛、决赛以及世界杯总冠军的各个队伍

Pytorch模型训练实用PDF教程【中文】

本教程以实际应用、工程开发为目的,着重介绍模型训练过程中遇到的实际问题和方法。在机器学习模型开发中,主要涉及三大部分,分...
发表于 12-21 09:18 309次 阅读
Pytorch模型训练实用PDF教程【中文】

ML之ECS:利用ECS的PAI进行傻瓜式操作机器学习的算法

ML之ECS:利用ECS的PAI进行傻瓜式操作机器学习的算法...
发表于 12-20 10:42 127次 阅读
ML之ECS:利用ECS的PAI进行傻瓜式操作机器学习的算法

清洗误标注的开发集和测试集样本

在进行误差分析时,你可能会注意到一些开发集的样本被误标注(mislabeled )了。此处的“误标注”指的是图像在使用算法处理前,已...
发表于 12-19 09:48 193次 阅读
清洗误标注的开发集和测试集样本