软件巨头Salesforce带来AutoML杀手TransmogrifAI

论智 2018-08-18 11:32 次阅读

如果说去年“机器换人”的舆论来自车间的机器人手,那今年在全球范围内挥舞起“自动化”大棒的,就成了机器学习。上月,李飞飞发布面向商业公司的机器学习库AutoML,技术门槛之低,让不少工程师担忧不已。一波未平,8月月初,美国德州农工大学开源Auto Keras,同样的功能,但是完全免费。而今天,软件巨头Salesforce也入场了,他们带来的TransmogrifAI,才可能是真正的AutoML“杀手”。

软件巨头Salesforce带来AutoML杀手TransmogrifAI

以下内容来自Salesforce Einstein数据科学高级总监Shubha Nabar:

在过去十年中,尽管机器学习取得了巨大进步,但构建可用的机器学习系统却依然是件难事。三年前,当我们着手把机器学习功能部署到Salesforce平台时,大家才发现,原来构建企业级机器学习系统更加困难。为了解决这个问题,我们开发了TransmogrifAI(发音为trans-mog-ri-phi)——一种用于处理结构化数据的端到端自动化机器学习库,它也是现在Einstein平台优化功能的一个工具。

今天,我们把这个项目分享给开源社区。未来,数据科学家和开发人员可以用它快速大规模地构建机器学习解决方案。

TransmogrifAI GitHub:github.com/salesforce/TransmogrifAI

当数据科学家在为商业产品构建机器学习功能时,他们通常会关注易于理解的样本和数据集。相比之下,企业拥有的数据和样本是多样化的,这种多样性使构建企业级机器学习系统成了一项挑战。在Salesforce,我们的客户可能希望预测一系列结果——从客户流失、销售预测、潜在用户转化,到数字广告点击、网购、报价接受、设备故障和延迟付款等,

对于企业客户来说,他们的数据是保密的、不可共享的,这两点至关重要。这意味着我们必须针对客户,用给定的数据样本构建机器学习模型。同时,构建全局模型绝对没有意义,因为每个企业都独立无二,他们有不同的商业模式,也有各自的经营规模和业务渠道,用机器学习的术语讲,就是有不同的偏差。

为了让机器学习真正为客户服务,我们要做的就是构建和部署上千个用不同数据样本训练得到的个性化机器学习模型!而如果不想聘请大批数据科学家,实现这一目标的唯一方法就是自动化。

TransmogrifAI工作流程

通常情况下,如果要构建性能良好的机器学习模型,它需要的研究量和开发量是相当可观的。数据准备、特征工程、模型训练……这些繁琐过程需要不断迭代,为了得到成熟的模型,数据科学家们可能要耗费数周乃至数月的时间。

TransmogrifAI是一个基于Scala和SparkML构建的库,它能承担这个过程中的部分工作。只需几行代码,数据科学家就可以自动完成数据清理、特征工程和模型选择,然后训练出一个高性能模型,进行进一步探索和迭代。

它封装了机器学习过程的五个主要步骤:

软件巨头Salesforce带来AutoML杀手TransmogrifAI

特征推断(Feature Inference)

数据是所有机器学习管道的第一步。数据科学家先收集所有相关数据,再进行整平操作,添加、聚合不同数据源,从中提取可能有助于预测的原始信号。这之后,提取得到的信号会被放进灵活的数据结构中,也就是DataFrame,方便后续操作。虽然这些数据结构简单且易于操作,但其中还是存在一些错误,可能会对下游造成影响,比如存在类型错误和空值错误。

TransmogrifAI可以帮助解决这类问题。它允许用户为其数据指定类型,自动把原始预测变量和响应信号提取为“特征”。除了原始类型,TransmogrifAI的支持面更丰富、更细化,地理位置、电话号码、邮政编码……凡是数据科学家可能频繁遇到的,它都能进行区分。

事实上,即便用户没有指定,TransmogrifAI也可以自行推断。例如,当它检测到数据中的文本特征其实是分类特征时,它会记录这个错误并进行适当处理。不用等到运行时再报错,数据科学家在编译时就能找出大多数错误。

软件巨头Salesforce带来AutoML杀手TransmogrifAI

自动化特征工程(Transmogrification)

虽然找到正确的类型有助于数据推理和减少对下游的不良影响,但最终所有特征都是要被转换成数字表示的。只有这样,机器学习算法才能寻找并利用其中的规律。这个过程被称为特征工程。

举个例子,我们该怎么把美国的各个州(如CA, NY, TX等)转成数字?一种方法是把每个州映射为1到50之间的数字,因为美国一共有50个州。但这种编码方法的缺点在于没有保留州与州之间地理位置上的关系。那么如果我们计算州中心点到美国中心点的距离,并以此为编码依据呢?这确实可以解决之前提到的问题,但它同样无法反映东西南北位置。

所以特征工程的方法有无数种,但是找出正确的一种十分不容易。

TransmogrifAI可以帮数据科学家自动化这个恼人的过程。它为自己支持的所有特征类型提供了无数种编码技术,能做到不仅把数据转成算法可用的格式,还能优化转换,使机器学习算法更容易从数据中学习。例如,同样是年龄数字特征,它能根据特定问题(时尚行业、金融理财)把它们转成最合适的年龄段。

尽管TransmogrifAI已经具备了上述强大能力,但考虑到特征工程是一场无穷无尽的“博弈”,它也支持用户自定义和扩展默认值。

自动化特征验证(Feature Validation)

特征工程可能导致数据维度出现爆炸性增长,而高维数据往往会让模型出现差错!其中最典型的是模型过拟合,另一个容易被忽视但影响巨大的问题是数据泄露。

假设我们手头有一个包含交易信息的数据集,任务是预测最终的交易金额,而数据集上一个条目叫“已结算交易金额”,这是完成交易后才能统计到的信息。如果我们不慎把这个信息也放进训练集里,模型就会发现它的“可参考性”极强,最后成为一个测试时精度极高,实践时一无所用的废品。

事实上,在Salesforce业务中,这种后见之明的偏见尤其成问题,因为大部分客户的数据很复杂,平时也是自动填充的,这使得数据科学家很容易混淆因果关系。

TransgmogrifAI包含执行自动特征验证的算法,可以删除几乎没有预测能力的特征——随着时间的推移而使用的特征,表现出零方差的特征,或者在训练样本中的分布与预测时的分布存在显着不同的特征。在处理含有偏差的高维数据时,这些算法会用一系列基于特征类型的统计测试,结合特征谱系来检测和排除偏差。

自动化模型选择(Model Selection)

完成所有关于数据预处理的工作后,数据科学家就该把机器学习算法应用于准备好的数据以构建预测模型。如果是手动完成,他们往往需要尝试许多不同的算法,并找到合适的参数设置。这是个耗时的工程。

TransmogrifAI的模型选择器可以在数据上运行多种算法,并比较它们的平均验证错误,从中挑出最佳算法。除此之外,它还能通过适当地对数据进行采样并重新校准预测以匹配真实的先验,自动处理不平衡数据的问题,进一步提高模型性能。

超参数优化(Hyperparameter Optimization)

上述自动化步骤的基础都涉及超参数优化,它几乎无处不在。而就是这么一个耗时久、任务量重、让数据科学家望而生畏的操作,它背后的技术原理却不难,可以直接看成一个高性能模型和一个随机数生成器模型。这个任务,TransmogrifAI可以代劳。、

赋予每个人使用ML技术的权利

总的来看,现在TransmogrifAI在Salesforce内部已经成功把训练模型所需的总时间从几周、几个月缩短到了几个小时。而封装所有这些复杂操作的代码却非常简单,只需短短几行就能搞定:

// 读取交易数据

val dealData = DataReaders.Simple.csvCase[Deal](path = pathToData).readDataset().toDF()

// 提取原始信号,预测特征

val (isClosed, predictors) = FeatureBuilder.fromDataFrame[RealNN](dealData, response = "isClosed")

// 自动化特征工程

val featureVector = predictors.transmogrify()

// 自动化特征验证

val cleanFeatures = survived.sanityCheck(featureVector, removeBadFeatures = true)

// 自动化模型选择

val (pred, raw, prob) = BinaryClassificationModelSelector().setInput(isClosed, cleanFeatures).getOutput()

// 设置工作流程,训练模型

val model = newOpWorkflow().setInputDataset(dealData).setResultFeatures(pred).train()

这意味着TransmogrifAI已经成为一个变革。

在我们眼里,这种自动化水平的工具对开发面向企业的机器学习系统至关重要,因此我们也相信,随着机器学习在各行各业的应用场景不断拓宽,对运营方式产生巨大影响,未来企业对机器学习系统的需求会不断增大,而那时,TransmogrifAI这样的自动化机器学习库可以帮助他们实现目标,实现转变。

原文标题:又一个AutoML库:Salesforce开源TransmogrifAI

文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

如何使用多维网格空间进行改进K-means聚类算法资料概述

K-means算法是被广泛使用的一种聚类算法,传统的-means算法中初始聚类中心的选择具有随机性,....

发表于 12-13 17:56 5次 阅读
如何使用多维网格空间进行改进K-means聚类算法资料概述

首届国际中学生人工智能交流展示会,商汤布局人工智能教育生态的重要一环

对于参加的学生来说,这次的交流展示会不仅是展露自己才华的大舞台,同时也是提升自我的好机会,因为在整个....

的头像 商汤科技 发表于 12-13 17:01 395次 阅读
首届国际中学生人工智能交流展示会,商汤布局人工智能教育生态的重要一环

联发科技发布 Helio P90 引领AI超高清拍摄潮流

2018年12月13日联发科技今日正式发布HelioP90系统单芯片,搭载全新超强AI引擎APU2.....

发表于 12-13 17:00 145次 阅读
联发科技发布 Helio P90 引领AI超高清拍摄潮流

抛开AI体验 智能音箱未来突破点仍是硬件PK

关心科技数码产品的朋友对罗永浩一定不陌生,作为活跃在市场一线最受争议的科技创业者,罗永浩为用户带来了....

发表于 12-13 16:45 73次 阅读
抛开AI体验 智能音箱未来突破点仍是硬件PK

首席科学家施亮主题为《深度画像的反欺诈应用》的精彩演讲

结合用户属性标签和行为画像,这就是传统画像主要基于的数据点,它是有些优势的。这种数据容易制定一些策略....

的头像 中国人工智能学会 发表于 12-13 16:36 132次 阅读
首席科学家施亮主题为《深度画像的反欺诈应用》的精彩演讲

一个5G+AI的全智能时代正在到来

从电路交换,到全IP,到全云化,电信业的时代车轮不停滚动迭代向前。而今,时代车轮的换轨声再次响起,一....

的头像 网优雇佣军 发表于 12-13 15:54 168次 阅读
一个5G+AI的全智能时代正在到来

脑科学与人工智能带来的机遇和挑战在哪里

脑,尤其是人脑,构造非常复杂。脑有上百亿的神经元,还有分支等连接起来,是一个非常复杂的结构。

的头像 中国人工智能学会 发表于 12-13 15:44 123次 阅读
脑科学与人工智能带来的机遇和挑战在哪里

机器学习的12大经验总结

本文整理了关于机器学习研究者和从业者的 12 个宝贵经验,包括需要避免的陷阱、需要关注的重点问题、常....

的头像 Imagination Tech 发表于 12-13 15:29 115次 阅读
机器学习的12大经验总结

如果做得好 人工智能可以帮助我们学习如何成为更好的人

尽管现在有许多工作都非常适合由人工智能应用来做,但很显然,处理人类情感可能和其中任何一种都不同。人工....

发表于 12-13 14:47 73次 阅读
如果做得好 人工智能可以帮助我们学习如何成为更好的人

通过开发集和度量指标加速迭代

对于当前面临的新问题,我们很难提前知道使用哪种方法会是最合适的,即使是一个经验丰富的机器学习研究员,通常也需要在尝试多种...

发表于 12-13 14:06 131次 阅读
通过开发集和度量指标加速迭代

优化指标和满意度指标

下面我们来了解一下组合多个评估指标的另一种方法。 假设你既关心学习算法的准确率(accuracy),又在意其运行时间(running ...

发表于 12-13 13:58 138次 阅读
优化指标和满意度指标

人工智能渗入我们生活 AI开始进入技术主战场

从人工智能产业链来看,中国在基础层的发展还相对薄弱,而技术层的计算机视觉、语音识别和自然语言处理是中....

发表于 12-13 11:24 61次 阅读
人工智能渗入我们生活 AI开始进入技术主战场

代码保护之道——混淆的艺术

第三点是藏叶于林。安全是业务的天然属性,业务是安全的最佳载体。只有结合了业务的安全才是真正的安全,孤....

的头像 嵌入式资讯精选 发表于 12-13 11:11 225次 阅读
代码保护之道——混淆的艺术

48V轻混系统技术成研发重点 燃油车还可再续命10年

随着排放法规越来越严苛,动力总成的技术升级也迫在眉睫,其中48V轻混系统逐渐成为国内外车企的研发重点....

发表于 12-13 11:05 77次 阅读
48V轻混系统技术成研发重点 燃油车还可再续命10年

人工智能时代即将到来 我们需深度思考的问题将变得更多

由于人口基数的原因,大数据的来源及应用在中国可能有着更加现实的意义和更快的发展速度,也就意味着更多的....

发表于 12-13 10:56 61次 阅读
人工智能时代即将到来 我们需深度思考的问题将变得更多

让AI参与分娩 只能作为辅助者而不是决策者

人们越来越多地要求像Alexa这样的虚拟助手,仰望天空,看看你是否需要一把雨伞,他们这样做可能是明智....

发表于 12-13 10:27 52次 阅读
让AI参与分娩 只能作为辅助者而不是决策者

移动机器人想要“穿梭自如”,还需强大的算法支持

启发式搜索算法,是在状态空间中的搜索对每一个搜索的位置进行评估,得到最好的位置,再从这个位置进行搜索....

的头像 人工智能 发表于 12-13 10:12 180次 阅读
移动机器人想要“穿梭自如”,还需强大的算法支持

辽宁支持研发手术机器人等AI产业项目

记者从辽宁省卫健委了解到,辽宁近日宣布支持“互联网+”医疗健康人工智能技术,鼓励推动研发手术机器人、....

发表于 12-13 10:09 61次 阅读
辽宁支持研发手术机器人等AI产业项目

人工智能产业发展的三大热点和下一阶段的趋势预期浅析

人工智能在上一个五年的发展得益于什么?其下一阶段的发展程度取决于什么?近日,《哈佛商业评论》中文版联....

发表于 12-13 09:57 77次 阅读
人工智能产业发展的三大热点和下一阶段的趋势预期浅析

AI应用渗透率依然偏低 企业智能变革势在必行

人工智能技术的飞速发展正对各行各业带来深远影响,AI已被视为企业提升运营效能、应对市场竞争的必经之路....

发表于 12-13 09:45 48次 阅读
AI应用渗透率依然偏低 企业智能变革势在必行

5G真4K直播演示为用户开启了下一代沉浸体验

当晚,咪咕音乐、咪咕视频等六大平台同步直播了本届咪咕汇,在线观看人数6900万,人次1.8亿,连续三....

发表于 12-13 09:41 63次 阅读
5G真4K直播演示为用户开启了下一代沉浸体验

北汽驱动自主品牌上升的动力 依靠AI智能互联技术引领2.0时代

在今年的广州车展上,发布了预售价格的“绅宝智道”,无疑是北汽自主品牌再次发力的最好代表。而此次北汽驱....

发表于 12-13 08:59 349次 阅读
北汽驱动自主品牌上升的动力 依靠AI智能互联技术引领2.0时代

如何在声音频谱嵌入中加入记忆机制

为了存储一整秒的频率频谱(每时步5毫秒),我们需要一个包含200个元素的缓冲区,其中每个元素包含频率....

的头像 论智 发表于 12-13 08:48 143次 阅读
如何在声音频谱嵌入中加入记忆机制

视频+人工智能应用不可阻挡 政策与立法同样需要跟上技术的步伐

尤其值得关注的是,当人工智能技术在视频分析中成为常态应用时,社会发展、商业运营,以及我们的生活方式都....

发表于 12-12 17:08 324次 阅读
视频+人工智能应用不可阻挡 政策与立法同样需要跟上技术的步伐

AI促进软硬件系统齐升级 进一步推进物流行业发展

快速的数字化正迫使企业精细化经营,公司正在寻求变得更加灵活和高效。这一趋势在物流行业更具有现实代表性....

发表于 12-12 17:03 89次 阅读
AI促进软硬件系统齐升级 进一步推进物流行业发展

智慧安防的道路 终究是人机和谐为妙

伴随着2018北京安博会落幕,其也释放了安防行业朝着智慧安防转型的信号。相比于2017年AI大爆发元....

发表于 12-12 16:38 97次 阅读
智慧安防的道路 终究是人机和谐为妙

大数据对技术、应用特别是经济带来巨大的影响——未来经济将会被数据驱动!

在大数据带动下,半导体市场也发生了一些变化。2017年半导体的成绩非常好,甚至到2018年上半年,半....

的头像 Cadence楷登 发表于 12-12 16:30 501次 阅读
大数据对技术、应用特别是经济带来巨大的影响——未来经济将会被数据驱动!

百度三大新兴AI产业勃发 将在2019为行业创造更多价值

据了解,与2017年相比,政府在2018年出台的多项政策更加强调AI落地、AI与产业结合。2018年....

发表于 12-12 16:30 161次 阅读
百度三大新兴AI产业勃发 将在2019为行业创造更多价值

百度李彦宏成全球十大AI领军人物

还有谷歌CEO桑达尔·皮查伊、Salesforce创始人马克·贝尼奥夫、Faceboook CEO马....

的头像 满天芯 发表于 12-12 16:22 555次 阅读
百度李彦宏成全球十大AI领军人物

全球车哈弗F7爆红 背后是筹谋已久的布局

8月发布F系品牌,9月首款车型F5上市,紧接着又在11月6日推出了F系旗舰车型哈弗F7。哈弗F系诞生....

发表于 12-12 16:17 161次 阅读
全球车哈弗F7爆红 背后是筹谋已久的布局

荣耀V20的真机曝光搭载魅眼全视屏极窄的下巴营造出惊艳的效果

随文字还有3张荣耀V20的真机海报,如上图,搭载魅眼全视屏的荣耀V20不断变换场景,但不变的是超高的....

发表于 12-12 16:13 107次 阅读
荣耀V20的真机曝光搭载魅眼全视屏极窄的下巴营造出惊艳的效果

无人机正成为众多行业的基础设施

无人机正在成为越来越多行业的基础设施大疆创新总裁罗镇华无人机正在成为越来越多行业的基础设施,也将成为....

的头像 无人机网 发表于 12-12 14:27 181次 阅读
无人机正成为众多行业的基础设施

云+AI成下一次科技革命发展趋势

20年前,互联网的出现,改变了人们信息传递的方式,进而人类整个生活发生翻天覆地的变化。

的头像 AI聂潜 发表于 12-12 14:25 228次 阅读
云+AI成下一次科技革命发展趋势

TechSee获融资 将继续研发计算机视觉加AR的可视化AI客服解决方案

12月12日消息,以色列初创公司TechSee宣布获得1600万美元(约合人民币1.1亿)B轮融资。....

发表于 12-12 13:42 75次 阅读
TechSee获融资 将继续研发计算机视觉加AR的可视化AI客服解决方案

计算机视觉是否是深度学习落地的好赛道

计算机视觉是目前AI在中国落地最顺利的技术。从目前的落地进展来看,移动互联网、安防、零售、物流、医疗....

的头像 电子发烧友网工程师 发表于 12-12 13:34 263次 阅读
计算机视觉是否是深度学习落地的好赛道

2019年七大AI科技趋势盘点 或将在未来五年内带来重大中断并带来机遇

尽管科幻小说可能将人工智能机器人描绘成坏人,但一些科技巨头现在也将其用于安全。 微软和优步等公司使用....

发表于 12-12 11:40 112次 阅读
2019年七大AI科技趋势盘点 或将在未来五年内带来重大中断并带来机遇

随着人工智能技术的入注 安防行业将迎来变革

纵观全球安防市场,早先安防以“人防+物妨”为主,所涉及的人力、物力甚多,却通常达不到预期的效果。而在....

发表于 12-12 11:33 495次 阅读
随着人工智能技术的入注 安防行业将迎来变革

使用单值评估指标进行优化

所谓的单值评估指标(single-number evaluation metric)有很多,分类准确率就是其中的一种:待你在开发集(或测试集)上运行分类...

发表于 12-12 11:33 132次 阅读
使用单值评估指标进行优化

当5G与AI技术深度融合将产生怎样的巨变

近几年,科技界有两大领域越来越热:一个是5G,一个是AI。两者都是能够改变时代的颠覆性技术。

的头像 悟空智能科技 发表于 12-12 10:24 428次 阅读
当5G与AI技术深度融合将产生怎样的巨变

沃尔玛引进清洁机器人 人工智能已经悄然接近

沃尔玛将为其少数百家门店配置共360台清洁机器人。在工作人员输入地图后这些AI清洁工就可以自在穿梭在....

发表于 12-12 10:11 118次 阅读
沃尔玛引进清洁机器人 人工智能已经悄然接近

全新发布的vivo双屏NEX带你畅想未来

12月11日晚间消息,vivo今晚发布了NEX双屏版,售价4998元,12月29日开售。

的头像 CINNO 发表于 12-12 10:10 261次 阅读
全新发布的vivo双屏NEX带你畅想未来

人工智能应用在商业领域的应用近况

虽然人工智能的使用仍处于早期阶段,但结果表明它已获得了有意义的回报。 当受访者被问及他们在使用人工智....

的头像 将门创投 发表于 12-12 10:00 290次 阅读
人工智能应用在商业领域的应用近况

百度在AI领域的布局策略 大致可以看出以下这三个关键词

来自技术咨询和服务提供商Infosys的全球性调查报告显示,企业AI 已经走过了实验性阶段,它们已被....

发表于 12-12 09:55 511次 阅读
百度在AI领域的布局策略 大致可以看出以下这三个关键词

TensorFlow 2.0中关于Keras的一些新功能和重大变化

Keras有以下几大关键优点:用户友好、模块化、可组合、容易扩展,既适合新手,也适合专家。这些优点加....

的头像 电子发烧友网工程师 发表于 12-12 09:55 163次 阅读
TensorFlow 2.0中关于Keras的一些新功能和重大变化

5G+AI+边缘让工厂变得更智能 物联网让员工更安全高效

全球的人口老龄化问题有多严重?或许,当你乘坐飞往欧洲的航班,看到坚守在岗位上的外国空姐老奶奶时可能会....

发表于 12-12 09:30 71次 阅读
5G+AI+边缘让工厂变得更智能 物联网让员工更安全高效

英伟达再出新研究成果 可以渲染合成交互式3D环境的AI技术

据透露,英伟达最新研发的这项成果,是可以渲染合成交互式3D环境的AI技术。在创建逼真的3D环境时,英....

发表于 12-12 09:22 71次 阅读
英伟达再出新研究成果 可以渲染合成交互式3D环境的AI技术

推荐3本经典深度学习教程,会改文风的AI来了!

令人更加印象深刻的是,另一项测试中的研究人员使用该系统同时控制句子的多种属性,包括情绪,时态,声音和....

的头像 新智元 发表于 12-12 09:21 274次 阅读
推荐3本经典深度学习教程,会改文风的AI来了!

传统安防企业也扛起AI大旗 顺势走上风口

AI在安防产业的应用早已长达数年,在AI刚落在安防产业时,以海康、大华、科达、宇视为首的安防企业纷纷....

发表于 12-12 09:13 92次 阅读
传统安防企业也扛起AI大旗 顺势走上风口

哪种编程语言将在2019年统治机器学习?

如今,Python和R语言通常在机器学习中占主导地位,在开发人员普及方面,Python仍然是增长最快....

的头像 新智元 发表于 12-12 09:04 232次 阅读
哪种编程语言将在2019年统治机器学习?

人工智能赋能更多医疗创新,诊断、检测、筛选应用多

导读:从12月8日圆满落幕的第二届松山湖超越摩尔技术创新论坛,可以看出人工智能(AI)带来了更多的医....

的头像 行业观察 发表于 12-11 20:55 1594次 阅读
人工智能赋能更多医疗创新,诊断、检测、筛选应用多

使用 Python 开始机器学习

在这篇文章中我们会讲Python的重要特征和它适用于机器学习的原因,介绍一些重要的机器学习包,以及其他你可以获取更详细资源的地...

发表于 12-11 18:37 55次 阅读
使用 Python 开始机器学习

联想正式开始输出AI能力 LeapAI平台的独特性保证了企业的竞争力

历经两次低谷之后,AI技术在2010年又一次迎来了爆发,巨头们都率先投入资源进行AI技术的研发。因此....

发表于 12-11 17:11 487次 阅读
联想正式开始输出AI能力 LeapAI平台的独特性保证了企业的竞争力

各种有可能成为下一个大事物的颠覆性技术汇编

机器人也许目前还没找到适合日常生活的有趣应用,它的大部分潜能仍停留在生产制造中。而“Cobot”这个....

的头像 人工智能 发表于 12-11 17:08 737次 阅读
各种有可能成为下一个大事物的颠覆性技术汇编

芯片管制困难 AI海外市场值得拓展

近日,包括富邦证券、东吴基金、海富通在内的42家机构对安防巨头海康威视进行了实地调研,海康威视副总经....

发表于 12-11 17:06 468次 阅读
芯片管制困难 AI海外市场值得拓展

开发集和测试集应该有多大?

开发集的规模应该尽可能的大,至少要能够区分出你所尝试的不同算法之间的性能差异。例如,如果分类器 A 的准确率为 90.0% ,而分...

发表于 12-10 10:23 139次 阅读
开发集和测试集应该有多大?

开发集和测试集应该服从同一分布

根据公司的核心市场分布情况,你将猫咪app的图像数据划分为“美国”、“中国”、“印度”和“其它地区”四个区域。在设立开发集和...

发表于 12-10 10:15 128次 阅读
开发集和测试集应该服从同一分布

深度学习中开发集和测试集的定义

继续分析我们之前提到的猫咪图片的案例:现在你负责运营一个移动端 app,用户会向这个app 上传许多不同内容的图片。而你希望这个...

发表于 11-30 16:58 316次 阅读
深度学习中开发集和测试集的定义

机器学习训练秘籍——吴恩达

1 机器学习为什么需要策略? 机器学习(machine learning)已然成为无数重要应用的基石——如今,在网络搜索、垃圾邮件检测、语音...

发表于 11-30 16:45 150次 阅读
机器学习训练秘籍——吴恩达

物联网中机器学习的挑战和机遇

]。

发表于 11-27 09:33 168次 阅读
物联网中机器学习的挑战和机遇

大规模特征构建实践总结

背景 一般大公司的机器学习团队,才会尝试构建大规模机器学习模型,如果去看百度、头条、阿里等分享,都有提到过这类模型。当...

发表于 11-19 09:35 354次 阅读
大规模特征构建实践总结