张飞软硬开源基于STM32 BLDC直流无刷电机驱动器开发视频套件,👉戳此立抢👈

怎样成为一名合格的算法工程师

工程师人生 2019-02-15 11:39 次阅读

成为一名合格的开发工程师不是一件简单的事情,需要掌握从开发到调试到优化等一系列能力,这些能力中的每一项掌握起来都需要足够的努力和经验。

成为一名合格的开发工程师不是一件简单的事情,需要掌握从开发到调试到优化等一系列能力,这些能力中的每一项掌握起来都需要足够的努力和经验。而要成为一名合格的机器学习算法工程师(以下简称算法工程师)更是难上加难,因为在掌握工程师的通用技能以外,还需要掌握一张不算小的机器学习算法知识网络。下面我们就将成为一名合格的算法工程师所需的技能进行拆分,一起来看一下究竟需要掌握哪些技能才能算是一名合格的算法工程师。

怎样成为一名合格的算法工程师

基础开发能力

所谓算法工程师,首先需要是一名工程师,那么就要掌握所有开发工程师都需要掌握的一些能力。有些同学对于这一点存在一些误解,认为所谓算法工程师就只需要思考和设计算法,不用在乎这些算法如何实现,而且会有人帮你来实现你想出来的算法方案。这种思想是错误的,在大多数企业的大多数职位中,算法工程师需要负责从算法设计到算法实现再到算法上线这一个全流程的工作。笔者曾经见过一些企业实行过算法设计与算法实现相分离的组织架构,但是在这种架构下,说不清楚谁该为算法效果负责,算法设计者和算法开发者都有一肚子的苦水,具体原因不在本文的讨论范畴中,但希望大家记住的是,基础的开发技能是所有算法工程师都需要掌握的。

基础开发所涉及到的技能非常的多,在这里只挑选了两个比较重要的点来做阐述。

单元测试

在企业应用中,一个问题的完整解决方案通常包括很多的流程,这其中每个环节都需要反复迭代优化调试,如何能够将复杂任务进行模块划分,并且保证整体流程的正确性呢?最实用的方法就是单元测试。单元测试并不只是简单的一种测试技能,它首先是一种设计能力。并不是每份代码都可以做单元测试,能做单元测试的前提是代码首先是可以划分为多个单元——也就是模块的。在把项目拆解成可独立开发和测试的模块之后,再加上对每个模块的独立的、可重复的单元测试,就可以保证每个模块的正确性,如果每个模块的正确性都可以保证,那么整体流程的正确性就可以得到保证。

对于算法开发这种流程变动频繁的开发活动来讲,做好模块设计和单元测试是不给自己和他人挖坑的重要保证。也是能让自己放心地对代码做各种改动优化的重要前提。

逻辑抽象复用

逻辑的抽象复用可以说是所有软件开发活动中最为重要的一条原则,衡量一个程序员代码水平的重要原则之一就是看他代码中重复代码和相似代码的比例。大量重复代码或相似代码背后反映的是工程师思维的懒惰,因为他觉得复制粘贴或者直接照着抄是最省事的做法。这样做不仅看上去非常的丑陋,而且也非常容易出错,更不用提维护起来的难度。

算法开发的项目中经常会有很多类似逻辑的出现,例如对多个特征使用类似的处理方法,还有原始数据ETL中的很多类似处理方法。如果不对重复逻辑做好抽象,代码看上去全是一行行的重复代码,无论是阅读起来还是维护起来都会非常麻烦。

概率和统计基础

概率和统计可以说是机器学习领域的基石之一,从某个角度来看,机器学习可以看做是建立在概率思维之上的一种对不确定世界的系统性思考和认知方式。学会用概率的视角看待问题,用概率的语言描述问题,是深入理解和熟练运用机器学习技术的最重要基础之一。

概率论内容很多,但都是以具体的一个个分布为具体表现载体体现出来的,所以学好常用的概率分布及其各种性质对于学好概率非常重要。对于离散数据,伯努利分布、二项分布、多项分布、Beta分布、狄里克莱分布以及泊松分布都是需要理解掌握的内容;对于离线数据,高斯分布和指数分布族是比较重要的分布。这些分布贯穿着机器学习的各种模型之中,也存在于互联网和真实世界的各种数据之中,理解了数据的分布,才能知道该对它们做什么样的处理。

此外,假设检验的相关理论也需要掌握。在这个所谓的大数据时代,最能骗人的大概就是数据了,掌握了假设检验和置信区间等相关理论,才能具备分辨数据结论真伪的能力。例如两组数据是否真的存在差异,上线一个策略之后指标是否真的有提升等等。这种问题在实际工作中非常常见,不掌握相关能力的话相当于就是大数据时代的睁眼瞎。

在统计方面,一些常用的参数估计方法也需要掌握,典型的如最大似然估计、最大后验估计、EM算法等。这些理论和最优化理论一样,都是可以应用于所有模型的理论,是基础中的基础。

机器学习理论

虽然现在开箱即用的开源工具包越来越多,但并不意味着算法工程师就可以忽略机器学习基础理论的学习和掌握。这样做主要有两方面的意义:

掌握理论才能对各种工具、技巧灵活应用,而不是只会照搬套用。只有在这个基础上才能够真正具备搭建一套机器学习系统的能力,并对其进行持续优化。否则只能算是机器学习搬砖工人,算不得合格的工程师。出了问题也不会解决,更谈不上对系统做优化。

学习机器学习的基础理论的目的不仅仅是学会如何构建机器学习系统,更重要的是,这些基础理论里面体现的是一套思想和思维模式,其内涵包括概率性思维、矩阵化思维、最优化思维等多个子领域,这一套思维模式对于在当今这个大数据时代做数据的处理、分析和建模是非常有帮助的。如果你脑子里没有这套思维,面对大数据环境还在用老一套非概率的、标量式的思维去思考问题,那么思考的效率和深度都会非常受限。

机器学习的理论内涵和外延非常之广,绝非一篇文章可以穷尽,所以在这里我列举了一些比较核心,同时对于实际工作比较有帮助的内容进行介绍,大家可在掌握了这些基础内容之后,再不断探索学习。

基础理论

所谓基础理论,指的是不涉及任何具体模型,而只关注“学习”这件事本身的一些理论。以下是一些比较有用的基础概念:

VC维。 VC维是一个很有趣的概念,它的主体是一类函数,描述的是这类函数能够把多少个样本的所有组合都划分开来。VC维的意义在哪里呢?它在于当你选定了一个模型以及它对应的特征之后,你是大概可以知道这组模型和特征的选择能够对多大的数据集进行分类的。此外,一类函数的VC维的大小,还可以反应出这类函数过拟合的可能性。

信息论。从某种角度来讲,机器学习和信息论是同一个问题的两个侧面,机器学习模型的优化过程同时也可以看作是最小化数据集中信息量的过程。对信息论中基本概念的了解,对于机器学习理论的学习是大有裨益的。例如决策树中用来做分裂决策依据的信息增益,衡量数据信息量的信息熵等等,这些概念的理解对于机器学习问题神本的理解都很有帮助。这部分内容可参考《Elements of Information Theory》这本书。

正则化和bias-variance tradeoff。如果说现阶段我国的主要矛盾是“人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾”,那么机器学习中的主要矛盾就是模型要尽量拟合数据和模型不能过度拟合数据之间的矛盾。而化解这一矛盾的核心技术之一就是正则化。正则化的具体方法不在此讨论,但需要理解的,是各种正则化方法背后透露出的思想:bias-variance tradoff。在不同利益点之间的平衡与取舍是各种算法之间的重要差异,理解这一点对于理解不同算法之间的核心差异有着非常重要的作用。

最优化理论。绝大多数机器学习问题的解决,都可以划分为两个阶段:建模和优化。所谓建模就是后面我们会提到的各种用模型来描述问题的方法,而优化就是建模完成之后求得模型的最优参数的过程。机器学习中常用的模型有很多,但背后用到的优化方法却并没有那么多。换句话说,很多模型都是用的同一套优化方法,而同一个优化方法也可以用来优化很多不同模型。对各种常用优化方法的和思想有所有了解非常有必要,对于理解模型训练的过程,以及解释各种情况下模型训练的效果都很有帮助。这里面包括最大似然、最大后验、梯度下降、拟牛顿法、L-BFGS等。

机器学习的基础理论还有很多,可以先从上面的概念学起,把它们当做学习的起点,在学习过程中还会遇到其他需要学习的内容,就像一张网络慢慢铺开一样,不断积累自己的知识。这方面基础理论的学习,除了Andrew Ng的著名课程以外,《Learning from Data》这门公开课也非常值得大家学习,这门课没有任何背景要求,讲授的内容是在所有模型之下的基础中的基础,非常地靠近机器学习的内核本质。这门课的中文版本叫做《机器学习基石》,也可以在网上找到,其讲授者是上面英文版本讲授者的学生。

有监督学习

在了解了机器学习的基本概念之后,就可以进入到一些具体模型的学习中了。在目前的工业实践中,有监督学习的应用面仍然是最广泛的,这是因为我们现实中遇到的很多问题都是希望对某个事物的某个属性做出预测,而这些问题通过合理的抽象和变换,都可以转化为有监督学习的问题。

在学习复杂模型之前,我建议大家都先学习几个最简单的模型,典型的如朴素贝叶斯。朴素贝叶斯有很强的假设,这个假设很多问题都不满足,模型结构也很简单,所以其优化效果并不是最好的。但也正是由于其简单的形式,非常利于学习者深入理解整个模型在建模和优化过程中的每一步,这对于搞清楚机器学习是怎么一回事情是非常有用的。同时,朴素贝叶斯的模型形式通过一番巧妙的变换之后,可以得到和逻辑回归形式上非常统一的结果,这无疑提供了对逻辑回归另外一个角度的解释,对于更加深刻理解逻辑回归这一最常用模型有着非常重要的作用。

在掌握了机器学习模型的基础流程之后,需要学习两种最基础的模型形式:线性模型和树形模型,分别对应着线性回归/逻辑回归和决策回归/分类树。现在常用的模型,无论是浅层模型还是深度学习的深层模型,都是基于这两种基础模型形式变幻而来。而学习这两种模型的时候需要仔细思考的问题是:这两种模型的本质差异是什么?为什么需要有这两种模型?他们在训练和预测的精度、效率、复杂度等方面有什么差异?了解清楚这些本质的差异之后,才可以做到根据问题和数据的具体情况对模型自如运用。

在掌握了线性模型和树形模型这两种基础形式之后,下一步需要掌握的是这两种基础模型的复杂形式。其中线性模型的复杂形式就是多层线性模型,也就是神经网络。树模型的复杂形式包括以GDBT为代表的boosting组合,以及以随机森林为代表的bagging组合。这两种组合模型的意义不仅在于模型本身,boosting和bagging这两种组合思想本身也非常值得学习和理解,这代表了两种一般性的强化方法:boosting的思想是精益求精,不断在之前的基础上继续优化;而bagging的思想是“三个臭裨将顶一个诸葛亮”,是通过多个弱分类器的组合来得到一个强分类器。这两种组合方法各有优劣,但都是在日常工作中可以借鉴的思想。例如在推荐系统中所我们经常会使用多个维度的数据做召回源,从某个角度来看就是一种bagging的思想:每个单独召回源并不能给出最好表现,但是多个召回源组合之后,就可以得到比每个单独召回源都要好的结果。所以说思想比模型本身更重要。

无监督学习

有监督学习虽然目前占了机器学习应用的大多数场景,但是无监督学习无论从数据规模还是作用上来讲也都非常的重要。无监督学习的一大类内容是在做聚类,做聚类的意义通常可以分为两类:一类是将聚类结果本身当做最终的目标,另一类是将聚类的结果再作为特征用到有监督学习中。但这两种意义并不是和某种聚类方法具体绑定,而只是聚类之后结果的不同使用方式,这需要在工作中不断学习、积累和思考。而在入门学习阶段需要掌握的,是不同聚类算法的核心差异在哪里。例如最常用的聚类方法中,kmeans和DBSCAN分别适合处理什么样的问题?高斯混合模型有着什么样的假设?LDA中文档、主题和词之间是什么关系?这些模型最好能够放到一起来学习,从而掌握它们之间的联系和差异,而不是把他们当做一个个孤立的东西来看待。

除了聚类以外,近年来兴起的嵌入表示(embedding representation)也是无监督学习的一种重要方法。这种方法和聚类的差异在于,聚类的方法是使用已有特征对数据进行划分,而嵌入表示则是创造新的特征,这种新的特征是对样本的一种全新的表示方式。这种新的表示方法提供了对数据全新的观察视角,这种视角提供了数据处理的全新的可能性。此外,这种做法虽然是从NLP领域中兴起,但却具有很强的普适性,可用来处理多种多样的数据,都可以得到不错的结果,所以现在已经成为一种必备的技能。

机器学习理论方面的学习可以从《An Introduction to Statistical Learning with Application in R》开始,这本书对一些常用模型和理论基础提供了很好的讲解,同时也有适量的习题用来巩固所学知识。进阶学习可使用上面这本书的升级版《Elements of Statistical Learning》和著名的《Pattern Recognition and Machine Learning》。

开发语言和开发工具

掌握了足够的理论知识,还需要足够的工具来将这些理论落地,这部分我们介绍一些常用的语言和工具。

开发语言

近年来Python可以说是数据科学和算法领域最火的语言,主要原因是它使用门槛低,上手容易,同时具有着完备的工具生态圈,同时各种平台对其支持也比较好。所以Python方面我就不再赘述。但是在学习Python以外,我建议大家可以再学习一下R语言,主要原因有以下几点:

R语言具有最完备的统计学工具链。我们在上面介绍了概率和统计的重要性,R语言在这方面提供的支持是最全面的,日常的一些统计方面的需求,用R来做可能要比用Python来做还要更快。Python的统计科学工具虽然也在不断完善,但是R仍然是统计科学最大最活跃的社区。

**向量化、矩阵化和表格化思维的培养。**R中的所有数据类型都是向量化的,一个整形的变量本质上是一个长度为一的一维向量。在此基础上R语言构建了高效的矩阵和(DataFrame)数据类型,并且在上面支持了非常复杂而又直观的操作方法。这套数据类型和思考方式也在被很多更现代化的语言和工具所采纳,例如Numpy中的ndarray,以及Spark最新版本中引入的DataFrame,可以说都是直接或间接从R语言得到的灵感,定义在上面的数据操作也和R中对DataFrame和向量的操作如出一辙。就像学编程都要从C语言学起一样,学数据科学和算法开发我建议大家都学一下R,学的既是它的语言本身,更是它的内涵思想,对大家掌握和理解现代化工具都大有裨益。

除了R以外,Scala也是一门值得学习的语言。原因在于它是目前将面向对象和函数式两种编程范式结合得比较好的一种语言,因为它不强求你一定要用函数式去写代码,同时还能够在能够利用函数式的地方给予了足够的支持。这使得它的使用门槛并不高,但是随着经验和知识的不断积累,你可以用它写出越来越高级、优雅的代码。

开发工具

开发工具方面,Python系的工具无疑是实用性最高的,具体来说,Numpy、Scipy、sklearn、pandas、Matplotlib组成的套件可以满足单机上绝大多数的分析和训练工作。但是在模型训练方面,有一些更加专注的工具可以给出更好的训练精度和性能,典型的如LibSVM、Liblinear、XGBoost等。

大数据工具方面,目前离线计算的主流工具仍然是Hadoop和Spark,实时计算方面Spark Streaming和Storm也是比较主流的选择。近年来兴起的新平台也比较多,例如Flink和Tensorflow都是值得关注的。值得一提的是,对于Hadoop和Spark的掌握,不仅要掌握其编码技术,同时还要对其运行原理有一定理解,例如,Map-Reduce的流程在Hadoop上是如何实现的,Spark上什么操作比较耗时,aggregateByKey和groupByKey在运行原理上有什么差异,等等。只有掌握了这些,才能对这些大数据平台运用自如,否则很容易出现程序耗时过长、跑不动、内存爆掉等等问题。

架构设计

最后我们花一些篇幅来谈一下机器学习系统的架构设计。所谓机器学习系统的架构,指的是一套能够支持机器学习训练、预测、服务稳定高效运行的整体系统以及他们之间的关系。在业务规模和复杂度发展到一定程度的时候,机器学习一定会走向系统化、平台化这个方向。这个时候就需要根据业务特点以及机器学习本身的特点来设计一套整体架构,这里面包括上游数据仓库和数据流的架构设计,以及模型训练的架构,还有线上服务的架构等等。这一套架构的学习就不像前面的内容那么简单了,没有太多现成教材可以学习,更多的是在大量实践的基础上进行抽象总结,对当前系统不断进行演化和改进。但这无疑是算法工程师职业道路上最值得为之奋斗的工作。在这里能给的建议就是多实践,多总结,多抽象,多迭代。

机器学习算法工程师领域现状

现在可以说是机器学习算法工程师最好的时代,各行各业对这类人才的需求都非常旺盛。典型的包括以下一些细分行业:

推荐系统。推荐系统解决的是海量数据场景下信息高效匹配分发的问题,在这个过程中,无论是候选集召回,还是结果排序,以及用户画像等等方面,机器学习都起着重要的作用。

广告系统。广告系统和推荐系统有很多类似的地方,但也有着很显著的差异,需要在考虑平台和用户之外同时考虑广告主的利益,两方变成了三方,使得一些问题变复杂了很多。它在对机器学习的利用方面也和推荐类似。

搜索系统。搜索系统的很多基础建设和上层排序方面都大量使用了机器学习技术,而且在很多网站和App中,搜索都是非常重要的流量入口,机器学习对搜索系统的优化会直接影响到整个网站的效率。

风控系统。风控,尤其是互联网金融风控是近年来兴起的机器学习的又一重要战场。不夸张地说,运用机器学习的能力可以很大程度上决定一家互联网金融企业的风控能力,而风控能力本身又是这些企业业务保障的核心竞争力,这其中的关系大家可以感受一下。

但是所谓“工资越高,责任越大”,企业对于算法工程师的要求也在逐渐提高。整体来说,一名高级别的算法工程师应该能够处理“数据获取→数据分析→模型训练调优→模型上线”这一完整流程,并对流程中的各种环节做不断优化。一名工程师入门时可能会从上面流程中的某一个环节做起,不断扩大自己的能力范围。

除了上面列出的领域以外,还有很多传统行业也在不断挖掘机器学习解决传统问题的能力,行业的未来可谓潜力巨大。

收藏 人收藏
分享:

评论

相关推荐

如何快速提升单片机开发效率

主题简介及亮点:如今环境下电子工程师缺乏系统性的工程技能训练,而测试与调试技术更是其中的关键,本次直播通过对示波器与逻辑
发表于 03-01 00:00 0次 阅读
如何快速提升单片机开发效率

怎么利用FPGA研究高速路由查找算法?

随着网络流量的不断增加和路由表容量的不断增大,路由查找已经成为制约因特网的主要瓶颈。尽管采用CIDR技术能产生聚集路由,...
发表于 08-15 07:23 22次 阅读
怎么利用FPGA研究高速路由查找算法?

机器学习算法帮助我们做出更好的决定

机器学习算法,可以帮助我们做出更好的决策,通过将人类的偏见最小化,使用更完整的数据集,或者弥补我们决....
的头像 视听前线音响短评 发表于 08-14 16:47 123次 阅读
机器学习算法帮助我们做出更好的决定

无人机光流模块使用技巧

无人机光流模块使用技巧 光流模块在无 GPS 环境下,课实时检测飞机水平移动距离,实现对四轴无人机长时间的稳定悬停。图1显示...
发表于 08-12 16:00 184次 阅读
无人机光流模块使用技巧

未来电子工程师发展前景在哪里

产品体验发生了巨大变化,但设计师依赖于制作这些体验的工具正在努力追赶。如果事情不会很快发生变化,工具....
的头像 PCB线路板打样 发表于 08-12 11:33 72次 阅读
未来电子工程师发展前景在哪里

矩阵论程云鹏第三版PDF电子书免费下载

《矩阵论(第3版)》共分7章,主要介绍线性空间与线性变换,矩阵范数,矩阵分析,矩阵分解,特征值估计,....
发表于 08-12 08:00 17次 阅读
矩阵论程云鹏第三版PDF电子书免费下载

怎样推动人工智能和金融相互融合

某些智能金融业务和操作还处于政策模糊地带,监管科技落后于市场发展等。
发表于 08-11 11:34 51次 阅读
怎样推动人工智能和金融相互融合

那些常用的 Unix 命令,你不知道的功能!

我逐渐意识到,Unix 的命令行工具可以解决一切与文字处理有关的问题。
的头像 Linux爱好者 发表于 08-11 10:04 165次 阅读
那些常用的 Unix 命令,你不知道的功能!

Improved SRN——最强人脸检测算法!

今天我们不说计算机视觉基础知识,接下来说说AAAI2019一篇比较新颖的Paper,其是中科院自动化....
的头像 传感器技术 发表于 08-09 16:06 178次 阅读
Improved SRN——最强人脸检测算法!

简述机器学习算法要点

当我们要处理很多数据来做一个有高预测能力的预测时,我们会用到 GBM 和 AdaBoost 这两种 ....
的头像 ADAS 发表于 08-09 10:25 176次 阅读
简述机器学习算法要点

统计机器学习常见算法分类的学习方式

像聚类算法一样,降低维度算法试图分析数据的内在结构,不过降低维度算法是以非监督学习的方式试图利用较少....
的头像 ADAS 发表于 08-09 10:16 234次 阅读
统计机器学习常见算法分类的学习方式

详细介绍ADAS算法

Hash是一种典型以空间换时间的算法,比如原来一个长度为100的数组,对其查找,只需要遍历且匹配相应....
的头像 ADAS 发表于 08-08 17:34 166次 阅读
详细介绍ADAS算法

CRC算法原理和CRC编码的实现方式与使用Verilog对CRC编码进行描述

CRC 校验是一种在数据通信系统和其它串行传输系统中广泛使用的错误检测手段。通用的CRC 标准有CR....
发表于 08-06 16:39 57次 阅读
CRC算法原理和CRC编码的实现方式与使用Verilog对CRC编码进行描述

人脸识别的三大模式

人脸识别技术已成人工智能最火热的应用之一,如刷脸登机、刷脸取厕纸、刷脸支付、刷脸考勤、刷脸识别闯红灯的行人、刷脸人脸识别...
发表于 08-06 14:15 182次 阅读
人脸识别的三大模式

什么是模拟电路?

作为一个电子工程师,您真正掌握了模拟电路技术吗?掌握模拟电路分为三个层次:初级层次、中级层次、高级层次。 ...
发表于 08-06 07:52 45次 阅读
什么是模拟电路?

电子工程师的四大发展方向

有什么样的能力,你才能去做什么样的事。先让自己具备拿高薪的素质,只要肯付出,肯定会有回报的,准备做好....
的头像 工程师人生 发表于 08-05 16:10 133次 阅读
电子工程师的四大发展方向

电子工程师有没有什么机会从挖矿产业中分一杯羹

近期笔者对数字货币的挖矿比较感兴趣,根据这段时间学习的内容,整理了本篇文章,算是一个梳理。
的头像 工程师人生 发表于 08-05 15:57 142次 阅读
电子工程师有没有什么机会从挖矿产业中分一杯羹

电子工程师入门须知

电子新手刚开始缺乏电子行业的整体思路,缺乏对工作上的事情深入分析,让他们觉得没有事情做;缺乏与同事的....
的头像 工程师人生 发表于 08-05 15:52 117次 阅读
电子工程师入门须知

‍‍‍e络盟新技术发布为设计师拓展知识和技能

传统硅电源设备在阻断电压、运行温度和开关特征方面已经达到极限。本文献概述了 SiC(碳化硅)技术的最....
的头像 易络盟电子 发表于 08-05 14:57 97次 阅读
‍‍‍e络盟新技术发布为设计师拓展知识和技能

通过机器学习基于演员们维持稳定工作量的能力来定义、量化甚至预测演员的成功

本次研究认为演员的“活跃度”和“作品产量”是定义其成功与否的重要因素,而非我们从前认为的“知名度”和....
的头像 将门创投 发表于 08-02 15:36 142次 阅读
通过机器学习基于演员们维持稳定工作量的能力来定义、量化甚至预测演员的成功

研究人员提出了一种多尺度高效率的新模型FAMED-Net

而基于学习的方法采用了数据驱动的方法来学习出图像特征和透射率之间的关系,克服了手工选取先验特征的不足....
的头像 将门创投 发表于 08-02 15:08 185次 阅读
研究人员提出了一种多尺度高效率的新模型FAMED-Net

基于学习的数据增强策略扩充你的数据集!

数据增强广泛是机器学习中常用的数据处理手段,不同的数据集通常会利用针对性的数据处理手段来处理。例如M....
的头像 将门创投 发表于 08-02 15:00 256次 阅读
基于学习的数据增强策略扩充你的数据集!

一种解偶人脸属性与化妆属性的妆容解偶迁移器

在这篇文章中,研究人员提出了一种称为解偶妆容迁移器(disentangled makeup tran....
的头像 将门创投 发表于 08-02 14:36 297次 阅读
一种解偶人脸属性与化妆属性的妆容解偶迁移器

未来媒体的竞争力来自于哪里

在人工智能不断发展的过程中,媒体需要探索将人工智能运用在新闻采集、生产、分发、接收、反馈中,用主流价....
发表于 07-30 15:39 410次 阅读
未来媒体的竞争力来自于哪里

AI支持的测谎仪

针对人工智能(AI)算法的网络攻击新闻已不再罕见,现在几乎每天都在发生。
的头像 网易智能 发表于 07-30 09:48 347次 阅读
AI支持的测谎仪

刷脸的安全如何来保证

在信息爆炸的时代,数据的处理、分析、应用很多都是由算法来实现的,越来越多的决策正被算法所取代。
发表于 07-30 09:19 434次 阅读
刷脸的安全如何来保证

英特尔收购Mobileye——算法和芯片协同进化的时代已经到来

如果说过去是算法根据芯片进行优化设计的时代,那么英特尔对 Mobileye 的收购,预示着一个新时代....
的头像 智车科技 发表于 07-29 09:43 447次 阅读
英特尔收购Mobileye——算法和芯片协同进化的时代已经到来

科普 | 商业分析与数据分析、算法模型的关系与区别

我们常说,办事情要“名正言顺”,而数据领域的名字则是格外的多,商业分析、数据分析、数据挖掘、算法模型....
的头像 人工智能爱好者社区 发表于 07-28 11:49 629次 阅读
科普 | 商业分析与数据分析、算法模型的关系与区别

六轴并联机器人——拥有最复杂算法并联机器人产品

Stewart平台以其特有的大刚度、高精度和高载荷自重比等特点,适用于高精度、大载荷且对工作空间的要....
的头像 高工机器人 发表于 07-26 09:32 325次 阅读
六轴并联机器人——拥有最复杂算法并联机器人产品

新手四旋翼算法的资料和程序总结免费下载

本文档的主要内容详细介绍的是新手四旋翼算法的资料和程序总结免费下载 首先,程序中一般用了两种求解姿态....
发表于 07-25 17:08 43次 阅读
新手四旋翼算法的资料和程序总结免费下载

【技术杂谈】动画演示各大算法,助力 AI 小白顺利入门

人工智能如此热门,如何自学呢?来自常青藤盟校布朗大学(Brown University)和罗德岛设计学院(RISD)的双学位学生马家驹...
发表于 07-25 16:07 369次 阅读
【技术杂谈】动画演示各大算法,助力 AI 小白顺利入门

稳定系统仅靠电脑算法,双螺旋桨无人机问世!

瑞士洛桑联邦理工学院(EPFL)的初创公司 Flybotix 研发了一款只有 2 个螺旋桨的无人机,....
的头像 无人机网 发表于 07-24 11:30 348次 阅读
稳定系统仅靠电脑算法,双螺旋桨无人机问世!

聚焦 | 数据、算力和算法赋能体验经济

数据洞察用户需求,算法改变商业本质,算力重塑经济未来!
的头像 SAP天天事 发表于 07-24 11:00 255次 阅读
聚焦 | 数据、算力和算法赋能体验经济

算法心得-高效算法的奥秘-第2版

发表于 07-23 16:00 552次 阅读
算法心得-高效算法的奥秘-第2版

【案例分享】基于BP算法的前馈神经网络

BP神经网络 首先给出只包含一个隐层的BP神经网络模型(两层神经网络): BP神经网络其实由两部分组成: 前馈神经网络:...
发表于 07-21 04:00 209次 阅读
【案例分享】基于BP算法的前馈神经网络

机器学习准确预测发病风险

机器学习算法在改善慢性病风险评估和护理方面发挥了关键作用,尤其对阿尔茨海默病(俗称老年痴呆症)患者和....
的头像 机器人技术与应用 发表于 07-19 17:15 358次 阅读
机器学习准确预测发病风险

DARPA人工智能作战应用研究将提升美军“算法战”能力

近日,DARPA副局长彼得·海纳姆在华盛顿接受记者采访时说,DARPA的“下一代人工智能”(AI N....
的头像 人工智能学家 发表于 07-19 17:10 359次 阅读
DARPA人工智能作战应用研究将提升美军“算法战”能力

夜间驾驶的“第三只眼”,车载视觉的行人检测受到广泛关注

根据世界卫生组织的最新调查,每年有大约125万人死于道路交通事故,其中超过一半的人数是弱势道路使用者....
的头像 芯片晶圆切割保护膜 发表于 07-19 13:44 446次 阅读
夜间驾驶的“第三只眼”,车载视觉的行人检测受到广泛关注

从月薪5K到50K,95%的电子工程师还差这一个距离!

现在开通VIP还能获得以下优惠: 一、购买任意一款VIP会员,免费获得从零开始学电子丛书(全11本) 7/19~7/31凡通过本...
发表于 07-19 09:52 1392次 阅读
从月薪5K到50K,95%的电子工程师还差这一个距离!

Light Conference2019国际会议盛大开幕邀请18个国家50余位知名家

7月17日上午,以Light为平台,由长春光机所与中国光学学会共同主办的Light Conferen....
的头像 中科院长春光机所 发表于 07-18 17:05 648次 阅读
Light Conference2019国际会议盛大开幕邀请18个国家50余位知名家

华为拍月亮专利公布

近日,华为的拍月亮技术专利在国家知识产权局进行了公示,这一专利被华为称为“一种拍摄月亮的方法和电子设....
的头像 科技美学 发表于 07-18 16:07 521次 阅读
华为拍月亮专利公布

深度强化学习给推荐系统以及CTR预估工业界带来的最新进展

所以,Google这两篇强化学习应用于YouTube推荐论文的出现给大家带来了比较振奋人心的希望。首....
的头像 AI科技大本营 发表于 07-18 11:11 288次 阅读
深度强化学习给推荐系统以及CTR预估工业界带来的最新进展

基于Erlang语言的视频相似推荐系统

视频行业一般是具备结构化信息的,一般视频公司会有CMS(Content Management Sys....
的头像 AI科技大本营 发表于 07-18 10:27 246次 阅读
基于Erlang语言的视频相似推荐系统

Lipson教授直面人工智能中最难的问题——自我意识

为了达到这个目的,Lipson公开地面对一个棘手的概念——意识——这在他的同事中常常被视为禁忌。他说....
的头像 新智元 发表于 07-18 09:22 319次 阅读
Lipson教授直面人工智能中最难的问题——自我意识

人工智能音乐家“出道”!推动音乐产业发展

AI实际上已经在幕后以许多方式影响着我们创作和倾听音乐的方式。
的头像 网易智能 发表于 07-17 09:51 425次 阅读
人工智能音乐家“出道”!推动音乐产业发展

【案例分享】经典的压缩算法Huffman算法

前两天发布那个rsync算法后,想看看数据压缩的算法,知道一个经典的压缩算法Huffman算法。相信大家应该听说过 David Huffman ...
发表于 07-17 04:30 191次 阅读
【案例分享】经典的压缩算法Huffman算法

【案例分享】改进的图像重组算法及其硬件实现

         目前,大多数的数字相机的图像传感器,不管是CMOS还是CCD,都是单色的,即只有灰...
发表于 07-17 04:00 189次 阅读
【案例分享】改进的图像重组算法及其硬件实现

2019美赛常用算法程序包的详细资料免费下载

本文档的主要内容详细介绍的是2019美赛常用算法程序包的详细资料免费下载常规的智能算法直接调用版主要....
发表于 07-16 08:00 48次 阅读
2019美赛常用算法程序包的详细资料免费下载

不同的人脸识别算法解析

在人脸识别领域,有一些比较经典的算法,例如特征脸法(Eigenface)、局部二值模式法、Fishe....
的头像 司南物联 发表于 07-15 16:50 428次 阅读
不同的人脸识别算法解析

Google提出间接卷积算法,未来可会有突破?

改变基于 GEMM 实现的 CNN底层算法提出的新方法。
的头像 AI科技大本营 发表于 07-15 16:24 336次 阅读
Google提出间接卷积算法,未来可会有突破?

自动驾驶中的决策规划算法概述

本文将分别介绍各层的主要作用与常见算法,并且比较各种算法的优劣性及适用情景。
的头像 智车科技 发表于 07-14 12:23 1047次 阅读
自动驾驶中的决策规划算法概述

基于下界函数的最优化这样一种优化思路

在有些情况下,我们知道目标函数的表达形式,但因为目标函数形式复杂不方便对变量直接求导。这个时候可以尝....
的头像 AI科技大本营 发表于 07-13 08:09 303次 阅读
基于下界函数的最优化这样一种优化思路

深度推荐系统与CTR预估2019年值得精读的论文

FaceBook推荐最新论文,通过建模与系统协同设计提出一种butterfly-shuffle的机制....
的头像 AI科技大本营 发表于 07-13 07:42 412次 阅读
深度推荐系统与CTR预估2019年值得精读的论文

FRVT赛程全纪录:格灵深瞳全球排名前五

在FRVT评测中,测试集是完全不公开的,只有简略的几段话描述。这意味着FRVT用的不是传统那种通过在....
的头像 AI科技大本营 发表于 07-13 07:33 638次 阅读
FRVT赛程全纪录:格灵深瞳全球排名前五

RetinaFace,最强开源人脸检测算法

效果强、还开源,真香!
的头像 AI科技大本营 发表于 07-11 15:53 843次 阅读
RetinaFace,最强开源人脸检测算法

​机器学习算法优缺点对比及选择

本文的目的,是务实、简洁地盘点一番当前机器学习算法。
的头像 人工智能学家 发表于 07-10 17:30 444次 阅读
​机器学习算法优缺点对比及选择

电子工程师必须改的29个习惯

市场上不存在5K的阻值,最接近的是 4.99K(精度1%),其次是5.1K(精度5%)
的头像 电子发烧友网 发表于 07-09 14:08 1853次 阅读
电子工程师必须改的29个习惯

行人再识别,澎思科技 ReID算法的三大突破

行人再识别起源于多摄像头跟踪,指在非重叠视角域多摄像头网络下进行的行人匹配,即确认不同位置的摄像头在....
的头像 AI科技大本营 发表于 07-09 11:00 512次 阅读
行人再识别,澎思科技 ReID算法的三大突破

女朋友生气了吗?算法比直男更懂她

你生气了啊?你猜
的头像 网易智能 发表于 07-08 16:55 480次 阅读
女朋友生气了吗?算法比直男更懂她

基于神经网络的新算法成功模拟量子系统的“稳态”!

算法巨大突破!
的头像 新智元 发表于 07-08 15:26 413次 阅读
基于神经网络的新算法成功模拟量子系统的“稳态”!

芯片半导体的资料库和体智库,只有你想不到,没有我们办不到的

半导体智库,中国半导体资料库。经过小编们彻夜不眠,我们终于收集并整理了超过18G全网最全的半导体学习....
的头像 半导体行业联盟 发表于 07-08 15:11 617次 阅读
芯片半导体的资料库和体智库,只有你想不到,没有我们办不到的