0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

现代化机器学习工具,有助于数据科学开展更多工程功能

如意 来源: 云智小号 作者: 云智小号 2020-07-06 10:11 次阅读

数据科学的发展日新月异,机器学习的角色正从数据科学的混合角色过渡到更多的工程或面相分析的角色,主要是以下的因素促成了这种变化。

1.机器学习模型更多地被应用到生产系统中,需要数据科学家具有比以前更深入的技术技能。

2.商业产品和用户行为的变化步伐加快,对自动化的需求也增加。

3.还有出于数据合规和监管的要求,增加了对数据的可追溯性和可解释性的预测和决策的需求。

这些变化的因素也导致了数据科学家使用的工具发生了变化。使得他们更多地利用云,自动化,可解释性和可重复过程的方向去发展。

基于云的机器学习。云基础架构和Kubernetes改变了数据科学家进行机器学习的方式。从能够将预构建的解决方案用作Saas应用程序,到能够在Kubernetes上运行完整的机器学习堆栈。

AutoML和编排。AutoML简化了训练模型,提供了一种自动的方法来进行数据准备,特征工程,超参数优化或模型的选择。

可解释且可重复的ML。在过去几年中,出现了一些库和工具来帮助理解模型预测及其背后的权重并赋予其含义。如whatiftools,Lime,Shap或Manifold之类的工具可以帮助数据科学家来实现这一目标。

基于云的机器学习

向云和Kubernetes的迁移是时下的主流方向,这推动了机器学习工程师对更多DevOps或数据操作功能的需求。

深度学习的快速发展推动了机器学习的进步,但深度学习需要更多的计算资源,它的利用率随工作负载变化很大,这迫使Tensorflow执行程序在Kubernetes上运行来支持更弹性和可扩展的基础架构。

另一个因素是机器学习在生产环境中的重要性日益提高。这种转变又增加了在原型堆栈和生产之间紧密结合的需求,并借助各种云的平台,比如AWS SageMaker、Google Cloud ML Engine。这些工具提供了如模型部署和API配置之类的功能,从而简化了流程将模型推向生产的过程。

AutoML和机器学习工作流程

具有生产型机器学习系统的重要性的提高反过来加速了从培训到部署的整个机器学习价值链对自动化的需求。自动化允许更快地迭代和改进模型。

AutoML提供了围绕模型训练过程的自动化层,可以处理其一些重复的任务。它可以处理如超参数优化,功能和模型选择之类的任务。现在,像Tpot或AutoKeras之类的库,以及大多数云提供商的机器学习即服务都将AutoML作为其解决方案的一部分。

对自动化的需求也增加了对工具进行编排的不同部分的需求。工作流工具如,Airflow,Kubeflow,MLFlow和MetaFlow是用于帮助实现这一目标的一些关键工具。他们负责将整个机器学习过程作为一条流水线来处理,帮助协调从数据采集到模型服务的端到端流程。

可解释且可重复的ML

合规和监管影响了我们构建机器学习模型的方式。他们推动了可解释和可复制的模型。

在可解释的方面,已经出现了一系列工具,可以帮助数据科学家从其模型中获得意义。这些工具评估不同的方案,分析变量如何互操作,并提供仪表板以帮助解释模型预测。whatiftools,Lime,Shap或Manifold是应对这一挑战的工具。

除了提供可靠的方法来调试模型的优点外,可复制性是受法规影响的另一个方面。总有可能使用工作流工具创建可重复的机器学习管道,但仍出现了一些特定的工具来简化这个过程。

DVC,Dolt,Weight and Biases(WANDB)和Dags Hub等是一些专门的工具,使构建模型,可重复的方式更简单。DVC负责模型和数据集的版本控制,而Dolt严格限于数据集本身。WANDB和Dags Hub则专注于跟踪模型构建/训练的权重和结果。

总结

机器学习工具,已经不仅仅局限于利用一些预测库和Jupyter笔记本。现在,进行数据科学需要掌握更广泛的工具集,其中包括云,工作流工具,解释和版本控制工具。这些增加的现代化工具应有助于数据科学开展更多的工程或业务功能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8136

    浏览量

    130584
  • 现代化
    +关注

    关注

    0

    文章

    18

    浏览量

    6643
  • 数据科学
    +关注

    关注

    0

    文章

    163

    浏览量

    9983
收藏 人收藏

    评论

    相关推荐

    在微芯片上使用3D反射器堆栈有助于加快6G通信的发展

    一项新的研究发现,在微芯片上使用3D反射器堆栈可以使无线链路的数据速率提高三倍,从而有助于加快6G通信的发展。
    的头像 发表于 03-13 16:31 241次阅读

    为微电子设施现代化提供资金

    公告,该法案旨在加强美国的制造业、供应链和国家安全。对BAE系统公司的微电子中心进行现代化改造有助于支持这一愿景以及尖端技术的持续开发和制造,以服务于客户的使命。 BAE系统公司的微电子中心是一个占地110,000 平方英尺、获得国防部 (DoD) 认证的半
    的头像 发表于 12-28 16:24 154次阅读

    ADI全新集成电路有助于监测心率

    电子发烧友网站提供《ADI全新集成电路有助于监测心率.pdf》资料免费下载
    发表于 11-24 10:38 0次下载
    ADI全新集成电路<b class='flag-5'>有助于</b>监测心率

    R课堂 | 有助于车载和工业设备降低功耗!内置SiC二极管的IGBT

    本文的关键要点 ・要想实现碳中和,就需要进一步提高DC-DC转换器等功率转换系统的效率。 ・ 集IGBT和SiC肖特基势垒二极管于一身的“Hybrid IGBT”,可同时实现高效率和低成本,有助于
    的头像 发表于 11-15 16:05 220次阅读
    R课堂 | <b class='flag-5'>有助于</b>车载和工业设备降低功耗!内置SiC二极管的IGBT

    多层pcb生产,更有助于高精度布线

    多层pcb生产,更有助于高精度布线
    的头像 发表于 11-15 11:02 254次阅读

    软通动力应用现代化平台工程产品及服务解决方案荣获“2023年应用现代化典型案例”称号

    的应用现代化平台工程产品及服务解决方案荣获“2023年应用现代化典型案例”称号。该评选旨在加快推动应用现代化发展与推广应用,形成行业应用带动和示范作用,打造应用
    的头像 发表于 11-14 16:50 401次阅读
    软通动力应用<b class='flag-5'>现代化</b>平台<b class='flag-5'>工程</b>产品及服务解决方案荣获“2023年应用<b class='flag-5'>现代化</b>典型案例”称号

    喜报丨软通动力应用现代化平台工程产品及服务解决方案荣获“2023年应用现代化典型案例”称号

    在数字经济时代,应用现代化正在成为一个共识。 近日,中国软件行业协会首届“应用现代化产业实践优秀案例”评选结果揭晓, 软通动力应用现代化研究中心打造的应用现代化平台
    的头像 发表于 11-13 19:30 435次阅读
    喜报丨软通动力应用<b class='flag-5'>现代化</b>平台<b class='flag-5'>工程</b>产品及服务解决方案荣获“2023年应用<b class='flag-5'>现代化</b>典型案例”称号

    存储网络在数据中心现代化中的作用

    电子发烧友网站提供《存储网络在数据中心现代化中的作用.pdf》资料免费下载
    发表于 09-01 14:43 0次下载
    存储网络在<b class='flag-5'>数据</b>中心<b class='flag-5'>现代化</b>中的作用

    机器学习和深度学习的区别

      机器学习和深度学习是当今最流行的人工智能(AI)技术之一。这两种技术都有助于在不需要人类干预的情况下让计算机自主学习和改进预测模型。本文
    发表于 08-28 17:31 1059次阅读

    数据挖掘和机器学习有什么关系

    数据挖掘和机器学习有什么关系 数据挖掘和机器学习是两个不同的概念,但它们有一些重要的相似之处。这
    的头像 发表于 08-17 16:29 2080次阅读

    python数据挖掘与机器学习

    用的数据挖掘和机器学习工具。 一、数据挖掘 数据挖掘是指从大量
    的头像 发表于 08-17 16:29 891次阅读

    激光脉冲或将有助于开发下一代高容量电池

    近日,阿卜杜拉国王科技大学(King Abdullah University,KAUST)了一项研究成果,该成果可能有助于改进下一代电池的阳极材料。
    发表于 08-08 14:44 189次阅读

    孔环是什么?深入了解孔环有助于实现PCB设计

    本文将探讨孔环,因为更深入的了解孔环有助于确保成功地实现PCB设计。
    的头像 发表于 07-19 10:21 2778次阅读
    孔环是什么?深入了解孔环<b class='flag-5'>有助于</b>实现PCB设计

    技术资讯 | 机器学习在电子电路设计中的优势

    学习整合到信号处理系统中,有助于对信号建模、检测、绘制推断和开发高精度调整,以获得良好的输出信号。机器学习为电子电路设计的进步做出了贡献在过去,工程
    的头像 发表于 06-26 12:00 681次阅读
    技术资讯 | <b class='flag-5'>机器</b><b class='flag-5'>学习</b>在电子电路设计中的优势

    Maxim芯片有助于设计人员降低系统功耗

    已经成为设计者追求的新目标,特别是对于每天工作24小时的系统。为了满足低功耗要求,电路设计人员深知细节决定成败,需要对每一部分电路的电流进行仔细测算。本文介绍了Maxim芯片在典型系统中的应用,有助于设计人员降低系统功耗。文中给出的实例只是Maxim众多超低电流器件中的几个典型例子。
    的头像 发表于 06-10 09:31 530次阅读
    Maxim芯片<b class='flag-5'>有助于</b>设计人员降低系统功耗