0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Python开源机器学习建模库PyCaret,发布了2.0版本

数据分析与开发 来源:量子位 2020-08-27 15:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Python开源机器学习建模库PyCaret,最近发布了2.0版本。

这款堪称调包侠神器的模型训练工具包,几行代码就能搞定模型编写、改进和微调。 从数据预处理到模型效果对比,PyCaret都能自动实现。 所以,PyCaret长啥样,2.0的版本又做了什么改进? 一起来看看。

机器学习库的炼丹炉

PyCaret说白了,有点像一个机器学习库的炼丹炉。 以下是它熔进来的部分库:

数据处理:pandas、numpy…
数据可视化:matplotlib、seaborn…
各种模型:sklearn、xgboost、catboost、lightgbm…

嗯…sklearn直接就给封装进去了,调用很方便。 然后,PyCaret这个炼丹炉,自带功能“按键”(定义了一些函数),包括数据预处理、模型训练、模型集成、模型分析、模型测试等。 只需要写上几行Python代码,这些功能“按键”就会被按下,PyCaret自动帮你实现。 至于实现过程中需要调用什么基本库,哪些可以放弃丝毫不需要考虑。 从下图来看,仅仅是预处理阶段,就包含样本划分、数据预处理、缺失值处理、归一化、独热编码等功能。

如果要实现必需的预处理功能,需要多少行代码来调用? 答案是0行。 因为,当使用setup()进行初始化时,PyCaret将自动执行机器学习必需的数据预处理步骤,包括缺失值插入、分类变量编码、标签编码、数据集拆分等。 例如,在数据处理前,你发现数据集有空缺的地方(下图中NaN部分)。

别怕,PyCaret会自动分析数据,进行缺失值插入。

预处理后,PyCaret还贴心地帮你准备了各种模型。 从模型训练、选用到测试,只有你想不到的,没有它做不了的。 如果已经将数据处理好,并交给PyCaret,一个compare_models函数就能训练库中的所有模型,进行结果比较后,标出最佳模型。 如下图,各种模型指标的最优值会被一键标黄,就看你怎么选择了。

选好后,想对模型进行一点优化?一个tune_model函数就能帮你搞定。 或者,不想仅仅选用一个模型? PyCaret也准备了模型集成的函数,blend和stack任你选。 除此之外,模型参数的分析(包括可视化)也只需要几行代码就能实现,功能非常强大。

最后,PyCaret还能为新数据提供迭代预测结果,下面的效果,同样只需要几行代码就能完成。

那么,这次PyCaret增强,进行了什么改进呢?(项目见传送门)

PyCaret 2.0增强版

这是PyCaret 2.0的6大特色,有些在1.0就有了,有些功能如实验日志,看起来是更新后新加入的功能。

实验日志,对于模型的调整不可或缺。 例如,想要将训练过程中模型的精度变化可视化,通常我们会在模型中加入生成日志文件的函数,生成一个更直观的时间-精度变化图。 PyCaret 2.0加入了实验日志的功能,自动帮你跟踪模型实验过程中的各项指标,以及生成视觉效果等。 不仅如此,在2.0中,模型生成到预测的所有工作流程,现在可以被设计了。 也就是说,你可以设置一条自定义流水线,在这个过程中,从训练到测试,所有模块的功能都会被自动化完成。 甚至,PyCaret 2.0还提供了机器学习模型前端软件的搭建工具。 以及,PyCaret 2.0现在几乎支持所有算法的并行处理,xgboost和catboost模型也支持GPU训练。

除此之外,还有一些新的程序功能,等待你去发现。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 代码
    +关注

    关注

    30

    文章

    4941

    浏览量

    73151
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136236
  • python
    +关注

    关注

    57

    文章

    4858

    浏览量

    89588

原文标题:调包侠神器2.0发布,Python机器学习模型搭建只需要几行代码

文章出处:【微信号:DBDevs,微信公众号:数据分析与开发】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    IvorySQL开源社区正式发布IvorySQL 5.0版本

    近日,IvorySQL开源社区正式发布IvorySQL 5.0版本。该版本基于PostgreSQL 18.0进行全面迭代升级,在Oracle兼容性上实现新突破,生态组件集成能力持续进阶
    的头像 发表于 12-04 10:06 312次阅读
    IvorySQL<b class='flag-5'>开源</b>社区正式<b class='flag-5'>发布</b>IvorySQL 5.0<b class='flag-5'>版本</b>

    摩尔线程发布Torch-MUSA v2.7.0版本

    近日,摩尔线程正式发布PyTorch深度学习框架的MUSA扩展——Torch-MUSA v2.7.0,新版本在功能集成、性能优化与硬件支持方面实现进一步突破。Torch-MUSA在短
    的头像 发表于 12-04 09:05 566次阅读

    开源鸿蒙6.1和8.1版本定为LTS建议版本,最新OpenHarmony路标发布

    开源项目生态建设中,版本生命周期管理是保障社区项目稳定演进、助力生态伙伴提前规划产品路线、降低开发者适配成本的核心环节。为进一步规范开源鸿蒙版本
    的头像 发表于 10-30 09:29 581次阅读
    <b class='flag-5'>开源</b>鸿蒙6.1和8.1<b class='flag-5'>版本</b>定为LTS建议<b class='flag-5'>版本</b>,最新OpenHarmony路标<b class='flag-5'>发布</b>

    开源鸿蒙6.0 Release版本重磅发布

    近日,在长沙国际会议中心举办的开源鸿蒙技术大会2025上,开放原子开源鸿蒙(即OpenAtom OpenHarmony,简称“开源鸿蒙”)项目群正式发布
    的头像 发表于 10-10 16:49 2194次阅读

    摩尔线程发布Torch-MUSA v2.1.1版本

    近日,摩尔线程发布其面向PyTorch深度学习框架的MUSA扩展——Torch-MUSA v2.1.1。该版本在v2.1.0的基础上,进一步扩展
    的头像 发表于 09-10 11:02 733次阅读

    开源鸿蒙6.0Beta1版本发布!触觉智能将率先适配RK3566/RK3568/RK3576等芯片平台芯片

    开放原子开源鸿蒙(OpenAtomOpenHarmony,简称“开源鸿蒙”或“OpenHarmony”)6.0Beta1版本正式发布。相比5.1.0Release
    的头像 发表于 06-20 14:05 1231次阅读
    <b class='flag-5'>开源</b>鸿蒙6.0Beta1<b class='flag-5'>版本</b><b class='flag-5'>发布</b>!触觉智能将率先适配RK3566/RK3568/RK3576等芯片平台芯片

    开源鸿蒙5.1 Release版本发布

    近日,开源鸿蒙5.1 Release版本正式发布,支持更多的设备形态,全面提升了系统的稳定性和开发者体验,这是其技术路线演进中的关键一跃——更快的开发体验,向消费端的加速渗透,以及向全场景生态发起猛攻。
    的头像 发表于 06-05 14:25 2040次阅读

    如何在Ubuntu 24.04上运行5.4.47版本

    ubuntu 18.04 不再是最新的,因此我用 ubuntu 24.04 设置一台新机器。在遇到一些困难之后,我能够为 SDK BSP 版本 6.6.52 构建 yocto 包
    发表于 04-11 06:08

    达实AIoT智能物联网管控平台V7版本发布

    近日,达实智能在公司总部发布达实AIoT智能物联网管控平台V7版本,展示生成式AI在园区数字化平台的实际应用。
    的头像 发表于 03-19 11:39 952次阅读

    芯来科技发布Nuclei Studio 2025.02版本

    Studio 2025.02版本发布以下功能特性: 集成Nuclei RISC-V Toolchain /OpenOCD /QEMU /Xlmodel 2025.02版本
    的头像 发表于 03-05 17:43 1774次阅读
    芯来科技<b class='flag-5'>发布</b>Nuclei Studio 2025.02<b class='flag-5'>版本</b>

    国地中心将推出人形机器人“Deep Snake”2.0版本

    国家地方共建人形机器人创新中心的具身智能训练场在上海浦东正式启用。在启用仪式上,国地中心首席科学家江磊宣布将推出人形机器2.0版本“Deep Snake”。 江磊表示,人形
    的头像 发表于 01-22 17:15 852次阅读

    适用于MySQL和MariaDB的Python连接器:可靠的MySQL数据连接器和数据

    和 MariaDB 数据服务器以及托管数据服务,以对存储的数据执行创建、读取、更新和删除操作。该解决方案完全实现 Python DB API
    的头像 发表于 01-17 12:18 845次阅读
    适用于MySQL和MariaDB的<b class='flag-5'>Python</b>连接器:可靠的MySQL数据连接器和数据<b class='flag-5'>库</b>

    适用于Oracle的Python连接器:可访问托管以及非托管的数据

    ,以对存储的数据执行创建、读取、更新和删除操作。该解决方案完全实现 Python DB API 2.0 规范,并作为 Windows、macOS 和 Linux 的 wheel 包分发。 特征
    的头像 发表于 01-14 10:30 740次阅读

    开源鸿蒙操作系统5.0 Release版本发布

    12月20日,在2024开放原子开发者大会暨首届开源技术学术大会开幕式上,开放原子开源鸿蒙(即OpenAtom OpenHarmony,简称“开源鸿蒙”或“OpenHarmony”)项目群重磅
    的头像 发表于 12-23 11:35 3248次阅读

    开源鸿蒙应用案例重磅发布

    开源赋能千行百业,有效推动产业创新升级。随着开放原子开源基金会的开源鸿蒙(OpenHarmony)5.0 Release版本正式发布,项目生
    的头像 发表于 12-23 11:32 1866次阅读