0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Scikit-learn机器学习库的概念及工作原理

NVIDIA英伟达 来源:NVIDIA英伟达 作者: NVIDIA英伟达 2022-09-30 11:00 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作为一个适用于 Python 编程语言的机器学习 (ML) 库,Scikit-learn 拥有大量算法,可供程序员和数据科学家在机器学习模型中轻松部署。

什么是 Scikit-learn?

Scikit-learn 是一个热门且可靠的机器学习库,拥有各种算法,同时也是用于 ML 可视化、预处理、模型拟合、选择和评估的工具。

Scikit-learn 基于 NumPy、SciPy 和 matplotlib 构建,并具有大量用于分类、回归和集群的高效算法。其中包括支持向量机、随机森林、梯度提升、k-means 和 DBSCAN

Scikit-learn 拥有一致且设计高效的 API、适用于大多数算法的丰富文档以及大量在线教程,因此相对易于开发。

当前版本可用于 Linux、MacOS 和 Windows 等热门平台。

为何选择 Scikit-learn?

得益于其相对易于使用、且设计周到又充满热情的社区,Scikit-learn API 已成为机器学习实施的实际标准。

Scikit-learn 为 ML 模型构建、拟合及评估提供了以下模块:

预处理是指 Scikit-learn 工具,这些工具可用于数据分析期间的特征提取和归一化。

分类是指一组工具,这组工具可识别机器学习模型中与数据相关的类别。例如,这些工具还可用于将电子邮件分类为有效邮件或垃圾邮件。实际上,分类可确定目标所属的类别。

回归是指 ML 模型的创建,该模型试图理解输入和输出数据(例如行为或股票价格)之间的关系。回归可预测与目标关联的连续值属性。

Scikit-learn 中的聚类工具自动将具有相似特征的数据以集的形式进行分组,例如根据物理位置排列成集的客户数据。

降维可减少用于分析的随机变量数量。例如,为了提升可视化的效率,可能会将离散数据排除在外。

模型选择是指算法及其提供相应工具的能力,并且这些工具能够比较、验证和选择最佳参数,以将其用于数据科学机器学习项目。

流程是指用于构建模型工作流程的实用程序。

机器学习可视化可支持快速绘图和视觉调整。

Scikit-learn 的工作原理

Scikit-learn 主要采用 Python 编写,并使用 NumPy 进行高性能线性代数以及数组运算。一些核心 Scikit-learn 算法则采用 Cython 编写,以提升整体性能。

作为更高级别的库,它包含各种机器学习算法的几种实施,Scikit-learn 让用户仅使用几行代码即可构建、训练和评估模型。

Scikit-learn 还提供一套统一的高级别 API,以供构建 ML 流程或工作流程使用。

在 Scikit-learn ML 流程中,您可以通过转换器传递数据并提取特征,使用估测器生成模型,并使用评估器测量模型的准确性。

Transformer:这是一种转换或输入数据,以进行预处理的算法。

Estimator:这是一种机器学习算法,用于训练或拟合数据,以构建可用于预测的模型。

流程:流程将多个转换器和估测器相连接,从而指定 ML 工作流程。

GPU 加速的 Scikit-learn API 和端到端数据科学

在架构方面,CPU 仅由几个具有大缓存内存的核心组成,一次只可以处理几个软件线程。相比之下,GPU 由数百个核心组成,可以同时处理数千个线程。

基于 CUDA-X AI 创建的 NVIDIA RAPIDS 开源软件库套件使您完全能够在 GPU 上执行端到端数据科学和分析流程。此套件依靠 NVIDIA CUDA 基元进行低级别计算优化,但通过用户友好型 Python 接口能够实现 GPU 并行化和高带宽显存速度。

RAPIDS cuML 的机器学习算法和数学基元遵循熟悉的类似于 scikit-learn 的 API。单块 GPU 和大型数据中心部署均支持 XGBoost、随机森林等主流算法。针对大型数据集,相较于同等功效的 CPU,这些基于 GPU 的实施方案能够以 10 到 50 倍的速度更快地完成任务。

借助 RAPIDS GPU DataFrame,数据可以通过一个类似 Pandas 的接口加载到 GPU 上,然后用于各种连接的机器学习和图形分析算法,而无需离开 GPU。这种级别的互操作性可通过 Apache Arrow 等库实现,并且可加速端到端流程(从数据准备到机器学习,再到深度学习)。

RAPIDS 支持在许多热门数据科学库之间共享设备内存。这样可将数据保留在 GPU 上,并省去了来回复制主机内存的高昂成本。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5731

    浏览量

    110321
  • 机器学习
    +关注

    关注

    67

    文章

    8571

    浏览量

    137442
  • python
    +关注

    关注

    59

    文章

    4892

    浏览量

    90445

原文标题:NVIDIA 大讲堂 | 什么是 Scikit-learn?

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    学习STM32单片机,从菜鸟到牛人应该怎么走?

    STM32的寄存器编程可以帮助你更深入地了解单片机的工作原理和底层操作。通过编写简单的程序,控制LED、读取按键等基本操作来加深理解。 5.学习HAL和CubeMX:HAL是S
    发表于 05-11 15:38

    晶圆划片机工作原理及操作流程详解

    ,是半导体产业链的“芯片分割利器”。本文将详细拆解其工作原理、核心技术及标准操作流程,同时介绍国产标杆企业博捷芯的相关布局,为行业从业者及学习者提供全面参考。一、核心
    的头像 发表于 03-26 20:40 323次阅读
    晶圆划片机<b class='flag-5'>工作原理</b>及操作流程详解

    算法工程师需要具备哪些技能?

    开发(如NumPy、Pandas、Scikit-learn)。C++/Java:高性能场景(如大规模矩阵运算、分布式系统开发)。 开发工具Linux命令行:文件操作、进程管理、日志分析等。Shell脚本
    发表于 02-27 10:53

    自然语言处理NLP的概念工作原理

    自然语言处理 (NLP) 是人工智能 (AI) 的一个分支,它会教计算机如何理解口头和书面形式的人类语言。自然语言处理将计算语言学与机器学习和深度学习相结合来处理语音和文本数据,这些数据也可以与其他类型的数据一起用于开发智能工程
    的头像 发表于 01-29 14:01 702次阅读
    自然语言处理NLP的<b class='flag-5'>概念</b>和<b class='flag-5'>工作原理</b>

    机器学习和深度学习中需避免的 7 个常见错误与局限性

    无论你是刚入门还是已经从事人工智能模型相关工作一段时间,机器学习和深度学习中都存在一些我们需要时刻关注并铭记的常见错误。如果对这些错误置之不理,日后可能会引发诸多麻烦!只要我们密切关注
    的头像 发表于 01-07 15:37 413次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>和深度<b class='flag-5'>学习</b>中需避免的 7 个常见错误与局限性

    无线充电器的工作原理核心

    无线充电器的工作原理核心
    的头像 发表于 12-06 10:19 2266次阅读
    无线充电器的<b class='flag-5'>工作原理</b>核心

    CIE全国RISC-V创新应用大赛 人脸识别系统介绍与移植

    scikit-learn 等依赖的编译需求,执行以下命令(需管理员权限): 打开命令行,不要进入venv环境,直接输入: sudo apt update && sudo apt
    发表于 11-08 11:19

    机器人关节模组:类型、设计、工作原理及应用

    机器人关节模组是一种用于驱动机器人关节转动、轮子旋转或控制夹爪运动的装置。根据负载需求,机器人关节模组有多种类型。负载通常涉及扭矩、精度、操作速度、功耗等因素。机器人关节模组的
    的头像 发表于 08-29 14:22 3885次阅读
    <b class='flag-5'>机器</b>人关节模组:类型、设计、<b class='flag-5'>工作原理</b>及应用

    解析基带和射频的工作原理

    在现代通信技术中,基带和射频是两个核心概念,它们共同构成了无线通信的基础。尽管这两个术语频繁出现在技术文档和行业讨论中,但其具体功能和技术细节却常常被误解。本文将以移动通信为例,深入解析基带和射频的工作原理及其在通信链路中的作用。
    的头像 发表于 08-06 09:28 3160次阅读
    解析基带和射频的<b class='flag-5'>工作原理</b>

    【「Yocto项目实战教程:高效定制嵌入式Linux系统」阅读体验】+基础概念学习理解

    是 Yocto 项目的核心部分之一,书中对元数据的概念、文件、语法以及菜谱和层的相关内容进行了详细阐述。通过学习这部分内容,我了解到元数据在 Yocto 项目中的重要性,它定义了构建系统的各个方面,包括
    发表于 08-04 22:29

    晶体三极管工作原理学习资料

    关于晶体三极管工作原理文献
    发表于 07-28 16:21 5次下载

    ARM入门学习方法分享

    )架构。学习ARM的开始可以从学习RISC和CISC架构的基础知识开始。 二、学习汇编语言:ARM架构的核心是汇编语言。学习汇编语言能够帮助你理解计算机内部的
    发表于 07-23 10:21

    高压清洗机的工作原理是什么?

    欢迎。那么,您是否了解高压清洗机的工作原理是什么呢?科伟达作为高压清洗机的领先品牌,本文将带您深度解析其工作原理,帮助您更好地理解和使用这种设备。高压清洗机的技术原
    的头像 发表于 07-18 16:39 2074次阅读
    高压清洗机的<b class='flag-5'>工作原理</b>是什么?

    基于米尔瑞芯微RK3576开发板的创建机器学习环境方案

    本文将介绍基于米尔电子MYD-LR3576开发板(米尔基于瑞芯微RK3576开发板)的创建机器学习环境方案的开发测试。 摘自优秀创作者-lulugl 米尔基于瑞芯微RK3576开发板 【前言
    发表于 06-27 11:33

    工业机器人与协作机器概念不同

    在自动化生产的浪潮中,工业机器人与协作机器人逐渐成为企业提升效率、优化产能的得力助手。但它们并非同一概念,在功能、设计与应用场景上有着显著差异。北京沃华慧通测控有限公司凭借深厚的技术沉淀,为不同需求的企业提供适配的
    的头像 发表于 06-03 13:15 1462次阅读
    工业<b class='flag-5'>机器</b>人与协作<b class='flag-5'>机器</b>人<b class='flag-5'>概念</b>不同