0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Scikit-learn机器学习库的概念及工作原理

NVIDIA英伟达 来源:NVIDIA英伟达 作者: NVIDIA英伟达 2022-09-30 11:00 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作为一个适用于 Python 编程语言的机器学习 (ML) 库,Scikit-learn 拥有大量算法,可供程序员和数据科学家在机器学习模型中轻松部署。

什么是 Scikit-learn?

Scikit-learn 是一个热门且可靠的机器学习库,拥有各种算法,同时也是用于 ML 可视化、预处理、模型拟合、选择和评估的工具。

Scikit-learn 基于 NumPy、SciPy 和 matplotlib 构建,并具有大量用于分类、回归和集群的高效算法。其中包括支持向量机、随机森林、梯度提升、k-means 和 DBSCAN

Scikit-learn 拥有一致且设计高效的 API、适用于大多数算法的丰富文档以及大量在线教程,因此相对易于开发。

当前版本可用于 Linux、MacOS 和 Windows 等热门平台。

为何选择 Scikit-learn?

得益于其相对易于使用、且设计周到又充满热情的社区,Scikit-learn API 已成为机器学习实施的实际标准。

Scikit-learn 为 ML 模型构建、拟合及评估提供了以下模块:

预处理是指 Scikit-learn 工具,这些工具可用于数据分析期间的特征提取和归一化。

分类是指一组工具,这组工具可识别机器学习模型中与数据相关的类别。例如,这些工具还可用于将电子邮件分类为有效邮件或垃圾邮件。实际上,分类可确定目标所属的类别。

回归是指 ML 模型的创建,该模型试图理解输入和输出数据(例如行为或股票价格)之间的关系。回归可预测与目标关联的连续值属性。

Scikit-learn 中的聚类工具自动将具有相似特征的数据以集的形式进行分组,例如根据物理位置排列成集的客户数据。

降维可减少用于分析的随机变量数量。例如,为了提升可视化的效率,可能会将离散数据排除在外。

模型选择是指算法及其提供相应工具的能力,并且这些工具能够比较、验证和选择最佳参数,以将其用于数据科学机器学习项目。

流程是指用于构建模型工作流程的实用程序。

机器学习可视化可支持快速绘图和视觉调整。

Scikit-learn 的工作原理

Scikit-learn 主要采用 Python 编写,并使用 NumPy 进行高性能线性代数以及数组运算。一些核心 Scikit-learn 算法则采用 Cython 编写,以提升整体性能。

作为更高级别的库,它包含各种机器学习算法的几种实施,Scikit-learn 让用户仅使用几行代码即可构建、训练和评估模型。

Scikit-learn 还提供一套统一的高级别 API,以供构建 ML 流程或工作流程使用。

在 Scikit-learn ML 流程中,您可以通过转换器传递数据并提取特征,使用估测器生成模型,并使用评估器测量模型的准确性。

Transformer:这是一种转换或输入数据,以进行预处理的算法。

Estimator:这是一种机器学习算法,用于训练或拟合数据,以构建可用于预测的模型。

流程:流程将多个转换器和估测器相连接,从而指定 ML 工作流程。

GPU 加速的 Scikit-learn API 和端到端数据科学

在架构方面,CPU 仅由几个具有大缓存内存的核心组成,一次只可以处理几个软件线程。相比之下,GPU 由数百个核心组成,可以同时处理数千个线程。

基于 CUDA-X AI 创建的 NVIDIA RAPIDS 开源软件库套件使您完全能够在 GPU 上执行端到端数据科学和分析流程。此套件依靠 NVIDIA CUDA 基元进行低级别计算优化,但通过用户友好型 Python 接口能够实现 GPU 并行化和高带宽显存速度。

RAPIDS cuML 的机器学习算法和数学基元遵循熟悉的类似于 scikit-learn 的 API。单块 GPU 和大型数据中心部署均支持 XGBoost、随机森林等主流算法。针对大型数据集,相较于同等功效的 CPU,这些基于 GPU 的实施方案能够以 10 到 50 倍的速度更快地完成任务。

借助 RAPIDS GPU DataFrame,数据可以通过一个类似 Pandas 的接口加载到 GPU 上,然后用于各种连接的机器学习和图形分析算法,而无需离开 GPU。这种级别的互操作性可通过 Apache Arrow 等库实现,并且可加速端到端流程(从数据准备到机器学习,再到深度学习)。

RAPIDS 支持在许多热门数据科学库之间共享设备内存。这样可将数据保留在 GPU 上,并省去了来回复制主机内存的高昂成本。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109086
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136231
  • python
    +关注

    关注

    57

    文章

    4857

    浏览量

    89576

原文标题:NVIDIA 大讲堂 | 什么是 Scikit-learn?

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    CIE全国RISC-V创新应用大赛 人脸识别系统介绍与移植

    scikit-learn 等依赖的编译需求,执行以下命令(需管理员权限): 打开命令行,不要进入venv环境,直接输入: sudo apt update && sudo apt
    发表于 11-08 11:19

    机器人关节模组:类型、设计、工作原理及应用

    机器人关节模组是一种用于驱动机器人关节转动、轮子旋转或控制夹爪运动的装置。根据负载需求,机器人关节模组有多种类型。负载通常涉及扭矩、精度、操作速度、功耗等因素。机器人关节模组的
    的头像 发表于 08-29 14:22 2513次阅读
    <b class='flag-5'>机器</b>人关节模组:类型、设计、<b class='flag-5'>工作原理</b>及应用

    晶体三极管工作原理学习资料

    关于晶体三极管工作原理文献
    发表于 07-28 16:21 2次下载

    ARM入门学习方法分享

    )架构。学习ARM的开始可以从学习RISC和CISC架构的基础知识开始。 二、学习汇编语言:ARM架构的核心是汇编语言。学习汇编语言能够帮助你理解计算机内部的
    发表于 07-23 10:21

    基于米尔瑞芯微RK3576开发板的创建机器学习环境方案

    本文将介绍基于米尔电子MYD-LR3576开发板(米尔基于瑞芯微RK3576开发板)的创建机器学习环境方案的开发测试。 摘自优秀创作者-lulugl 米尔基于瑞芯微RK3576开发板 【前言
    发表于 06-27 11:33

    GPIO配置的工作原理是什么?

    我使用 EZ-USB 配置实用程序,我想知道是否有人知道 GPIO 配置的工作原理。 例如,GPIO0 可以用作传感器复位,我知道这个 GPIO0 用于重置传感器,但我不明白的是选项用户 GPIO 例如GPIO 1可以是User GPIO0,这是什么意思呢?
    发表于 05-19 06:56

    详细介绍机场智能指路机器人的工作原理

    机场智能指路机器人主要依靠感知系统、定位系统、导航系统、智能交互系统和运动系统协同工作,来实现为旅客准确指路和提供服务的功能,以下是其详细工作原理: 感知系统 传感器类型 :机器人配备
    发表于 05-10 18:26

    【「# ROS 2智能机器人开发实践」阅读体验】机器人入门的引路书

    ROS的全称:Robot Operating System 机器人操作系统 ROS的 目的 :ROS支持通用,是通信总线,协调多个传感器 为了解决机器人里各厂商模块不通用的问题,让机器
    发表于 04-30 01:05

    微动开关的工作原理

    微动开关的工作原理
    的头像 发表于 04-17 09:00 2718次阅读

    光通信中光电二极管的工作原理

    本文介绍了光通信中的光电二极管的工作原理,及其响应度和效率的概念
    的头像 发表于 03-12 14:27 1490次阅读
    光通信中光电二极管的<b class='flag-5'>工作原理</b>

    超级电容电池的工作原理

    超级电容电池是一种介于传统电容器与电池之间的新型储能装置。其工作原理主要基于电荷分离和电场存储,以下是关于超级电容电池工作原理的详细解释:
    的头像 发表于 01-27 11:17 1987次阅读

    人工智能和机器学习以及Edge AI的概念与应用

    与人工智能相关各种技术的概念介绍,以及先进的Edge AI(边缘人工智能)的最新发展与相关应用。 人工智能和机器学习是现代科技的核心技术 人工智能(AI)和机器
    的头像 发表于 01-25 17:37 1573次阅读
    人工智能和<b class='flag-5'>机器</b><b class='flag-5'>学习</b>以及Edge AI的<b class='flag-5'>概念</b>与应用

    传统机器学习方法和应用指导

    在上一篇文章中,我们介绍了机器学习的关键概念术语。在本文中,我们会介绍传统机器学习的基础知识和多种算法特征,供各位老师选择。 01 传统
    的头像 发表于 12-30 09:16 1980次阅读
    传统<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法和应用指导

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习应用的首选。然而,市场上的云原生机器
    的头像 发表于 12-25 11:54 699次阅读

    RAG的概念及工作原理

    )与外部知识源集成,增强了其能力。这种集成允许模型动态地引入相关信息,使其能够生成不仅连贯而且事实准确、上下文相关的回应。RAG系统的主要组成部分包括: ·检索器(Retriever): 该组件从外部知识中获取相关数据。 ·生成器(Generator):
    的头像 发表于 12-17 13:41 3042次阅读
    RAG的<b class='flag-5'>概念及</b><b class='flag-5'>工作原理</b>