0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

几个数据分析中经常需要用到的重要函数

lviY_AI_shequ 来源:数据科学杂谈 2020-05-12 10:00 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Numpy 功能十分强大,很多我们想要的复杂操作都有实现。今天分享几个数据分析中经常需要用到的重要函数。掌握这些函数可以帮助我们保持代码整洁并且避免重复造轮子。

准备工作

导入numpy

import numpy as np

示例数据

本文以二分类任务为例,通常我们的model会输出预测的概率,得到概率后需要进行后续的处理,比如:

•根据阈值,将概率大于某个阈值的label设置为1,小于阈值的设置为0•在模型诊断过程中,找出满足某些条件的样本

本文使用的示例数据如下:

predict_prob = np.array([0.1,0.3,0.7,0.4,0.9])

where()

np.where() 方法可以帮助我们找到array中满足条件的元素的位置。现在我们可以使用np.where()找出所有预测概率大于0.5的的元素了:

predict_prob = np.array([0.1,0.3,0.7,0.4,0.9])np.where(predict_prob > 0.5)# output:array([2, 4]),)

如果我们想将所有概率大于0.5的元素替换为1,否则替换为0,该怎么做呢?

一个简单粗暴的方式是先用上面的方法分别找出array中概率大于或者小于0.5的索引,然后再对这些位置的元素重新赋值。

其实,np.where() 一个函数就能完成所有的操作,只需要添加两个参数:

•第一个参数是满足条件替换的值•第二个参数是不满足条件替换的值

predict_prob = np.array([0.1,0.3,0.7,0.4,0.9])np.where(predict_prob > 0.5, 1, 0)# output: array([0, 0, 1, 0, 1])

argmin()、argmax()、argsort()

np.argmin()、np.argmax()方法会返回array中最小或最大的元素索引,对示例数据运行结果如下:

predict_prob = np.array([0.1,0.3,0.7,0.4,0.9]) np.argmax(predict_prob)# output: 4np.argmin(predict_prob)# output: 0

我们成功找到了array中最大最小的元素索引,那怎样找到前n个最大的或最小的值呢?

现在该轮到np.sort()上场了

predict_prob = np.array([0.1,0.3,0.7,0.4,0.9])np.argsort(predict_prob)# output: array([0, 1, 3, 2, 4])

np.argsort()方法还支持多维数据的排序,感兴趣的可以自行查看Numpy官方文档[1]

intersect1d()

intersect1d()要做的是,它会找出两个array中的交集,这个函数和前面的几个函数不同,返回的不是索引位置,而是array中的实际值。

本函数我们使用新的示例数据:

arr1 = np.array([1,2,4,4,6])arr2 = np.array([2,3,4,5,6])

现在,我们可以使用intersect1d()找出两个数组共同的元素了:

np.intersect1d(arr1, arr2)# output: array([2, 4, 6])

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 阈值
    +关注

    关注

    0

    文章

    124

    浏览量

    18993
  • 函数
    +关注

    关注

    3

    文章

    4422

    浏览量

    67863
  • 数据分析
    +关注

    关注

    2

    文章

    1523

    浏览量

    36367

原文标题:Numpy 中不得不知的4个重要函数

文章出处:【微信号:AI_shequ,微信公众号:人工智能爱好者社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    电磁兼容试验怎么做?都有哪些类别?需要用到哪些设备?

    电磁兼容性EMC是指设备或系统在其电磁环境中符合要求运行,并不对其环境中的任何设备产生无法忍受的电磁骚扰的能力。随着电子设备的普及和电磁环境的日益复杂,电磁兼容性问题已经变得愈发重要。为了确保
    的头像 发表于 04-24 14:59 97次阅读
    电磁兼容试验怎么做?都有哪些类别?<b class='flag-5'>需要用到</b>哪些设备?

    电动车需要做哪些检测?有哪些方法和标准?需要用到哪些设备?

    成为了未来出行的重要趋势。然而,与任何机械设备一样,电动车的性能与安全性也需要通过定期检测来保障。电动车检测的重要性1.安全保障:电动车虽以电力驱动,但其动力系统、制动
    的头像 发表于 04-24 14:56 61次阅读
    电动车<b class='flag-5'>需要</b>做哪些检测?有哪些方法和标准?<b class='flag-5'>需要用到</b>哪些设备?

    API数据分析:淘宝流量来源分析,渠道优化!

    优化渠道策略。我们将使用Python作为工具,结合数据分析和统计方法,确保过程真实可靠。 1. 理解淘宝流量来源 淘宝流量主要来自多个渠道,包括: 直接访问 :用户直接输入淘宝网址或从收藏夹访问。 搜索引擎 :如百度或淘宝内搜索,贡献
    的头像 发表于 01-23 13:42 416次阅读
    API<b class='flag-5'>数据分析</b>:淘宝流量来源<b class='flag-5'>分析</b>,渠道优化!

    利用拼多多用户API进行粉丝数据分析,有效提升用户粘性

    这些API进行粉丝数据分析,并基于分析结果制定增强用户粘性的策略。 一、 拼多多用户API概览 拼多多开放平台提供了丰富的API接口,涵盖商品、交易、用户、物流等多个维度。对于粉丝数据分析,以下
    的头像 发表于 12-30 10:38 378次阅读
    利用拼多多用户API进行粉丝<b class='flag-5'>数据分析</b>,有效提升用户粘性

    经营数据分析可以通过哪些方式

    系统的、科学的、符合商业规律的数据分析知识。这些数据分析都要基于数据质量,所以通常我们还会需要个数据
    的头像 发表于 12-05 16:31 750次阅读

    谁有3566+电池+POE充电的方案,有个项目需要用该功能的主板

    谁有3566+电池+POE充电的方案,有个项目需要用该功能的主板
    发表于 12-01 08:21

    软件设计及串口相关函数介绍

    因为本章节的UART相关实验例程需要用到板子上的LED功能,因此我们可以直接以前面的“11_GPIO_LED”工程为基础进行修改。
    的头像 发表于 10-27 11:23 2273次阅读
    软件设计及串口相关<b class='flag-5'>函数</b>介绍

    汉思新材料:无人机哪些部件需要用到环氧固定胶

    在无人机的制造和维修中,环氧固定胶因其高强度、优异的耐候性、耐化学性、耐高低温、出色的绝缘性和抗震性而被广泛应用于需要永久性、高可靠性粘接、密封、固定或灌封的部件。以下是一些无人机中特别需要使用环氧
    的头像 发表于 09-12 11:22 978次阅读
    汉思新材料:无人机哪些部件<b class='flag-5'>需要用到</b>环氧固定胶

    机床数据采集需要用到协议转换网关吗

    在当今制造业向智能化加速迈进的浪潮中,机床数据采集作为实现智能制造的关键一环,其重要性不言而喻。通过对机床运行数据的实时、精准采集与深入分析,企业能够有效提升生产效率、优化生产流程、保
    的头像 发表于 08-20 10:54 583次阅读
    机床<b class='flag-5'>数据</b>采集<b class='flag-5'>需要用到</b>协议转换网关吗

    如何通过数据分析识别设备故障模式?

    通过数据分析识别设备故障模式,本质是从声振温等多维数据中提取故障特征,建立 “数据特征 - 故障类型” 的映射关系,核心可通过特征提取、模式匹配、趋势分析三步实现,精准定位故障根源与发
    的头像 发表于 08-19 11:14 1138次阅读
    如何通过<b class='flag-5'>数据分析</b>识别设备故障模式?

    构建自定义电商数据分析API

      在电商业务中,数据是驱动决策的核心。随着数据量的增长,企业需要实时、灵活的分析工具来监控销售、用户行为和库存等指标。一个自定义电商数据分析
    的头像 发表于 07-17 14:44 733次阅读
    构建自定义电商<b class='flag-5'>数据分析</b>API

    AI数据分析仪设计原理图:RapidIO信号接入 平板AI数据分析

    AI数据分析仪, 平板数据分析仪, 数据分析仪, AI边缘计算, 高带宽数据输入
    的头像 发表于 07-17 09:20 896次阅读
    AI<b class='flag-5'>数据分析</b>仪设计原理图:RapidIO信号接入 平板AI<b class='flag-5'>数据分析</b>仪

    企业数字化改造需要用到哪些平台

    开发成本,缩短交付周期。 推荐平台 : 伙伴云 :国内零代码赛道开创者,支持全场景定制(如生产制造、零售、金融等),提供8大自研引擎(如结构化数据协作、BPMN2.0流程引擎),与企微、钉钉深度集成,被比亚迪、泡泡玛特等企业采用。 明道云
    的头像 发表于 07-07 17:57 1758次阅读

    PD3173放电正常;充电无法带电池,没有充电电流,是否需要用MCU通过IIC设置相关参数,如何设置?

    您好,我公司刚刚开始用PD方案,请教以下几个问题: 1、PD3173放电正常;充电无法带电池,没有充电电流,是否需要用MCU通过IIC设置相关参数,如何设置? 2、QC放电给手机充电时,电压自动加到9V后又掉到5V,重新开始加,如此循环,这个是什么原因?
    发表于 06-04 08:29

    电力|智能配电房需要用到哪些设备?

    一、核心电力设备:智能化的基础智能配电房的核心电力设备是实现配电自动化、高效运行和远程管理的关键。这些设备不仅具备传统配电设备的功能,还集成了先进的传感、通信和控制技术,能够实时监测、分析和优化
    的头像 发表于 05-09 11:27 1003次阅读
    电力|智能配电房<b class='flag-5'>需要用到</b>哪些设备?