0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

超强图解Pandas,建议收藏

数据分析与开发 来源:数据分析与开发 2023-08-29 15:15 次阅读

Pandas是数据挖掘常见的工具,掌握使用过程中的函数是非常重要的。本文将借助可视化的过程,讲解Pandas的各种操作。

sort_values

(dogs[dogs['size']=='medium']
.sort_values('type')
.groupby('type').median()
)

执行步骤:

  • size列筛选出部分行
  • 然后将行的类型进行转换
  • 按照type列进行分组,计算中位数

a5f568ce-461f-11ee-a2ef-92fbcf53809c.png

a61410e4-461f-11ee-a2ef-92fbcf53809c.png

a64c1ffc-461f-11ee-a2ef-92fbcf53809c.png

a660e18a-461f-11ee-a2ef-92fbcf53809c.png

selecting a column

dogs['longevity']

a6a52af2-461f-11ee-a2ef-92fbcf53809c.png

groupby + mean

dogs.groupby('size').mean()
执行步骤:
  • 将数据按照size进行分组
  • 在分组内进行聚合操作

a6c0e6d4-461f-11ee-a2ef-92fbcf53809c.png

a710f78c-461f-11ee-a2ef-92fbcf53809c.png

grouping multiple columns

dogs.groupby(['type','size'])

a728224a-461f-11ee-a2ef-92fbcf53809c.png

groupby + multi aggregation

(dogs
.sort_values('size')
.groupby('size')['height']
.agg(['sum','mean','std'])
)

执行步骤

  • 按照size列对数据进行排序
  • 按照size进行分组
  • 对分组内的height进行计算

a76d271e-461f-11ee-a2ef-92fbcf53809c.png

a7842842-461f-11ee-a2ef-92fbcf53809c.png

a7c8abde-461f-11ee-a2ef-92fbcf53809c.png

a7dcf7c4-461f-11ee-a2ef-92fbcf53809c.png

filtering for columns

df.loc[:,df.loc['two']<= 20]

a80dedac-461f-11ee-a2ef-92fbcf53809c.png

filtering for rows

dogs.loc[(dogs['size']=='medium')&(dogs['longevity']>12),'breed']

a81c82d6-461f-11ee-a2ef-92fbcf53809c.png

dropping columns

dogs.drop(columns=['type'])

a851d990-461f-11ee-a2ef-92fbcf53809c.png

joining

ppl.join(dogs)

a87522a6-461f-11ee-a2ef-92fbcf53809c.png

merging

ppl.merge(dogs,left_on='likes',right_on='breed',how='left')

a89f9bbc-461f-11ee-a2ef-92fbcf53809c.png

pivot table

dogs.pivot_table(index='size',columns='kids',values='price')

a8b2a2ac-461f-11ee-a2ef-92fbcf53809c.png

melting

dogs.melt()

a8e765fa-461f-11ee-a2ef-92fbcf53809c.png

pivoting

dogs.pivot(index='size',columns='kids')

a8f5b862-461f-11ee-a2ef-92fbcf53809c.png

stacking column index

dogs.stack()

a91a2e5e-461f-11ee-a2ef-92fbcf53809c.png

unstacking row index

dogs.unstack()

a922b7c2-461f-11ee-a2ef-92fbcf53809c.png

resetting index

dogs.reset_index()

a948d81c-461f-11ee-a2ef-92fbcf53809c.png

setting index

dogs.set_index('breed')

a95e22da-461f-11ee-a2ef-92fbcf53809c.png


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据挖掘
    +关注

    关注

    1

    文章

    405

    浏览量

    24040
  • 可视化
    +关注

    关注

    1

    文章

    1023

    浏览量

    20556

原文标题:超强图解 Pandas,建议收藏

文章出处:【微信号:DBDevs,微信公众号:数据分析与开发】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    收藏建议

    不知道是不是我没发现我觉得需要增加一个收藏功能,也就是看到好的帖子,可以收藏下来,想看时就不用找那么久。看了那么久只看到收藏本版的功能!!!{:45:}{:45:}{:45:}真的是我没发现么呵呵
    发表于 11-10 19:40

    关于“收藏”设置的建议

    在论坛里会看到很精彩的文章,就会收藏保存,以后从新温习,,但是收藏不能分组,所有的收藏文件都挤在一起,所以实在是太乱了,找到哪一个文件的话,非常的不方便,,,建议能够进行分组归类,,这
    发表于 06-12 10:02

    pandas是什么?

    系列文章目录提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结前言提示:这里可以添加本文要记录
    发表于 07-14 07:48

    pandas是什么

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结前言提示:这里可以添加本文要记录的大概内容:例如:随着
    发表于 08-09 07:39

    pandas使用步骤

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结学习内容:学习时间:学习产出:前言一、pandas是什么?二
    发表于 08-10 07:50

    pandas是什么?怎么使用?

    系列文章目录提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加例如:第一章 Python 机器学习入门之pandas的使用提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助
    发表于 12-07 06:37

    pandas是什么?

    文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结前言一、pandas是什么?二、使用步骤1.引入库代码如下(示例):import numpy as npimport
    发表于 01-11 07:53

    pandas是什么?

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结前言提示:这里可以添加本文要记录的大概内容:例如:随着
    发表于 01-12 07:53

    pandas是什么?

    系列文章目录提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加例如:第一章 Python 机器学习入门之pandas的使用提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助
    发表于 01-17 06:52

    无线路由器设置图解

    无线路由器设置图解,值得收藏
    发表于 11-10 17:39 833次下载
    无线路由器设置<b class='flag-5'>图解</b>

    探究pandas与GUI界面的超强结合

    pandasgui安装与简单使用 根据作者的介绍,pandasgui是用于分析 Pandas DataFrames的GUI。这个属于第三方库,使用之前需要安装。 pip install
    的头像 发表于 11-09 10:55 1331次阅读
    探究<b class='flag-5'>pandas</b>与GUI界面的<b class='flag-5'>超强</b>结合

    【CC2530授课笔记】课程列表汇总 【超级干货】【建议收藏

    【CC2530授课笔记】课程列表汇总 【超级干货】【建议收藏
    发表于 11-29 19:36 0次下载
    【CC2530授课笔记】课程列表汇总 【超级干货】【<b class='flag-5'>建议</b><b class='flag-5'>收藏</b>】

    图解Pandas常用操作!

    它描述了一个在线商店的不同产品线,共有四种不同的产品。与前面的例子不同,它可以用NumPy数组或Pandas DataFrame表示。但让我们看一下它的一些常见操作。
    的头像 发表于 04-25 10:55 590次阅读
    <b class='flag-5'>图解</b><b class='flag-5'>Pandas</b>常用操作!

    Linux 命令大全建议收藏

    本文为 Linux 命令大全,从 A 到 Z 都有总结,建议大家收藏以便查用,或者查漏补缺!
    的头像 发表于 05-12 10:53 596次阅读

    建议收藏)使用示波器必懂的基础知识汇总

    群,想要加群学习讨论/领取文档资料的同学都可以扫描图中运营二维码一键加入哦~  (广告、同行勿入 原文标题:(建议收藏)使用示波器必懂的基础知识汇总 文章出处:【微信公众号:张飞实战电子】欢迎添加关注!文章转载请注明出处。
    的头像 发表于 07-10 19:40 479次阅读
    (<b class='flag-5'>建议</b><b class='flag-5'>收藏</b>)使用示波器必懂的基础知识汇总