0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

推荐神器:四大可供学习Pandas的GitHub代码库

如意 来源:读芯术微信公众号 作者:读芯术微信公众号 2020-08-19 13:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Github的大名想必无人不知,无人不晓。一些新手或许会不敢接触Github,但同为初学者,我非常清楚Github的用途远不止管理项目版本。除了人人都可参与的开源项目以外,Github上还有丰富的学习资源。

网课固然让人受益良多,但辅以练习才能巩固新知。一些常用网站,例如“Codewars”和“Codekata”,提供每日练习,用户可根据自身需求选择语言并解题。

如果要针对Pandas进行强化练习,可以参考下列四大可供学习Pandas的Github代码仓库。其中一个代码仓库经Fork次数最多,受众层次广,Pandas新手以及进阶学习者都可使用。

Pandas Exercises——多种类数据(4k Forks)

该代码仓库由11个部分组成,涵盖了从数据预处理到高级数据可视化等内容。每个文件夹中有多个数据集,包含不同的练习。

用户可下载IPYNB文件,打开Jupyter notebook,亲自动手一试。可将代码输入题目下方的空白cell框格中,并查看“Exercise_with_Solution.ipynb”文件以核对答案。

该代码仓库资源综合性强,共有27个notebook可供使用。即使已经熟悉Pandas,“入门须知(Getting and knowing)”部分也值得一看,或许可从中新学到.describe(include=all) 和 .nunique()等函数。

Pandas Videos——多种类数据/含视频(1.2k Forks)

该代码仓库内含的Jupyter notebook附有代码,其代码来自于一个介绍Pandas多种不同功能的系列视频。作者使用真实数据集,遍历了解决问题的全过程,将其写进notebook中并发布于网上。

理想状态下,打开Jupyter notebook后便会随之播放视频。视频和代码都浏览完毕后,可将代码仓库中的notebook作为“答题纸”。这些notebook中还附有脚注,有助于厘清特定cell框格的输出结果。

这些视频与相应的notebook综合性极强。对于Pandas相关的疑问,诸如“如何对Pandas中的Series和Dataframe进行排序”等简单小问题,或是“如何用Pandas和sci-kit learn在Kaggle完成提交”等复杂大问题,都能在这一代码仓库中获得解答。

100 Pandas Puzzles(1k Forks)

该代码库中含有一个Jupyter notebook文件和一些练习以供下载。用户可将代码填入问题下方的cell框格中,并可与“solutionsnotebook”文件中的相应cell框格进行比对。

notebook由不同部分组成,包括“导入Pandas(Importing Pandas)”、“DataFrame基础知识(DataFrame basics)”和“Series与DatetimeIndex(Series andDatetimeIndex)”等。大多数问题并不需大段代码,在理想情况下仅用寥寥几行即可解决。

该代码仓库中的“扫雷(Minesweeper)”部分很有趣,内容包含:创建DataFrame,使其内含扫雷游戏的必要数据,包括方格坐标值、格内是否含雷及其相邻方格中的含雷数量。“扫雷”中等偏难,对于已完成之前练习的人来说,仍属力所能及之范围。有别于传统的数据分析,该部分考察了在特殊场景中运用DataFrame的能力,颇具趣味性。

作者也指出了题目列表尚不完整,有意完善题目的人可以提出申请,以获取更多练习、做出更正和改进。

Pycon 2019 Tutorial——中等难度(180 Forks)

该代码仓库中含有一个极长的notebook,其中有作者在自制的“使用Pandas的最佳数据科学实践(Data Science Best Practices with Pandas)”视频中讨论到的代码。该代码仓库不含Pandas的基础知识,因此适合中等水平的Pandas用户使用。

它共有八个主要部分,并不十分遵循“教程”模式,更类似于真实的数据分析项目,从数据检验、数据清洗到创建初步可视化,以帮助解答一些具体的问题,例如“平均来说,哪类职业的工作者发表的TED演讲最为有趣?”等。

对于刚接触Python和Pandas的数据分析项目的新手来说,可以观看整个视频来学习他人如何完成数据清洗、探索和分析等不同步骤,取其精华并活用于自己的项目之中。

学习的途径多种多样,你不妨从中选取符合自己Pandas水平的学习资源,在Github上一试身手。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7349

    浏览量

    95061
  • 源代码
    +关注

    关注

    96

    文章

    2953

    浏览量

    70720
  • GitHub
    +关注

    关注

    3

    文章

    489

    浏览量

    18770
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Python AI 数字化实战:从 Pandas 自动化到 DeepSeek “星逻系统”开发,无密

    一致的DataFrame进行加减运算时,Pandas会自动根据行列索引进行类似数据的外连接匹配,缺失值自动填充为NaN,这种防呆设计极大地降低了数据错位带来的计算风险。 、 性能防线:内存视图与数据类型
    发表于 04-30 13:43

    四大“门派”围攻边缘及端侧AI SoC市场“光明顶”

    据北京华兴万邦管理咨询有限公司观察,当下市场正形成四大特色鲜明、同台竞技的芯片企业阵营——物联网阵营,MCU/MPU阵营,CPU、主控SoC及应用处理器阵营,新兴专用AI SoC阵营。
    的头像 发表于 04-30 10:18 324次阅读
    <b class='flag-5'>四大</b>“门派”围攻边缘及端侧AI SoC市场“光明顶”

    Keil Studio现已支持在GitHub Codespaces中运行

    Keil Studio 现已支持在 GitHub Codespaces 中运行,通过你的浏览器即可将 Arm 量产级、兼容 CMSIS 的开发工作流,融入全托管、容器化的云端工作空间。数秒内即可搭建纯净且可复用的开发环境,让构建、代码评审与自动化流程与
    的头像 发表于 04-21 14:38 323次阅读
    Keil Studio现已支持在<b class='flag-5'>GitHub</b> Codespaces中运行

    技术干货 | 锂电池保护芯片工作原理详解:四大机制守护电池安全

    锂电池为何“娇贵”?保护芯片如何24小时防止过充、过放和短路?本文深入浅出解析锂电池保护IC的四大核心职责与技术原理。
    的头像 发表于 03-20 10:54 635次阅读
    技术干货 | 锂电池保护芯片工作原理详解:<b class='flag-5'>四大</b>机制守护电池安全

    全景拆解固变SST四大核心软件层的控制代码

    在**“多核 DSP + 多片 FPGA 集群”**的分布式异构硬件架构上。 主流中高压 固变SST 采用**“交-直-交”三级式物理拓扑**。全景拆解 固变SST 四大核心软件层 的控制代码,详细说明其 实现
    的头像 发表于 02-22 11:32 452次阅读
    全景拆解固变SST<b class='flag-5'>四大</b>核心软件层的控制<b class='flag-5'>代码</b>

    GitHub王炸:AI编程进入&quot;多智能体时代&quot;,1.8亿人彻夜未眠

    微软旗下代码托管平台GitHub正式集成Claude与Codex,开发者可在统一工作流中自由切换顶级AI助手 2026年2月5日,微软旗下GitHub宣布重大战略升级:正式将Anthropic
    的头像 发表于 02-06 15:06 348次阅读
    <b class='flag-5'>GitHub</b>王炸:AI编程进入&quot;多智能体时代&quot;,1.8亿人彻夜未眠

    一文详解SystemC仿真的编译

    AMD Vivado 设计套件以文件和的形式提供仿真模型。仿真包含器件和 IP 的行为和时序模型。编译后的可供多个设计项目使用。用户必须在设计仿真之前通过名为 compile_s
    的头像 发表于 12-12 15:08 5100次阅读
    一文详解SystemC仿真<b class='flag-5'>库</b>的编译

    MCU软件核心及示例代码速览 !

    为加速嵌入式项目开发,本文对MCU软件核心进行整体速览,涵盖初始化、外设控制与中断处理等关键部分,并结合简洁示例代码,帮助开发者快速理解与应用功能。 一、MCU核心库函数功能 MCU核心
    的头像 发表于 12-11 17:19 872次阅读
    MCU软件核心<b class='flag-5'>库</b>及示例<b class='flag-5'>代码</b>速览 !

    和而泰发布四大自研核心技术平台

    从智能家电到工业机器人,从新能源汽车到低空经济,和而泰的四大技术平台正在重新定义智能设备的"生命系统"。
    的头像 发表于 10-13 16:08 1468次阅读

    从入门到精通:基于开源代码的BLE种模式开发详解

    通过分析BLE低功耗蓝牙的种核心工作模式,结合可下载、可修改的开放源码,本教程为开发者提供一套系统、实用的开发学习路径。 BLE(Bluetooth Low Energy): 也称为
    的头像 发表于 10-09 18:00 727次阅读
    从入门到精通:基于开源<b class='flag-5'>代码</b>的BLE<b class='flag-5'>四</b>种模式开发详解

    汇川技术四大架构重磅发布

    2025 汇川技术爆品发布会上,FA、运控、传动、机器人四大 IPMT 主任携覆盖 “设计 - 制造 - 传动 - 执行” 的全栈架构登场,为中国制造业智能化转型破局。这不是简单产品升级,而是重构智能制造底层逻辑的革命。
    的头像 发表于 09-02 15:54 5004次阅读
    汇川技术<b class='flag-5'>四大</b>架构重磅发布

    空气是如何“钻空子”的?压铸件气密检测泄漏的四大元凶

    压铸件泄漏是制造业常见质量难题,看似偶然,实则是设计、工艺、材料、检测四大环节的“漏洞”共同导致。空气通过这些薄弱点侵入产品,引发质量事故。下面深度剖析四大元凶,并提供实战解决方案。1.设计缺陷隐形
    的头像 发表于 08-29 15:39 1428次阅读
    空气是如何“钻空子”的?压铸件气密检测泄漏的<b class='flag-5'>四大</b>元凶

    微软开源GitHub Copilot Chat,AI编程迎来新突破

    GitHub Copilot + vscode的组合我已经用了很久,我的代码开发效率完全提升了一个level。帮我代码提示,代码不全,注释理解生成
    的头像 发表于 07-02 09:34 1456次阅读
    微软开源<b class='flag-5'>GitHub</b> Copilot Chat,AI编程迎来新突破

    代码革命的先锋:aiXcoder-7B模型介绍

       国内开源代码大模型 4月9日aiXcoder宣布正式开源其7B模型Base版,仅仅过去一个礼拜,aiXcoder-7B在软件源代码托管服务平台GitHub上的Star数已超过2k。同时跻身
    的头像 发表于 05-20 14:41 967次阅读
    <b class='flag-5'>代码</b>革命的先锋:aiXcoder-7B模型介绍

    英飞凌碳化硅产品创新的四大支柱综述(二)

    本文是作者2024年“第十八届中国半导体行业协会半导体分立器件年会”演讲稿第二部分,第一部分请见《英飞凌碳化硅SiC技术创新的四大支柱综述(一)》。英飞凌SiC技术创新到丰富产品的四大支柱SiC
    的头像 发表于 05-19 17:32 924次阅读
    英飞凌碳化硅产品创新的<b class='flag-5'>四大</b>支柱综述(二)