0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GitHub上开源了个集众多数据源于一身的爬虫工具箱——InfoSpider

人工智能与大数据技术 来源:开源最前线 作者:开源最前线 2020-11-23 11:28 次阅读

国内一位开发者在 GitHub 上开源了个集众多数据源于一身的爬虫工具箱——InfoSpider,一不小心就火了!!!

有多火呢?开源没几天就登上GitHub周榜第四,标星1.3K,累计分支172个(GitHub地址:https://github.com/kangvcar/InfoSpider) 在这样一个信息爆炸的时代,每个人都有很多个账号,账号一多就会出现这么一个情况:个人数据分散在各种各样的公司之间,就会形成数据孤岛,多维数据无法融合,这个项目可以帮你将多维数据进行融合并对个人数据进行分析,这样你就可以更直观、深入了解自己的信息。 InfoSpider 是一个集众多数据源于一身的爬虫工具箱,旨在安全快捷的帮助用户拿回自己的数据,工具代码开源,流程透明。并提供数据分析功能,基于用户数据生成图表文件,使得用户更直观、深入了解自己的信息。

目前支持数据源包括GitHub、QQ邮箱、网易邮箱、阿里邮箱、新浪邮箱、Hotmail邮箱、Outlook邮箱、京东、淘宝、支付宝、中国移动、中国联通、中国电信、知乎、哔哩哔哩、网易云音乐、QQ好友、QQ群、生成朋友圈相册、浏览器浏览历史、12306、博客园、CSDN博客、开源中国博客、简书。 根据创建者介绍,InfoSpider 具有以下特性:

安全可靠:本项目为开源项目,代码简洁,所有源码可见,本地运行,安全可靠。

使用简单:提供 GUI 界面,只需点击所需获取的数据源并根据提示操作即可。

结构清晰:本项目的所有数据源相互独立,可移植性高,所有爬虫脚本在项目的 Spiders 文件下。

数据源丰富:本项目目前支持多达24+个数据源,持续更新。

数据格式统一:爬取的所有数据都将存储为json格式,方便后期数据分析。

个人数据丰富:本项目将尽可能多地为你爬取个人数据,后期数据处理可根据需要删减。

数据分析:本项目提供个人数据的可视化分析,目前仅部分支持。

InfoSpider使用起来也非常简单,你只需要安装python3和Chrome浏览器,运行 python3 main.py,在打开的窗口点击数据源按钮, 根据提示选择数据保存路径,接着输入账号密码,就会自动爬取数据,根据下载的目录就可以查看爬下来的数据。 是不是很简单呢,如果你对InfoSpider也感兴趣,赶紧试一下。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    2985

    浏览量

    41711
  • GitHub
    +关注

    关注

    3

    文章

    457

    浏览量

    15914
  • 爬虫
    +关注

    关注

    0

    文章

    77

    浏览量

    6509

原文标题:一款爆红的开源爬虫工具箱

文章出处:【微信号:TheBigData1024,微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    使用PSoc6在Modus工具箱中创建示例应用程序时,终端报错的原因?

    你好, 每当我尝试使用 PSoc6 在 Modus 工具箱中创建示例应用程序时,我的终端都会显示以下两错误。 有人有什么建议吗? 1) make[1]:*** [../mtb_s
    发表于 03-04 07:01

    为什么无法在modustoolbox™工具箱中打开新应用程序?

    我无法在modustoolbox™工具箱中打开新应用程序。 如何解决这个问题?
    发表于 01-31 07:32

    可以在Modus工具箱eclipse中使用DAVE™创建的项目吗?

    我们可以将项目(在 IDE 中创建 DAVE™ )使用 Modus 工具箱 eclipse IDE 吗? 如果是,怎么做? 如果不是,为什么不呢?
    发表于 01-26 06:55

    使用自定义BSP的空项目出现Modus工具箱编译错误的原因?

    的日志。 有人能为我指出有关这个错误的方向吗? 也许使用 BZI 芯片然后尝试在 LQI 芯片加载代码是更好的主意吗? (我可以确认 BZI 芯片成功兼容空应用程序)。 看来这是我要问的关于 modus 工具箱众多问题之
    发表于 01-23 06:32

    请问KitProg2是否支持加载使用Modus工具箱构建的程序闪存?

    。 对于编程工具,我考虑使用Modus工具箱编程器或 PSoC™ 编程器。 我想在 PSOC4100s MAX 设备加载 Flash。
    发表于 01-19 06:29

    在ADAU1761的工具箱库下的部分组件没有Help说明是为什么?

    在ADAU1761的工具箱库下的部分组件没有Help说明,比如MSEnv组件,有没有这部分的资料?
    发表于 11-29 07:20

    VisionFive 2成功集成Android开源项目(AOSP)!

    非常高兴地向各位宣布,赛昉VisionFive 2已成功集成了Android开源项目(AOSP),为用户带来了更多的软件解决方案以及与Android软件生态系统的无缝集成。这里程碑源于
    发表于 10-16 13:11

    易上手的数据报表工具有哪些?奥威BI零编程

    易上手的数据报表功能有哪些?实际,国产的BI报表工具都算得上是易上手的,因为它们大多都是低代码的BI报表工具,只需掌握基础SQL即可。但奥威BI报表
    发表于 08-01 15:58

    多数据源数据转换和同步的ETL工具推荐

    有许多支持多数据源数据转换和同步的ETL工具可供选择。以下是一些常见的ETL工具和它们支持多数据源数据
    的头像 发表于 07-28 16:32 497次阅读

    瑞萨 IC 工具箱软件手册

    瑞萨 IC 工具箱软件手册
    发表于 06-30 19:43 0次下载
    瑞萨 IC <b class='flag-5'>工具箱</b>软件手册

    MobaXterm 的安装-迅为STM32MP157开发板

    MobaXterm 是远端电脑的终极工具箱,作为单窗口程序,为程序员,网站管理员,IT 管理员以及更多需要处理远端任务的用户提供很多实用的功能。MobaXterm 为 windo
    发表于 06-27 15:50

    基于模型的RT1062固件开发方法,在哪里可以找到有关修改此工具箱(我假设它需要更改)的最快方法的指导?

    我正在尝试在我们的产品开发中为 RT1062 评估基于模型的 FW 开发方法(SiL、PiL)。我可以访问 NXP 提供的 Matlab 工具箱。第一个问题是我在哪里可以找到有关修改此工具箱(我假设
    发表于 06-08 07:56

    MATLAB自动驾驶工具箱使用

    1. 打开工具箱 MATLAB R2017a及以后的版本才有自动驾驶工具箱。 在MATLAB的APPS中选择AUTOMOTIVE下面的Driving Scenario Designer 也可以命令行
    发表于 06-07 11:40 1次下载
    MATLAB自动驾驶<b class='flag-5'>工具箱</b>使用

    S32K146的基于模型的设计工具箱 - 示例代码生成并闪烁但没有任何反应的原因?

    我已经安装了用于 NXP UCANS32K146 开发板的 NXP“S32K1xx 汽车微处理器系列基于模型的设计工具箱”。 我正在使用简单的示例“gpio_s32k146”,它切换 LED 并读取
    发表于 05-17 06:10

    如何将MC33771C与S32K3XX工具箱起使用?

    我正在尝试选择可以与 S32K3 工具箱起使用的组件。我想使用 teh MC33771C,但看起来 Simulink 工具箱只支持我无法获得的 MC33775 和仅适用于 6 电池
    发表于 05-09 08:21