0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GitHub上开源了个集众多数据源于一身的爬虫工具箱——InfoSpider

人工智能与大数据技术 来源:开源最前线 作者:开源最前线 2020-11-23 11:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

国内一位开发者在 GitHub 上开源了个集众多数据源于一身的爬虫工具箱——InfoSpider,一不小心就火了!!!

有多火呢?开源没几天就登上GitHub周榜第四,标星1.3K,累计分支172个(GitHub地址:https://github.com/kangvcar/InfoSpider) 在这样一个信息爆炸的时代,每个人都有很多个账号,账号一多就会出现这么一个情况:个人数据分散在各种各样的公司之间,就会形成数据孤岛,多维数据无法融合,这个项目可以帮你将多维数据进行融合并对个人数据进行分析,这样你就可以更直观、深入了解自己的信息。 InfoSpider 是一个集众多数据源于一身的爬虫工具箱,旨在安全快捷的帮助用户拿回自己的数据,工具代码开源,流程透明。并提供数据分析功能,基于用户数据生成图表文件,使得用户更直观、深入了解自己的信息。

目前支持数据源包括GitHub、QQ邮箱、网易邮箱、阿里邮箱、新浪邮箱、Hotmail邮箱、Outlook邮箱、京东、淘宝、支付宝、中国移动、中国联通、中国电信、知乎、哔哩哔哩、网易云音乐、QQ好友、QQ群、生成朋友圈相册、浏览器浏览历史、12306、博客园、CSDN博客、开源中国博客、简书。 根据创建者介绍,InfoSpider 具有以下特性:

安全可靠:本项目为开源项目,代码简洁,所有源码可见,本地运行,安全可靠。

使用简单:提供 GUI 界面,只需点击所需获取的数据源并根据提示操作即可。

结构清晰:本项目的所有数据源相互独立,可移植性高,所有爬虫脚本在项目的 Spiders 文件下。

数据源丰富:本项目目前支持多达24+个数据源,持续更新。

数据格式统一:爬取的所有数据都将存储为json格式,方便后期数据分析。

个人数据丰富:本项目将尽可能多地为你爬取个人数据,后期数据处理可根据需要删减。

数据分析:本项目提供个人数据的可视化分析,目前仅部分支持。

InfoSpider使用起来也非常简单,你只需要安装python3和Chrome浏览器,运行 python3 main.py,在打开的窗口点击数据源按钮, 根据提示选择数据保存路径,接着输入账号密码,就会自动爬取数据,根据下载的目录就可以查看爬下来的数据。 是不是很简单呢,如果你对InfoSpider也感兴趣,赶紧试一下。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    4031

    浏览量

    45568
  • GitHub
    +关注

    关注

    3

    文章

    484

    浏览量

    18424
  • 爬虫
    +关注

    关注

    0

    文章

    87

    浏览量

    7949

原文标题:一款爆红的开源爬虫工具箱

文章出处:【微信号:TheBigData1024,微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    在Google Pixel 10“听诊”蓝牙信道?开源安卓应用实测揭秘

    的应用开发工具箱注入精准距离估算能力。开发者首次能够通过Nordic Semiconductor的开源应用,在搭载nRF54L系列设备的Pixel 10智能手机上评估并运用蓝牙信道探测技术。 本次更新
    发表于 11-30 21:09

    DP1363F 多协议NFC 兼容CLRC663开发资料

    ​DP1363F是高度集成的收发器芯片,用于13.56Mhz的非接触式通讯。强大的多协议支持、最高射频输出功率,以及突破性技术低功耗卡片检测等优势于一身,满足市场对更高集成度、更小外壳和互操作性
    发表于 11-03 14:01

    CANape的CASL工具箱

    在汽车电子ECU(电子控制单元)开发与测试领域,CANape是核心的测量、标定与诊断工具,而其专属的CASL(CalculationandScriptingLanguage)语言,凭借接近C语言
    的头像 发表于 10-29 10:03 297次阅读
    CANape的CASL<b class='flag-5'>工具箱</b>

    开放原子开源基金会与新开源项目完成捐赠签约

    近日,在2025开放原子开源生态大会开幕式,开放原子开源基金会与新开源项目完成捐赠签约,涵盖人工智能、具
    的头像 发表于 07-28 17:04 805次阅读

    微软开源GitHub Copilot Chat,AI编程迎来新突破

    30分,微软首席执行官Satya Nadella向大家展示VS Code的最新AI开源编辑器GitHub Copilot Chat。 GitHub Copilot Chat的
    的头像 发表于 07-02 09:34 814次阅读
    微软<b class='flag-5'>开源</b><b class='flag-5'>GitHub</b> Copilot Chat,AI编程迎来新突破

    开源工具 Made with KiCad(131):BomberCat 安全测试工具

    “  BomberCat 是结合硬件开发与安全测试的开源工具,主要面向电子工程和网络安全领域。用于检测银行终端、门禁系统等设备的漏洞。 ” Made with KiCad 系列将支
    的头像 发表于 06-19 11:18 7710次阅读
    <b class='flag-5'>开源</b><b class='flag-5'>工具</b> Made with KiCad(131):BomberCat 安全测试<b class='flag-5'>工具</b>

    Made with KiCad(104):Cynthion - 用于构建、分析和 Hack USB 设备的多功能工具

    “  Cynthion 是 USB 设备构建、测试、监控和实验于一身工具。采用基于 FPGA 的独特架构,其数字硬件可根据应用进行完全定制。因此,它可以充当不折不扣的高速 US
    的头像 发表于 04-30 16:47 2490次阅读
    Made with KiCad(104):Cynthion - 用于构建、分析和 Hack USB 设备的多功能<b class='flag-5'>工具</b>

    NVIDIA推出开源物理AI数据

    标准化合成数据的初始版本预计将成为世界最大的此类数据,目前已作为开源版本提供给机器人开发人员。
    的头像 发表于 03-24 17:52 895次阅读

    Open Echo:开源的声纳项目

    “  这是还在迭代中的项目。开源的回声测深仪/水深测量仪/声呐系统,适用于水文测绘及科研用途。基于Arduino平台开发并具备良好兼容性  ”   Open Echo 概览 作为持续迭代
    的头像 发表于 03-20 11:14 2014次阅读
    Open Echo:<b class='flag-5'>一</b><b class='flag-5'>个</b><b class='flag-5'>开源</b>的声纳项目

    七款经久不衰的数据可视化工具

    量的激增,单纯通过数字和文本来分析数据已不再高效。数据可视化则提供种直观、互动性强的方式,帮助人们通过视觉元素,如柱状图、折线图、饼图、热力图等图表形式,理解复杂的
    发表于 01-19 15:24

    十堰新批智慧路灯投用,多种功能于一身 智慧路灯案例分享

    十堰新批智慧路灯投用,多种功能于一身 智慧路灯案例分享
    的头像 发表于 01-03 10:39 580次阅读
    十堰新<b class='flag-5'>一</b>批智慧路灯投用,<b class='flag-5'>集</b>多种功能<b class='flag-5'>于一身</b> 智慧路灯案例分享

    IP地址数据信息和爬虫拦截的关联

    多样的数据,那么我们应该怎么利用IP地址信息来对爬虫行为进行识别呢? 访问频率异常的大概率是爬虫行为 正常用户访问:浏览网站时,操作速度会受到人类行为习惯的限制,通常会在页面上停留
    的头像 发表于 12-23 10:13 678次阅读

    性能与成本于一身的IMU,让无人机飞行更稳定

    无人机在进行任何形式的飞行时,必须了解空中平台的方向、其运动的性质以及飞行方向。通常用于测量此运动的是IMU,IMU提供与无人机三轴向的加速度和角速度数据,以及有关无人机在横滚、俯仰和偏航方面的测量数据。常见应用包括控制和稳定
    的头像 发表于 12-19 15:45 1548次阅读
    <b class='flag-5'>集</b>性能与成本<b class='flag-5'>于一身</b>的IMU,让无人机飞行更稳定

    手持多参数速测记录仪:多种测量功能于

    速测记录仪的显著特点便是能够多种测量功能于一身,广泛涵盖了众多关键参数的检测。在水质分析领域,它可以精确测量酸碱度(pH),实时反映水体的酸碱性程度,这对于判断水质是否适宜水生生物生存以及评估水体受污染状况至
    的头像 发表于 12-17 11:13 656次阅读

    Mybatis 拦截器实现单数据源多数据库切换

    作者:京东保险 王奕龙 物流的分拣业务在某些分拣场地只有个数据源,因为数据量比较大,将所有数据存在张表内查询速度慢,也为了做不同设备
    的头像 发表于 12-12 10:23 1602次阅读