0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Photon情报搜集爬虫的主要功能与安装使用说明

python爬虫知识分享 来源:python爬虫知识分享 作者:python爬虫知识分享 2022-06-23 16:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Photon是一个由s0md3v开源的情报搜集爬虫,其主要功能有:

1.爬取链接(内链、外链)。
2.爬取带参数的链接,如(pythondict.com/test?id=2)。
3.文件(pdf, png, xml)。
4.密钥(在前端代码中不小心被释放出来的)。
5.js文件和Endpoint(spring中比较重要的监视器)
6.匹配自定义正则表达式的字符串。
7.子域名和DNS相关数据。

你可以用它来干很多事,比如爬图片、找漏洞、找子域名、爬数据等等。

不仅如此,它甚至支持json格式 ,仅需要在输入命令的时候加上json参数:

python photon.py -u "http://example.com" --export=json

1、下载安装

https://github.com/s0md3v/Photon/archive/refs/heads/master.zip

2、简单使用

注意,使用的时候要在Photon文件夹下。比如我们随便提取一个网站的URL试一下,在终端输入以下命令:

python photon.py -u https://bk.tencent.com/

它会在当前目录下产生一个你测试的域名的文件夹,比如在我这里是 bk.tencent.com:

结果如下:

pYYBAGK0JCWAGbHpAABO34wJ3lQ540.png

嘻嘻,让我们看看里面有什么东西,有没有程序员留下的小彩蛋,打开external.txt,这是该网站的外链的存放位置。可以看到,这里不仅仅是只有网站页面,连CDN文件地址都会放在这里,所以external可能是个藏宝库哦。


3、扩展

这个项目的价值,不仅在于能够快速拉取你想要得到的数据,还在于能够构建一个牛逼轰轰的情报系统(如果你技术够强的话)。因为它是能不断延伸下去的,比如从外链出发,你能找到很多和这个网站相关的讯息。

相比于搜索引擎搜索的结果,实际上这些信息更符合情报的要求。因为存在禁止搜索引擎爬取的 robot.txt, 所以不是网站的所有信息都能在搜索引擎搜索得到,而通过这个Photon,你可以顺藤摸瓜找到那些隐藏在互联网世界的它们。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    4348

    浏览量

    46446
  • python
    +关注

    关注

    58

    文章

    4885

    浏览量

    90314
  • 爬虫
    +关注

    关注

    0

    文章

    87

    浏览量

    8178
  • photon
    +关注

    关注

    0

    文章

    33

    浏览量

    3916
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    LG HB806TGW使用说明

    LG HB806TGW使用说明
    发表于 01-04 10:51 0次下载

    NVMe高速传输之摆脱XDMA设计49:主要功能测试结果与分析1

    本文主要交流设计思路,在本博客已给出相关博文约九十篇,希望对初学者有用。注意这里只是抛砖引玉,切莫认为参考这就可以完成商用IP设计。 1)初始化功能测试 系统在上电复位后, 首先由 PCIE 集成块
    发表于 11-28 08:33

    综合配电柜主要功能喝应用场景是什么

    是综合配电柜的主要功能和应用场景的详细说明: 一、核心功能 电能分配 将输入的电力(如三相电或单相电)通过断路器、隔离开关等设备分配到多个输出回路,为不同负载(如电机、照明、空调等)提供独立电源。 支持多路输出,满足复
    的头像 发表于 10-10 10:41 1268次阅读

    医院专用数据记录仪主要功能有哪些

    数据记录仪的主要功能在于采集、存储并分析各类数据,在众多领域有着广泛而深入的应用,为不同行业的发展带来了新的活力与变革。那么,医院专用数据记录仪主要功能有哪些?有何产品推荐?下面就让小编来为大家简单
    发表于 09-28 14:53

    RFID手持机的主要功能

    很多企业在做固定资产盘点,通常会使用RFID手持机,毕竟RFID手持机是一款融合无线射频识别技术的便携式数据采集终端机,也称PDA,它具备RFID读写功能,可以对RFID标签进行识读。
    的头像 发表于 08-27 14:10 1221次阅读

    窗口看门狗定时器(WWDT)的主要功能是什么?

    窗口看门狗定时器(WWDT)的主要功能是什么?
    发表于 08-26 06:23

    手持采集器是干什么用的 PDA采集器的主要功能与应用场景

    的“得力助手”。下面就来详细说说手持采集器的主要功能和常见应用场景。一、手持采集器的核心功能1.多形式数据采集手持采集器最核心的能力就是“采集”,它支持条形码、二维码
    的头像 发表于 08-20 15:09 1375次阅读
    手持采集器是干什么用的 PDA采集器的<b class='flag-5'>主要功能与</b>应用场景

    PLC远程监控解决方案的主要功能与场景应用

    功能模块化设计与场景化适配,让远程运维从“看得见”升级为“控得准”“管得好”,在水务、化工、汽车制造等领域展现出强大的应用潜力。 一、核心功能模块:从数据采集到智能决策的全链条支撑 PLC远程监控解决方案的功能体系
    的头像 发表于 08-08 17:44 865次阅读

    PLC温度控制系统的主要功能 #物联网 #

    物联网
    juying
    发布于 :2025年08月07日 18:08:30

    PLC温度控制系统的主要功能

    PLC温度控制系统作为工业加热、恒温场景的核心控制单元,通过整合传感器、执行器与逻辑控制算法,实现对温度的精准调控,其主要功能可归纳为以下六大核心模块: 一、实时温度检测与采集 系统
    的头像 发表于 08-07 17:59 1312次阅读

    一维二维码条码识读器的主要功能有哪些

    在信息化快速发展的当下,一维二维码条码识读器已成为各行各业高效处理信息的重要工具。从超市收银到物流追踪,它凭借快速准确的信息识别能力,大幅提升了工作效率。那么,一维二维码条码识读器的主要功能有哪些呢
    的头像 发表于 08-01 15:59 1213次阅读
    一维二维码条码识读器的<b class='flag-5'>主要功能</b>有哪些

    图像采集卡的主要功能与应用

    图像采集卡是一种安装在计算机内部(通常是PCIe插槽)或通过外部接口(如USB3.0,)连接的硬件设备。它的主要功能是将来自摄像头、摄像机、传感器或其他视频源的模拟或数字视频信号,捕获、数字化并传输
    的头像 发表于 07-23 13:47 1403次阅读
    图像采集卡的<b class='flag-5'>主要功能与</b>应用

    电力智慧场站核心功能与应用场景详解

    电力智慧场站是基于物联网、大数据和人工智能技术的智能化电力运维系统,主要实现对汇流箱、环网柜、压板等关键设备的实时监测与智能分析,提升电力系统的安全性、可靠性和运维效率。以下是其主要功能和应用场景的详细介绍。
    的头像 发表于 06-28 09:44 1323次阅读

    直流负载箱的主要功能有哪些?

    直流负载箱是专门用于模拟和测试直流电源系统负载的设备,其主要功能包括以下几点: 直流负载箱可以模拟各种不同类型的负载,如电阻、电感、电容等,以满足不同应用场景的需求。通过调整负载箱的参数,可以实现
    发表于 06-17 13:34

    Xilinx Shift RAM IP概述和主要功能

    Xilinx Shift RAM IP 是 AMD Xilinx 提供的一个 LogiCORE IP 核,用于在 FPGA 中实现高效的移位寄存器(Shift Register)。该 IP 核利用 FPGA 的分布式 RAM(Distributed RAM)或块 RAM(Block RAM)资源,创建一个可配置的移位寄存器,支持用户定义的宽度和深度,适用于需要数据延迟、数据缓冲或流水线处理的场景。Shift RAM IP 提供灵活的输入/输出接口和控制信号,支持同步操作,广泛应用于数字信号处理(DSP)、通信系统和数据流处理。
    的头像 发表于 05-14 09:36 1279次阅读