练习题目:Training-WWW-Robots
在 Web 安全攻防中,robots.txt 往往是最容易被忽视的入口。下面通过一个经典训练题来演示其实际影响。
挑战目标:理解 Robots Exclusion Standard,发现被爬虫排除但实际暴露的路径。
解题思路
-
访问站点根目录 打开题目场景(如攻防世界),直接尝试访问
http://目标域名/robots.txt。 -
分析文件内容 如果存在该文件,查看其中的
Disallow指令。有时管理员会误将敏感路径写入其中,或者像本题一样,在注释或特定规则下隐藏了真实入口。 -
定位敏感文件 在本例中,我们发现根目录下有一个
f10g.php的文件。直接访问该路径即可获取 flag。




知识点讲解:Web 安全信息收集 - robots.txt
⚠️ 安全提示:本文仅用于授权测试和安全学习,未经授权扫描目标属于违法行为。
一、纠正误区:这不是'漏洞',是'藏宝图'
很多新手会听到'Repbots 漏洞'这种说法,其实正确的术语是 Robots 协议。它本身不是代码漏洞,但在信息收集阶段,robots.txt 文件往往是攻击者眼中的'藏宝图'。
几年前我负责某系统的安全评估时,渗透同事只花了一分钟访问了 目标网站/robots.txt,发现里面 Disallow 了一个 /backup_2023.zip 路径。直接访问该路径,下载到了包含数据库账号密码的备份文件。
全程未利用任何技术漏洞,仅靠一个配置文件。这就是 robots.txt 的安全价值——它本意是保护,配置不当却成了泄露源。


