别让网站的robots成为最大的安全漏洞

       你的网站信息安全吗?树大招风,一些公司往往再收到攻击之后,才想起网站安全。网站注册的个人信息能被黑客们轻易的拿下,对用户造成的损失无法估量。没有100%安全而完美的系统,黑客们乐此不彼的研究着这些网站的安全漏洞,总有一天会被攻破。

       网站根目录下的robots.txt文件告诉搜索引擎的访问范围,使用方法很简单,但是搜索引擎还是个人来说都是可以访问的, 很多新人不知道这个文件的重要性,对于渗透测试人员或黑客,可以通过robots.txt文件发现敏感信息,比如猜测这是什么后台用什么数据库等,意味着自己的网站是真空上阵。

别让网站的robots成为最大的安全漏洞

如何防止别人访问呢?

       网上有人这么做:在IIS中,选中robots.txt,右键属性里,选中重定向到URL,输入任意一个非本站的URL路径,勾选“上面准确的URL”以及“资源的永久重定向”,有点基础的童鞋知道,访问 http://域名/robots.txt 时,是自动跳转到指定的那个非本站URL路径。 这个方法在Apache环境中可以借助.htaccess达到这个重定向的目的。

       但是对于蜘蛛来说,这样的跳转意味着站内不存在这个文件,那蜘蛛就不会遵守这个规则,把能发现的URL都抓了。

       为防止别人利用robots文件泄露了网站的结构,做其他手脚,站长们是绞尽脑汁。不让搜索引擎来抓这个文件,那就不遵从抓取范围,都会放进索引库,对不想让搜索引擎建立索引的方法参考:页面不让搜索引擎建立索引。

实用的防护措施,推荐采用通配符(*)替换敏感文件或文件夹

      比如某个重要文件夹为admin,可以这样写robots

User-agent:
Disallow:/a*/

       意思是禁止所有搜索引擎索引根目录下a开头的目录,一般的网站的比较通用的命名有admin,include,templets,plus等,这些都是重要的文件夹,可以修改文件名,但是其他关联一并修改,否则系统会出错。

用.htaccess禁止垃圾蜘蛛访问

一搜YisouSpider   #无视robots规则
宜搜EasouSpider   #无视robots规则
易查   #无视robots规则
MSNmsnbot-media
有道youdao
必应bingbot

       当然你也要看流量来源,如果有,那就不要屏蔽,实在是少得很有每天很勤快的来访的话,可以屏蔽。

robots屏蔽蜘蛛

User-agent: YisouSpider
Disallow: /
User-agent: EasouSpider
Disallow: /
User-agent: msnbot-media
Disallow: /
User-agent: YoudaoBot
Disallow: /
User-agent: bingbot
Disallow: /

.htaccess屏蔽蜘蛛

SetEnvIfNoCase User-Agent "^Yisou" bad_bot
SetEnvIfNoCase User-Agent "^Easou" bad_bot
SetEnvIfNoCase User-Agent "^Youdao" bad_bot
SetEnvIfNoCase User-Agent "^msn" bad_bot
Deny from env=bad_bot 

       或者如下写法,中间加就行了

RewriteCond %{HTTP_USER_AGENT} (jikeSpider|easouSpider|YisouSpider|bingbot|YoudaoBot|) [NC]

主题测试文章,只做测试使用。发布者:xiangxiang,转转请注明出处:http://www.poddns.com/525.html

(0)
xiangxiang的头像xiangxiang
上一篇 2024年12月24日 下午12:13
下一篇 2024年12月24日 下午12:13

相关推荐

  • 默认隐藏部分内容,点击展开更多JS代码

    移动端优化由于分辨率的原因,不适宜展开所有的内容,根据实际情况点击再展开。从SEO优化的角度来说,这只是隐藏显示到用户端,蜘蛛能正常抓取完整内容,并不是SEO黑帽。 区别于ajax异步调用内容,蜘蛛不抓取调用出来的所有内容,因为是触发了某个按钮或鼠标命令才调用,因此不建议运用ajax筛选,而采用php筛选,能让蜘蛛正常抓取URL。参考文章《终极讲解dedec…

    2025年1月12日
    00
  • Win7局域网共享不输入用户名密码权限设置

    在局域网内文件夹共享可以减少很多不必要的资源浪费,一些比较大型的机构可以把内容统一放到局域网服务器,以提高工作效率。 虽然微软主推Win10,但是Win7用户还是不愿意更换。在办公室有一些财务、视频软件是破解版或二次开发,对Win10的支持欠佳。秀站网用的都是Win10,这个会自动更新,而且用了网上说的一些方法也不能阻止Win10的更新。 干脆还是用较稳定的…

    2025年1月3日
    00
  • 网站查询百度收录,全方位解析与实用技巧

    百度作为中国最大的搜索引擎,其收录的网站数量占据了市场的主导地位,对于网站运营者来说,了解自己的网站在百度中的收录情况至关重要,本文将为您全方位解析如何查询百度收录,并提供一些实用技巧。 百度收录概述 1、百度收录定义 百度收录是指百度搜索引擎将网站中的页面添加到其数据库中,以便用户通过关键词搜索到这些页面,就是网站页面被百度抓取并展示在搜索结果中。 2、百…

    2025年3月24日
    00
  • SEO现在对百度排名有用吗

    一、SEO现在对百度排名有用吗 自从轰轰烈烈的百度魏则西事件过后,国家网信办会同国家工商总局、国家卫生计生委成立的联合调查组入驻百度调查过后,百度搜索页面只能有4条广告了,并且全都标注了“商业推广”,相对大家都理解了,这样导致关键词点击成本高涨,大量中小企业转移到SEO阵地上,很多中小企业纷纷组建SEO团队,或者外包给seo公司,现在做SEO也越来越激烈,越…

    笔记 2024年12月18日
    00
  • 揭秘,为什么网站收录的很少?全方位解析收录难题

    随着互联网的快速发展,网站已经成为企业展示自身形象、拓展业务的重要平台,许多网站在搜索引擎中收录的页面数量却寥寥无几,导致网站流量低迷,无法发挥应有的价值,为什么网站收录的很少呢?本文将从多个角度为您揭秘收录难题。 网站收录的影响因素 1、网站内容质量 搜索引擎对网站内容的评价是影响收录的重要因素,如果网站内容质量低,如存在大量抄袭、低质量文字、图片、视频等…

    2025年3月19日
    00

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信