通过IP反查(nslookup)判断百度蜘蛛IP真假

我们经常会碰到黑客利用伪装蜘蛛扫描网站,今天我们介绍下如何利用IP反查方法,判断蜘蛛是否为百度搜索引擎蜘蛛。

以百度为例,通常我们判断是否是百度蜘蛛抓取看用户代理字符串也就是User-Agent,但是User-Agent是可以模拟的,所以很多时候也会有虚假的模拟伪装成百度蜘蛛来抓取,这时候我们就需要学会分辨真伪。

通过IP反查(nslookup)判断百度蜘蛛IP真假

首先是百度User-Agent代理字符串,百度官方公布的有如下User-Agent:

移动UA:Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,likeGecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

PC UA:Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

新增渲染UA:

移动UA:Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 likeMac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143Safari/601.1 (compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

PC UA:Mozilla/5.0 (compatible;Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

需要注意的是百度新增了一个移动的User-Agent,和一个PC的User-Agent。我们知道了百度蜘蛛的User-Agent,如何正确识别和判断某条抓取是否是真实的百度蜘蛛。

如何识别百度蜘蛛

1、首选我们需要通过关键词找User-Agent中是否包含Baiduspider;

2、如果想区分移动和PC的蜘蛛的话,我们还需要在结果中再进行关键词过滤,移动端的User-Agent包含:Android 、iPhone、Mobile等三个中至少一个。

3、通过上述操作我们可以分辨出哪些抓取是百度蜘蛛抓取,但并不能分辨真伪。

判断百度蜘蛛真伪

1、验证百度蜘蛛真伪我们一般使用的是DNS反查IP的方式来进行判断,首选我们需要找到上述抓取记录中蜘蛛的IP。

通过IP反查(nslookup)判断百度蜘蛛IP真假

通过IP反查(nslookup)判断百度蜘蛛IP真假

2、以windows操作系统为例,开始运行中输入cmd 弹出窗口中输入 nslookup (上述IP地址),判断百度蜘蛛的真伪,真是百度蜘蛛结果中会返回以*.baidu.com 或*.baidu.jp 的格式命名hostname,如不包含则为假百度蜘蛛。

常见HTTP状态码解读:

1、200代码,表示蜘蛛爬取正常

2、404代码,访问的这个链接是错误链接

3、301代码,永久重定向

4、302代码,表示临时重定向

5、304代码,客户端已经执行了GET,但文件未变化。

6、500代码,表示网站内部程序或服务器有错

主题测试文章,只做测试使用。发布者:xiangxiang,转转请注明出处:http://www.poddns.com/378.html

(0)
xiangxiang的头像xiangxiang
上一篇 2024年12月11日 上午11:41
下一篇 2024年12月11日 上午11:41

相关推荐

  • PbootCMS网站做一个多少钱

    做一个网站需要钱并不多,如果只是做个人网站、企业官网之类的,只要大概500元左右就可以了;很多人问做个网站多少钱、网站有多种类型、您要确定您打算做个什么类型的网站。不同的类型价格肯定不一样、如果您是要宣传公司产品、展示公司形象、这样的网站属于企业网站。普通企业网站价格0-3000不等、性价比最好的可以用pbootcms模板及程序,可以免费商用。 做网站主要花…

    2024年12月4日
    00
  • 东至网站收录,揭秘靠谱的收录平台,助你网站脱颖而出

    随着互联网的飞速发展,网站数量呈爆炸式增长,如何让自己的网站在众多竞争者中脱颖而出,成为许多网站运营者关心的问题,网站收录是影响网站排名的关键因素之一,东至网站收录哪里靠谱呢?本文将为您揭秘靠谱的收录平台,助您网站脱颖而出。 搜索引擎收录 1、百度收录:百度作为中国最大的搜索引擎,其收录平台具有较高的权威性和可信度,要想在百度上获得较好的收录效果,可以通过以…

    2025年3月21日
    00
  • 电影网站收录,揭秘电影网站的收录规则与优化策略

    随着互联网的快速发展,电影行业也迎来了新的发展机遇,越来越多的人通过电影网站观看电影,而电影网站作为电影资源的汇聚地,其收录规则和优化策略成为了众多电影爱好者和从业者关注的焦点,本文将围绕电影网站收录这一话题,为您揭秘电影网站的收录规则与优化策略。 电影网站收录规则 1、网站内容质量 电影网站收录的核心因素之一是内容质量,高质量的电影资源、丰富的电影类型、专…

    2025年3月24日
    00
  • 揭秘金融客期刊收录,盘点各大网站收录情况及选择指南

    随着金融行业的蓬勃发展,金融客期刊作为行业内的权威媒体,其影响力日益扩大,对于众多金融从业者来说,如何快速找到收录金融客期刊的网站成为一大难题,本文将为您揭秘金融客期刊的收录情况,并提供选择指南,帮助您轻松获取所需信息。 金融客期刊简介 金融客期刊是我国金融行业的重要媒体,致力于为金融从业者提供权威、专业的资讯和观点,期刊内容涵盖金融政策、市场动态、行业分析…

    2025年5月7日
    00
  • pbootcms网站备份教程

    pbootcms网站备份教程,网站备份是网站安全必备的基础技能,今日我们详解pbootcms程序的备份方法。pbootcms程序有两种数据结构,一种是使用的sqlite轻量数据库类型,一种是使用的mysql数据库类型。 准备工作: 首先查看pbootcms程序使用的数据库类型,打开config/database.php 文件,查看数据库使用的类型。 sqli…

    笔记 2024年12月4日
    00

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信