通过IP反查(nslookup)判断百度蜘蛛IP真假

我们经常会碰到黑客利用伪装蜘蛛扫描网站,今天我们介绍下如何利用IP反查方法,判断蜘蛛是否为百度搜索引擎蜘蛛。

以百度为例,通常我们判断是否是百度蜘蛛抓取看用户代理字符串也就是User-Agent,但是User-Agent是可以模拟的,所以很多时候也会有虚假的模拟伪装成百度蜘蛛来抓取,这时候我们就需要学会分辨真伪。

通过IP反查(nslookup)判断百度蜘蛛IP真假

首先是百度User-Agent代理字符串,百度官方公布的有如下User-Agent:

移动UA:Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,likeGecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

PC UA:Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

新增渲染UA:

移动UA:Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 likeMac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143Safari/601.1 (compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

PC UA:Mozilla/5.0 (compatible;Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

需要注意的是百度新增了一个移动的User-Agent,和一个PC的User-Agent。我们知道了百度蜘蛛的User-Agent,如何正确识别和判断某条抓取是否是真实的百度蜘蛛。

如何识别百度蜘蛛

1、首选我们需要通过关键词找User-Agent中是否包含Baiduspider;

2、如果想区分移动和PC的蜘蛛的话,我们还需要在结果中再进行关键词过滤,移动端的User-Agent包含:Android 、iPhone、Mobile等三个中至少一个。

3、通过上述操作我们可以分辨出哪些抓取是百度蜘蛛抓取,但并不能分辨真伪。

判断百度蜘蛛真伪

1、验证百度蜘蛛真伪我们一般使用的是DNS反查IP的方式来进行判断,首选我们需要找到上述抓取记录中蜘蛛的IP。

通过IP反查(nslookup)判断百度蜘蛛IP真假

通过IP反查(nslookup)判断百度蜘蛛IP真假

2、以windows操作系统为例,开始运行中输入cmd 弹出窗口中输入 nslookup (上述IP地址),判断百度蜘蛛的真伪,真是百度蜘蛛结果中会返回以*.baidu.com 或*.baidu.jp 的格式命名hostname,如不包含则为假百度蜘蛛。

常见HTTP状态码解读:

1、200代码,表示蜘蛛爬取正常

2、404代码,访问的这个链接是错误链接

3、301代码,永久重定向

4、302代码,表示临时重定向

5、304代码,客户端已经执行了GET,但文件未变化。

6、500代码,表示网站内部程序或服务器有错

主题测试文章,只做测试使用。发布者:普帝思,转转请注明出处:https://www.poddns.com/378.html

(0)
普帝思的头像普帝思
上一篇 2024年12月11日 上午11:41
下一篇 2024年12月11日 上午11:41

相关推荐

  • Pbootcms网站打开很慢解决办法

    Pbootcms是一个入门级及易用的CMS系统,备用广大中小企业青睐,最重要的是pbootcms可免费商用,可谓是国内CMS中首屈一指的开源系统。 Pbootcms模板行业也是百家绽放,提供了海量的Pbootcms模板和丰富的教程资源,但是有些客户会碰到各种pbootcms的问题,比如pbootcms网站打开慢?pbootcms中毒挂马?等等问题,今天我们重…

    2024年11月30日
    00
  • PbootCms关闭自动更新防止二开文件被覆盖

    PbootCms有在线更新功能,如果是二开的网站,在线更新很容易把文件给覆盖了,那么二开后怎么防止更新被覆盖文件。 第一种方法: 将二开文件进行备份,更新后再用二开备份文件覆盖一下。 第二种方法: 将在线更新按钮关闭掉。 分别打开下面两个文件: apps/admin/view/default/system/home.html apps/admin/view/…

    2024年11月30日
    00
  • 科学与财富,揭秘搜索引擎收录的秘密

    在互联网时代,网站收录成为了众多网站运营者关注的焦点,科学与财富这两个关键词在搜索引擎中的收录情况如何呢?本文将为您揭秘这两个关键词的收录秘密。 科学与财富的背景 1、科学 科学是一个涵盖自然科学、社会科学、人文科学等多个领域的广泛概念,在我国,科学被视为国家发展的基石,是推动社会进步的重要力量,近年来,随着互联网的普及,科学领域的信息传播速度加快,科学类网…

    2025年5月19日
    00
  • 2022年网站收录,趋势分析、优化策略与未来展望

    随着互联网的快速发展,网站已成为企业、个人展示形象、拓展业务的重要平台,网站收录是搜索引擎优化(SEO)的核心指标之一,直接影响着网站的流量和曝光度,本文将分析2022年网站收录的趋势,探讨优化策略,并对未来收录方向进行展望。 2022年网站收录趋势分析 1、移动端收录占比持续增长 随着智能手机的普及,用户在移动端的搜索需求日益增长,2022年,移动端收录占…

    2025年5月4日
    00
  • 网站文章秒收录的优势,提升网站排名,加速内容传播

    在互联网时代,网站文章的收录速度直接影响着网站的整体运营效果,秒收录,顾名思义,就是指文章在发布后瞬间被搜索引擎收录,本文将为您详细介绍网站文章秒收录的优势,帮助您更好地提升网站排名,加速内容传播。 秒收录的优势 1、提升网站权重 搜索引擎对网站权重的评估主要依据网站内容的更新速度、质量以及用户体验等方面,秒收录意味着网站内容更新速度快,搜索引擎会认为该网站…

    2025年3月24日
    00

购买域名联系

zname@aliyun.com

在线咨询: QQ交谈

邮件:zname@aliyun.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
可转让~