通过IP反查(nslookup)判断百度蜘蛛IP真假

我们经常会碰到黑客利用伪装蜘蛛扫描网站,今天我们介绍下如何利用IP反查方法,判断蜘蛛是否为百度搜索引擎蜘蛛。

以百度为例,通常我们判断是否是百度蜘蛛抓取看用户代理字符串也就是User-Agent,但是User-Agent是可以模拟的,所以很多时候也会有虚假的模拟伪装成百度蜘蛛来抓取,这时候我们就需要学会分辨真伪。

通过IP反查(nslookup)判断百度蜘蛛IP真假

首先是百度User-Agent代理字符串,百度官方公布的有如下User-Agent:

移动UA:Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,likeGecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

PC UA:Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

新增渲染UA:

移动UA:Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 likeMac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143Safari/601.1 (compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

PC UA:Mozilla/5.0 (compatible;Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

需要注意的是百度新增了一个移动的User-Agent,和一个PC的User-Agent。我们知道了百度蜘蛛的User-Agent,如何正确识别和判断某条抓取是否是真实的百度蜘蛛。

如何识别百度蜘蛛

1、首选我们需要通过关键词找User-Agent中是否包含Baiduspider;

2、如果想区分移动和PC的蜘蛛的话,我们还需要在结果中再进行关键词过滤,移动端的User-Agent包含:Android 、iPhone、Mobile等三个中至少一个。

3、通过上述操作我们可以分辨出哪些抓取是百度蜘蛛抓取,但并不能分辨真伪。

判断百度蜘蛛真伪

1、验证百度蜘蛛真伪我们一般使用的是DNS反查IP的方式来进行判断,首选我们需要找到上述抓取记录中蜘蛛的IP。

通过IP反查(nslookup)判断百度蜘蛛IP真假

通过IP反查(nslookup)判断百度蜘蛛IP真假

2、以windows操作系统为例,开始运行中输入cmd 弹出窗口中输入 nslookup (上述IP地址),判断百度蜘蛛的真伪,真是百度蜘蛛结果中会返回以*.baidu.com 或*.baidu.jp 的格式命名hostname,如不包含则为假百度蜘蛛。

常见HTTP状态码解读:

1、200代码,表示蜘蛛爬取正常

2、404代码,访问的这个链接是错误链接

3、301代码,永久重定向

4、302代码,表示临时重定向

5、304代码,客户端已经执行了GET,但文件未变化。

6、500代码,表示网站内部程序或服务器有错

主题测试文章,只做测试使用。发布者:xiangxiang,转转请注明出处:http://www.poddns.com/378.html

(0)
xiangxiang的头像xiangxiang
上一篇 2024年12月11日 上午11:41
下一篇 2024年12月11日 上午11:41

相关推荐

  • pbootcms后台登陆不显示验证码【阿里云虚拟主机】

    pbootcms验证码图片显示,常见于阿里云虚拟主机中。 这个问题主要是阿里云虚拟主机的配置问题。 登陆阿里云控制台,进入虚拟主机-高级环境设置-PHP.INI设置,如下图:  

    2024年12月4日
    100
  • 揭秘搜索网站收录量,如何展示和提升网站收录量

    随着互联网的快速发展,搜索引擎已经成为人们获取信息的重要渠道,网站收录量作为衡量网站质量的重要指标,对于网站优化和推广具有重要意义,本文将围绕展示搜索网站收录量这一主题,探讨如何提升网站收录量,助力网站在搜索引擎中脱颖而出。 什么是网站收录量? 网站收录量是指搜索引擎抓取并收录的网页数量,一个网站收录量越高,说明其在搜索引擎中的权重和影响力越大,提高网站收录…

    2025年5月8日
    300
  • PbootCMS模板免费下载

    标题:PbootCMS模板免费下载,助你打造个人网站的神器! 导语:想要拥有一个专属于你的个人网站吗?PbootCMS模板免费下载让你轻松实现这一梦想! 正文: PbootCMS是一款优秀的开源内容管理系统(CMS),它可以帮助你轻松创建和管理网站。今天,我们要为大家推荐的是PbootCMS模板免费下载,让新手也能快速搭建属于自己的个人网站! 一、Pboot…

    笔记 2024年10月31日
    100
  • QQ浏览器收录网站攻略,提升网站流量与排名,让您的网站脱颖而出

    随着互联网的快速发展,网站已经成为企业展示形象、拓展业务的重要平台,如何让您的网站在众多网站中脱颖而出,吸引更多潜在客户呢?QQ浏览器作为国内主流的浏览器之一,对网站的收录和排名有着重要影响,本文将为您详细介绍QQ浏览器收录网站攻略,帮助您提升网站流量与排名。 了解QQ浏览器收录网站的特点 1、网站内容质量:QQ浏览器对网站内容的原创性、丰富性、相关性等方面…

    2025年3月24日
    500
  • 教育新探索期刊,引领学术前沿的收录网站解析与展望

    随着教育事业的不断发展,教育新探索期刊作为我国教育领域的重要学术平台,近年来在学术界的影响力日益扩大,本文将深入解析教育新探索期刊的收录网站,探讨其在推动教育学术研究中的作用,并对未来发展进行展望。 教育新探索期刊简介 教育新探索期刊是我国教育领域具有较高影响力的学术期刊,由中国教育学会主办,该期刊致力于传播教育新理念、新方法、新技术,推动教育改革与发展,自…

    2025年5月13日
    1000

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
域名可转让~