百度蜘蛛抓取如何识别

时间:2021-11-06 来源:未知网络 作者:996建站网

SEO小白,初出茅庐时会听说百度蜘蛛抓取云云,那这个蜘蛛抓取是个什么呢?它要干啥呢?

百度蜘蛛,它是百度的一个自动化程序,它的主要工作是收集整理互联网的页面、图片、视频等,从而分类建库,让用户在百度搜索中检索到需要的内容。

百度蜘蛛抓取如何识别插图

在SEO优化的过程中,经常有人问:“最近百度蜘蛛来的太频繁服务器抓爆了,怎么办?”“最近百度蜘蛛都不来了怎么办”还有很多站长想要得到百度蜘蛛的IP段,并把他们加入到IP白名单中,但是IP却不固定。那站长们该怎么正确识别百度蜘蛛呢?

1、查看UA,如果UA都不对,可以直接判断非百度搜索的蜘蛛,目前对外公布过的UA是:
移动UA:Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,likeGecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0;+baidu.com/search/spider)
PC UA:Mozilla/5.0 (compatible; Baiduspider/2.0;+baidu.com/search/spider)
新增渲染UA:
移动UA:Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 likeMac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143Safari/601.1 (compatible; Baiduspider-render/2.0; +baidu.com/search/spider)

PC UA:Mozilla/5.0 (compatible;Baiduspider-render/2.0; +baidu.com/search/spider)
2、反查IP
站长可以通过DNS反查IP的方式判断某只spider是否来自百度搜索引擎。根据平台不同验证方法不同,如linux/windows/os三种平台下的验证方法分别如下:
1)、在linux平台下,您可以使用host ip命令反解ip来判断是否来自Baiduspider的抓取。Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。

百度蜘蛛抓取如何识别插图

2)、在windows平台或者IBM OS/2平台下,您可以使用nslookup ip命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入nslookup xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以*.baidu.com 或*.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。
3)、 在mac os平台下,您可以使用dig 命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入dig xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或*.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。

以上内容是由华联纵横商务提供,如果大家有业务上的类似需求,可直接联系华联纵横客服咨询。他们的技术水平的确不错。

百度蜘蛛抓取如何识别插图1

微信扫一扫 关注公众号

微信扫一扫 使用小程序

百度扫一扫 使用小程序