如何分析百度蜘蛛抓取网站数据

发布时间: 2015-05-26 浏览:5408 次

百度蜘蛛(Baiduspider)是百度用于抓取网页的程序。当网站上线后,百度蜘蛛就会抓取该网站,怎么知道百度是否访问了网站?网站是否被抓取了?对于新站长来说可能不太了解,这里点击未来深圳网站建设为大家介绍下如何通过网站日志来查看网站是否被抓取了。

查看网站被百度抓取的情况,首先需要对日志进行分析,需要知道查看日志的方式。

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

日志内容如下:

djie.net 180.76.15.139 - - [25/May/2015:12:07:27 +0800] "GET /about/view/typeid/7/id/675.html HTTP/1.1" 200 3538 251222 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)"

分析:

GET /about/view/typeid/7/id/675.html  代表,抓取GET /about/view/typeid/7/id/675.html 这个页面。

200 代表成功抓取。

3538 251222代表抓取了3538 251222个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

以上就是点击未来对“百度蜘蛛抓取网站数据”的相关介绍,如果还有其他问题,可以在线咨询我们网站(www.djie.net)客服,或者拨打服务热线0755-82925166,欢迎您进行咨询。


小编还为您推荐一些seo优化知识:

新闻稿有哪些关键点?

死链接会给网站带来哪些不利因素

做网站的主要流程有哪些

上一篇:怎样快速提升企业网站权重     下一篇:[深圳网站建设]网站被K了怎么办