首页> 优帮智库>分析网站日志应该从哪个页面入手?

分析网站日志应该从哪个页面入手?

发布时间:2019-03-26 11:30:10     来源: 搜骐网络

如果您有SEO优化、网站租赁需求请致电:17742004931 , 057188730320

网站日志分析是网站SEO优化的重要组成部分。网站刚刚创建,我们想看看蜘蛛是否爬行;网站包含,我们需要知道蜘蛛的活动;网站包含减少,我们想看看服务器是否有问题;网站是K,我们想看看服务器日志中的服务器是否有问题。  

因此,无论网站何时运行,网站日志都应该始终关注网站服务器日志的动态。如何分析网站日志?我们需要知道哪些数据?接下来,终的SEO顾问将与您讨论网站日志分析的主题。在分析网站日志时,我们应该关注以下数据:  

网站日志记录了蜘蛛和访客访问网站的实际情况。这些数据对网站具有重要意义。用户行为和蜘蛛行为都有重要的参考数据。  

从用户的访问行为,我们可以知道用户喜欢哪个页面,他进入哪个入口,后离开哪个页面;他访问了多少页面,他在网站上停留了多长时间,这些数据非常重要。在很大程度上,它帮助我理解用户的浏览行为和思想。  

从蜘蛛的角度来看,一般可以观察到蜘蛛的出访次数、蜘蛛停留时间、蜘蛛抓取量和蜘蛛返回码。我们可以计算蜘蛛平均停留时间、蜘蛛平均抓取量、蜘蛛抓取量、蜘蛛重复抓取的页数;以及抓取时间、抓取页面和特定的页面列类型。这对于网站了解网站的权重分布是非常重要的参考。  

我们可以通过观察网站日志来分析蜘蛛的行为。  

1。蜘蛛总抓取量和平均抓取量的增加和减少可以显示网站的结构、蜘蛛对网页的偏好程度以及蜘蛛总访问量可以显示网站的大小。  

2。平均网页停留时间表明蜘蛛爬行一页,减少网页爬行时间无疑对网站有重大意义。  

3。可以用来分析网站是否允许蜘蛛爬行无效页面的数据量。如果出现这种情况,我们应该及时处理,以避免蜘蛛的损失。网站上也有重复爬行的次数和蜘蛛的重复率。重复爬虫不能增加收集的数据量,网站的总权重与排名和流量有着密切的关系。在这种情况下,我们应该引导蜘蛛去爬行网站的其他页面,减少蜘蛛重复的爬行页面。在这里我们可以借用nofollower标签来辅助。  

4。蜘蛛捕捉时间分析,通过日志分析,可以大致了解蜘蛛何时访问你的网站,可以更好地帮助你掌握网站的更新时间和规律。  

5。结合网站流量趋势图,当网站流量大幅下降,网站流量异常时,需要了解分析蜘蛛是否在同一时间段内异常爬行,如返回码是否正常,服务器是否稳定等。  

通过以上的描述,我认为您应该对网站日志的重要性有一个大致的了解,并对网站日志进行分析。  

我们如何才能简单地开始分析日志?下面是一个简单的日志来说明:  

#软件:MicrosoftInternet信息服务6.0  

版本1  

#日期:2011-03-0100:00:17  

#字段:日期时间s-sitenames-ipcs-methodcs-uri-stemcs-uri-querys-portcs-usernamec-ipcs(用户代理)sc-statussc-substatussc-win32-statussc-bytes  

2011-03-0102:44:37W3SVC381211.154.135.217get/news/news.aspid=20080-203.208.60.169Mozilla/5.0+(兼容;+Googlebot/2.1;++http://www.google.com/bot.html)20000029057298  

搜索引擎蜘蛛:  

百度:百度蜘蛛谷歌:谷歌机器人msn:msnbot  

雅虎:slurpyodao:youdaobotsogou:sogou+get+spider  

在上面搜索蜘蛛的名字,你就能看到蜘蛛的踪迹。重要的是如何阅读下面的代码。我们称之为HTTP状态代码。  

日期表示访问记录的日期;  

时间访问时间;  

s-sitename代表您的虚拟主机。  

S-IP访客IP;  

cs方法是指访问方法,有两种常见的方法,一种是get,即我们通常打开一个url访问操作,另一种是post,提交表单操作时;  

cs-uri-step是要访问的文件。  

cs-uri查询是指访问地址参数,如asp文件?下面的字符串id=12等等,如果没有参数,使用来表示;  

S端口访问的端口  

cs用户名访问者名称  

C-IP源IP  

CS(用户代理)访问源;  

SC状态状态状态,200表示成功,403表示无权限,404表示404表示打不到该页面,500表示程序有错;
sc-substatus 服务端传送到客户端的字节大小;
cs–win32-statu客户端传送到服务端的字节大小;

  • 波浪
  • 波浪