网站日志是记录 web 服务器接收处理请求以及运行时错误等各种原始信息的以•log 结尾的文件,确切的讲,应该是服务器日志。网站日志最大的意义是记录网站运营中比如空间的运营情况,被访问请求的记录。通过网站日志可以清楚的得知用户在什么 IP、什么时间、用什么操作系统、什么浏览器、什么分辨率显示器的情况下访问了你网站的哪个页面,是否访问成功
所谓的网站日志,就是网站所在服务器接受用户的各种请求的时候进行的处理状况的记录,无论是正常处理或者是出了各种错误,都会在网站日志中记录下来,其文件结尾以。log 为扩展名。
从网站上下载下的网站日志,在 txt 文本中就可以看到以下数据: 222.208.186.66--GET/HTTP/1.1-200-32229-http://www.yzfdjz.net-Mozilla/4.0(compatible;MSIE6.0;WindowsNT5.0)
222.208.186.66——这是用户的 IP 地址,相信大家都能轻易看懂。知道了用户的 IP,你甚至可以通过查询来得知用户是来自哪个国家、哪个省份、哪个城市的。查询得知,这个 IP 来自国内北京地区。不同的网站其用户群会有比较明显的区别,比如我的博客肯定大多数访问者是来自沈阳的,而有的网站其用户没有什么明显的地域区别。用户 IP 配合下面的关键词等信息可以让你更加有效的分析网站的用户体验做得够不够好。
——这里讲的是发生该处理请求的具体时间。这里的时间是 2014 年 8 月 30 日 7 点 16 分 41 秒,后面的+0800 则指的是时区,即所在地方相对应英国伦敦格林尼治时间,+0800 代表的是东八区的时间。
GET——这是服务器的处理动作,一共只有两种:GET 和 POST。在网站日志中绝大部分都是 GET,只有在进行 CGI 处理的时候才会出现 POST,否则绝大多数时间服务器的响应都是 GET,也就是用户从服务器上获取了页面或者别的文件。注意了,GET 后面还有一个“/”,这里代表的是用户访问的页面,只有一个斜杠自然代表访问的是网站首页。
HTTP/1.1——这个代表用户访问该页面的时候,是通过 HTTP1.1 协议进行传输的,也就是超文本传输 1.1 版本协议。这个我们不必理会,因为网站日志中除了你可能用 FTP 之外,普通用户基本都是通过 HTTP 协议来进行访问的(个别提供 FTP 下载的网站除外)。
200-32229——代表的是用户访问页面的时候返回的状态码。以下就一些代码做个解释:
1**
:请求收到,继续处理
2**
:操作成功收到,分析、接受
3**
:完成此请求必须进一步处理
4**
:请求包含一个错误语法或不能完成
5**
:服务器执行一个完全有效请求失败
以上就是简单对一段网站日志进行的分析,当然实际上大多数时候我们根本不需要这样人工去查看网站日志,有大把的网站日志工具可以供我们使用分析网站日志。不过当你的网站出现了一些问题的时候,那么一般的日志分析软件就无法帮助你进行分析的,你必须需要自己去查看日志了。