您现在的位置是:主页 > 网站建设 > 网站建设

石家庄网站制作:你的用户在哪里?网站日志告诉你

邢台网站优化h-5321网站日志(1)用户分析(1)人已围观

简介网站运营很多时候我们在说懂得大数据分析,那么数据分析的内容从哪里获取呢?其中之一就是今天邢台网站建设要和大

网站运营很多时候我们在说懂得大数据分析,那么数据分析的内容从哪里获取呢?其中之一就是今天邢台网站建设要和大家讲的网站日志。它一般有空间商提供,你可以从网站根目录下获得或者从空间控制面板中下载。下面我们一起来读懂你的网站日志。

网站日志就是服务器日志,是记录web服务器接收处理请求以及运行时错误等各种原始信息的log文件。网站日志的文件类型为.log文件,可以从我们网站跟目录的wwwlog目录下拷贝,根据服务器的运行环境,网站日志可以分为IIS日志和Apache日志。下面我们就以运行Windows操作系统的IIS日志为例,告诉你怎样来分析我们的网站日志。或者说,如何从网站日志中提取我们所需要的数据内容。

下载网络日志log文件后,我们发现它是堆叠在一起的各种数据,说真的当小丹看到这样的数据也是眼晕,更别说去提取分析了。所以这个时候我们就需要工具帮我们把网站日志的各个数据类别分开。通常我们会选择在线网络日志分析工具,或者直接通过EXE表格来进行。小丹喜欢用EXE表格,所以这里我们就以此来进行。首先通过EXE数据中的导入数据将网站日志植入到EXE中,记得导入时候选择分隔符形式,然后进行调节,看到清晰的数据类别的时候我们可以直接点击确定了。这个时候我们就可以看到一份比较清晰的数据了。

不过,网站日志中的数据类别都是代表什么意思呢?我们是否需要全部来进行分析呢?其实打开不必,只要明白你的用户,访问时间,查看页面,停留时间这些基本的数据即可,所以我们可以剔除不需要的数据类别,让整个网站日志看起来更加明了一些。如果不懂这些英文类别的意思也没关系,下面小丹已经为您总结,对照一下即可。IIS日志参数详解:
    date:发出请求时候的日期。
    time:发出请求时候的时间。注意:默认情况下这个时间是格林威治时间,比我们的北京时间晚8个小时,下面有说明。
    c-ip:客户端IP地址。
    cs-username:用户名,访问服务器的已经过验证用户的名称,匿名用户用连接符-表示。
    s-sitename:服务名,记录当记录事件运行于客户端上的Internet服务的名称和实例的编号。
    s-computername:服务器的名称。
    s-ip:服务器的IP地址。
    s-port:为服务配置的服务器端口号。
    cs-method:请求中使用的HTTP方法,GET/POST。
    cs-uri-stem:URI资源,记录做为操作目标的统一资源标识符(URI),即访问的页面文件。
    cs-uri-query:URI查询,记录客户尝试执行的查询,只有动态页面需要URI查询,如果有则记录,没有则以连接符-表示。即访问网址的附带参数。
    sc-status:协议状态,记录HTTP状态代码,200表示成功,403表示没有权限,404表示找不到该页面,具体说明在下面。
    sc-substatus:协议子状态,记录HTTP子状态代码。
    sc-win32-status:Win32状态,记录Windows状态代码。
    sc-bytes:服务器发送的字节数。
    cs-bytes:服务器接受的字节数。
    time-taken:记录操作所花费的时间,单位是毫秒。
    cs-version:记录客户端使用的协议版本,HTTP或者FTP。
    cs-host:记录主机头名称,没有的话以连接符-表示。注意:为网站配置的主机名可能会以不同的方式出现在日志文件中,原因是HTTP.sys使用Punycode编码格式来记录主机名。
    cs(User-Agent):用户代理,客户端浏览器、操作系统等情况。
    cs(Cookie):记录发送或者接受的Cookies内容,没有的话则以连接符-表示。
    cs(Referer):引用站点,即访问来源。

找到我们所需要的数据,根据用户名落地页面来检查网站内容,如果该页面的内容质量很低,那马上去修改;如果该页面返回HTTP状态码是404那么你可以去提交死链,或者创建这个页面。同时根据用户停留时间和页面也可以看出用户对于网站内容的类别,即可从这方面出发来完善网站内容。

很赞哦! ()

文章评论

站点信息

  • 建站时间:2018年04月24日
  • 微信公众号:扫描二维码,关注我们
  • 站点地图:xml地图/html地图