搜索学院 《网站分析白皮书(站长版)》
《网站分析白皮书(站长版)》 最新更新章节:2015-01-20

《网站分析白皮书》是百度统计产品团队针对当前国内的互联网环境,参考国内外互联网专家的经验,总结了先进的网站分析方法论,其中内容并不着眼于高大全的百科全书式说教,而是针对中国互联网特殊环境,从流程、思路到分析手段介绍基础网站分析方法论,辅以实战案例说明,力求把这些来源于实战的方法让广大网站运营分析者再应用到实际网站运营中去。之前该白皮书仅在百度文库上传了PDF版,为了便于传播,百度站长平台特意将WORD整理奉上。

流量分析原理

 流量统计原理主要有两种:传统的基于日志文件统计和当前较为流行的基于脚本(JavaScript等)统计。

  ● 
基于日志文件的统计
         通过分析网站后台的日志文件来统计访客的浏览和点击行为。这种方法的优点是简单方便,无需修改网页代码,可以收集网络爬虫数据等。缺点是网站日志包含所有日志数据,需预处理来提升数据质量;而且无法统计到页面缓存导致的缓存浏览数据。

  ● 
基于脚本的统计
         此方法需要在网站的html代码中嵌入一段脚本(JavaScript等)用于统计访客的浏览等行为。这种方法的优点是技术难度低,只需嵌入脚本代码,无需配置服务器;能够快速获取点击、响应等数据并方便展现;不需要担心缓存带来的影响,数据的准确度较高。缺点主要是无法统计网络爬虫的信息。当前主流的流量分析系统绝大部分采用此种方法收集数据,包括百度统计和谷歌分析等。以下为网站分析工具的JavaScript收集数据流程图: