logo
  • 搜索学堂
  • 搜索服务
  • 互动交流
  • 资源合作
  • 用户中心
登录
推荐内容 创作者小课堂 工具解读 搜索规范 基础开发 智能小程序

资源提交

站点资源
  • 快速抓取
  • 普通收录
  • 移动适配
  • 死链提交

数据统计

小程序资源
  • 流量统计
站点资源
  • 索引量
  • 流量与关键词
  • 抓取频次
  • 抓取诊断
  • 抓取异常
  • Robots

搜索展现

  • 站点子链
  • 站点属性

站点优化与维护

  • 网站改版
论坛 反馈中心 VIP俱乐部
合作专题 申请历史
站点管理 消息提醒 联系方式 管理员设置 安全防护
  • 在线咨询

  • 反馈中心

  • 回到顶部

搜索学堂 百度搜索引擎网页质量白皮书

百度搜索引擎网页质量白皮书

发布日期:2019-09-18

互联网网页资源现状

CNNIC2014年年初发布的《中国互联网络发展状况统计报告》中称:截至2013年12月,中国网页数据为1500亿,相比2012年同期增长了22.2%。2013年中国单个网站的平均网页数和单个网页的平均字节数均维持增长,显示出中国互联网上的内容更为丰富:平均网站的网页数达到4.69万个,较去年同期增长2.3%。

 为了保证搜索质量、提高用户使用满意度,百度搜索引擎每周都会进行网页质量抽样评估。然而从近一年的评估数据中我们发现,优质网页的绝对数量非常少,且几乎没有增长;普通网页的占比在下降,相应的,质差网页的比例却有明显上涨。截至2014年5月,统计数据显示,在百度网页搜索发现的海量网页中,优质网页仅占7.4%,质差网页高达21%,其余普通网页为71.6%。

百度网页搜索通过一系列筛选、识别、分析、赋权等工作,努力将更多优质网页呈现在用户面前,每天约打击上万质量差网站,涉及网页达百万量级,尽可能减少质量差网页给用户带来的干扰。从下图2014年5月的网页展现分析数据显示,目前展现在用户面前的网页质量分布中,优质网页占比为40%,质量差网页降为11%——虽然这个变化已经非常明显,但百度网页搜索还是希望能和广大站长一起努力,将质量差占比降到更低。

 

 

互联网全部网页

 

在百度搜索得到展现的网页

优质网页

 

7.4%

 

41%

普通网页

 

71.6%

 

49%

质量差网页

 

21%

 

11%

上述质量差网页包括低质网页和垃圾网页两部分,低质网页问题分布如下图所示:

从上图我们看出,目前低质网页中最严重的问题即因广告过多、占据网页主要位置以及超预期弹窗带来的浏览体验差,内容空短、网页需要权限才能获取资源和过期信息也是低质网页的重要组成部分。 

质量差网页中除了低质网页外,无任何质量可言的垃圾页面的问题分布如下图所示:

从上图我们看出,目前低质网页中最严重的问题即因广告过多、占据网页主要位置以及超预期弹窗带来的浏览体验差,内容空短、网页需要权限才能获取资源和过期信息也是低质网页的重要组成部分。 

质量差网页中除了低质网页外,无任何质量可言的垃圾页面的问题分布如下图所示:

死链对用户、网站和搜索引擎来说都已没有存在的意义,垃圾网页中占比最大。其次是对用户和搜索引擎伤害巨大的作弊网页,资源无效、有问无答和不相关搜索结果页这些极大浪费用户时间的网页也是搜索引擎不希望呈现给用户的。

首页 上一页 1 2 3 4 下一页 尾页

推荐阅读

  • 促进下载生态良性发展,清风算法4....
  • 烽火算法持续升级,控制回退按钮失效问题
  • 百度升级『蓝天算法』,加强“站点构...
  • 官方解读:这些常见的搜索算法违规问...
  • 惊雷算法3.0升级上线 持续打击刷...
  • 搜索公开课复盘之《搜索算法全解析》
  • 搜索算法规范详解
智能小程序 投诉平台 百度统计 百度智能云 百度云加速 百度安全 百度大脑 百度保障 百度开发者中心 联系我们 微信公众号
©2025 Baidu 使用百度前必读 京ICP证030173号