logo
  • 搜索学堂
  • 搜索服务
  • 互动交流
  • 资源合作
  • 用户中心
登录
推荐内容 创作者小课堂 工具解读 搜索规范 基础开发 智能小程序

资源提交

站点资源
  • 快速抓取
  • 普通收录
  • 移动适配
  • 死链提交

数据统计

小程序资源
  • 流量统计
站点资源
  • 索引量
  • 流量与关键词
  • 抓取频次
  • 抓取诊断
  • 抓取异常
  • Robots

搜索展现

  • 站点子链
  • 站点属性

站点优化与维护

  • 网站改版
论坛 反馈中心 VIP俱乐部
合作专题 申请历史
站点管理 消息提醒 联系方式 管理员设置 安全防护
  • 在线咨询

  • 反馈中心

  • 回到顶部

抓取异常问答

1、什么是抓取异常

    对于互联网中可正常访问的页面,百度蜘蛛抓取的内容应与普通用户访问到的内容是一致的,除此以外的情况,就是抓取异常。 

2、抓取异常对网站的影响有哪些

    若网站中有大量抓取异常的网页存在,搜索引擎会认为网站存在用户体验上的缺陷,并降低对网站的评价,最终影响到网站在百度搜索引擎中的表现。 

3、什么是死链

    页面已经无效,无法对用户提供任何有价值信息的页面就是死链接,包括协议死链和内容死链两种形式。

    协议死链:页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、403、503状态等。

    内容死链:服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面。

    对于死链,建议及时修复死链数据,或进行死链数据推送,以便搜索引擎更快地发现死链,减少死链对用户以及搜索引擎的影响。 

4、什么是IP禁封

    限制网络的出口IP地址,禁止该IP段的使用者进行内容访问,即为IP禁封。 

5、什么是UA禁封

     UA即为用户代理(User-Agent),服务器通过UA识别访问者的身份。当网站针对指定UA的访问,返回异常页面(如403,500)或跳转到其他页面的情况,即为UA禁封。  

6、什么是异常重定向

     将网络请求重新指向其他位置即为重定向。常见的重定向有两种:永久重定向(301跳转协议)和暂时重定向(302跳转协议),目前百度都可以识别和支持。

     对于长时间跳转到其他域名的情况,如网站更换域名,建议您使用301跳转协议。 

7、还有哪些其他异常

     针对百度refer的作弊:网页针对来自百度的refer返回不同于正常内容的行为。

     针对百度ua的作弊:网页对百度UA返回不同于页面原内容的行为。

     JS跳转作弊:网页加载了百度无法识别的JS跳转代码,使得用户通过搜索结果进入页面后发生了跳转的情况。

     压力过大引起的偶然禁封:百度会根据站点的规模,访问量等信息,自动设定一个合理的抓取压力。但是在异常情况下,如压力控制失常时,服务器会根据自身负荷进行保护性的偶然封禁。这种情况下,请在返回码中返回503(其含义是  “Service Unavailable”),百度蜘蛛会过段时间再来尝试抓取这个链接,如果网站已空闲,则会被成功抓取。

智能小程序 投诉平台 百度统计 百度智能云 百度云加速 百度安全 百度大脑 百度保障 百度开发者中心 联系我们 微信公众号
©2025 Baidu 使用百度前必读 京ICP证030173号