logo
  • 搜索学堂
  • 搜索服务
  • 互动交流
  • 资源合作
  • 用户中心
登录
推荐内容 创作者小课堂 工具解读 搜索规范 基础开发 智能小程序

资源提交

站点资源
  • 快速抓取
  • 普通收录
  • 移动适配
  • 死链提交

数据统计

小程序资源
  • 流量统计
站点资源
  • 索引量
  • 流量与关键词
  • 抓取频次
  • 抓取诊断
  • 抓取异常
  • Robots

搜索展现

  • 站点子链
  • 站点属性

站点优化与维护

  • 网站改版
论坛 反馈中心 VIP俱乐部
合作专题 申请历史
站点管理 消息提醒 联系方式 管理员设置 安全防护
  • 在线咨询

  • 反馈中心

  • 回到顶部

搜索学堂 页面无用时间信息导致网页不被抓取

页面无用时间信息导致网页不被抓取

发布日期:2019-12-23

在第一期【院长帮帮忙】栏目露面的站点是编织汇(www.bianzhihui.com),该站点通过反馈中心反馈页面内容迟迟不被抓取,经百度工程师追查,原来是因为页面上的无用时间信息——没有想到是不是?同学们快来看看这个案例吧。也想让院长帮助追查吗?快来看看这里!

站点求助:现象
  编织汇网站内容发布后几个礼拜都未曾收录。案例如下:
  http://www.bianzhihui.com/t/6717(教程详细页面举例)
  http://www.bianzhihui.com/u/12306 (用户页面举例)
  http://www.bianzhihui.com/h/154 (编织花样页面举例)
  我们已将这些url放入sitemap,并使用了百度统计的集成的JS推荐,但是未曾有改善。

站点求助:自查
  根据反馈中心的回复,使用抓取异常工具诊断:未发现异常

院长出手,内部追查
  工程师结论: spider抓取很及时,但因为该网站没有设置内容产出时间,网站底部却有个老旧时间日期,导致spider误以为网页内容老旧(具体策略较复杂,在此不做赘述)。建议增加页面内容产生时间,去掉没有必要的时间信息


  *以上为旧页面截图,“2014年9月9日”对时间识别造成干扰。

站点总结:
  1,网页上切忌勿乱加时间,如我们网站的(始于2014年9月9日)这种时间是一个大忌
  2,网页内容尽可能加上产出时间,也就是发布时间
  3,百度site的结果时间和权重并无太多关系
  4,跟百度沟通的时候,一定要条例清晰,证据确凿。自身的问题一定要先排查准确。

【院长帮帮忙】第二期:服务器限制外网访问造成主动推送失败

【院长帮帮忙】第三期:无效搜索结果页是个祸害

【院长帮帮忙】第四期:URL构成越简单越平常越好

推荐阅读

  • 轻松两步,教你快速识别百度蜘蛛(U...
  • 百度对网页内容大小和字符有要求吗?
  • 百度不收录原因分析——spider抓取篇
  • 百度蜘蛛抓取流量暴增的原因
  • 资讯页不收录,原来是抢发惹的祸(第四期)
  • 善用抓取诊断工具:站点IP变更
智能小程序 投诉平台 百度统计 百度智能云 百度云加速 百度安全 百度大脑 百度保障 百度开发者中心 联系我们 微信公众号
©2025 Baidu 使用百度前必读 京ICP证030173号