logo
  • 搜索学堂
  • 搜索服务
  • 互动交流
  • 资源合作
  • 用户中心
登录
推荐内容 创作者小课堂 工具解读 搜索规范 基础开发 智能小程序

资源提交

站点资源
  • 快速抓取
  • 普通收录
  • 移动适配
  • 死链提交

数据统计

小程序资源
  • 流量统计
站点资源
  • 索引量
  • 流量与关键词
  • 抓取频次
  • 抓取诊断
  • 抓取异常
  • Robots

搜索展现

  • 站点子链
  • 站点属性

站点优化与维护

  • 网站改版
论坛 反馈中心 VIP俱乐部
合作专题 申请历史
站点管理 消息提醒 联系方式 管理员设置 安全防护
  • 在线咨询

  • 反馈中心

  • 回到顶部

数据标注工具帮助

    作者:百度站长平台     发布时间:2014年9月4日
        

    一、什么是数据标注工具?

    二、如何使用数据标注工具?

    三、使用数据标注工具能带来什么收益?

    四、目前支持哪些数据类型?

    一、什么是数据标注工具?

    数据标注工具,是一种快速将网站结构化数据提交给百度的方式。您只要用鼠标简单的划选,百度就可以快速学习如何从您网站中提取结构化数据,之后这些信息能在百度搜索结果中以富摘要的形式展现,提升网站的形象和流量。

    二、如何使用数据标注工具?

    以软件下载站为例,除了各种软件分类列表页外,软件下载站的主要页面为软件下载页,包含了许多结构化数据。例如百度浏览器下载页,页面含有软件名称、大小、更新时间、评分、下载链接等结构化数据。其他软件下载页,和这个页面包含的信息类似。

    1)选择此网页为典型网址,作为训练百度学习提取结构化数据的起始网页。

    如下图,我们若要告知百度网页哪部分内容代表软件名称,只要用右键划选“百度浏览器”,在弹出菜单中选择“名称”即可,其他信息采用类似的方式标注。

    

    页面右侧列出了描述软件信息的字段,希望将网页中有的信息都标注完整。有些右侧带“重要”标识,这些字段是出富摘要的必要字段,需特别关注。

    2)此页面标注完成后,点“继续标注”进入创建网页集页面。

    网页集是指一类相似页面的集合,通过网址模式来圈定。对于网址结构良好的网站来说,一个网址模式可以代表一类网页,此模式覆盖的网页,网页结构是类似的。百度将结合对您网站结构的理解,根据对您标注的第一个页面,自动推荐一个模式。请您根据网站具体情况修改或确认接收。网址模式过于宽泛或过于具体,都是不合理的。

    

    3)接下来到验收百度学习成绩时候了。

    大部分情况下,百度的学习成绩是不错的。百度会根据网页集模式,随机抽样符合此模式的网页,并自动标注网页内容。

    

    您需要详细检查百度的学习成果,并给予反馈:

  • 如果随机抽样的网页,页面结构和首次标注的典型网页不一样,需点击“忽略”;

  •  如果有些字段,没有自动抽取出来,需要用鼠标划选标注。

  •  如果有些字段,自动标注的内容错了,需要删除,重新划选标注。       

    百度会结合这些反馈信息,不断学习提高成绩。

    4)标注完成后,回到工具首页可以了解数据处理的状态和进度。

    

    5)如果数据处理没问题,最终您网站将获得类似下图的富摘要展现效果。

    

    三、使用数据标注工具能带来什么收益?

  1. 在百度的搜索结果中以富摘要的形式展现,提升网站的形象和流量。

  2. 让百度更了解您的网站,获得其他方面受益。        

    四、目前支持哪些数据类型?

    此工具目前处于邀请内测阶段,只支持软件类,之后逐步开放电影、游戏等类别。

智能小程序 投诉平台 百度统计 百度智能云 百度云加速 百度安全 百度大脑 百度保障 百度开发者中心 联系我们 微信公众号
©2025 Baidu 使用百度前必读 京ICP证030173号