搜索学院 百度搜索引擎工作原理
百度搜索引擎工作原理 最新更新章节:2014-12-10

关于百度以及其它搜索引擎的工作原理,其实大家已经讨论过很多,但随着科技的进步、互联网业的发展,各家搜索引擎都发生着巨大的变化,并且这些变化都是飞快的。我们设计这个章节的目的,除了从官方的角度发出一些声音、纠正一些之前的误读外,还希望通过不断更新内容,与百度搜索引擎发展保持同步,给各位站长带来最新的、与百度高相关的信息。本章主要内容分为四个章节,分别为:抓取建库;检索排序;外部投票;结果展现。

结构化数据——助力站点获得更多点击

网页经历了抓取建库,参与了排序计算,最终展现在搜索引擎用户面前。目前在百度搜索左侧结果展现形式很多,如:凤巢、品牌专区、自然结果等,一条自然结果怎样才能获得更多的点击,是站长要考虑的重要一环。

目前自然结果里又分为两类,见下图,第一个,即结构化展现,形式比较多样。目前覆盖80%的搜索需求,即80%的关键词下会出现这种复杂展现样式;第二个即一段摘要式展现,最原始的展现方式,只有一个标题、两行摘要、部分链接。

很明显,结构化展现能够向用户明确传递信息,直击用户需求痛点,获得更好的点击自然不在话下。目前结构化展现有几个样式:
 1,  通用问答:提取答案,方便搜索用户参考,有些结构化数据还提取出了问题

2, 
下载:


3
,时间戳:对于时效性较强的资讯,将时间提取出来,吸引用户点击,还有回复的条目,能够表现这个链接的有效性和热度


4
, 
在线文档:出现文档格式示意图


5,
原创标记:
原创标记的使用是最严格的,只有通过人工审核的站点才能拥有原创标志,在抓取和排序上有一定优待,所以审核非常严格,严控质量。

6,
配图:扩大面积,方便用户了解网页内容,吸引点击


那么站长可以通过什么途径获得结果化展现呢:
1,参与原创星火计划:百度站长平台VIP俱乐部提供申请入口,需要经过人工审核后进行数据提交
2,结构化数据提交工具:zhanzhang.baidu.com/wiki/197
3,结构化数据标注工具:/itemannotator/index
4,搜索结果配图:具体要求为,在文章主体位置;图片与内容相关;图片上没有文字;图片比例接近121*91