搜索学院 百度搜索算法大盘点2013-2019
百度搜索算法大盘点2013-2019 最新更新章节:2019-06-13

为了给搜索用户提供更加优质便捷的搜索体验,百度搜索始终不忘初心,致力与内容生产者、资源提供者携手共建和谐健康的搜索生态。 2013年,百度搜索发布首篇算法公告。经过6年的发展沉淀,百度搜索共计发布了13个算法、48篇公告及算法解读文章。 2019年,为帮助广大站长快速系统地了解搜索算法及规则、更好地提升自身网站质量,我们将算法进行梳理分类,汇编为《百度搜索算法大盘点》,助力站长全面获取算法最全信息。

2.用户需求满足


2.1 《百度搜索网页标题规范》——严惩网页标题作弊


2017年9月,百度搜索发布清风算法,严惩网站通过网页标题作弊,欺骗用户并获得点击的行为;从而保证搜索用户体验,促进搜索生态良性发展。


2018年11月,百度搜索针对网页标题作弊行为发布《百度搜索网页标题规范》,对搜索生态下的网页标题进行了严格的规范和要求。不符合《百度搜索网页标题规范》的站点,将会被清风算法1.0覆盖,受到限制搜索展现的处理。


《百度搜索网页标题规范》


1.标题的原则


• 网站应确保该站点下的每个页面都有指定的标题,且同一站点的不同网页应分别使用不同的标题;

• 页面标题应准确概括页面内容,避免使用模糊和不相关的描述;

• 页面标题应简明扼要,避免使用冗长的标题,避免关键词堆砌;

• 页面标题的符号使用正确,建议参考百度建议的标题符号用法(详细内容请参见后文“3.2标题的符号”部分)


2.不允许出现的标题类型

标题存在以下恶劣问题时,会对这类结果做相应的搜索结果展现限制。


2.1标题内容虚假


指标题和网页内容不相符,欺骗诱导用户点击的情况。


类型1:虚假官网

指非官方网站,但标题表述为官网的情况。

问题示例12: 非官方网站但标题为官网的负面案例

图片


类型2:无法满足用户需求

如:标题中标明可下载或在线阅读小说txt,但是页面中不提供下载服务或诱导用户下载APP;或在标题中说明有百度云下载、支持在线观看,但是页面既不能下载,又不能在线观看。


问题示例13:标题标明可下载小说,但页面中诱导下载APP的负面案例

图片


类型3:标题表述部分虚假

如:某网页标题中标明有江苏一本大学排名,但页面只有大学名单,而没有排名相关的内容。


2.2标题重复、堆砌

指网站通过网页标题过度重复或堆砌等手段,获取不正当流量的情况。


类型1:标题关键词大量重复

类型2:标题大量堆砌语义相近的关键词标签

问题示例14:标题堆砌关键词的负面案例

图片


3.优质页面标题建议

优质的网页标题,不仅能明确表达网页的主旨目的,更能给搜索用户有效的引导,吸引目标用户点击。对符合优质规范的标题,百度将会给予更多的展现优待。


3.1 标题的构成 

百度页面标题可以概括为“核心词+修饰词”的格式,修饰词建议不多于3个。


图片


3.2 标题的符号

图片


4.百度标题改写机制


为保证搜索用户的体验,百度搜索将会对部分易造成用户误导的页面标题进行相应的改写,包括但不限于以下几种情况:


对于标题堆砌等过度优化的站点首页,百度搜索会将过度优化的标题直接改写为站点名称或公司名称;

对于部分表意模糊的页面,百度搜索将会从页面中提取页面关键信息补充在标题中,保证用户能够及时获取有效信息。


针对标题堆砌的改写示例:

图片


关于清风算法1.0的更多信息请参考: 

2018.11.14 百度搜索网页标题规范 

2017.9.14 【官方说法】百度推出清风算法,严惩网页标题作弊


2.2 清风算法3.0——规范下载行业欺骗下载、捆绑下载等行为


为了规范下载行业站点的欺骗下载、捆绑下载等伤害用户的行为,百度搜索分别于2018年4月、2018年10月发布清风算法2.0、3.0版本,清风算法覆盖的问题范围从标题作弊行为扩展到下载行业站点的欺骗用户行为。


2018年10月,百度搜索发布《百度搜索下载站质量规范》,对百度搜索范围内下载站的站点行为进行严格要求和控制。不符合此规范的下载站,将会被清风算法3.0覆盖,受到搜索展现的限制。


《百度下载站质量规范》


1.下载站质量规范概要


下载站需遵守以下原则,坚持为用户提供高质量、有效,安全的下载服务:

①保证软件的安全性,无挂马、窃取用户隐私等恶意行为;

②无”李鬼下载“行为,通过普通下载/本地下载入口下载的软件必须为下载按钮文字描述的目标软件;

③下载页面中不能存在与下载按钮类似的诱导类广告;

④允许存在安全下载/高速下载的情况,但是页面中必须有明确说明解释。


2.下载站质量规范说明


2.1 PC端下载站质量规范


图示:PC端下载站页面

图片


a板块.本地下载:

应保证下载软件的安全性,无挂马、窃取用户隐私等问题;

本地下载/普通下载点击后,效果必须为直接下载目标软件,不能存在下载内容与描述不符的“李鬼下载”问题;


b板块.高速下载:

若存在高速下载情况,需要在页面上明确告知用户其与本地下载(如上图a区所示)的区别,如:说明实际效果为先下载高速下载器,然后在高速下载器中下载目标软件(如上图b区所示);


c板块.诱导广告:

下载页面中不能存在与下载按钮相似的诱导类广告,如上图c区所示的情况是不允许出现的。


2.2高速下载器规范

说明:此项规范针对用户在PC页面中下载高速下载器后,通过高速下载器下载目标软件的情况。


图示:用户下载高速下载器打开后的界面

图片


①允许下载前默认勾选推荐软件(如上图红框区域所示),但是用户可自主根据实际需求取消勾选,取消勾选后不能再将推荐软件进行捆绑下载;

②推荐下载的软件不能为色情、赌博等违法软件;


2.3移动端下载站质量规范

图示:移动端下载界面

图片


①保证下载软件的安全性,无挂马、窃取用户隐私等问题;

②下载点击后,效果必须为直接下载目标软件,不能存在“李鬼下载”现象;

③下载需要有明确说明,在页面上告知用户,如上图所示,说明实际效果为先下载某应用市场,后续可在应用市场中下载目标软件,这种方式更加安全等;

④允许默认勾选,优先进行高速下载,但用户可自主根据实际情况取消勾选,直接进入普通下载,下载目标软件。


关于清风算法3.0的更多信息请参考: 

2018.10.16 百度搜索推出清风算法3.0,规范下载行业生态 

2018.10.11 百度搜索下载站质量规范 

2018.4.19 百度搜索将推出清风算法2.0 严厉打击欺骗下载


2.3 打击虚假诈骗违法违规信息


为了维护安全健康的搜索生态,保障搜索用户的合法权益,2019年2月,百度搜索发布《关于百度搜索严厉打击虚假诈骗等违法违规信息的公告》,打击电信网络中的虚假诈骗、违法交易、黄赌毒等违法违规信息。


百度搜索打击的违法违规信息包括但不限于以下内容:


1.虚假、诈骗类信息: 
(1)仿冒政府/企业官网、伪造政府/企业联系方式等,或恶意传播相关虚假信息; 
(2)售卖或传播诈骗相关的书籍、手法、工具,宣传不正当获利手段;


2.违法交易类信息: 
(1)伪造证件:如伪造驾照、身份证、结婚证、银行卡等; 
(2)恶意套现交易:如花呗套现、白条套现等; 
(3)学术不端:如代发论文、代写论文等; 
(4)私家侦探:不符合国家法律规定,恶意探究他人隐私,侵犯他人隐私权等; 
(5)违法贷款:未取得政府认可,进行无抵押贷款、黑户贷款、裸贷等; 
(6)违规软件:恶意提供软件破解版、游戏外挂、刷赞/刷粉等作弊工具软件; 
(7)违规兼职网赚:发布刷单、打字等欺诈类兼职或违法灰色网赚信息,导致网络用户财产受损;


3.黄赌毒信息: 
(1)恶意传播色情淫秽内容或擦边信息; 
(2)恶意传播非国家认可的彩种信息,引导大众赌博,如时时彩等; 
(3)恶意传播赌博微信群、赌博工具、聚众赌博地点等非法内容。


关于打击虚假诈骗的更多信息请参考: 

2019.2.27 关于百度搜索严厉打击虚假诈骗等违法违规信息的公告


2.4 信风算法——控制翻页诱导


2019年5月,百度搜索发布信风算法,打击网站利用翻页键诱导用户的行为。


信风算法主要针对以下情况:


用户点击翻页键时,自动跳转至网站的其他频道页(如目录页、站外广告页等)。


问题示例15: 移动端,用户点击“下一页”直接跳转至站内频道目录页

图片


问题示例16:PC端,用户点击“下一页”直接跳转至站内频道目录页

图片


对于此类问题,我们建议:

1、不要放置虚假翻页键。如果您希望能获得更多的用户浏览和点击,可以在正文结束后,为用户推荐相关的优质内容,吸引用户点击。

2、尊重用户浏览体验,避免出现刻意拆分一篇简短文章为多个分页的行为。


关于信风算法的更多信息请参考: 

2019.5.22 杜绝翻页诱导行为,百度搜索信风算法即将上线



目录

1.网站内容质量 

2.用户需求满足

3.搜索恶意竞争

4.网站安全问题

5.落地页体验问题