发布日期:2019-11-22
网站域名选择不仅能快速直观让用户了解网站定位,域名设置更会影响搜索对网站的抓取情况。因此选择简单好记且安全的域名是网站搭建前期最重要的一步。
网站搭建之初对网站域名的选择建议独立、简单好记;独立移动站域名选择也遵循此规则。
移动站可以是与pc站为同一个域名的自适应模式,也可以与PC站域名独立分开,但不建议移动站用pc站的二级目录;比如PC站域名是www.test.com,移动站是www.test.com/m/的形式
网站域名选择中,主要有以下两点建议:
内容发布系统,无论是网站自建还是使用第三方建站系统百度都是支持的;所有发布系统除遵循有条理、逻辑清晰建站,还要注意网站搭建的安全问题,避免网站安全隐患才能更好的提升网站价值。
网站自建内容发布系统,注意事项包括:
√ 主体内容清晰且能够很好的识别与分辨;
√ 后台发布时间切勿自行设置,遵循发布时间与展示时间一致;
√ 内容发布系统中各表单设置合理,如对tag标签的设置不宜过多、不宜罗列关键词;
√ 分类划分明确,分类主题的文章对应发布到相应分类下;
√ 题文相符,切勿挂羊头卖狗肉,欺骗搜索引擎流量,损伤用户体验;
√ 段落清晰合理、字体大小适中、字体颜色切勿使用与背景色相近的颜色;
√ 发布内容目录划分清晰,具体参考2.3章节中网站结构设置;
√ 后台发布系统中首页、栏目、内容管理不要堆砌过多的关键词标题。
使用第三方发布系统建站,需要站长关注以下注意事项:
√ 模板主题不建议频繁更换;
√ 类似wordpress等系统,不建议使用过多插件会影响网页打开速度;
√ URL伪静态的处理,命名规范、层级清晰;
√ 开源建站系统存在较多安全隐患,使用过程中务必做一些安全上的设置和优化;
√ 使用第三方系统不建议频繁修改设置路径,以免造成大量404页面;
无论网站自建发布系统,还是网站使用第三方建站系统,网站页面的生成都应注意以下几点:
√ 网页结构清晰、各分类名称设置醒目;
√ 导航、面包屑导航设置合理,机器可读、位置突出,用户能很好得知所访问页面在网站中的位置;
√ 不存在遮挡主体内容的广告元素;
√ 无三俗图文、音频元素;
注意网站搭建系统安全问题,杜绝网站安全隐患。
访问请求中的content-type需要根据对应的类型进行正确设置,图示如下:
合理设置网站结构是网站被快速抓取、获得搜索流量的基础;因网站结构设置不合理导致网站无法被快速识别抓取的事例在百度日常反馈中经常见到且网站换域名也会对网站造成一定损失,故希望各位站长从建站之初重视网站结构设置,避免不必要的损失。
URL搭建时有以下几点注意事项:
√ 在搭建网站结构、制作URL时,尽量避开非主流设计追求简单美即可,越简单越平常越好,例如URL中出现生僻字符,如不常见的“II”,会引起搜索引擎识别错误;
√ URL长度要求去掉协议头http(s)://之后的URL长度不要超过256个字节;
√ 谨慎使用#参数,有效的参数不能放在#后面;可能被截断导致网页抓取异常;
√ URL不建议使用中文路径;
√ URL不建议使用多余的“?&”参数避免造成相同内容不同URL导致重复;
网站目录结构是否搭建合理影响搜索引擎对网站的抓取,这里需要提到的是网站目录结构无论是扁平化还是树形结构,一般都可以被搜索引擎发现,但有以下几点需要注意:
√ 建议不同内容放在不同目录或子域下,域名划分在网站域名划分章节中有详细提到;
√ 不要使用孤岛链接,孤岛链接很难被搜索引擎快速发现;若网站已存在大量孤岛链接,建议使用搜索资源平台的链接提交工具向百度提交数据;
√ 重要内容不建议放在深层目录,若该内容没有大量内链指向,搜索引擎很难判断该页面的重要程度;
√ 目录结构不建议超过2级,如:www.test.com/a/b/1.html;
√ 目录不建议中文或特殊编码;
以下是图片示例:
选择服务商或者自建服务器,对网站搭建都是十分重要基础的一环;服务器安全和稳定将直接影响百度搜索引擎对网站的整体判断。
关于域名服务和域名部署,有以下注意事项:
√ 站长在域名部署中请仔细各环节问题,不要出现域名部署错误情况;
√ 不建议网站进行泛解析,若网站爆发大规模泛解析,且影响恶劣,则会受到搜索策略打压;
√ 尽量选择优质域名服务商。
做网站还有非常重要的一环,就是服务器的选择,那服务器选择中,无论是虚拟主机、云主机还是独立的服务器,都应该注意以下四点:
√ 中文网站不建议选择国外服务器;
√ 服务器的稳定性非常重要,需要保持访问流畅,服务器是否稳定,可以使用百度搜索资源平台抓取异常、抓取诊断工具进行检测维护。(服务器经常无法访问或者死机,对爬虫来讲都是致命伤害);
√ 服务器选择除了自身的稳定性外,实际上还要考虑网站的业务量,例如带宽、内存、CPU是否能够承受访问量,突发大流量情况下是否可以正常访问;
√ 服务器主机设置,需要注意是否有禁止爬虫抓取的设置、或存在404错误信息设置,这些情况都会引起不必要的搜索引擎抓取判断异常,为网站带来不必要的损失。
总的来说,建议虚拟主机选购时候需要特别注意:
√ 主机商是否存在限制搜索引擎访问的情况;
√ 主机商的资质是否符合要求;
√ 主机商的技术沉淀是否足够,建议选择品牌较大的主机商;
√ 主机商托管的机房的物理条件和网络条件是否足够优秀;
√ 主机商的技术和客服支持情况是否够好;
√ 主机商是否会存在超容量的情况;
√ 主机商是否存在违规接入高风险站点的问题或同一IP下是否会存在高风险站点的情况;
√ 国内站点建议选购国内云主机建站。
独立主机为站点带来更加宽松的使用环境和个性软件的安装,因此独立主机需要站长拥有一定的技术力量来保证网站的正常运行和安全。
我们对于站长选购和托管独立主机的建议是:
√ 注意虚拟主机是否有将爬虫IP拉入黑名单;
√ 建议使用独立IP地址的主机;
√ 建议使用规模较大机构的主机,在安全配置、稳定性上相对更好;
√ 对IDC服务商的建设标准需要一定的考虑,例如防火、防盗是否有UPS保证、室内温控、消防等;
√ IDC服务商的服务质量和技术是否达标,是否24h值班,是否能够协助排查一些故障、免费重启重装系统等;
√ IDC机房的资质是否齐全,存放站点是否有高风险站点或服务器存在。
当前百度已实行全站化HTTPS安全加密服务,百度HTTPS安全加密已覆盖主流浏览器,旨在用户打造了一个更隐私化的互联网空间,加速了国内互联网的HTTPS化。同时也希望更多网站加入到HTTPS的队伍中来,为网络安全贡献一份力量。
HTTPS安全原理解析
HTTPS主要由有两部分组成:HTTP + SSL / TLS也就是在HTTP上又加了一层处理加密信息的模块。服务端和客户端的信息传输都会通过TLS进行加密,所以传输的数据都是加密后的数据。
HTTS复杂的加密机制有效的加大了网站的安全性,加密机制与认证机制可以减少网站被劫持和假冒的风险,建议站长们可以通过做HTTPS改造来强化网站安全。
网站被黑通常表现为网站中出现大量非本网站发布的类似博彩内容或网站页面直接跳转到博彩页面。网站被黑表明网站自身安全可能存在严重漏洞,技术人员应迅速采取手段修复防止再次被黑。同时网站运营人员还需要进行一些资源维护和预防的工作,详情可参考《网站被黑应该怎么做 — 网站被黑操作指南》;
同时平台最近监控发现,优质权威站点被黑被攻击概率增高,也请各优质站长重点关注和我们一起努力打击黑产。
从搜索抓取机制上讲百度蜘蛛对站点的抓取方式和普通用户访问一样,只要普通用户能访问到的内容,百度蜘蛛就能抓取到。不管是用什么技术只要能保证用户能流畅的访问网站对搜索引擎就没有影响。但有站长反馈使用CDN后出现网站抓取异常、甚至流量异常等问题,主要是两方面的因素:
一是部分CDN服务商硬件投入不够经常出现不稳定情况,会导致大量的蜘蛛抓取失败,从而影响网站抓取效果,有的甚至影响了索引量数据;所以选择有实力的CDN服务商很重要;
二是缓存机制在网站出现死链、无法打开、被黑等情况导致此问题的发生。
点击查看《百度移动搜索建站优化白皮书》第三章:网站优化