百度搜索引擎劲风算法解读和应对策略

2020-03-03 09:34:50
百度搜索引擎发布公告,将于近期上线劲风算法,主要打击四种聚合类内容。针对长期使用关键词,进行资源聚合的采集站点以及通过聚合页进行长尾词优化的站点,都可能受到劲风算法的影响。那么我们应该如何应对呢?

百度MUX LOGO设计,站酷 Haha__ 设计


第一类:页面内容与站点本身所属领域不符,或站点无专注领域,多为采集拼凑内容

小宇解读:百度在6年前,甚至更早的时候,就已经将主题作为网站的评价指标之一。网站的内容维护本质上资源整合的过程,除了少数门户之外,绝大多数站点都有其擅长的领域,甚至是某一领域的权威。

百度认为,权威内容对于普通用户生成内容,对搜索用户的参考价值更大。由于是在需要专业技能和资质的领域,比如医疗。

一个站点可能有多个关注领域,不同领域间存在交叉,比如游戏、动漫。但站点内容的关注领域的过度分散,将影响百度对站点主题的评估,一般情况下,建议站点的涉及领域不要超过3个。

这并不意味着,我们不能在站点上发其他主题的文章,但应该严格控制这部分内容的占比。如果网站存在大量用户生成内容,并且这部分内容质量普遍较低时,强烈建议通过robots协议主动禁止百度抓取这部分内容,以便百度蜘蛛将“有限的精力”投入到站点高质量内容的抓取上。

如果大中型站点,或者您可以需要在网站上,发表多个看似毫不相关的领域内容,那么给不同领域的内容,设置不同的子域名,是一种比较好的方式。早期的门户站点,都在采用这种方式,但需要提醒的是:

1 子域名和主域名在百度排名,并不直接存在 权重继承 的关系,但两者的表现,的确会有关联。比如主域名被用来作灰色站点,那么子域名的内容无论多么正确,也很可能不会被百度收录。反之也有影响。

2 使用子域名,需要确保该域名的内容达到一定量级,如果内容较少,又通过子域名分散到不同领域,将带来维护上的困难,并且也不利于集中力量排名。正确的做法,如果内容叫啥,将不同领域的内容,划分到不同子目录,但需要注意的是,一旦子目录内容足够,请及时将其独立出来,避免带偏网站主题。


第二类:页面内容与标题及页面中标记的标签不符

小宇解读:标签,是TDK中仅次于标题的重要一环,现在的站点,都具备了通过标签自动聚合内容的能力。然而却在标签的加入上,依靠自动关键词提取,或者任由用户自己添加。这意味着,描述页面的关键词本身与页面内容不存在强关联,甚至可能会导致关键词堆砌,或者影响搜索引擎对站点的信任度。

值得一提的是,部分UGC内容站点曾发明了多人协作标签的方式,来完善标签信息。具体的操作方法很简单,也需要充分利用用户本身的行为属性。通过用户添加标签,用户投票选择,加上人工审核的方式,来确保大量优质内容的标签准确。

对于标签页,百度已经给过建议了,我这里结合自己的思考,建议如下:

1 如果网站对网页标签,抱着随意的态度,建议将所有标签页放到同一目录下,如果是伪静态,可以放到同一层级下,然后通过robots协议,屏蔽掉这部分页面。

2 随意添加的标签,默认不要写进 keywords 中,而是直接留空。百度蜘蛛会根据抓取到的内容,主动为网页标记合适的关键词。

百度搜索曾针对低质移动网站泛滥问题发布冰桶算法


第三类: 由网站搜索功能生成的静态搜索结果页

小宇解读:站内搜索,是洞悉网站用户需求的重要渠道,通过记录搜索关键词,我们可以准确发现用户的意图,及时调整运营策略。由用户搜索关键词自动生成的页面,一定程度上,也会成为网站长尾流量的重要来源。然而,大部分网站并没有对用户搜索内容,进行限制,并且多数情况下,站内搜索并不总能返回有效结果,部分网站甚至在用户无搜索结果时,擅自主张,返回热门推荐,猜你喜欢这样的内容。

对于搜索页,结合百度的分享,我的建议如下:

1 搜索功能,采用ajax或者流行的js框架去做,这与通过robots协议一样,由我们主动告知 百度 不要抓取 搜索结果。因为robots协议的生效存在滞后性,所以直接将搜索内容变得不可被抓取,是简单有效的办法。

2 如果一定要获取站内搜索这部分流量,建议只针对 用户检索频繁,并且结果较多,关联度强的 页面,生成唯一的url页面,或者由内容编辑采用专题,专栏,话题的方式,主动聚合高质量的内容。

3 站内搜索,一定要对用户输入的内容,有所限制,包括敏.感.词,广告信息,隐私信息,输入内容的长度等等,避免搜索页成为 部分用户 创造低质、灰色内容、引流的入口。


第四类:空短、无有效信息、失效的聚合页

小宇解读:如果前三类还可能存在无意触及算法的情况,第四类情况,显然有意而为之的情况多一些。并且这类结果,目前正在比较多地干扰百度搜索引擎的用户体验。此类页面的特征,标题是热门话题,热门问题,热门关键词。内容是文章列表,但有趣的是,这些文章的标题被强行改造成与关键词相同,挂羊头卖狗肉的情况十分普遍。

实际上,在信息高度流通的今天,很多信息都具有时效性,时效性也在百度评价体系之中,一个站点,如果由大量的过期页面,会影响百度对于站点的整体评价。

对于聚合页,我的建议如下:

1 聚合页中的内容,最好不是静态的,而是可以根据主题更新的,早起的最近更新,热门内容这样的布局依然是行之有效的办法。

2 聚合页不仅应包括对内容的聚集,还应包括对聚合主题本身的描述,这些内容可以是对话题的概括性描述,内容的指导,UGC站点可以为聚合页本身添加评论,评价等等信息,为聚合页本身创造独特内容。

3 对于无效、失效和过期的信息,我曾经得到的建议是直接404,然后向百度搜索引擎提交死链,比较忌讳的做法,是将这部分页面直接修改 到期时间,让其看起来继续有效,或者让页面直接跳转到 首页,或者其他页面。

深圳百度国际大厦实拍照片

以上,就是小宇对百度劲风算法的理解,欢迎批评指教!