百度到底是如何计算某个网页的权重的?

百度到底是如何计算某个网页的权重的?

gavin 暂无评论
SEO大神Gavin

百度权重是爱站、站长工具等网站推出的针对网站关键词排名预计给网站带来流量,划分等级0-10的第三方网站欢迎度评估数据。但是百度官方始终未能给出一个真正的关于百度权重的官方算法。所以直到现在大家都认为百度权重是一个很神秘的东西,很多第三方机构虽然在依靠着自己的算法在判断百度权重,但事实上都不是百度所用的算法。都不具有十分权威的说服力。

那么百度是如何来算一个网页的百度权重的呢?我们首先来看一下下面这一组公式:

这个公式估计大家暂时都看不懂,不过没关系。实际上这组我们看不懂的公式就是百度计算某个网页权重的算法。

这个公式可以说是百度的核心算法,它其中包括了HTML代码的权值、网页链接的权值以及用户日志的权值。而HTML代码的权值、网页链接的权值、用户日志的权值这三项是整个公式的最大影响因素,每一项的变化都会影响整个网页的权重值。而实际上我们也能够从以这三项为基础的整个公式中看出百度的这个权值算法实际上有着很大的漏洞。明白这些,我们会明白很多之前我们所遇到的疑惑。

下面我们来说说这个公式,这个公式是针对某个网页而言的,在没有进行算法之前,百度先给这个网页中的每一个特征项一个缺省的权值 ,还有人问什么是缺省,其实缺省就是默认。不要介意我说得很专业,我只是想不侮辱SEO这各行业而已。如果一个特征项还被其它有权标签包围着,那么在计算这个特征项的权值时还要把这些有权标签的权值考虑进去。

比方说在这样的情况下<h1><b>t</b><h1>,那么gavin这个特征项在整个网页中这一次出现的权值就应该这么算:

对于任何一个网页,以这种方式来计算某个特征项的权重值应该都是公平的,因为那个 是确定的,而后面的变化就在于你的网站内容如何。可是很快,聪明的你就会发现,在这个公式中是存在问题,如果一个网页足够长,这个t出现的频率会很多,也就说这个n的值越大那么这个特征值岂不就越大?如果一个网站的关键词是一个很低频的词他的 很小,网页又不够长,那么他的权值岂不是很吃亏?但是百度在一开始的时候就针对这个问题给这个公式打了补丁。这个补丁其实很常见,因为在百度算法和中不止一次出现了,具体补丁是这样的,他们沿用了IR中的IDF项。

具体的解决方式,我会在下一篇文章中解释,欢迎大家关注,并给出自己的观点!谢谢!
文军二维码

今日说说

    问:做什么事情会让你成就感爆棚?

    答:做让你感觉心理畏惧的事情,做完之后你会发现,去TMD,不过如此。

站内搜索