400-685-0732

WJMonitor舆情之声

企业大数据智能舆情监测管理解决方案

全网监测海量数据按需发布监测预警

实时把握舆情动态精准追溯信息源头

为什么网站页面不收录?

为什么网站页面不收录?

rude 2 条评论
SEO工具

很多人都在问一个问题,为什么我的网站页面不收录?谈到这个,我们应该先明白搜索引擎存在的价值是什么。对,为用户提供有价值的信息,然后将有价值的信息尽可能的展现给用户。

如果在我的数据库中,已经收录了一个网站页面,你的内容和这个相似度很高,而你又不是像新浪、搜狐、腾讯等一些大型的权重高的站点(即使这些站点复制内容,也会被收录,因为他们能将信息传递给更多的用户,加大信息被浏览的概率),我为什么要收录你的?这就牵扯到一个页面的相似度问题。相似度,不仅仅是网站与网站之间,网站内部也会有这个问题。

通过site指令查询网站收录时,翻到最后一页,我们往往会看到类似这样的句子(这应该就是页面相似度的直接由来了吧):

为了提供最相关的结果,我们省略了与已显示的 146 个类似的条目。
根据您的意愿,可将省略的结果纳入搜索范围后再重新搜索。

谷歌支持这样一个查询语句:site:www.yourdomainname.com/&,显示出来的结果可以认为是谷歌评判出来的可以忽略的与现有site域名出来的结果相似的页面数量

而在日常工作中,我们用到的一个相似度查询工具是:http://www.webconfs.com/similar-page-checker.php。用法也十分简单,将两个网址分别输入上下栏即可(页面相似度超过60%会是一个危险的信号,影响页面被收录):

页面相似度对比

既然谈到了页面相似度,就不免要来说说一些降低相似度的小技巧。

1、网站中难免会有统一调用的左侧或者右侧。举个例子来说,一个公司站点,将公司的客服热线和联系方式作为了统一的左侧来显示(显然,这些从SEO的角度来说,并没有意义)。如果全部用文字内容来展示,必然会增加各个页面之间的相似度。这时,我们对这部分内容采用图片的方式显示,就可以适度减小页面之间相似的比例。

2、页面代码部分,建议能够建设起一些微格式和微数据(此处未考证,个人感觉应当是有效果的)。

3、增加文章页面的“上一篇”、“下一篇”、“相关文章推荐”、评论等信息。

在更新的文章中,每篇文章的“上一篇”、“下一篇”、“相关文章推荐”、评论等信息理论上应当是不同的,增加这些信息,也可以适度减少页面的相似度,增加页面收录的概率(这也是很多电商站送积分赚评论的原因,因为产品介绍都雷同,只能通过评论来增加单品页面被收录的概率)。

4、将文字内容部分进行拆分,原本一段的可以用两段或者三段来展示(据业内人士乡巴佬-王楠介绍:标点符号的前后几个字符,文章中最长语句判断等,都是判断一篇文章是否原创的重要依据)。当然,前提是不影响用户阅读。

例如:在QQ群247853421中有着一群活跃的少年。他们分别是“洗洗睡吧”,“浅水”,“善大师”;“胖子”,“侃帝”,“蛋蛋”,“西泠”。

写成:

在QQ群247853421中,

有着一群活跃的骚年。

他们分别是“洗洗睡吧”、“浅水”、“善大师”、“胖子”、“侃帝”、“蛋蛋”、“西泠”。

要更好一些。

5、给相应的文字添加注释。

我们继续采用上面的例子,在降低页面的相似度中,写成下面这样:

在QQ群247853421(SEO半瓶子水)中,有着一群活跃的骚年。

他们分别是“洗洗睡吧(喜欢收集别人果照)”,“浅水(美女)”,“善大师(阿弥陀佛)”;

还有“胖子(淫人无限)”,“侃帝(别迷糊)”,“蛋蛋(1米9啊)”,“西泠(蛋蛋的最爱)”。
文军二维码

推荐阅读

2 条评论

rude

十月 16, 2012 at 3:44 下午

楼主写的真好,虽然木有看完!

 Reply

rude

十月 16, 2012 at 2:44 下午

很详细 很清楚了 农民 越来越厉害了

 Reply

发表评论

站内搜索