潜在语义索引对网站排名的影响

潜在语义索引对网站排名的影响

zorro 暂无评论
SEO之剑Zorro

  当你发现一个问题的时候,最初只以为它是一个普通的现象,有着一个简单的答案。可随着研究的深入,你会感觉它越来越有意思,你会发现它的背后竟然隐藏着这么多的秘密……

  继续前两篇博客的话题,为何标题中没有关键词却能够。最近在看《SEO实战密码》,顿有相见恨晚的感觉,这本10年出版的书竟然早有提到这个问题。书中提到一词叫做“潜在语义索引”,而正是这项算法,导致以上现象。

  搜索引擎是使用机器算法来替代过去人工搜索的工作。但机器算法和人的工作有一个很不一样的地方就是人可以直接理解词的意思,文章的意思,机器和算法却无法理解——人看到苹果这两个字就知道指的是那个圆圆的,有水的挺好吃的东西,搜索引擎却不能从感性上理解。

  因此,潜在语义索引(Latent Semantic Index)便应运而生,它是1988年(好早的说)S.T. Dumais等人提出了一种新的信息检索代数模型,是用于知识获取和展示的计算理论和方法,它使用统计计算的方法对大量的文本集进行分析,从而提取出词与词间潜在的语义结构,并用这种潜在的语义结构,来表示词和文本,达到消除词之间的相关性和简化文本向量实现降维的目的。

  定义很枯燥,举个简单的例子:电脑和计算机这两个词在人们写文章时经常混用,这两个词在大量的网页中同时出现,搜索引擎就会认为这两个词是极为语义相关的。由此,当你在搜索“电脑”一词的时候,会出现很多不包含“电脑”而包含“计算机”的结果。

  这也不由得让我想到,之前Boson老师给我们培训的一次课程《SEO站内优化之主题模型》,讲的便是词系联系的重要性,搜索引擎会自动解读内容实体,通过“人物、地点、事物”来寻找关联,然后通过搜索引擎大量页面数据可以比对出“每个实体”之间的关联性。而我们所要做的便是怎加这些词系之间的关联性。比如在搜索框当中输入“文军”,搜索引擎便会自动关联到“SEO”。

  百度一下“潜在语义索引”,会得到很多结果,讲的有深有浅,当看到这篇文章的时候我也真是醉了……

  还有一个展现潜在语义索引算法的例子是,以我的姓氏“宋”字为例:在百度搜索“宋字去掉宝盖”,百度给出的第一条结果如下:

  而非标题当中包含“宋字去掉宝盖”这个关键词的页面,当我又试了下“宋字去掉木”时,还有个意外发现:

  宝盖头“宀”竟然读作“mian”。

  搜索引擎的智商值还不到人类 6 岁儿童的一半,但我相信在未来搜索引擎的智商也会随着其“年龄”的增长而不断增加。所以用户体验的重要性在不断增加,因为“搜索引擎体验”正在不断向“用户体验”靠近。

 
文军二维码

今日说说

    问:做什么事情会让你成就感爆棚?

    答:做让你感觉心理畏惧的事情,做完之后你会发现,去TMD,不过如此。

站内搜索