400-685-0732

WJMonitor舆情之声

企业大数据智能舆情监测管理解决方案

全网监测海量数据按需发布监测预警

实时把握舆情动态精准追溯信息源头

SE与SEO大牛们都扯到过的遍历算法

SE与SEO大牛们都扯到过的遍历算法

rude 3 条评论
搜索引擎技术

记得那会看搜索引擎原理,看到蜘蛛抓取页面时的广度抓取和深度抓取,书上介绍说其实广度和深度就是什么图的遍历算法;

然后上次在无锡的GOMX上途牛的SEO经理分享了一个PPT,说是建立关键词库时可以用遍历法来查找关键词;

今天在微博上看到一件事,说一个很牛叉的团购大全网被百度给干了,然后百度站长平台出来解释说这个团购网在作弊,遍历了一些热门关键词在创造页面。

然后我就发现,遍历这个词出现的频率太高了。好吧,好奇心来了,了解一下是个神马情况。

自然是先看度娘百科的解释:

所谓遍历(Traversal),是指沿着某条搜索路线,依次对树中每个结点均做一次且仅做一次访问。访问结点所做的操作依赖于具体的应用问题。 遍历是二叉树上最重要的运算之一,是二叉树上进行其它运算之基础。当然遍历的概念也适合于多元素集合的情况,如数组。

嗯,还有图的遍历:

图遍历又称图的遍历,属于数据结构中的内容。指的是从图中的任一顶点出发,对图中的所有顶点访问一次且只访问一次。图的遍历操作和树的遍历操作功能相似。图的遍历是图的一种基本操作,图的许多其它操作都是建立在遍历操作的基础之上。

好吧,感觉文字还是太枯燥了,忽然想起在《数学之美》那本书中看到过的一章的一个图,哥来给大家还原下:

遍历算法

 

 

 

 

 

 

 

 

 

 

看着很简单吧,第一个图就是广度优先的遍历,第二个图是深度优先的遍历。不管采用哪种方式,都能跑遍任意一个点。

说道这里,该给遍历下一个最简单的定义了:遍就是跑遍的意思,历就是历经的意思,遍历,就是历经每个点,跑遍每个点,木有遗漏。

当然,看完之后也会感觉这是最笨的方法,但也是最容易机器实现的行之有效的方法。

额,一个多小时过去了,工作上的事情还木有做完,果断应了那句话,好奇心,害死猫啊。
文军二维码

推荐阅读

3 条评论

rude

十一月 27, 2013 at 5:28 下午

能看懂遍历(瞬间想到了算法课程),但是没闹懂“遍历热门关键词”跟“作弊”有啥关系?怎么算作弊?做遍历是想干嘛?被惩罚之前展现了什么样的好效果啊?

 Reply

    rude

    十一月 30, 2013 at 10:13 下午

    热门的可能就不一定跟自己的网站相关了。

     Reply

rude

十一月 19, 2013 at 5:39 下午

SEO真的是越来越难了,百度太过份了。

 Reply

发表评论

站内搜索