400-685-0732

WJMonitor舆情之声

企业大数据智能舆情监测管理解决方案

全网监测海量数据按需发布监测预警

实时把握舆情动态精准追溯信息源头

敢问搜索为何物

敢问搜索为何物

viker 暂无评论
SEO技术

SEO是什么?Seo的全称是search engine optimization,大义是搜索引擎优化。

说白了,先有搜索引擎,而后有seo。Seo是基于搜索引擎的规则玩的一套优化体系。

seo的价值在于通过持续的研究搜索引擎的规则,从而制定一套持续改进的方案对自己的网站进行优化,从而提高自己网站的pv、uv、点击等等数据。

那么在学习seo之前,了解搜索引擎非常重要!

搜索分类

目前,搜索引擎主要分为全网搜索引擎和垂直搜索引擎。

全网搜索引擎主要分为谷歌、百度、360、搜狗、神马等。而垂直搜索引擎在电子商务领域应用比较多,主要以淘宝、ebay、环球为典型代表。

搜索原理

数据收集
第一步:派出大量的spider(蜘蛛、爬虫、机器人)在互联网上进行收集数据,并且将数据返回到服务器。
第二步:数据需要整理,一般的处理包括:链接抽离(提取链接队列供爬取,以及计算链接权重分配)、内容处理(提取title、keywords、description、正文)、消除噪声(去除网页标签、js、flash、图片、导航)等;
第三步:对网页文本内容进行中文分词、去除停止词等,并筛选出有代表性的词给目标网页做索引。
第四步:对网页内容进行分词后判断该页面内容与那个已索引的内容是否有重复,剔除重复页,对网页进行倒排索引(关键词都记录在倒排索引库中),然后等待用户的检索。
数据检索
第一步:对用户的搜索词进行分词(查询分析),并根据用户的地理位置和历史检索特征进行用户需求分析,以便使用地域性搜索结果和个性化搜索结果展示用户最需要的内容;
第二步:查找缓存中是否有该关键词的查询结果,如果有,为了加速呈现效率,搜索引擎会从缓存中抽取数据,再根据用户地域和查询cookie对结果进行微调甚至直接呈现。
第三步:如果缓存没有,则从索引库中根据网页各种因素包括权重数据、用户体验对网页进行排序。网页排名:主要根据相关性、重要性(链接权重分析)、用户体验进行分析得到。
文军二维码

推荐阅读

WJMonitor试用

站内搜索