SEO之搜索引擎原理

search.jpg

        当Google市值超过IBM,又一个IT业绩的奇迹诞生了,没有什么不可以改变,唯一不变的是创新和更贴近用户服务的法则。不得不承认搜索时代的到来,作为一名IT从业者我们有必要对搜索引擎的原理有所了解,这是开发面向服务IT产品的基础,也是基于搜索引擎营销所必需掌握的知识。
        搜索引擎的前身应该是网址目录导航,这种方式主要通过人工方式对互联网网址进行采集分类,然后编排成目录,供用户点击。我们比较熟悉的YAHOO!网站的前身就是一个网址目录导航。随着爬虫技术的应用,更多台主机,更多网页的内容可以被迅速抓取,真正的搜索引擎诞生了。目前我们经常使用的Google和Baidu属于全文检索型的搜索引擎。
搜索引擎主要完成三个方面的工作,第一:网页抓取,第二:网页分析,第三:网页供用户搜索。除了第三项工作,前两项工作对用户来说是不可见的。
        网页抓取主要采用网络爬虫技术也称为网络蜘蛛,即搜索引擎按主机IP段或用户提交的地址,主动采集网页,采集时爬虫会分析网页内的关键词或段落,从而获取网页的核心内容,存入搜索服务器。
        搜索引擎会对存入搜索服务器的网页进行Rank分析,这方面不同的搜索引擎有不同的评价Rank的方法,但总结起来无外乎几种因素,首先是网站的内外部链接数,通常获得外部链接的数量越多,表明网页的可信度越高,其次是网页内容的原创性,如果网页只是简单的网址罗列或抄袭其他网页势必得不到较高的Rank,在有就是网页构建时内容结构是否清晰,通常Html标记混乱的网页不会有好的Rank,所以建议大家使用Web标准构建网页,其他影响Rank的因素还有网页创建时间以及更新频率等,通常创建时间越长,更新越频繁的网页,Rank值较高。不同搜索引擎确定网页Rank时,采用的算法和权重略有不同,这也是我们SEO工作的重点。
        用户通过输入关键词,要获取搜索结果时,搜索引擎首先迅速按用户关键字,到数据库中匹配符合关键词的网页,将搜索结果显示给用户,显示时按Rank值从高到低的方式排列显示(竞价排名除外)。
以上简单列出的就是搜索引擎的工作原理,未来搜索引擎的发展方向是对网页的分析更加细化,从而用户输入关键词后,会提供给用户较为贴切的提示和更准确的结果,以下是我做的一个搜索引擎原理的结构图,愿与各位同仁一起分享。

评论已关闭。