当Google市值超过IBM,又一个IT业绩的奇迹诞生了,没有什么不可以改变,唯一不变的是创新和更贴近用户服务的法则。不得不承认搜索时代的到来,作为一名IT从业者我们有必要对搜索引擎的原理有所了解,这是开发面向服务IT产品的基础,也是基于搜索引擎营销所必需掌握的知识。
搜索引擎的前身应该是网址目录导航,这种方式主要通过人工方式对互联网网址进行采集分类,然后编排成目录,供用户点击。我们比较熟悉的YAHOO!网站的前身就是一个网址目录导航。随着爬虫技术的应用,更多台主机,更多网页的内容可以被迅速抓取,真正的搜索引擎诞生了。目前我们经常使用的Google和Baidu属于全文检索型的搜索引擎。
搜索引擎主要完成三个方面的工作,第一:网页抓取,第二:网页分析,第三:网页供用户搜索。除了第三项工作,前两项工作对用户来说是不可见的。
网页抓取主要采用网络爬虫技术也称为网络蜘蛛,即搜索引擎按主机IP段或用户提交的地址,主动采集网页,采集时爬虫会分析网页内的关键词或段落,从而获取网页的核心内容,存入搜索服务器。
搜索引擎会对存入搜索服务器的网页进行Rank分析,这方面不同的搜索引擎有不同的评价Rank的方法,但总结起来无外乎几种因素,首先是网站的内外部链接数,通常获得外部链接的数量越多,表明网页的可信度越高,其次是网页内容的原创性,如果网页只是简单的网址罗列或抄袭其他网页势必得不到较高的Rank,在有就是网页构建时内容结构是否清晰,通常Html标记混乱的网页不会有好的Rank,所以建议大家使用Web标准构建网页,其他影响Rank的因素还有网页创建时间以及更新频率等,通常创建时间越长,更新越频繁的网页,Rank值较高。不同搜索引擎确定网页Rank时,采用的算法和权重略有不同,这也是我们SEO工作的重点。
用户通过输入关键词,要获取搜索结果时,搜索引擎首先迅速按用户关键字,到数据库中匹配符合关键词的网页,将搜索结果显示给用户,显示时按Rank值从高到低的方式排列显示(竞价排名除外)。
以上简单列出的就是搜索引擎的工作原理,未来搜索引擎的发展方向是对网页的分析更加细化,从而用户输入关键词后,会提供给用户较为贴切的提示和更准确的结果,以下是我做的一个搜索引擎原理的结构图,愿与各位同仁一起分享。
站内搜索
标签
-
近期文章
近期评论
- uyan 发表在《地图热点区域高亮显示解决方案》
- AVENT 发表在《由Pinterest兴起 谈社交电子商务的发展》
- WP社会化评论插件 发表在《百度分享给网站带来了什么?》
- feetel 发表在《为你的网站添加网址图标》
- Wordpress社交评论插件 发表在《由UC和海豚的口水战 谈手机浏览器的发展趋势》
- 冰雷 发表在《百度地图API建站应用实例:沈阳地铁二号线站点地图》
- 电商 发表在《Splize新型互动式电子商务平台》
- WP专用分享插件 发表在《百度地图API建站应用实例:沈阳地铁二号线站点地图》
- dushanbe 发表在《微软Bing取代雅虎搜索 将成谷歌搜索最大敌人》
- 文秘之家 发表在《百度地图API建站应用实例:沈阳地铁二号线站点地图》


谢谢站长这样一个有意义的博客文章。给我留下了深刻的印象与你的看法 SEO.