在讨论如何与搜索引擎对话之前,其实今天另外一个原因是希望大家对SEO的认识更深一步,而且也希望能帮一部分朋友摆脱SEO瓶颈,最后实现SEO简单化。
在讨论之前我想问大家一个问题,你是否有想过搜索引擎是如何做到一短短的零点几秒内可以完成上百万甚至上亿的页面检索与排序?要是没有一个合理的算法与机制,我想目前世界上任何一台大型计算机都不太可能在那么短的时间内搞定检索、排序。我们带着问题开始今天的搜索引擎之路。
搜索引擎之后的一句话就是蜘蛛,我们做SEO的站长们往往会把蜘蛛与搜索引擎直接联系起来。确实他们是一个有机的整体,从搜索引擎角度来说,它最缺的东西永远是内容。那么蜘蛛在这个里面就起到了,去抓取网络里的内容。只是蜘蛛的爬行方式是通过我们网站的链接来进行抓取。那么这个我们就可以把这个过程认为是搜索引擎工作原理里面的“采集”
针对蜘蛛采集网站内容,我们站在搜索引擎的角度来看。搜索引擎他们也是人来创造的,他们也必定会考虑硬件成本。那么蜘蛛每次对某个网站的抓取时间与抓取深度肯定不一样。更何况有些网站的链接还不能保持通畅,有些网站链接而且弄的很深很长。那么这些表现形式其实都是我们优化过程经常会操作到的。URL标准化、网站结构等一系列的问题。
蜘蛛采集回内容,放到了搜索引擎数据库里。那么是不是就直接把这些数据编进索引?其实不是的,他必定要做下处理与分类。在这个工作过程中,必定会去判断本次的内容的质量度(只是做初步判断)当然包括这个页面是否有更新?这个就是我们大家常说的网站快照。
当然这个里面的过程比我上面说的复杂的多,比如提取网页的信息,网页本身的链接等。其实我们也不难发现,其实搜索引擎在抓取来内容的时候必定已经做了一些处理,为了更好的服务后面的查询服务。
查询服务这个就是搜索引擎的最重要的一步,通过一些大量的采集与处理最终实现网页的排序。这里为什么会说网页的排序是重最要的呢?从搜索引擎与用户的角度来说,用户之所以会用搜索引擎是因为他们想利用搜索引擎来找寻他们想要的内容。那么从搜索引擎角度来说,假如这个搜索引擎在返回的结果里没能达到用户的最终期望值,那么我相信这个搜索引擎肯定活不长。
关于搜索引擎的工作原理,在这里何涛只是简单的说了一些。主要的就是希望大家能够了解搜索引擎的大概,我们更要体会到网站优化与搜索引擎之间的距离,其实真的很近。只是当有些朋友连自己的服务对象都搞不清来操作网站优化更多的只会浪费时间,最终无法实现真正的优化。 |