搜索引擎是互聯(lián)網(wǎng)的入口,相信幾乎所有的網(wǎng)民都使用過搜索引擎,搜索引擎能夠幫助你在茫茫的互聯(lián)網(wǎng)大海之中找到你所需要的網(wǎng)站,那么,大家應(yīng)該有發(fā)現(xiàn)到一個(gè)問題:為什么搜索引擎的搜索結(jié)果不是實(shí)時(shí)的,而是有延遲的,所以出現(xiàn)了百度快照、網(wǎng)頁快照等名詞。
一般我們網(wǎng)站用的站內(nèi)搜索是實(shí)時(shí)的,因?yàn)樗阉鞯臄?shù)據(jù)庫不是很大,所以速度還可以,但是搜索引擎的數(shù)據(jù)庫是面向幾百億個(gè)網(wǎng)站,數(shù)據(jù)庫非常龐大,而且隨著網(wǎng)絡(luò)的發(fā)展,網(wǎng)站越來越多,一個(gè)網(wǎng)站的頁面也會越來越多,正常,我們打開一個(gè)網(wǎng)站,如果3秒內(nèi)打不開,如果那個(gè)網(wǎng)站不是唯一的,可能90%的用戶會選擇離開,如果從幾百億個(gè)網(wǎng)站中找到符合用戶搜索的網(wǎng)站并排序,就算是世界上最先進(jìn)最強(qiáng)大的服務(wù)器,估計(jì)也要很久,所以搜索引擎最大的關(guān)鍵點(diǎn)在于如何根據(jù)用戶輸入的關(guān)鍵詞讓搜索結(jié)果瞬間展示出來。
在這么短的時(shí)間內(nèi)從龐大的數(shù)據(jù)庫中根據(jù)關(guān)鍵詞來篩選和排序,只有一個(gè)辦法,那就是緩存數(shù)據(jù)結(jié)果,首先,服務(wù)器定時(shí)從無數(shù)的網(wǎng)站中獲取數(shù)據(jù)存到服務(wù)器,然后服務(wù)器從數(shù)據(jù)中提取出所有的關(guān)鍵詞,根據(jù)關(guān)鍵詞按照一定的算法篩選和排序出一個(gè)搜索結(jié)果,再存儲起來,然后用戶搜索相應(yīng)關(guān)鍵詞的時(shí)候,直接把相應(yīng)關(guān)鍵詞的搜索結(jié)果讀取出來,然后,搜索引擎每隔一段時(shí)間就去更新這個(gè)搜索數(shù)據(jù)庫,這樣就完成了整個(gè)搜索流程。
現(xiàn)在,你應(yīng)該知道為什么搜索引擎的搜索結(jié)果不是實(shí)時(shí)的了吧,其實(shí)搜索引擎更新這個(gè)搜索數(shù)據(jù)庫也是有規(guī)律的,不會一下子全部更新,所以有的網(wǎng)站快照比較前有的比較后,一般更新比較頻繁的比較前,沒更新的可能是一年前的。所以,根據(jù)快照時(shí)間可以判斷出一個(gè)網(wǎng)站的更新頻率。更新的快,搜索引擎給予的權(quán)重肯定會比較高的,正因?yàn)槿绱耍芏嘟粨Q友情鏈接的人都看快照時(shí)間。