正文

Google的顛覆與創(chuàng)造

搜主義:Google持續(xù)成長(zhǎng)的秘密 作者:張遠(yuǎn)昌


Google站在前人的肩上,對(duì)搜索引擎進(jìn)行了顛覆傳統(tǒng)的修改,創(chuàng)造出了新的價(jià)值,同時(shí)還創(chuàng)造出了一家市值達(dá)845億美元的公司,也促使搜索成為互聯(lián)網(wǎng)的心臟。

截止到2005年2月16日,Google已留存、搜集整理了8 058 044 651個(gè)網(wǎng)頁(yè),13億張圖像,成為搜集網(wǎng)頁(yè)最完整的搜索引擎。而在7年前,整個(gè)網(wǎng)絡(luò)僅有區(qū)區(qū)3億個(gè)網(wǎng)頁(yè)。這符合“資料多多益善”(More data is better data)的莫瑟定律(Mercer’s Law)。

目前,Google在全球各地?fù)碛? 000多部紅帽Linux服務(wù)器,Google用這幾千臺(tái)機(jī)器構(gòu)成一個(gè)龐大的超級(jí)計(jì)算機(jī),并很好地完成了一切步驟:搜集信息、整理歸類(lèi)、精確網(wǎng)絡(luò)信息、處理搜索請(qǐng)求。盡管每天要處理1億以上、每秒上千次的搜索查詢(xún), Google仍然能夠在不到1秒的時(shí)間內(nèi)對(duì)近百億網(wǎng)頁(yè)進(jìn)行篩選并得出搜索結(jié)果。

以往的搜索引擎,盡管也能搜索到相關(guān)信息,但精確性卻大打折扣,搜索結(jié)果往往很少能符合搜索用戶(hù)的需要。Google卻成功地解決了這些問(wèn)題:不用空間向量模型(關(guān)鍵詞比對(duì)),而用精確搜索(完全符合)與網(wǎng)頁(yè)排名。這顛覆了傳統(tǒng)上重視齊全,而不重視搜索結(jié)果精確的想法。同時(shí)也呼應(yīng)了Google“快比慢好”以及“信息永遠(yuǎn)累積遞增”的兩個(gè)信條。

Google通過(guò)其佩奇位階(網(wǎng)頁(yè)級(jí)別,PageRank)技術(shù),越多網(wǎng)頁(yè)所鏈接到的頁(yè)面,將會(huì)獲得更好的排名。網(wǎng)頁(yè)上一個(gè)個(gè)的超級(jí)鏈接,就像一張張選票,選擇出最有價(jià)值的網(wǎng)頁(yè),體現(xiàn)了Google式的網(wǎng)絡(luò)民主:越多網(wǎng)頁(yè)所鏈接到的網(wǎng)頁(yè),其信息越符合用戶(hù)的需求?!熬W(wǎng)頁(yè)排序”技術(shù)顛覆了傳統(tǒng)搜索引擎依賴(lài)分析網(wǎng)頁(yè)內(nèi)文字的排名方式,讓單一網(wǎng)頁(yè)的所有者很難操弄網(wǎng)頁(yè)內(nèi)的文字與超級(jí)鏈接,影響自己網(wǎng)頁(yè)的重要性排名。Google的首頁(yè)簡(jiǎn)約典雅,但有用的信息幾乎都在前幾頁(yè)。實(shí)際上,用戶(hù)通常查看前幾頁(yè)的搜索結(jié)果。

雖然AltaVista具有前所未有的廣泛搜索范圍和快速的搜索速度,但能夠把搜索范圍、速度及PageRank技術(shù)完美結(jié)合起來(lái)的Google最終實(shí)現(xiàn)了質(zhì)的飛躍。


上一章目錄下一章

Copyright ? 讀書(shū)網(wǎng) www.autoforsalebyowners.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)