權(quán)重把戲
你可能已經(jīng)在想,為什么要對(duì)網(wǎng)頁(yè)的所有鏈入鏈接一視同仁。來(lái)自專家的推薦肯定就要比菜鳥(niǎo)的推薦更有價(jià)值?要細(xì)致地理解這一點(diǎn),我們繼續(xù)研究上面的炒蛋例子,不過(guò)研究的是另一組鏈入鏈接。下頁(yè)的圖對(duì)鏈入鏈接進(jìn)行了重新設(shè)置:現(xiàn)在,伯特和歐尼的菜譜的鏈入鏈接數(shù)相等了(只有一個(gè)),但歐尼的鏈入鏈接來(lái)自我的主頁(yè),而伯特的則來(lái)自于著名主廚艾利斯·沃特斯。
如果沒(méi)有其他信息,你更喜歡哪個(gè)菜譜?很顯然,選擇由一位著名主廚推薦的菜譜,要比選擇由一名計(jì)算機(jī)科學(xué)相關(guān)書(shū)籍作者推薦的菜譜更好。我們稱這一基本原則為“權(quán)重把戲”(the authority trick):來(lái)自高“權(quán)重”網(wǎng)頁(yè)的鏈接排名要比來(lái)自低“權(quán)重”網(wǎng)頁(yè)鏈接的排名高。
這個(gè)原則很好,但其實(shí)際形式對(duì)搜索引擎而言一點(diǎn)用都沒(méi)有。計(jì)算機(jī)如何才能自動(dòng)判定艾利斯·沃特斯在炒蛋方面比我更具有權(quán)威性呢?有個(gè)想法對(duì)此也許會(huì)有所幫助:讓我們把超鏈接把戲和權(quán)重把戲結(jié)合起來(lái)。所有網(wǎng)頁(yè)的初始權(quán)重值(authority score)都是1,但如果一個(gè)網(wǎng)頁(yè)有鏈入鏈接,在計(jì)算該網(wǎng)頁(yè)權(quán)重時(shí)就要加入指向其的網(wǎng)頁(yè)的權(quán)重。也就是說(shuō),如果X和Y網(wǎng)頁(yè)鏈向Z網(wǎng)頁(yè),那么Z網(wǎng)頁(yè)的權(quán)重就是X網(wǎng)頁(yè)和Y網(wǎng)頁(yè)權(quán)重相加的值。
下面的圖在計(jì)算這兩個(gè)炒蛋菜譜網(wǎng)頁(yè)的權(quán)重值上很詳細(xì)。終值顯示在圓圈中。圖中有兩個(gè)網(wǎng)頁(yè)鏈向我的主頁(yè);這些網(wǎng)頁(yè)本身沒(méi)有鏈入鏈接,因此權(quán)重值為1。我的主頁(yè)的權(quán)重值是所有鏈入鏈接權(quán)重值的總和,相加得2。艾利斯·沃特斯的主頁(yè)有100個(gè)鏈入鏈接,每個(gè)鏈入鏈接的權(quán)重值為1,因此它的權(quán)重是100。歐尼的菜譜只有一個(gè)鏈入鏈接,但這個(gè)鏈入鏈接的權(quán)重值是2,因此將其所有鏈入鏈接的權(quán)重值相加(這個(gè)例子中只有一個(gè)數(shù)可加),歐尼菜譜網(wǎng)頁(yè)的權(quán)重值為2。伯特菜譜網(wǎng)頁(yè)也只有一個(gè)鏈入鏈接,但其權(quán)重值為100,因此伯特菜譜網(wǎng)頁(yè)的權(quán)重值為100。而因?yàn)?00大于2,所以伯特的網(wǎng)頁(yè)排名要比歐尼的高。
隨機(jī)訪問(wèn)者把戲
就自動(dòng)計(jì)算權(quán)重值來(lái)說(shuō),我們似乎擁有了一個(gè)真正奏效的策略,無(wú)須計(jì)算機(jī)真正地理解網(wǎng)頁(yè)內(nèi)容。不幸的是,這種方法有個(gè)大問(wèn)題。超鏈接很有可能形成被計(jì)算機(jī)科學(xué)家稱為“循環(huán)”(cycle)的東西。循環(huán)指訪問(wèn)者可以通過(guò)點(diǎn)擊超鏈接返回出發(fā)時(shí)的網(wǎng)頁(yè)。