Es wurde bereits gezeigt, dass ein jeder eingehender
Link auf ein Webseite deren Pagerank stets erhöht. Bei oberflächlicher
Betrachtung des ursprünglichen PageRank-Algorithmus:
PR(A) = (1-d) + d (PR(T1)/C(T1) + ...
+ PR(Tn)/C(Tn))
möchte man meinen, ein zusätzlicher eingehender
Link erhöht den PageRank der verlinkten Seite um:
d × PR(X) / C(X)
wobei PR(X) der PageRank der verlinkenden
Seite X und C(X) deren Anzahl ausgehender Links ist. Bei genauerer
Betrachtung zeigt sich allerdings, dass eine Webseite, die einen
zusätzlichen eingehenden Link erhält, selbst auch auf andere Webseiten
verlinken kann. Diese erhalten nunmehr ebenfalls einen höheren PageRank,
den sie gegebenfalls wiederum über Links an unsere Seite mit dem
zusätzlichen eingehenden Link zurückgeben.
Die einzelnen Effekte zusätzlicher eingehender
Links sollen nun anhand eines Beispiels beschrieben werden.
Wir
betrachten eine kleine Website aus den Seiten A, B, C und D, die
im Kreis verlinkt sind und nicht selbst auf andere Webseiten verlinken.
Ohne eingehende Links von externen Seiten ergibt sich ganz offensichtlich
ein PageRank von 1 für jede der betrachteten Seiten.
Wir wählen nunmehr eine Seite X, für die ein PageRank PR(X)
von 10 angenommen wird. Seite X verlinkt auf Seite A und sonst auf
keine andere Seite. Bei einem willkürlich gewählten Dämpfungsfaktor
von 0.5 ergibt sich das folgende Gleichungssystem für den PageRank
der einzelnen Seiten unserer Site:
Da die Anzahl der ausgehenden Links jeder Seite
gleich 1 ist, müssen diese hier nicht berücksichtigt werden. Die
Lösung des Gleichungssystems ergibt folgende Werte für den PageRank
der einzelnen Seiten:
PR(A) = 19/3 = 6.33
PR(B) = 11/3 = 3.67
PR(C) = 7/3 = 2.33
PR(D) = 5/3 = 1.67
Der unmittelbare Effekt des zusätzlichen Links auf Seite A in Höhe
von:
d × PR(X) / C(X) = 0,5 × 10 / 1 = 5
setzt sich also über die Verlinkung der einzelnen Seiten untereinander
fort.
Der Einfluss des Dämpfungsfaktors:
Der Grad der Weitergabe von PageRank ist
vor allem auch abhängig von der Höhe des Dämpfungsfaktors d. Wird
für diesen beispielsweise ein Wert von 0.75 angenommen, ergibt sich
für das obige Beispiel das folgende Gleichungssystem:
Die Lösung dieses Gleichungssystems ergibt folgende Werte für den
PageRank der einzelnen Seiten:
PR(A) = 419/35 = 11.97
PR(B) = 323/35 = 9.23
PR(C) = 251/35 = 7.17
PR(D) = 197/35 = 5.63
Es zeigt sich zunächst ein wesentlich höherer unmittelbarer Effekt
des zusätzlichen eingehenden Links auf den PageRank von Seite
A in Höhe von:
d × PR(X) / C(X) = 0.75 × 10 / 1 =
7.5
Dieser Effekt setzt sich nun aber noch verstärkt durch die interne
Verlinkung der Seiten fort, so dass der PageRank von Seite
A bei einem Dämpfungsfaktor von 0.75 beinahe doppelt so hoch ist
wie bei einem Dämpfungsfaktor von 0.5. Ist der PageRank von
Seite A bei einem Dämpfungsfaktor von 0.5 noch beinahe viermal größer
als der Pagerank von Seite D, so ist er bei einem Dämpfungsfaktor
von 0.75 nur noch etwas mehr als doppelt so groß. Je höher der Dämpfungsfaktor
ist, um so stärker ist einerseits der Effekt auf den PageRank
der den Link erhaltenden Seite und um so gleichmäßiger verteilt
sich andererseits der PageRank auf die anderen Seiten der
Site.
Der tatsächliche Effekt
eingehender Links:
Die Summe der PageRank-Werte aller Seiten
bei einem Dämpfungsfaktor von 0.5 beträgt in unserem Beispiel:
PR(A) + PR(B) + PR(C) + PR(D) = 14
Dadurch, dass eine Seite mit einem PageRank
von 10 mit ihrem einzigen Link auf eine Seite der Beispiel-Site
verlinkt, erhöht sich also deren aufaddierter PageRank um
10. (Vor Erhalt des Links hatte jede Seite einen PageRank
von 1.) Bei einem PageRank von 0.75 beträgt die Summe der PageRank-Werte:
PR(A) + PR(B) + PR(C) + PR(D) = 34
Der aufaddierte PageRank erhöht sich also
um 30. Es zeigt sich, dass sich die Summe des PageRanks stets um:
(d / (1-d)) × (PR(X) / C(X))
erhöht, wenn X die verlinkende Seite, PR(X) deren
PageRank und C(X) die Anzahl der ausgehenden Links von Seite
X ist. Dieser Wert ist allerdings daran gebunden, dass die Verlinkung
in ein geschlossenes Sytem von Webseiten, also etwa eine Website
ohne ausgehenden Link erfolgt. Sofern von der Website Links auf
andere, externe Webseiten gesetzt sind, verringert sich der Faktor
entsprechend.
Die Begründung für den oben angegebenen Wert liefert
uns Raph Levien und sie bezieht sich auf das Random Surfer Modell.
Die Länge eines Surf-Vorgangs des Zufalls-Surfers ist eine Exponentialverteilung
mit einem Mittel von (d/(1-d)). Wenn also der Zufalls-Surfer einen
Link auf ein geschlossenes System von Webseiten verfolgt, besucht
er im Schnitt genau (d/(1-d)) Seiten innerhalb dieses geschlossenen
Systems. Und genau so viel mehr PageRank der ursprünglich
verlinkenden Seite - gewichtet nach der Anzahl der ausgehenden Links
- muss damit an das geschlossene System übertragen werden.
Lawrence Page und Sergey Brin geben regelmäßig
einen Dämpfungsfaktor von 0.85 für die tatsächliche PageRank-Berechnung
an. Damit ergibt sich ein Faktor für die Erhöhung des aufaddierten
PageRanks einer geschlossenen Site durch einen zusätzlichen eingehenden
Link von Seite X in Höhe von:
Eingehende Links haben also einen weitaus größeren
Effekt auf den PageRank als man bei oberflächlicher Betrachtung
annehmen mag.
Die PageRank-1 Regel:
Viele Nutzer der Google Toolbar stellen fest,
dass oftmals Seiten mit einem bestimmten Toolbar-PageRank
eine darauf verlinkende Seite mit einem Toolbar-PageRank aufweisen,
der um den Wert 1 höher ist als der der verlinkten Seite. Diese
Beobachtung dient vielfach dazu, den hier präsentierten PageRank-Algorithmus
in Frage zu stellen. Dagegen soll an dieser Stelle gezeigt werden,
dass die Beobachtung vollkommen im Einklang mit dem hier präsentierten
PageRank-Algorithmus steht.
Zuallererst stützt die PageRank-1 Regel das
grundlegende Konzept des PageRank-Verfahrens. Webseiten sind
genau dann bedeutsam, wenn andere bedeutsame Webseiten auf sie verweisen.
Es ist nicht erforderlich, dass eine Website viele eingehenden Links
erhält, um einen hohen PageRank zu bekommen. Ein einzelner
Link von einer Website mit einem hohen PageRank reicht hierzu
aus.
Dafür, dass die PageRank-1 Regel auch mit
dem hier präsentierten PageRank-Algorithmus in Einklang steht,
sind mehrere Faktoren verantwortlich. Zunächst ist Toolbar-PageRank
eine logarithmisch skalierte Version des tatsächlichen PageRank.
Wenn der PageRank einer verlinkenden Seite im Sinne der Toolbar
um eins höher ist als derjenige der verlinkten Seite, so kann ihr
tatsächlicher PageRank immer mindestens um einen Faktor höher
sein, der der Basis des für die Skalierung eingesetzten Logarithmus
entspricht. Ist also die Basis des Logarithmus gleich 6, und der
Toolbar-PageRank der verlinkenden Seite gleich 5, so kann
der tatsächliche PageRank der verlinkten Seite immer mindestens
6 Mal kleiner sein, damit diese in jedem Fall noch einen Toolbar-PageRank
von 4 erreicht.
Der Basis des Logarithmus wirkt nun die Anzahl
der ausgehenden Links auf der verlinkenden Seite entgegen, da deren
PageRank praktisch unter allen verlinkten Seiten aufgeteilt
wird. Es wurde allerdings oben auf dieser Seite bereits gezeigt,
dass der über einen Link an eine Seite weitergegebene PageRank
weitaus größer sein kann, als der im Algorithmus erscheinenden Term
d(PR(Ti)/C(Ti)) vermuten lässt. Dies hängt damit zusammen, dass
intern in der Regel weitere Seiten auf die von außen verlinkte Seite
verlinken und somit weiteren PageRank auf diese Seite verteilen.
Gehen wir nun etwa davon aus, dass die logarithmische Basis für
die Skalierung 6 beträgt und weiterhin bei einem hohen Dämpfungsfaktor
das doppelte des nach ausgehenden Links gewichteten PageRank
der verlinkenden Seite auf die verlinkte Seite übertragen wird,
so könnte die verlinkende Seite mindestens 12 ausgehende Links haben,
damit die verlinkte Seite immer noch einen Toolbar-PageRank
aufweist, der maximal um 1 kleiner ist als derjenige der verlinkenden
Seite.
Eine Zahl von 12 ausgehenden Links erscheint an
dieser Stelle zugegebenermaßen sehr gering. Allerdings ist es in
aller Regel so, dass wenn eine Webseite von außen verlinkt wird,
dies nicht nur von einer einzelnen Seite geschieht, und der betrachteten
Seite somit noch weiterer PageRank übertragen wird. Falls
sich Beispiele finden, bei der eine Seite durch einen einzigen externen
Link ein PageRank übertragen wird, der der PageRank-1
Regel entspricht, und die verlinkende Seite eine hohe Zahl ausgehender
Links hat, so ist dies vor allem ein Indiz dafür, dass der PageRank
der verlinkenden Seite sich im oberen Bereich ihres Toolbar-PageRank-Wertes
befindet. Schließlich könnte die verlinkende Seite aus unserem Beispiel
eine "hohe" 5 und die verlinkte Seite eine "tiefe" 4 sein. In diesem
Falle könnte die verlinkende Seite bis zu 72 ausgehende Links aufweisen.
Diese Zahl würde sich weiter erhöhen, wenn wir von einer größeren
logarithmischen Basis für die Skalierung des Toolbar-PageRanks ausgehen.