Inhaltsverzeichnis:
„Producing a ranking for pages using distances in a Web-link graph“
So heißt das neue Patent von Google, auf welches Ich Dank Bill Slawski´s Blogpost gestoßen bin. Ich finde es spannend, weil es anregt, das vielleicht totgesagte Thema Linkbuilding noch einmal genauer unter die Lupe zu nehmen.
Kurz gesagt:
Google hat am 20.10.2015 ein neues Patent zugeteilt bekommen, welches konkurrierende Webseiten danach rankt, wie „weit“ sie von einem Set der sogenannten „Seed Pages“ (Trust-Sites) entfernt sind. Die Seite, die in Summe den „kürzesten Link-Weg“ zu einer der Seed-Pages aufweist, bekommt den besten „Ranking-Score“.
Der kürzeste Weg ist hierbei aber nicht zwingend der mit den wenigsten „Klicks“. Jedem Link im betrachteten Linkgraphen wird ein bestimmter Wert (Link-Länge) zugewiesen. Dann entscheidet die Summe aller Link-Werte über den kürzesten Weg.
Der klassische Pagerank wird hierdurch nicht ersetzt oder überflüssig. Der in dem Patent beschriebene Prozess ist eher eine Erweiterung dessen und zielt darauf ab, Webseiten anhand ihrer Nähe zu vertrauensvollen Webseiten zu gewichten und zu ranken.
Hier fusionieren also Trustrank und Pagerank. Daher nenne Ich ihn hier „Trust-Pagerank“.
Wie funktioniert das Patent nun genau?
„The system receives a set of pages to be ranked“
Der Algo liefert (z.B. auf Grund einer Suchanfrage) ein Set an potentiellen Suchergebnissen aus dem Index, die untereinander verlinkt sein können, aber nicht müssen.
„The system also receives a set of seed pages“
Das System erhält eine Liste von „Seed-Pages“, die ausgehende Links zum o.g. Set von Webseiten haben. Somit ergibt sich ein spezifischer Link-Graph für das Set an zu bewertenden Seiten. Siehe Grafik „Berechnung neuer „Trust-Pagerank“.
„The system then assigns lengths to the links“
Als nächstes berechnet das System für jeden Link einen individuellen „Link-Längen-Wert“ (length-value). Dieser Wert ist stark von den qualitativen Eigenschaften der Links abhängig. Genannt werden im Patent Eigenschaften wie:
- wie viele weitere Links befinden sich auf der Quell-Seite des Links?
- wie ist der Link formatiert (font)?
- wo ist der Link auf der Webseite platziert?
Google lässt sich in der Patentschrift die Türe offen für weitere Bewertungskriterien.
Wichtig ist nun zu wissen, dass z.B. viele weitere ausgehende Links auf der Quellseite die berechnete Link-Länge erhöhen. Der Weg Richtung Seed-Page wird also weiter!
„Compute shortest distances“
Wenn nun für alle Links die Längen berechnet sind, sucht das System für jede einzelne Seite die kürzeste Distanz zu einer der vorhandenen Seed-Pages. Dabei reduziert das System den anfänglichen Link-Graphen auf einen Sub-Graphen, der nur noch jeweils den kürzesten Klick-Pfad (shortest path) jeder Webseite zu einer Seed-Seite enthält. Entlang dieses Link-Pfads werden dann alle einzelnen Link-Längen-Werte summiert und mit denen der konkurrierenden Seiten verglichen.
„Determine a ranking score for each page“
Da nun für jede Webseite die individuelle Distanz zu einer Seed-Page vorliegt, wird jeder Seite ein Ranking-Score zugewiesen. Die Seite mit der kürzesten Distanz bekommt den höchsten und damit besten Wert.
„Produce a ranking for the set of pages“
Das System bringt die Webseiten abschließend anhand des Ranking-Scores in eine Reihenfolge, wie die Seiten an den Suchenden im Suchergebnis ausgeliefert werden können.
Wo ist nun der Nutzen für Google?
Im Patent beschreibt Google, dass es auf Grund der immens großen Anzahl an Ressourcen im Internet eine immense Herausforderung ist, die qualitativ hochwertigsten Ergebnisse zu filtern. Ursprünglich ist man davon ausgegangen, dass der herkömmliche Pagerank ein verlässlicher Gradmesser für die relative Qualität und Vertrauenswürdigkeit einer Webseite ist. Doch leider ist dieser Wert leicht zu manipulieren, weshalb nach verlässlicheren Rankingkriterien sucht. Das hier beschriebene Patent soll ein Schritt in diese Richtung sein.
However, the simple formulation of Equation (1) for computing the PageRank is vulnerable to manipulations. Some web pages (called „spam pages“) can be designed to use various techniques to obtain artificially inflated PageRanks, for example, by forming „link farms“ or creating „loops.“
Entscheidend bei diesem Patent ist nun, dass Google die Berechnung des neuen Ranking-Scores nicht mehr auf Basis aller vorhandenen Webseiten und Links wie beim Pagerank vornehmen will , sondern an Hand eines definierten und ausgewählten Sets an „Seed-Pages“.
One possible variation of PageRank that would reduce the effect of these techniques is to select a few „trusted“ pages (also referred to as the seed pages) and discovers other pages which are likely to be good by following the links from the trusted pages.
Das Patent beschreibt, dass die Seed-Pages manuell ausgewählt und erweitert werden können. Ziel ist es, möglichst viele dieser Seed-Pages zu definieren, um weltweit ausreichend relevante Trust-Sites „vorrätig“ zu haben. Allerdings steigt mit jeder neuen Seed-Page der Rechenaufwand linear. Daher hat Google (zumindest laut Patentschrift) die Anzahl der Seed-Pages erst einmal beschränkt.
Learnings für Linkbuilder
Die grundsätzliche Frage, die man sich anhand dieses Patents stellen sollte, ist:
„Wie erreiche ich möglichst kurze Link-Distanzen zu vertrauensvollen Webseiten?“
Zielführend hierfür ist:
1. Alle Webseiten, die gut ranken sollen, brauchen eingehende Links!
Es reicht nicht aus, z.B. einfach Links auf die Startseite aufzubauen. Da jede Seite einzeln bewertet wird, braucht sie eingehende Links, um überhaupt einen Link-Pfad zu einer Seed-Page zu ermöglichen. Seiten, die von keiner Seed-Page erreichbar sind, werden nicht gerankt.
2. Eingehende Links von vertrauenswürdigen Seiten aufbauen!
Das Motto muss lauten „Qualität statt Quantität“. Ziel muss sein,“näher“ an die Seed-Pages zu kommen. Daher bringen z.B. Links von unbekannten Blogs, die selbst kaum eingehende Links haben, ziemlich wenig. Seiten, die von keiner Seed-Page erreichbar sind, werden nicht gerankt.
3. Eingehende Links von themenrelevanten Seiten aufbauen!
Auch wenn das nicht wirklich neu ist, aber Links von „irgendwelchen“ Trust-Pages sind bei der hier beschriebenen Bewertung nicht zielführend. Am Ende soll der Linkgraph von Euch zu einer themenrelevanten Seed-Page führen um den maximalen Ranking-Score absahnen zu können.
4. Exklusive Verlinkungen aufbauen!
Der berechnete Link-Weg wird kürzer, je weniger ausgehende Links sich auf der Quell-Seite befinden. Es lohnt sich also zu überlegen, welche „Kooperationen“ man mit anderen Portalen eingehen kann, um dort im Idealfall exklusiv auf einer Seite verlinkt zu werden.
5. Achtet auf eine prominente Verlinkung!
Google bewertet die Art der Einbindung der Links. Also vereinfacht gesagt: „Der Link muss so eingebettet werden, dass er geklickt wird“. Ist er unauffällig und vielleicht noch deutlich unter „above the fold“ eingesetzt, dann wird der Link-Weg auch länger und somit die Ranking-Chancen schlechter.
Fazit
Wie genau das Patent nun im Einsatz ist weiß keiner so genau. Da es schon im Jahr 2006 eingereicht wurde kann es sein, dass es mittlerweile schon in einer ganz anderen Ausprägung im Einsatz ist.
Aber die hier beschriebenen Grundprinzipien werden mit Sicherheit irgendwie gelten. Google ist ständig auf der Suche nach hochwertigen Inhalten und je näher unsere Inhalte in den Dunstkreis von Trust-Sites kommen, um so wertvoller sind sie auch in Googles Augen.
Wer sich selbst mit dem Patent auseinander setzten will, der möge diesem Link folgen: Link zur Patentschrift
7 comments
das ist genau das was ich seit jahren beobachte .. und dabei spielt es keine rolle was die zielseite für inhalte hat ..
da ich mich oft gefragt habe warum viele thin content pages so gut ranken .. ist das eine plausible erkärung
auf jeden fall gut erklärt
Ja das scheint der „Bug“ im System zu sein. Wenn es nur Seiten zu bewerten gibt die kaum oder keine eingehenden Links haben, dann kann eine relativ dürftige Seite nur auf Grund von Backlinks top Rankings abstauben.
War das nicht schon immer so? Der Algo ist sicherlich einfacher wie hier öfter mal hochgekocht wird mit den 200 Ranking-Faktoren. Wenn alles stimmen würde, was die ganzen SEO´s nach irgendwelchen Updates in ihrer Hektik erzählen und umsetzen würden, dann gäbe es heute keine Schrottseiten die ganz oben stehen. Diese gibt es aber immer noch und wird es auch immer noch geben, sobald sie eben Backlinks haben. Leider.
Klar. Der Algo hat immer noch seine Schwächen und niemand weiß genau welches Signal welches Gewicht im Ranking-Algo hat.
Ich fand das Patent einfach spannend, weil es ein wenig zeigt, dass Linkbuilding eben alles ist, nur nicht tot und sinnlos.
Und der Unterschied zum Trustrank-Patent war mir wichtig, weil dieser Domain-weit „vererbt“ wird. Hier gehts aber um „Einzelseiten“.
…I’m not surprised!
Thanks for the explanation. I guess, some tests will confirm the theory – including the „bug“ of handling thin pages.
Greetings…
Miladin