|
- Werbung -
suchradar.de >
Magazin
> Archiv >
Ausgabe 33 > Link-Datenbanken-Vergleich: Daten der Google Webmaster Tools
Link-Datenbanken im Vergleich:
Die Daten der Google Webmaster Tools
Die Google Webmaster Tools liefern kostenlos Daten über die Verlinkung der eigenen Website. Lässt sich aus diesen Daten etwas lernen? Wie gut sind sie im Vergleich zu kommerziellen Link-Datenbanken? Von Markus Hövener.
In suchradar Ausgabe 32 wurden drei Link-Datenbanken unter die Lupe genommen: SEOmoz, Majestic SEO und OpenLinkGraph. Dabei wurde eine wichtige Möglichkeit, die Backlinks einer Domain zu erfahren, außer Acht gelassen: die Google Webmaster Tools (www.google.de/webmaster).
Das hatte einen guten Grund, denn dort kann man zwar Link-Daten erhalten, aber nur für eigene Websites. Um Zugriff auf diese Daten zu bekommen, muss man die Website gegenüber Google validieren (z. B. durch ein von Google vorgegebenes Meta-Tag im Kopf der HTML-Datei). So stellt Google sicher, dass nur Daten über Websites gewonnen werden können, die man auch administriert. Analysen der Konkurrenten sind so also nicht möglich – es sei denn, dass man es schafft, der Startseite eines Konkurrenten ein Meta-Tag hinzuzufügen, was aber wohl strafrechtlich relevant wäre.
Nun kann man argumentieren, dass in den Webmaster Tools gewonnene Daten in Bezug auf Backlinkanalyse wertlos sind, weil man natürlich die Backlinks der Konkurrenten kennen möchte. Die Informationen über die Verlinkung der eigenen Website hingegen sind ja z. B. nur wichtig, um den Status Quo der eigenen Verlinkung zu kennen.
Ein genauer Blick auf die von Google gelieferten Daten ist aber dennoch interessant, weil er Rückschlüsse auf die Auswertung der Links und auch auf die Qualität der von Link-Datenbanken gelieferten Informationen zu lässt.
Der Test
Für diesen Test wurde die Verlinkung von vier Domains getestet, auf die ein Zugriff über die Google Webmaster Tools bestand. In der Sektion „Ihre Website im Web > Links zu Ihrer Website“ erhält man eine Übersicht. Hier werden die Domains angezeigt, die auf die jeweilige Website verlinken. Nach einem Klick auf eine Domain lassen sich die konkreten verlinkenden Seiten abrufen.
Insgesamt werden maximal 1.000 Domains angezeigt. Um die Auswertung aussagekräftig zu halten, wurden daher die vier Test-Domains so gewählt, dass sie in den Webmaster Tools nicht mehr als 1.000 verlinkende Domains haben.
Abbildung 1: Link-Daten exportieren
Teile dieser Informationen können auch exportiert werden. Hierzu existieren am Ende der Seite zwei Links (siehe Abbildung 1):
- „Download this table“ liefert eine Liste aller Domains
- „Download more sample links” liefert konkrete Beispiel-URLs
Dabei ist vor allem zu beachten, dass die Liste der Domains mehr Domains enthält als die Liste der Beispiel-URLs. Hier scheint es so zu sein, dass Google Dubletten oder sehr ähnliche Seiten herausfiltert. Es gibt leider derzeit keine automatisierte Möglichkeit, eine vollständige Liste aller URLs zu bekommen, die zu der Liste aller Domains passen würde.
Für die vier Test-Domains wurden außerdem über die Link-Datenbanken SEOmoz, Majestic SEO und OpenLinkGraph alle verlinkenden Seiten erkundet.
Der Vergleich
Nachdem nun alle Link-Daten überprüft waren und sichergestellt werden konnte, dass sich auf den Seiten auch wirklich ein Link (Dofollow oder Nofollow) befand, ging es darum zu prüfen, wie sich die Daten zueinander verhalten - denn deckungsgleich sind die beiden Mengen durchaus nicht:
- Wie hoch ist die Menge der URLs, die von den Google Webmaster Tools und den Link-Datenbanken gleichermaßen gemeldet werden?
- Wie hoch ist die Menge der „Unique“ URLs bei den Google Webmaster Tools, also der Verlinkungen, die nur Google findet? Gibt es dafür Gründe?
- Wie hoch ist die Menge der „Unique“ URLs bei den Link-Datenbanken, also der Verlinkungen, die nur durch eine oder mehrere Link-Datenbanken gefunden wird? Diese Frage ist noch deutlich interessanter als die zweite, da sich hierzu möglicherweise Gründe finden lassen, warum Google ganz bestimmte Links nicht in die Datenbank aufnimmt.
Unique URLs der Link-Datenbanken
Es war leider auf Grund der großen Menge an Links nicht möglich, alle gefundenen Unique URLs manuell zu prüfen und herauszufinden, warum diese nur von den Link-Datenbanken gefunden wurden. Am Beispiel der Daten von www.suchradar.de lassen sich aber klare Muster erkennen, warum Google ganz bestimmte Links nicht ausgibt.
Bei den folgenden Beispielen zeigt Google existierende Verlinkungen nicht in den Google Webmaster Tools an. Es ist aber auch so, dass die verlinkende Seite häufig dennoch im Suchmaschinen-Index vorhanden ist (überprüft mit der Suchanfrage„info:URL“). Google sollte also grundsätzlich in der Lage sein, die dort vorhandenen Links zu erkennen.
Beispiele:
- http://swissonlinemarketing.ch: Der Link auf suchradar.de befindet sich weit unten auf der Seite in einer langen Liste mit anderen Links
- http://www.rab-friedrich-ramm.de/linkliste14.html: Die Seite verfügt über ca. 250 externe Links
Bei der Überprüfung lässt sich feststellen, dass es viele URLs gibt, die laut Link-Datenbanken auf suchradar.de verlinken, sich aber gar nicht im Google-Index befinden. Einige Beispiele für diese URLs:
- http://blekko.com/ws/ /view /s1seo/deutsche-seo-blogs: Diese Seite ist eine automatisch erstellte Seite, die ausschließlich Suchergebnisse der Suchmaschine Blekko wiedergibt. Google könnte die Indexierung dieser Seite verweigern, weil es von diesen Seiten Millionen oder Milliarden Varianten gibt und weil Google grundsätzlich geneigt ist, solche Suchergebnisseiten nicht zu indexieren.
- http://www.seokomm.at.iproxy.saverpigeeks.com: Hierbei handelt es sich lediglich um eine Kopie der Seite www.seokomm.at.
- http://bellnet.com/suchen/info/web/linklisten.html: Diese Seite hat Google indexiert, aber unter der URL www.bellnet.de/suchen/info/web/linklisten.html.
Bei der Durchsicht der Unique URLs lässt sich erkennen, dass Link-Datenbanken zwei grundsätzliche Probleme haben:
- Sie können die Qualität einer Seite oder Website schlecht einschätzen. Selbst wenn Link-Datenbanken hier bessere Heuristiken entwickeln würden, wären diese wohl niemals deckungsgleich mit denen von Google, insbesondere in Hinblick auf den Qualitätsanspruch.
- Sie sind recht empfänglich für Kanonisierungsprobleme. Dass es auf bellnet.com und bellnet.de identische Inhalte gibt, kann Google recht gut erkennen. Eine Link-Datenbank scheitert an einer solchen Frage leider noch oft. Hierzu zählen auch Probleme wie die Indexierung von Domains der Form www.domain.de und domain.de (mit „www“ und ohne) oder auch www.meine-domain.de und www.meinedomain.de. Dieses Problem potenziert sich leider noch, wenn man (wie in diesem Test) die Ergebnisse verschiedener Link-Datenbanken kombiniert. So kann es passieren, dass eine Datenbank einen Link von www.domain.de meldet, während eine andere den Link auf www.domain.com erkennt. Die Kanonisierung muss dann durch denjenigen erfolgen, der die Daten zusammenführt – was nahezu unmöglich ist.
Unique URLs bei Google
Wer nun einen Blick darauf wirft, welche Unique URLs von den Google Webmaster Tools ausgewiesen werden, muss allerdings anerkennen, dass auch Google ein Qualitätsproblem hat. So finden sich dort für die Website www.suchradar.de Verlinkungen von automatisiert erstellten Websites, die für Millionen von Domains Informationen bereitstellen. In diesem Fall sind das dann URLs wie:
- http://www.sitegrep.com/site/suchradar.de
- http://www.siteluck.com/en/suchradar.de
- http://www.sitonomy.com/?url=www.suchradar.de
- http://www.websvalue.com/www.suchradar.de/
- http://www.cubestat.com/www.suchradar.de
Diese URLs werden – wie gesagt – von Google als Verlinkungen ausgewiesen, von den Link-Datenbanken aber nicht. Bei der manuellen Durchsicht der Verlinkungen lässt sich schnell erkennen, dass ein relativ großer Teil der von Google gemeldeten Verlinkungen eher zweifelhafter Qualität ist.
Gleichwohl gibt es aber auch legitime Seiten, auf denen Links zu finden sind, die von Google, aber nicht von den Link-Datenbanken gefunden wurden, z. B.
- http://www.rechenkraft.net/phpBB/viewtopic.php?f=14&t=6654&start=168
- http://www.pharmaflash.de/2006/agenturen-kostenlose-erfahrungen-und-tipps/
Vergleich
Der folgende Vergleich der URL-Mengen ist relativ schwierig, da Google Webmaster Tools und die Link-Datenbanken sehr unterschiedliche Maßstäbe hinsichtlich der Qualität und der Kanonisierung ansetzen. Verglichen wurden für Tabelle 1 die von Google als Beispiel-URLs gelieferten Seiten sowie die von den Link-Datenbanken gelieferten URLs. Alle URLs wurden daraufhin überprüft, ob dort auch ein Link (Dofollow oder Nofollow) existiert (Verteilung siehe Tabelle 2). Der Vergleich erfolgte dann jeweils auf Domain-Ebene. Wenn Google also einen Link von der Seite www.domain.de/links und die Link-Datenbanken von domain.de/linkliste.htm fanden, wurde das als Gemeinsamkeit gewertet.
Domain |
Domain Pop
(Google) |
Domain Pop
(Link-DB) |
Domain Pop (kombiniert Google und Link-DB) |
Gemeinsame Treffer |
Unique URLs (Google) |
Unique URLs (Link-DB) |
Domain 1 |
738 |
539 |
876 |
401 |
337 |
138 |
Domain 2 |
610 |
679 |
984 |
305 |
305 |
374 |
Domain 3 |
542 |
447 |
822 |
197 |
345 |
280 |
Domain 4 |
261 |
215 |
383 |
93 |
168 |
122 |
Summe |
2.151 |
1.880 |
3.065 |
996 (=32,50 %) |
1.155 (=37,68 %) |
914 (29,82 %) |
| Tabelle 1: Auswertung der Linkdaten |
Domain |
Domain Pop
(Google) |
Davon Dofollow |
Domain Pop
(Link-DB) |
Davon Dofollow |
Domain 1 |
738 |
599 (=81,17 %) |
539 |
496 (=92,02 %) |
Domain 2 |
610 |
510 (=83,61 %) |
679 |
654 (=96,32 %) |
Domain 3 |
542 |
462 (=85,24 %) |
447 |
440 (=98,43 %) |
Domain 4 |
261 |
180 (=68,97 %) |
215 |
201 (=93,49 %) |
Durchschnitt |
|
81,40 % |
|
95,27 % |
| Tabelle 2: Verteilung der Dofollow-Links |
Schlussfolgerungen
Wie sich zeigt, ist die Überschneidung mit 32,50 % (siehe Tabelle 1) gar nicht so hoch, wie man es erwarten könnte. Es gibt aber auch verhältnismäßig viele Unique URLs auf beiden Seiten, wobei interessanterweise Google mit 37,68 % Anteil an den Gesamt-Links mehr Unique URLs liefert als die Link-Datenbanken mit 29,82 %.
Google führt einige URLs nicht auf, weil sie auf Grund der von der Suchmaschine durchgeführten Bereinigung herausfallen. Wer glaubt, dass die von Google gelieferten Sample-Links ein Indiz dafür sind, wie Google Links wertet, kann daraus schon Schlüsse ziehen. So werden Links über Dubletten in den von Google genannten Sample-Links relativ zielsicher entfernt. Wer also eine Pressemitteilung identisch in 100 PR-Portale einträgt, kann faktisch nur einen einzigen Link generieren.
Auch zeigt sich, dass die Link-Datenbanken nicht alle Links liefern können, die Google erkennt. Das kann man den Link-Datenbanken aber nur begrenzt vorwerfen, weil das Internet einfach unglaublich groß ist und Google im Zweifel durch die fast endlos verfügbaren Ressourcen hier wohl immer noch im Vorteil ist. Es zeigt aber vor allem, dass auch bei der Kombination von drei kommerziellen Link-Datenbanken noch immer kein annähernd vollständiges Abbild der Verlinkung zu erhalten ist. Dass einige Links in den Google Webmaster Tools fehlen, obwohl Google die verlinkenden Seiten indexiert hat, kann darauf hinweisen, dass sie einfach ignoriert werden, z. B. weil die Linkseiten überfüllt sind oder weil der Link nicht prominent sichtbar ist.
Vor allem zeigt sich aber, dass Google Webmaster Tools und die Link-Datenbanken gleichermaßen Verlinkungen liefern, die mitunter von mangelhafter Qualität sind – zumindest aus Sicht eines Menschen. Wie weit Google mit einer algorithmischen Bewertung ist, ist leider offen. Zumindest lässt sich Google über die Webmaster Tools nicht sehr tief in die Karten schauen, denn auch dort werden Links angezeigt, die sicherlich einen sehr geringen Wert haben und von denen man nicht annehmen sollte, dass Google diese positiv wertet.
Indirekt hat Google das auch bestätigt. So hat sich Matt Cutts auf der PubCon wie folgt geäußert:
„Although there are many tools that report links, none of the tools can tell you which links are trusted by Google (not even Google’s tools).”
Das reine Vertrauen auf Kennzahlen wie Domain- oder IP-Popularität oder den PageRank der verlinkenden Site führen hier zu einem nur sehr oberflächlichen Bild. Eine Website könnte hunderte Backlinks haben, die aber allesamt von Internetseiten stammen, die automatisiert auf nahezu alle relevanten Websites im Internet verlinken. Die thematische Nähe zwischen verlinkenden und verlinkten Website wird weder von Google noch von den Link-Datenbanken angegeben – und das, obwohl es wohl relativ unstrittig ist, dass die thematische Nähe durchaus als Kriterium für Verlinkungen zählt.
Nofollow-Links
Interessant ist übrigens auch, dass fast 20 % der von Google gelieferten Verlinkungen Nofollow-Links sind. Das ist natürlich schon deswegen relevant, weil sich so zeigt, dass Nofollow-Links nicht komplett von Google ignoriert werden. Da sie über die Google Webmaster Tools abrufbar sind, müssen sie auch in irgendeiner Form von Google gespeichert werden. Und dann ist die Frage natürlich zulässig, ob diese dann nicht auch irgendwie gewertet werden.
Hierzu gibt es unter SEOs kontroverse Meinungen. Aber grundsätzlich kann argumentiert werden, dass Google natürlich anhand der enormen Link-Daten „weiß“, welcher Anteil an Nofollow-Links normal ist. Eine Website, die also nur Dofollow-Backlinks hätte, würde aus Google-Sicht natürlich recht seltsam erscheinen.
Fazit
Bei dem Test hat sich gezeigt, dass selbst durch die Kombination von drei Link-Datenbanken und den Google Webmaster Tools kein vollständiges Abbild der Verlinkung einer Website gewonnen werden kann. Es wurde aber auch klar, dass alle Seiten klare Qualitätsprobleme haben, d. h. dass viele Links gemeldet werden, die entweder durch doppelten Content entstehen oder von minderwertiger Qualität sind.
 |
Über den Autor
Markus
Hövener ist Chefredakteur des Magazins suchradar
und geschäftsführender Gesellschafter der SEO-/SEM-Agentur Bloofusion Germany.
E-Mail: markus@suchradar.de
Markus Hövener (@bloonatic)
bei Twitter: 
|
|
|
Das suchradar Print-Abo
Ab 300 Abonnenten (bis 30.09.12) starten wir ein Print-Abo für das suchradar zum Preis von 58,50 € jährlich (inkl. MwSt. und Versand, Preis für Deutschland). Jetzt hier für das Abo anmelden!
Nichts verpassen...
Agenturen & Dienstleister
SEO-/SEM-Agenturen
> Agenturen in Deutschland,
Österreich,
Schweiz
> Agenturen in Berlin,
Bremen, Düsseldorf,
Frankfurt, Hamburg,
Hannover, Innsbruck,
Köln, München,
Wien, Zürich
Weitere Dienstleister:
> Content-Dienstleister
> SEO-/SEM-Tools
Ausgabe 35 (26. April 2012)
Fokus-Thema"Linkaufbau in der Praxis":
> "Schlechte" Links erkennen
> Linkbait
> Linkaufbau in der Praxis
> Linkaufbau mit Beziehung
Außerdem:
> Lokale Suche
> Interview: Mike Blumenthal
> AdWords-Platzhalter
> Facebook-Anzeigen
> Paginierung
> Brandbidding und Recht
> SEOTools für Excel
> strucr.com
> On-Page-Kreativität
Jetzt herunterladen...
Unsere Partner



Weitere Partner...
|