|
- Werbung -
Links, Links, Links:
Yahoo-Linkdaten unter der Lupe
Die Abfrage von Verlinkungen anderer Websites macht vieles leichter: Wer z.B. ein neues Dating-Portal startet, kann durchaus von den etablierten Portalen lernen. Welche Websites verlinken denn auf Sites wie www.friendscout24.de, www.ilove.de und www.parship.de? Da diese Seiten prinzipiell auch auf das eigene Portale verlinken könnten, verkürzen derartige Analysen die Suche nach guten Verlinkungsmöglichkeiten enorm.
Seit Jahren wird für die Analyse der Verlinkungen gerne die Suchmaschine Yahoo genutzt. Zwar kann man auch bei Google mit der Anfrage "link:www.domain.de" bzw. "link:http://www.domain.de/pfad/" abfragen, welche Seiten auf eine bestimmte Domain bzw. URL verlinken. Die von Google gelieferten Daten sind aber nicht sehr umfangreich und umfassen nur einen Bruchteil aller Verlinkungen.
Dass Google wesentlich mehr Verlinkungen kennt, zeigt der Blick in die Google Webmaster Tools. Die dort verfügbaren Daten sind extrem umfangreich - zeigen aber eben leider nur Links auf die eigenen Websites an. Der Blick auf die Verlinkung von Konkurrenten bleibt damit verborgen.
Der Zugriff auf Yahoo ist da - zumindest in Bezug auf fremde Websites - wesentlich bequemer. Über das Kommando "link:URL" erhält man sehr viele Verlinkungen für diese URL. In der Regel wird man das Kommando noch um "-site:www.domain.de" erweitern (also z.B. "link:http://www.domain.de/ -site:www.domain.de), um interne Links auszublenden.
Auch das Kommando "linkdomain:www.domain.de" ist sehr interessant, weil es eben alle Links anzeigt, die auf eine bestimmte Domain verlinken. Dieses Kommando würde also sowohl Links auf die Startseite als auch Links auf tiefere Seiten innerhalb der Website anzeigen.
Kombinieren
Die Operatoren "link" und "linkdomain" darf man dabei beliebig kombinieren. Wer z.B. nach Linkseiten zum Thema Dating sucht, wird bei einer Suchanfrage wie "link:http://www.datingdomain.de" von der Anzahl der Antworten erschlagen.
Wer aber nach "link:http://www.datingdomain1.de/ link:http://www.datingdomain2.de/" sucht, erhält nur Seiten, die auf beide Dienste verlinken. Die Chancen, hier eine Linkliste zu finden, sind dabei sehr hoch. Diese Anfrage kann man natürlich auch mit "linkdomain" machen.
Auch kann man Suchbegriffe und Linkanfragen kombinieren. Wer also z.B. nach "gay link:http://www.datingdomain.de" sucht, erhält Seiten, in denen das Wort "gay" und ein Link auf die genannte Domain vorkommen.
Nur 1000?
Der Nachteil der Yahoo-Abfrage - genau wie bei Google - liegt darin, dass man nur die ersten 1000 Suchergebnisse abfragen kann. Bei vielen Websites ist das keine ernsthafte Beschränkung, aber wer Verlinkungen großer Portale (z.B. ebay, Amazon) analysieren möchte, stößt hier sehr schnell an Grenzen.
Es gibt leider keinen echten Weg, um mehr als 1000 Suchergebnisse abzufragen, aber zumindest kann man sich mit einem Trick behelfen: Man führt viele Anfragen durch und führt die Ergebnisse zusammen. Wer also möglichst viele Links einer bestimmten Domain erhalten möchte, kann z.B. viele Suchanfragen der Form "(Suchbegriff) link:www.domain.de -site:www.domain.de" stellen. Wenn man diese Anfrage für sehr viele Suchbegriffe durchführt und die Ergebnisse zusammenführt, erhält man deutlich mehr als 1000 Suchergebnisse.
Automation
Das alles geht ab einem bestimmten Punkt natürlich nicht mehr manuell. Zwar kann man sich über den Yahoo! Site Explorer [1] die Verlinkungsdaten im TSV-Format herunterladen (siehe Abbildung 1), aber für hunderte von Suchanfragen wird das dann doch sehr mühselig. Glücklicherweise gibt es von Yahoo eine Schnittstelle [2] (neudeutsch: API), über die man automatisiert Anfragen stellen und Suchergebnisse erhalten kann. Die Suchparameter werden der API dabei als URL-Parameter übergeben, z.B.
http://api.search.yahoo.com/WebSearchService/V1/webSearch?appid=TOKEN&query=link:http://www.suchradar.de/&results=100&start=1
|

Abbildung
1: Yahoo! Site Explorer
|
Einzige Voraussetzung für derartige API-Abfragen ist ein so genanntes Token, das man kostenlos bei Yahoo erhält und über den Parameter "appid" übergibt.
Die Suchergebnisse kommen dann im XML-Format zurück (siehe Kasten "XML-Code"). Das Parsen dieser XML-Ergebnisse ist dadurch relativ einfach. Die API ist - obwohl schon seit mehreren Jahren im Betrieb - nicht immer sehr zuverlässig, so dass man hier schon robust programmieren muss. So kommt es manchmal vor, dass eine leere Ergebnisseite geliefert wird oder dass die erste und die zweite Ergebnisseite Überschneidungen haben.
Ergebnisse überprüfen
Dennoch ist die Yahoo-API ein hervorragendes Tool, um automatisiert Linkabfragen durchzuführen. Blind vertrauen sollte man den Ergebnissen aber auf gar keinen Fall. Bei einem Testlauf mit ca. 90000 gelieferten URLs haben wir überprüft, wieviele der URLs wirklich einen Link auf die angefragte Website enthielten. Das Ergebnis zeigt, dass es sinnvoll ist, die URLs jeweils herunterzuladen und zu überprüfen, ob sich auf der jeweiligen Seiten ein für Suchmaschinen sichtbarer Link befindet:
- 21,9% der Links konnten auf der jeweiligen Seiten nicht gefunden werden, d.h. dass sie entweder nicht (mehr) existierten oder als nofollow markiert waren.
- 1,1% der Links befanden sich auf Seiten, die über einen Robots-Meta-Tag (noindex oder nofollow) verfügten.
- 5,6% der Seiten konnten nicht abgerufen werden (i.d.R. 404, Server down oder Domain nicht mehr existent).
- 71,4% der Links konnten gefunden werden (Seite konnte geladen werden, kein noindex/nofollow als Robots-Meta-Tag, Link konnte gefunden werden und war nicht als nofollow markiert).
Die Tatsache, dass Yahoo auch Links aufführt, die Nofollow-Links sind oder bei denen die Seite selber einen Meta-Robots-Tag "noindex" oder "nofollow" hat, sorgt oft dafür, dass die gelieferten Linkzahlen wesentlich besser aussehen als in der Realität. Oftmals zeigt Yahoo zwar an, dass es eine vier-, fünf- oder sogar sechsstellige Anzahl an Links gibt. Nach der Überprüfung bleibt davon aber oft wenig übrig, weil die Links z.B. von nur einer geringen Anzahl unterschiedlicher Domains kommen und zudem vielleicht als Nofollow-Links ausgeführt sind.
[1] http://siteexplorer.search.yahoo.com/de/
[2] http://developer.yahoo.com/search/web/webSearch.html
XML-Code
Die von Yahoo bereitgestellten Ergebnisse werden im XML-Format geliefert. Das folgende Code-Beispiel zeigt nur einen kleinen Ausschnitt der gelieferten Parameter und wurde stark verkürzt:
<?xml version="1.0" encoding="UTF-8" ?>
<ResultSet type="web" totalResultsAvailable="1780" totalResultsReturned="100" firstResultPosition="1">
<Result>
<Title>SMX München - Ausstellung, 8-9 April, 2008</Title>
<Summary>Nach sehr erfolgreichen Veranstaltungen u.a. in New York, London und Stockholm ... WebCertain's Ziel ist es, Wachstum für Kunden zu generieren, die sich ...</Summary>
<Url>http://searchmarketingexpo.com/munich_archive/2008/network.shtml</Url>
<ClickUrl>http://searchmarketingexpo.com/munich_archive/2008/network.shtml</ClickUrl>
</Result>
</ResultSet>
|
Fazit
Die Yahoo-Linkdaten sind eine sehr große Hilfe bei der Suche nach guten Linkseiten. Insbesondere die Abfrage über die kostenlose Yahoo-API vereinfacht das Sammeln der notwendigen Daten. Wichtig ist aber vor allem, dass die gelieferten Linkseiten auch überprüft werden, da Yahoo auch Links liefert, die von Suchmaschinen gar nicht gewertet werden.
|
 |
Über
den Autor
Markus Hövener ist Chefredakteur des Magazins suchradar
und geschäftsführender Gesellschafter der Suchmaschinen-Marketing-Agentur
Bloofusion Germany.
Email: markus@suchradar.de
|
Kommentare
| Uwe Walcher schrieb am 27.02.2009: |
| Hallo, die eine Aussage im letzten Abschnitt das Links mit "noindex" aufgeführt werden und diese nicht zählen stimmt nur bestimmt. Wird eine Seite z.b. mit noindex,follow versehen werden die Links von dieser sehr wohl gewertet. |
|
| Sven schrieb am 10.04.2009: |
| Hi,
hast du auch das Problem, dass die gleiche TSV beim Download unterschiedlich kodiert sein kann? Schwierig bei der Automatisierung. Kennst du eine gute Möglichkeit dieses Problem zu umgehen. Vielleicht einen bestimmten Yahoo-Server anzufragen?
Die Ergebnisse bei der API-Anfrage sind unterschiedlich zu den Site-Anfragen und auch viel älter, oder nicht? |
|
| Markus Hövener schrieb am 10.04.2009: |
| Wir nutzen eigentlich nur die API - die allerdings auch ihre eigenen Macken hat. Die Daten sind schon gelegentlich anders als die über den Browser gelieferten Daten. Aber mir ist noch nie aufgefallen, dass es da extreme Abweichungen gibt. |
|
Kommentar abgeben
|