XML Sitemaps:
Hilfreich für Suchmaschinen-Rankings?

Die drei großen Suchmaschinen-Betreiber Google, Yahoo und Microsoft unterstützen den Sitemaps-Standard, der es Webmastern ermöglichen soll, mehr Einfluss auf die Indexierung der eigenen Website auszuüben. Wie erstellt man Sitemaps? Helfen diese beim Kampf um die vorderen Suchmaschinen-Positionen?

Was ist eine XML Sitemap?

Eine XML Sitemap ist eine Datei (bzw. mehrere Dateien), die alle Seiten einer Website auflistet, die von Suchmaschinen erfasst werden sollen (Definition des Standards siehe [1]). Eine XML Sitemap einer Website mit nur einer Seite könnte so aussehen:

<?xml version="1.0" encoding="UTF-8"?>
    urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
    <loc>http://www.website.de/</loc>
    <priority>0.5</priority>
    <lastmod>2005-07-11T11:37:32+00:00</lastmod>
    <changefreq>daily</changefreq>
    </url>
</urlset>

Die ersten beiden Zeilen und die letzte Zeile sind dabei nur der Rahmen für die eigentlichen Daten. Diese stellen sicher, dass Suchmaschinen die Datei eindeutig als XML Sitemap erkennen können.

Die relevanten Bestandteile der XML Sitemap stellen dann die Blöcke zwischen "<url>" und "</url>" dar. Für jede URL der Website gibt es einen solchen Block. Innerhalb dieses Blocks befinden sich dann weitere Informationen:

  • <loc>...</loc>: Die URL der jeweiligen Seite
  • <priority>...</priority>: Ein Zahlwert, der die Wichtigkeit der Seite innerhalb der Website angibt. Der Wert kann zwischen 0.0 (unwichtig) und 1.0 (wichtig) liegen.
  • <lastmod>...</lastmod>: Das Datum der letzten Änderung
  • <changefreq>...</changefreq>: Die Häufigkeit, mit der diese Seite geändert wird (mögliche Werte: always, hourly, daily, weekly, monthly, yearly, never)

Über die Optionen <priority> und <changefreq> soll es möglich sein, die Crawler der Suchmaschinen besser zu steuern. Theoretisch werden Seiten mit einer hohen Änderungsfrequenz und einer hohen Priorität häufiger erfasst. Nicht sinnvoll ist dabei, allen Seiten dieselben Werte zuzuweisen. Es hilft also nicht, allen Seiten die höchste Priorität (1.0) zuzuweisen und die Änderungsfrequenz aller Seiten auf "always" zu setzen. Laut Aussage von Google werden die Werte nur dann zum gewünschten Effekt führen, wenn den einzelnen Seiten unterschiedliche Werte zugewiesen werden. Im Übrigen steuern diese Parameter nur den Crawler. Seiten mit einer hohen Priorität werden nicht bessere Suchmaschinen-Rankings aufweisen, als Seiten mit einer niedrigen Priorität.

XML Sitemaps verfügen übrigens über einige - in der Praxis kaum relevante - Einschränkungen. Eine einzelne Datei darf nicht mehr als 50.000 Einträge aufweisen und darf eine Größe von 10 MB nicht überschreiten. Falls eine Website über mehr als 50.000 Einträge verfügt, müssen diese über mehrere Dateien verteilt werden und mit einer Sitemap-Index-Datei versehen werden; in diesem Fall darf es aber nicht mehr als 1.000 Dateien geben, so dass Sitemaps maximal 1.000 x 50.000 = 50 Millionen URLs beinhalten dürfen.

Brauchen Suchmaschinen Sitemaps?

Prinzipiell benötigen Suchmaschinen bei den meisten Websites keine XML Sitemaps. Die Crawler der Suchmaschinen besuchen zunächst die Startseite einer Website und verfolgen von dort aus alle Links auf tiefere Seiten. Im Normalfall sind Suchmaschinen also auch ohne XML Sitemaps in der Lage, alle Seiten einer Website zu erfassen - insbesondere, wenn es sich um eine kleine Website mit einer drei- oder vierstelligen Anzahl an Seiten handelt.

XML Sitemaps sind also eher ein Fall für größere, komplexere Portale, die hauptsächlich zwei Probleme haben:

  1. Die Suchmaschinen-Crawler indexieren pro Tag nur eine bestimmte Menge an Seiten. Über XML Sitemaps und Parameter wie <priority> und <changefreq> ist es möglich, diese "Energie" auf die wichtigen Seiten zu konzentrieren. Damit soll sichergestellt werden, dass die wichtigen Seiten auf jeden Fall regelmäßig erfasst werden.
  2. Nicht alle Seiten einer Website können von Suchmaschinen erfasst werden, weil sie sich z.B. hinter einem Formular befinden. Über XML Sitemaps könnten derartige bislang nicht erfassbare Seiten doch indexiert werden, ohne die Struktur der Website ändern zu müssen.
Wie finden Suchmaschinen Sitemaps?

Wenn sich ein Website-Betreiber für den Einsatz von XML Sitemaps entscheidet, müssen Suchmaschinen auch von der Existenz dieser Dateien erfahren. Dazu gibt es prinzipiell zwei Möglichkeit: Webmaster-Schnittstellen und Auto Discovery.

Suchmaschinen wie Google [2], Yahoo [3] und MSN/Live [4] haben für Website-Betreiber Webmaster-Schnittstellen eingerichtet, über die diese mit Suchmaschinen kommunizieren. Dort kann jeweils die URL der Sitemap eingetragen werden.

Es geht aber auch ohne die Webmaster-Schnittstellen. Der folgende Eintrag in der Datei /robots.txt bewirkt, dass die Suchmaschinen die Sitemaps automatisch finden (Auto Discovery):

Sitemap: URL der Sitemap

Abbildung 1: Google Webmaster Tools

Die Nutzung der Webmaster-Schnittstellen ist dabei wesentlich effizienter, da Suchmaschinen hier direkt mit dem Website-Betreiber kommunizieren. Falls es also z.B. ein technisches Problem gibt, wird dies von den Webmaster-Tools in der Regel direkt angezeigt (siehe Abbildung 1); bei der Auto Discovery gibt es dieses Feedback nicht. Die Google Webmaster Tools zeigen auch jeweils seitengenau an, wie viele der in der Sitemap genannten URLs bereits von Google indexiert sind - eine sehr interessante Information, die wesentlich genauer als z.B. die Abfrage über das Kommando "site:www.meinesite.de" ist.

Helfen Sitemaps?

XML Sitemaps helfen vor allem großen Websites, mehr Kontrolle über die Indexierung zu erlangen. Die Nutzung von Sitemaps führt aber in keinem Fall zu besseren Suchmaschinen-Rankings.

Eine Sitemap hat daher einen ähnlichen Effekt wie eine Suchmaschinen-Anmeldung: Bestenfalls wird damit sichergestellt, dass die Seiten einer Website indexiert werden. Nach der Indexierung greifen aber andere Erfordernisse - allen voran die Abstimmung der Inhalte auf Suchbegriffe und die Verlinkung der Website.

Auch darf nicht vergessen werden, dass es prinzipiell wenig hilft, wenn Suchmaschinen eine Seite indexieren, weil diese in einer Sitemap aufgeführt ist. Für Suchmaschinen wie Google zählt auch und vor allem die Analyse der internen Verlinkung. Dabei wird überprüft, wie prominent eine bestimmte Seite innerhalb der Website verlinkt ist und wie tief sich diese Seite in der Site befindet. Prinzipiell wird eine Seite, die über die Navigationsleiste aller Seiten verlinkt ist und nur einen Klick von der Startseite entfernt ist, wesentlich besser ranken als eine Seite, die sechs oder sieben Klicks von der Startseite aus entfernt ist.

Diese Informationen fehlen den Suchmaschinen aber, wenn eine Seite nur auf Basis der XML Sitemaps indexiert. Es muss also davon ausgegangen werden, dass diese Seite dann kaum signifikante Suchmaschinen-Rankings für konkurrenzstarke Suchbegriffe aufzeigen kann.

Wie erstelle ich Sitemaps?

Wer eine Sitemap für seine eigene Website erstellen möchte, kann das auf verschiedene Art und Weise machen:

  1. Manuell: Der Sitemaps-Standard findet sich auf der Website [1]. Ein manuelles Erstellen der Sitemap ist aber nur dann sinnvoll, wenn eine Website aus ganz wenigen Seiten besteht. Nach dem manuellen Erstellen einer Sitemap sollten Sie aber auf jeden Fall einen Validator wie [7] nutzen, um zu überprüfen, ob die XML-Sitemap korrekt ist.
  2. Online: Es gibt Dienste wie [5], die XML Sitemaps in einem Browser erzeugen lassen. Der Dienst [5] ist auf Websites mit weniger als 500 URLs beschränkt, was aber für viele Websites durchaus ausreichend ist.
  3. Software: Es gibt viele Programme, die entweder auf dem PC oder auf dem Server installiert werden können. In der Regel bieten diese Programme sehr viele Einstellungsmöglichkeit, um z.B. Prioritäten zu setzen oder bestimmte Seiten aus der XML Sitemap auszuschließen. Eine Übersicht über diese Programme findet sich unter [6].
Fazit

XML Sitemaps sind vor allem mit Hilfe spezieller Programme oder Online-Tools relativ einfach zu erstellen. Bei vielen Websites bedarf es aber keiner Sitemap, um von Suchmaschinen gut erfasst zu werden. Prinzipiell können XML Sitemaps aber niemals schaden, sondern können auch interessante Informationen liefern, wenn man diese über die Webmaster-Schnittstellen der Suchmaschinen anmeldet.

[1] http://www.sitemaps.org/
[2] https://www.google.com/webmasters/tools
[3] http://webmaster.live.com/
[4] http://siteexplorer.search.yahoo.com/
[5] http://www.xml-sitemaps.com/
[6] http://code.google.com/sm_thirdparty.html
[7] http://www.validome.org/google/

 

Über den Autor

ist Chefredakteur des Magazins suchradar und geschäftsführender Gesellschafter der SEO-/SEM-Agentur Bloofusion Germany.

Email: markus@suchradar.de