URL-Parameter: Mit den richtigen Einstellungen Probleme vermeiden

Beitrag aus Ausgabe 70 / Februar 2018
SEO
Markus Hövener

ist Chefredakteur des Magazins suchradar und geschäftsführender Gesellschafter der SEO-/SEA-Agentur Bloofusion Germany.

Auch wenn es heute faktisch nur noch sprechende URLs gibt, sind URL-Parameter immer noch ein SEO-Problem. Was passieren kann und wo man welche Einstellungen vornehmen sollte, zeigt dieser Leitfaden.

URL-Parameter – oder auch CGI-Parameter – sind manchmal Bestandteil einer URL. Eingeleitet werden diese durch ein Fragezeichen, gefolgt von einzelnen Parametern, die durch ein Et-Zeichen (&) getrennt werden (also z. B. „…?parameter1=wert&parameter2=wert2“).

Wenn also z. B. die URL http://www.meinewebsite.de/news.php?id=33&modus=anzeigen aufgerufen wird, passiert das Folgende: Das Programm, das sich hinter /news.php verbirgt, liest die Parameter „id“ und „modus“ aus, um dann zu entscheiden, was passieren soll. In diesem Fall holt es die News mit der ID 33 aus der Datenbank und zeigt den entsprechenden Beitrag an. Die unterschiedlichen Parameter-Namen und -Werte legt der jeweilige Programmierer für das Programm selbst fest.

Insgesamt sind URL-Parameter heute seltener als früher zu finden. Heute verfügen Websites in der Regel über „sprechende URLs“, also z. B.

http://www.meinewebsite.de/produkte/miele-staubsauger-3315.html

anstelle von

http://www.meinewebsite.de/index.cgi?modus=produkt&id=3315&sid=2782398&preise=1

Dass heute mehr sprechende URLs zu finden sind, liegt auch darin begründet, dass sich Suchmaschinen in der Vergangenheit geweigert haben, URLs mit vielen URL-Parametern zu crawlen und zu indexieren. So begann der Siegeszug der sprechenden URLs.

Lange Zeit stand die Vermeidung von Parameter-URLs ganz oben auf der SEO-Liste. Die meisten Shop- und Content-Management-Systeme können mittlerweile ohne Umprogrammierung saubere, sprechende URLs generieren. Zeitgleich haben sich auch die Suchmaschinen weiterentwickelt. Gerade Google hat faktisch keine Probleme mehr mit Parameter-URLs.

Auch wenn es heute fast nur noch sprechende URLs gibt, sind URL-Parameter immer noch ein gewisses Problem. Denn: Ohne URL-Parameter geht es auch bei sprechenden URLs häufig nicht. Zwar sind die wichtigsten Parameter mittlerweile nicht mehr als URL-Parameter in der URL zu finden. Aber fürs Tracking und einige andere Funktionalitäten benötigt man sie immer noch.

Ein typisches Beispiel: Wer Besucherquellen richtig analysieren möchte, hängt oft die von Google Analytics unterstützten Parameter „utm_source“, „utm_campaign“ und „utm_medium“ an die URL an. Je nach Content-Management- oder Shop-System gibt es aber auch spezielle Parameter: Bei Typo3 findet sich bspw. oft der Parameter „cHash“ in der URL (siehe Abbildung 1).

URL-Parameter gibt es also immer noch bei fast jeder Website. Da stellt sich natürlich die Frage, wie das in Bezug auf SEO nachteilig sein kann – und was man dagegen tun sollte.

Muss man sich überhaupt darum kümmern?

Zu Beginn ein Beispiel: Auf die Artikelseite /artikel.html wird mit unterschiedlichen URLs verlinkt, z. B.

/artikel.html?utm_campaign=neukundenwerbung2017

/artikel.html?utm_campaign=rundschreiben2016

So wird natürlich viel Duplicate Content erzeugt, denn es gibt eine Seite mit identischem Content und unterschiedlichen URLs.

In diesem Fall ist das gar nicht so schlimm, denn die Seiten haben jeweils ein Canonical Tag, und zwar:

<link rel=“canonical“ href=“http://www.website.de/artikel.html“ />

Da die Dubletten dasselbe Canonical Tag (ohne URL-Parameter) haben, zieht Google die Dubletten einfach wieder zusammen und addiert deren einzelne Signale, sodass kein Schaden entstehen kann. Es ist quasi so, als ob es die Dubletten niemals gegeben hätte. Das klingt grundsätzlich gut, sorgt aber auch für Probleme.

Wenn man ein Canonical Tag hat, muss der Google-Crawler trotzdem alle Dubletten herunterladen und indexieren. So verschwendet man das sogenannte Crawl-Budget. Der Crawler ist also damit beschäftigt, Dubletten herunterzuladen – und hat dann später vielleicht nicht mehr ausreichend Zeit, um neue Seiten ebenfalls herunterzuladen. Bei kleineren Websites ist das in der Regel kein echtes Problem, da das Crawl-Budget hinreichend groß ist. Bei großen Websites oder vielen URL-Parametern kann es dadurch aber schon zu Problemen kommen.

Wer kein Canonical Tag hat, begegnet oft dem Problem, dass die URLs mit den Parametern auch im Suchergebnis auftauchen. Wie in Abbildung 2 zu sehen ist, kann es dann passieren, dass ein Nutzer aus dem Google-Ergebnis auf die Seite kommt und aufgrund der falschen Parameter einem falschen Kanal zugeordnet wird.

Man sollte sich also in jedem Fall um URL-Parameter kümmern – auch wenn es in der Regel kein gewaltiges Schadenspotenzial gibt, wenn man dies nicht tut.

Wie findet man alle URL-Parameter einer Website?

Am Anfang einer Analyse steht immer die Frage, welche URL-Parameter die eigene Website benutzt. Dies lässt sich zum Teil mit einem Crawl beantworten: Mit Tools wie dem Screaming Frog SEO Spider kann die eigene Website komplett gecrawlt werden, um dann in den URLs gezielt nach URL-Parametern zu suchen.

Deutlich einfacher und effizienter ist der Weg, in der Google Search Console unter „URL-Parameter“ nachzusehen. Dort zeigt Google alle relevanten Parameter an, die der Google-Crawler in der letzten Zeit gefunden hat (siehe Abbildung 3).

Wer wissen möchte, welche URLs den jeweiligen Parameter angehängt haben, kann auf „Bearbeiten“ und dann auf „Beispiel-URLs anzeigen“ klicken (siehe Abbildung 4).

Parameter identifiziert – was nun?

Sobald man nun einen oder mehrere Parameter identifiziert hat, muss man sich die Frage stellen, wie wichtig dieser Parameter ist, um die entsprechenden Einstellungen vorzunehmen.

Fall 1: Parameter ist nicht relevant

Falls die Seite mit und ohne Parameter exakt gleich ausgeliefert wird, ist dieser irrelevant und damit faktisch überflüssig (in Bezug auf Google und SEO).

Beispiele:

  • Session-IDs
  • Tracking-Parameter (utm_...)

Wenn man solche Parameter gefunden hat, sollte man sicherstellen, dass diese Parameter nicht im Canonical Tag erscheinen. Außerdem sollte man diesen Parameter in der Google Search Console „ausschalten“. Im Report „URL-Parameter“ kann man dann auf „Bearbeiten“ bzw. „Parameter hinzufügen“ gehen und die Frage „Ändert dieser Parameter den Seiteninhalt, der dem Nutzer angezeigt wird?“ mit „Nein“ beantworten.

Dann wird Google den Parameter idealerweise schon vor dem Crawling aus der URL entfernen, was das Crawl-Budget deutlich schonen kann.

Fall 2: Parameter ist kritisch für die Seite (der einfache Fall)

Es gibt aber natürlich auch URL-Parameter, die relevant sind. Mit anderen Worten: Wenn man diese aus der URL entfernt, kann die Seite nicht mehr wie gehabt ausgeliefert werden.

Beispiele:

  • Produkt-IDs
  • News-IDs
  • Monat, Jahr

Wenn dies der Fall ist, muss eigentlich nur sichergestellt sein, dass diese Parameter auch im Canonical Tag erscheinen, damit Google diese auch erkennen kann. Außerdem sollte hier die Frage „Ändert dieser Parameter den Seiteninhalt, der dem Nutzer angezeigt wird?“ mit „Ja“ beantwortet werden. In der Regel wird man dann die zweite Frage mit „Präzisierung“ und die dritte mit „Jede URL“ beantworten (siehe Abbildung 5). Grundsätzlich gilt: Die Wahl „Entscheidung dem Googlebot überlassen“ sollte man eigentlich niemals auswählen.

Fall 3: Relevant, aber …

Und dann gibt es noch Parameter, die nicht unter Fall 1 und 2 fallen. Ein Beispiel: Über den Parameter „sort“ wird eingestellt, wie die Ergebnisse auf der Seite sortiert werden. Ein solcher Parameter kann schnell ganz viele Dubletten erzeugen – vor allem auch in Kombination mit anderen Parametern. Sollen URLs mit diesem Parameter im Index erscheinen? Sollen diese überhaupt gecrawlt werden?

Typischerweise wird man sich konkret die folgenden Fragen stellen:

  • Braucht es Seiten mit diesem URL-Parameter, damit der Crawler an bestimmte Seiten herankommt? Oder kann der Crawler auch über andere Seiten an alle Seiten gelangen? Ein Beispiel: Bei einem Shop schafft es der Google-Crawler auch über die „normalen“ Rubrikenseiten (ohne sort-Parameter), an alle Produktdetailseiten zu kommen. Die Sortier-Seiten werden also unter diesem Aspekt nicht für Google benötigt.
  • Sollte ein Nutzer auf einer solchen Seite landen? Sollte der Besucher z. B. auf einer Rubrikenseite landen, bei der zuerst die Produkte mit dem höchsten Preis erscheinen? Oder die mit der schlechtesten Bewertung? Unter diesem Aspekt sollte ein sort-Parameter also auch nicht im Google-Index erscheinen.

Je nach Antwort muss man eine der folgenden Maßnahmen wählen:

  • In der Google Search Console müssen die URL-Parameter entsprechend eingestellt werden, um Google die Bedeutung der Parameter mitzuteilen (siehe Fall 2). So kann man dort die Frage „Wie wirkt sich dieser Parameter auf den Seiteninhalt aus?“ z. B. mit „Sortierung“ beantworten, um so zu kommunizieren, dass der Parameter wichtig ist und dass URLs mit dem sort-Parameter auch gecrawlt und indexiert werden sollen.
  • Wenn man sich aber dafür entscheidet, dass ein bestimmter Parameter nicht relevant ist, sollte man diesen (siehe Fall 1) auch entsprechend konfigurieren.
  • Wer sehr auf sein Crawl-Budget achtet, kann Parameter auch fürs Crawling ausschließen, indem diese per robots.txt gesperrt werden. Ein Eintrag „Disallow: /*sort=“ würde alle URLs, in denen irgendwo „sort=“ steht, vom Crawling ausschließen. Mit solchen Einstellungen muss man natürlich insgesamt sehr vorsichtig sein.

Bing Webmaster Tools

Eine ähnliche Funktion wie der URL-Report in der Google Search Console bietet auch die Konkurrenz: In den Bing Webmaster Tools gibt es eine Funktion, über die man irrelevante URL-Parameter definieren kann. Über „URL-Parameter ignorieren“ (siehe Abbildung 6) können die jeweiligen Parameter Stück für Stück eingegeben werden. Weitergehende Einstellungen (wie oben: Fall 2 und 3) kann man damit leider nicht vornehmen.

Spannend? Jetzt Artikel zu Ende lesen!

Lesen Sie den Artikel weiter in unserer suchradar Ausgabe 70 von Februar 2018 mit dem Titelthema „Online-Marketing-Mythen: Was stimmt? Was nicht?“.

Kostenloses PDF-Magazin bestellen Online weiterlesen? Einfach kostenlos für den Newsletter anmelden. Kostenpflichtiges Print-Abo bestellen