Canonical Tag: Inhalte richtig kanonisieren leicht gemacht

Beitrag aus Ausgabe 58 / Februar 2016
SEO
Markus Hövener

ist Chefredakteur des Magazins suchradar und geschäftsführender Gesellschafter der SEO-/SEA-Agentur Bloofusion Germany.

Das Canonical Tag ist grundsätzlich ein nützlicher Helfer im SEO-Werkzeuggürtel. Aber wozu braucht man es? Und wie kann man prüfen, ob man es richtig einsetzt?

Doppelte Inhalte sind für viele Online-Marketer ein Schreckgespenst. Zum Glück hat Google Website-Betreibern schon vor etlichen Jahren ein mächtiges Werkzeug bereitgestellt: das Canonical Tag. Über dieses Tag ist es möglich, die Nachteile, die doppelte Inhalte erzeugen, zu minimieren.

Ein Beispiel für die sinnvolle Nutzung eines Canonical Tags findet sich in Abbildung 1. Wenn ein Crawler wie der Googlebot die Website www.religioese-geschenke.de Seite für Seite herunterlädt, folgt er ja den internen Verlinkungen. Nun ist es aber so, dass ein und dieselbe Seite mal unter der URL http://www.religioese-geschenke.de/fahrrad-plakette-christophorus.html verlinkt wird und an andere Stelle unter der URL http://www.religioese-geschenke.de/fahrrad-plakette-christophorus.html?c=567.

Das ist gerade bei Onlineshops üblich, da Produkte mehreren Kategorien angehören können. Wenn dann die Kategorie in der URL erscheint, gibt es unterschiedliche URLs für ein und dasselbe Produkt.

Für solche Fälle gibt es das Canonical Tag. In den beiden genannten URLs befindet sich jeweils das gleiche HTML-Tag:

<link rel="canonical" href="http://www.religioese-geschenke.de/fahrrad-plakette-christophorus-klammer.html" />

Dieses Tag hat zweierlei Wirkung:

1. Beide URLs bzw. die dazugehörigen Seiten sammeln Signale. Das können interne oder externe Verlinkungen oder auch soziale Signale sein – Signale, die Google bei der Berechnung der Rankings helfen. Wenn es ein Canonical Tag gibt, werden die Signale der jeweiligen Dubletten zusammengefasst und auf einer einzigen Seite „gebündelt“.

2. Die im Canonical Tag genannte URL wird bevorzugt in den Suchergebnissen ausgegeben. Im Regelfall sollte man also genau diese URL (und nicht die mit „c=567“ aus dem Beispiel) als Suchergebnis erhalten.

Duplicate Content

Bei solchen Dubletten handelt es sich um Duplicate Content („doppelte Inhalte“) – etwas, vor dem viele Website-Betreiber zu Unrecht Angst haben. Mit dem Canonical Tag können die negativen Effekte von Duplicate Content verhindert werden. Mit diesen „negativen Effekten“ sind aber keine Abstrafungen oder Abwertungen gemeint, sondern das, was in der Praxis passiert: Unterschiedliche Seiten haben jeweils einige gute Signale und schaffen es in den Suchergebnissen nicht unbedingt nach vorne. Durch das Bündeln der Signale in einer Seite kann man nun Vorteile im Ranking erzielen.

Grundsätzlich gilt daher die Empfehlung, dass alle Seiten ein Canonical Tag enthalten sollten. Das Canonical Tag ist dabei eine Art „Sicherheitsnetz“, das man in der Regel gar nicht bemerken wird. Falls es einmal Probleme mit internem Duplicate Content gibt, werden diese automatisch durch das Canonical Tag behoben.

Dennoch muss gesagt werden, dass das Canonical Tag Duplicate Content nicht verhindert. Im Beispiel von www.religioese-geschenke.de gibt es die URL eben zweimal – und so erscheinen auch im Google-Index jeweils zwei Einträge. Der Googlebot muss beide Seiten herunterladen, obwohl es eigentlich unnötig ist. In diesem Fall mag das nicht gravierend sein, aber wenn es zu einer Seite nicht nur zwei, sondern zwanzig Dubletten gibt, kann das bei einer sehr großen Website zu Crawling-Engpässen führen.

In diesem Fall könnte man sich z. B. über die Google Search Console behelfen, indem der URL-Parameter „c“ (unter „Crawling“ > „URL-Parameter“) als irrelevanter Parameter definiert wird (siehe Abbildung 2). Dann könnte sich der Crawler entscheiden, diesen Parameter aus der URL „herauszuschneiden“, sodass Duplicate Content gar nicht erst entsteht. In der Praxis funktioniert das recht oft. Eine Alternative kann darin bestehen, solche Parameter über Rewrite-Regeln (in der .htaccess) entfernen zu lassen.

PDF und Co.

Das HTML-Tag befindet sich im <head>-Bereich einer HTML-Seite. Man kann ein Canonical Tag jedoch auch für Nicht-HTML-Inhalte vergeben. Dann kann sich dieses natürlich nicht in der Datei befinden, sondern muss über den HTTP-Header ausgeliefert werden.

Das kann über die .htaccess-Datei erfolgen, indem z. B. der folgende Code verwendet wird, um das Canonical Tag für die PDF-Datei „beispiel.pdf“ auf die HTML-Seite http://www.website.de/beispiel.html zu setzen:

<Files beispiel.pdf>
Header append Link "<http://www.website.de/beispiel.html/>; rel=\"canonical\"“
</Files>

Das würde dazu führen, dass einem Nutzer, der eigentlich die PDF-Datei als Suchergebnis erhalten würde, stattdessen eine passende HTML-Seite angezeigt wird.

Tools

Für die Überprüfung von Canonical Tags gibt es eine Vielzahl von Tools. In der Praxis sind allerdings einige wenige ausreichend.

Ein interessantes Werkzeug ist dabei die Firefox-Erweiterung SearchStatus. Diese zeigt auf jeder Seite an, ob ein Canonical-Tag enthalten ist oder nicht. Außerdem stellt sie dar, ob das Canonical Tag zu der aktuellen URL passt (graues „C“) oder davon abweicht (blaues „C“, siehe Abbildung 3). So kann man beim Besuch einer Website schnell die Canonical Tags einzelner Seiten überprüfen.

Das funktioniert natürlich nur für wenige URLs wirklich gut. Wer eine ganze Website überprüfen möchte, sollte eher Tools wie den Screaming Frog SEO Spider nutzen. Wichtig ist dabei, dass man die Option „Configuration“ > „Spider“ > „Advanced“ > „Respect Canonical“ zuvor deaktiviert.

Wenn der Crawler startet, kann man unter „Directives“ > „No Canonical“ (siehe Abbildung 4) prüfen, welche Seiten derzeit kein Canonical Tag enthalten. Es ist nicht unbedingt nötig, dass wirklich alle Seiten einer Website ein Canonical Tag haben, sodass man hier eher nach größeren „Defekten“ suchen sollte.

Spannend? Jetzt Artikel zu Ende lesen!

Lesen Sie den Artikel weiter in unserer suchradar Ausgabe 58 von Februar 2016 mit dem Titelthema „Crawling und Indexierung: Der beste Weg in den Google-Index“.

Kostenloses PDF-Magazin bestellen Online weiterlesen? Einfach kostenlos für den Newsletter anmelden. Kostenpflichtiges Print-Abo bestellen