suchradar     Magazin     Archiv     Foren-Ticker     Blog-Ticker     Agenturen & Dienstleister     Links     Comic     Kalender     Newsletter    Blog 


- Werbung -

SEO für Einsteiger:
HTTP-Codes

Es gibt Dinge, die man täglich benutzt, ohne zu verstehen, wie sie eigentlich funktionieren. HTTP ist so etwas. Dabei ist es durchaus einen Blick wert, weil es Auswirkungen auf SEO haben kann. Von Markus Hövener.

Es gibt Dinge, die man täglich benutzt, ohne zu verstehen, wie sie eigentlich funktionieren. Dieselmotoren, Elektrorasierer, Backöfen mit Selbstreinigung und vieles mehr. Vielen Menschen mag es so auch mit HTTP gehen. Ein Protokoll, das zwangsweise jeden Tag genutzt wird und das sich einem noch gelegentlich durch das "http:" bei den URLs verrät.
Dabei ist HTTP durchaus einen Blick wert, weil es eben auch Auswirkungen auf SEO haben kann. So gibt es Unterschiede zwischen 301- und 302-Weiterleitungen. Und nicht funktionierende URLs können unterschiedliche Codes liefern, z. B. 403, 404 und 410. Aber was bedeutet das alles?

HTTP

HTTP, das Hypertext Transfer Protocol, wird zur Kommunikation zwischen dem Browser und dem Server genutzt. Der Browser möchte eine bestimmte Seite beim Server abrufen und schickt ihm hierzu eine Nachricht. Dieser antwortet im Idealfall mit der gewünschten Seite, ansonsten mit einer (Fehler-)Meldung.

HTTP hat dabei vor allem den Vorteil, dass zwischen Browser und Server in Klartext kommuniziert wird. Anders als bei einigen anderen Protokollen kann man diese Kommunikation also durchaus mitlesen, wenn denn die Grundzüge des Protokolls verstanden werden.

Der folgende Artikel geht auf bestimmte Feinheiten von HTTP übrigens nicht ein. So gibt es z. B. den so genannten Keepalive-Mechanismus, bei dem zwischen Browser und Server eine Verbindung für mehrere Anfragen und Antworten genutzt wird.

Frage …

ROI markieren in EyeQuant

Abbildung 1 zeigt eine typische HTTP-Anfrage und eine typische Antwort darauf.

Abbildung 1 zeigt eine typische Anfrage und eine typische Antwort darauf. Bevor die Anfrage vom Browser an den Server geschickt werden kann, muss der Browser eine TCP-Verbindung (Transfer Control Protocol) zum Server aufbauen. Falls diese Verbindung hergestellt werden kann, schickt er auch schon eine Anfrage wie im oberen Teil von Abbildung 1 zu sehen.

Die Zeile

"GET / HTTP/1.1"

bedeutet dabei, dass der Browser vom Server, den er kontaktiert hat (in diesem Fall: www.suchradar.de) die Datei mit dem Pfad / haben möchte (also die Seite mit der URL http://www.suchradar.de/).Neben dem "GET", zum Herunterladen einer Datei, gibt es noch verschiedene andere Anfragen, etwa HEAD (zur Überprüfung einer Datei) oder auch POST (zur Übertragung von Formularinhalten).

In den folgenden Zeilen der Anfrage stehen noch weitere Daten, die der Server auswerten kann, z. B.

  • Host: www.suchradar.de - Hier wird explizit der Host genannt, von dem die URL abgefragt wird (wichtig, weil auf einem Server bzw. einer IP mehrere unterschiedliche Hosts liegen können)
  • Accept-Encoding: gzip, deflate - Der Browser unterstützt die komprimierte Übertragung von Dateien
  • User-Agent: … - Hier übergibt der Browser seine Kennung. Wenn Google eine Anfrage an einen Server stellt, steht dort "Googlebot". So kann der Server erkennen, welche Browser bzw. Crawler eine Datei abfragen.
… und Antwort

Der Server nimmt diese Anfrage nun entgegen und versucht sie zu beantworten. Wenn es - wie in diesem Fall - die angefragte Datei gibt, schickt er eine Antwort zurück, die mit der Zeile

"HTTP/1.1 200 OK"

beginnt. An diese Zeile schließen sich noch einige Informationszeilen an, dann eine Leerzeile, gefolgt von den Inhalten der angefragten Seite.


Die Zahl 200 ist dabei ein HTTP-Statuscode, von denen es sehr viele gibt. Ein Statuscode ist immer dreistellig und die erste Zahl gibt grob an, ob die Anfrage erfolgreich war oder nicht, z. B.

  • 2xx: Anfrage erfolgreich
  • 3xx: Umleitungen
  • 4xx: Ein Fehler, der in der Verantwortung des Browsers liegt (z. B. weil er eine fehlerhafte URL angefragt hat)
  • 5xx: Ein Fehler, der in der Verantwortung des Servers liegt (z. B. weil der Server gerade überlastet ist)
Umleitungen

Häufig hat man es als SEO mit Umleitungen zu tun. Bei diesen wird zwischen temporären und permanenten Umleitungen unterschieden. Eine temporäre Umleitung wird über einen Statuscode 302 ausgedrückt. Bei ihr gehen der Browser oder der Crawler davon aus, dass die Seite zwar zum Zeitpunkt der Anfrage umgeleitet wird, dass man aber später wieder davon ausgehen kann, die ursprüngliche URL doch wieder funktionierend vorzufinden.

Eine permanente Umleitung hingegen wird durch die Statuscode 301 ausgedrückt und ist in der Regel die Art der Umleitung, die man für SEO-Zwecke nutzt. Wer z. B. eine URL auf seinem Server geändert hat, richtet dafür eine 301-Umleitung ein (alte URL wird umgeleitet auf neue URL), damit beispielsweise von Benutzern gesetzte Bookmarks oder - im SEO-Sinn noch wichtiger - alte bestehende Verlinkungen von anderen Websites nicht verloren gehen.

Wer etwa die folgende Anfrage der nicht mehr existenten URL http://www.suchradar.de/magazin/archiv/2006/suchradar-aug-2006.pdf an den Server www.suchradar.de richtet

GET /magazin/archiv/2006/suchradar-aug-2006.pdf HTTP/1.1
HOST: www.suchradar.de
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.5) Gecko/20091102 Firefox/3.5.5
Accept: */*
Connection: Keep-Alive

erhält die folgende Antwort vom Server:

HTTP/1.1 301 Moved Permanently
Server: Apache/2.2.16
Location: http://www.suchradar.de/magazin/
Connection: close

Der Browser weiß also jetzt zweierlei:

a) Die alte URL hat sich für immer ("permanent") geändert.
b) Die neue URL der angefragten Datei findet sich unter http://www.suchradar.de/magazin/ (siehe dritte Zeile "Location:")

Nach dieser Information würde der Browser also einfach die neue URL anfragen, ohne dass der Benutzer darauf im Browser explizit hingewiesen wird. Und genau das ist das Problem: Der Browser zeigt nicht an, ob er einer 301- oder 302-Umleitung folgt, obwohl das für SEO ein nicht unerheblicher Aspekt ist.

Fehler

Aber auch bei den Statuscodes, die mit einer 4 beginnen, gibt es viele Unterschiede. So gibt es u. a. die folgenden Statuscodes:

  • 403 ("Forbidden"): Die Anfrage war zwar korrekt, aber die Seite kann, z. B. wegen fehlender Login-Informationen, nicht geliefert werden.
  • 404 ("Not Found"): Der häufigste Fehlercode ist sicherlich der 404-Code, der angibt, dass er zu der angefragten URL nichts liefern kann.
  • 410 ("Gone"): Diese Nachricht ist ähnlich dem 404-Code, aber hier wird explizit signalisiert, dass die angefragte URL nicht mehr existiert und sich dieser Zustand auch garantiert nicht mehr ändern wird.
Tools

ROI markieren in EyeQuant

Abbildung 2: Urivalet hilft bei der Analyse von HTTP-Anfragen.

Ob 301 und 302, ob 404 und 410 - der Browser liest zwar diese Statuscodes, informiert den Nutzer aber nicht darüber. Wer also wissen möchte, welcher Code konkret geliefert wird, muss sich die HTTP-Antworten anschauen - und dazu bedarf es einiger Hilfsmittel.

Man kann z. B. das Tool auf der Website www.urivalet.com nutzen, um eine Anfrage zu stellen und dann die unterschiedlichen HTTP-Header einzusehen (siehe Abbildung 2). Dieses Tool kann auch dazu genutzt werden, um unterschiedliche Browser oder Crawler zu simulieren. So lässt sich hier auch "Googlebot" wählen, um dem Server eine Google-Anfrage vorzutäuschen.

Alternativ kann man aber auch z. B. für den Firefox-Browser Add-Ons wie "Live HTTP headers" (livehttpheaders.mozdev.org) nutzen. Diese schneiden alle HTTP-Anfragen mit und zeigen diese übersichtlich an.

Ein Problem gibt es dabei allerdings in der Regel: Ein Seitenaufruf erzeugt nicht nur eine Anfrage beim Server, sondern meist deutlich mehr. Denn auch für alle Bilder, alle JavaScript- und CSS-Dateien wird jeweils eine Anfrage erzeugt. Daher genügt es meist, bei den Auswertungen der Header-Daten, einen Blick auf die erste aufgezeichnete Anfrage zu richten.

Ein kleiner Test

ROI markieren in EyeQuant

Abbildung 3: Enttarnt: Die "Fehlerseite" sendet einen Code 200.

Google weist seit einigen Monaten in den Google Webmaster Tools auch auf so genannte Soft-404s hin - eine gute Gelegenheit, die Kenntnisse über Statuscodes in die Praxis umzusetzen. Bei Soft-404s geht es darum, dass eine nicht existierende URL (z. B. http://www.suchradar.de/sfdkjhgdylkfjhgsldkjfh) einen 200-Code (Seite gefunden) zurückgibt, statt einen 4xx-Code und am ehesten einen 404-Code zu liefern. Dies geschieht, indem eine künstlich geschaffene Informationsseite (mit einer textlichen Fehlerinformation, aber ohne Fehlercode) anstelle der eigentlichen Seite geschaltet wird.

Wer die URL http://www.suchradar.de/sfdkjhgdylkfjhgsldkjfh z. B. über www.urivalet.com überprüft, erhält dabei die korrekt Antwort (Server liefert einen 404-Code). Wer allerdings die Fehlerseite www.bonprix.de/bp/404.htm überprüft, sieht zwar eine Fehlerseite, erhält aber einen 200-Code. Google ist also hier nicht in der Lage, nicht mehr existente URLs als solche zu erkennen, da der Server bei allen abgefragten URLs antwortet, dass diese stimmen.

 

 

 

 

Fazit

Wer wissen möchte, ob es sich bei einer Weiterleitung um eine 301- oder eine 302-Umleitung handelt, sollte sich auch mit dem HTTP-Protokoll auseinandersetzen und dessen grundsätzliche Funktion verstehen. Denn Browser zeigen die jeweiligen Statuscodes meist nicht an, obwohl diese im Einzelfall für Suchmaschinen signifikante Unterschiede darstellen können.

 

Über den Autor

ist Chefredakteur des Magazins suchradar und geschäftsführender Gesellschafter der SEO-/SEM-Agentur Bloofusion Germany.

E-Mail:
markus@suchradar.de

Markus Hövener (@bloonatic) bei Twitter:
Follow bloonatic on Twitter

 

 

Das suchradar Print-Abo

Ab 300 Abonnenten (bis 30.09.12) starten wir ein Print-Abo für das suchradar zum Preis von 58,50 € jährlich (inkl. MwSt. und Versand, Preis für Deutschland). Jetzt hier für das Abo anmelden!

Nichts verpassen...

Folge suchradar auf Twitter

Agenturen & Dienstleister

SEO-/SEM-Agenturen
> Agenturen in Deutschland, Österreich, Schweiz
> Agenturen in Berlin, Bremen, Düsseldorf, Frankfurt, Hamburg, Hannover, Innsbruck, Köln, München, Wien, Zürich

Weitere Dienstleister:
> Content-Dienstleister
> SEO-/SEM-Tools

Ausgabe 35 (26. April 2012)

Fokus-Thema"Linkaufbau in der Praxis":
> "Schlechte" Links erkennen
> Linkbait
> Linkaufbau in der Praxis
> Linkaufbau mit Beziehung

Außerdem:
> Lokale Suche
> Interview: Mike Blumenthal
> AdWords-Platzhalter
> Facebook-Anzeigen
> Paginierung
> Brandbidding und Recht
> SEOTools für Excel
> strucr.com
> On-Page-Kreativität

Jetzt herunterladen...

 

Unsere Partner

Weitere Partner...

   

 

suchradar ist ein Projekt der
SEO-/SEM-Agentur Bloofusion