|
- Werbung -
suchradar.de >
Magazin
> Archiv >
Ausgabe 26
> SEO für Einsteiger - HTTP-Codes
SEO für Einsteiger:
HTTP-Codes
Es gibt Dinge, die man täglich benutzt, ohne zu verstehen,
wie sie eigentlich funktionieren. HTTP ist so etwas. Dabei
ist es durchaus einen Blick wert, weil es Auswirkungen auf
SEO haben kann. Von Markus Hövener.
Es gibt Dinge, die man täglich benutzt, ohne zu verstehen,
wie sie eigentlich funktionieren. Dieselmotoren, Elektrorasierer,
Backöfen mit Selbstreinigung und vieles mehr. Vielen
Menschen mag es so auch mit HTTP gehen. Ein Protokoll, das
zwangsweise jeden Tag genutzt wird und das sich einem noch
gelegentlich durch das "http:" bei den URLs verrät.
Dabei ist HTTP durchaus einen Blick wert, weil es eben auch
Auswirkungen auf SEO haben kann. So gibt es Unterschiede zwischen
301- und 302-Weiterleitungen. Und nicht funktionierende URLs
können unterschiedliche Codes liefern, z. B. 403, 404
und 410. Aber was bedeutet das alles?
HTTP
HTTP, das Hypertext Transfer Protocol, wird zur Kommunikation
zwischen dem Browser und dem Server genutzt. Der Browser möchte
eine bestimmte Seite beim Server abrufen und schickt ihm hierzu
eine Nachricht. Dieser antwortet im Idealfall mit der gewünschten
Seite, ansonsten mit einer (Fehler-)Meldung.
HTTP hat dabei vor allem den Vorteil, dass zwischen Browser
und Server in Klartext kommuniziert wird. Anders als bei einigen
anderen Protokollen kann man diese Kommunikation also durchaus
mitlesen, wenn denn die Grundzüge des Protokolls verstanden
werden.
Der folgende Artikel geht auf bestimmte Feinheiten von HTTP
übrigens nicht ein. So gibt es z. B. den so genannten
Keepalive-Mechanismus, bei dem zwischen Browser und Server
eine Verbindung für mehrere Anfragen und Antworten genutzt
wird.
Frage
|

Abbildung 1 zeigt eine typische HTTP-Anfrage und eine
typische Antwort darauf.
|
Abbildung 1 zeigt eine typische Anfrage und eine typische
Antwort darauf. Bevor die Anfrage vom Browser an den Server
geschickt werden kann, muss der Browser eine TCP-Verbindung
(Transfer Control Protocol) zum Server aufbauen. Falls diese
Verbindung hergestellt werden kann, schickt er auch schon
eine Anfrage wie im oberen Teil von Abbildung 1 zu sehen.
Die Zeile
"GET / HTTP/1.1"
bedeutet dabei, dass der Browser vom Server, den er kontaktiert
hat (in diesem Fall: www.suchradar.de)
die Datei mit dem Pfad / haben möchte (also die Seite
mit der URL http://www.suchradar.de/).Neben dem "GET",
zum Herunterladen einer Datei, gibt es noch verschiedene andere
Anfragen, etwa HEAD (zur Überprüfung einer Datei)
oder auch POST (zur Übertragung von Formularinhalten).
In den folgenden Zeilen der Anfrage stehen noch weitere Daten,
die der Server auswerten kann, z. B.
- Host: www.suchradar.de
- Hier wird explizit der Host genannt, von dem die URL abgefragt
wird (wichtig, weil auf einem Server bzw. einer IP mehrere
unterschiedliche Hosts liegen können)
- Accept-Encoding: gzip, deflate - Der Browser unterstützt
die komprimierte Übertragung von Dateien
- User-Agent:
- Hier übergibt der Browser seine
Kennung. Wenn Google eine Anfrage an einen Server stellt,
steht dort "Googlebot". So kann der Server erkennen,
welche Browser bzw. Crawler eine Datei abfragen.
und Antwort
Der Server nimmt diese Anfrage nun entgegen und versucht
sie zu beantworten. Wenn es - wie in diesem Fall - die angefragte
Datei gibt, schickt er eine Antwort zurück, die mit der
Zeile
"HTTP/1.1 200 OK"
beginnt. An diese Zeile schließen sich noch einige Informationszeilen
an, dann eine Leerzeile, gefolgt von den Inhalten der angefragten
Seite.
Die Zahl 200 ist dabei ein HTTP-Statuscode, von denen es sehr
viele gibt. Ein Statuscode ist immer dreistellig und die erste
Zahl gibt grob an, ob die Anfrage erfolgreich war oder nicht,
z. B.
- 2xx: Anfrage erfolgreich
- 3xx: Umleitungen
- 4xx: Ein Fehler, der in der Verantwortung des Browsers
liegt (z. B. weil er eine fehlerhafte URL angefragt hat)
- 5xx: Ein Fehler, der in der Verantwortung des Servers
liegt (z. B. weil der Server gerade überlastet ist)
Umleitungen
Häufig hat man es als SEO mit Umleitungen zu tun. Bei
diesen wird zwischen temporären und permanenten Umleitungen
unterschieden. Eine temporäre Umleitung wird über
einen Statuscode 302 ausgedrückt. Bei ihr gehen der Browser
oder der Crawler davon aus, dass die Seite zwar zum Zeitpunkt
der Anfrage umgeleitet wird, dass man aber später wieder
davon ausgehen kann, die ursprüngliche URL doch wieder
funktionierend vorzufinden.
Eine permanente Umleitung hingegen wird durch die Statuscode
301 ausgedrückt und ist in der Regel die Art der Umleitung,
die man für SEO-Zwecke nutzt. Wer z. B. eine URL auf
seinem Server geändert hat, richtet dafür eine 301-Umleitung
ein (alte URL wird umgeleitet auf neue URL), damit beispielsweise
von Benutzern gesetzte Bookmarks oder - im SEO-Sinn noch wichtiger
- alte bestehende Verlinkungen von anderen Websites nicht
verloren gehen.
Wer etwa die folgende Anfrage der nicht mehr existenten URL
http://www.suchradar.de/magazin/archiv/2006/suchradar-aug-2006.pdf
an den Server www.suchradar.de richtet
GET /magazin/archiv/2006/suchradar-aug-2006.pdf HTTP/1.1
HOST: www.suchradar.de
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US;
rv:1.9.1.5) Gecko/20091102 Firefox/3.5.5
Accept: */*
Connection: Keep-Alive
erhält die folgende Antwort vom Server:
HTTP/1.1 301 Moved Permanently
Server: Apache/2.2.16
Location: http://www.suchradar.de/magazin/
Connection: close
Der Browser weiß also jetzt zweierlei:
a) Die alte URL hat sich für immer ("permanent")
geändert.
b) Die neue URL der angefragten Datei findet sich unter http://www.suchradar.de/magazin/
(siehe dritte Zeile "Location:")
Nach dieser Information würde der Browser also einfach
die neue URL anfragen, ohne dass der Benutzer darauf im Browser
explizit hingewiesen wird. Und genau das ist das Problem:
Der Browser zeigt nicht an, ob er einer 301- oder 302-Umleitung
folgt, obwohl das für SEO ein nicht unerheblicher Aspekt
ist.
Fehler
Aber auch bei den Statuscodes, die mit einer 4 beginnen,
gibt es viele Unterschiede. So gibt es u. a. die folgenden
Statuscodes:
- 403 ("Forbidden"): Die Anfrage war zwar korrekt,
aber die Seite kann, z. B. wegen fehlender Login-Informationen,
nicht geliefert werden.
- 404 ("Not Found"): Der häufigste Fehlercode
ist sicherlich der 404-Code, der angibt, dass er zu der
angefragten URL nichts liefern kann.
- 410 ("Gone"): Diese Nachricht ist ähnlich
dem 404-Code, aber hier wird explizit signalisiert, dass
die angefragte URL nicht mehr existiert und sich dieser
Zustand auch garantiert nicht mehr ändern wird.
Tools
|

Abbildung 2: Urivalet hilft bei der Analyse von HTTP-Anfragen.
|
Ob 301 und 302, ob 404 und 410 - der Browser liest zwar diese
Statuscodes, informiert den Nutzer aber nicht darüber.
Wer also wissen möchte, welcher Code konkret geliefert
wird, muss sich die HTTP-Antworten anschauen - und dazu bedarf
es einiger Hilfsmittel.
Man kann z. B. das Tool auf der Website www.urivalet.com
nutzen, um eine Anfrage zu stellen und dann die unterschiedlichen
HTTP-Header einzusehen (siehe Abbildung 2). Dieses Tool kann
auch dazu genutzt werden, um unterschiedliche Browser oder
Crawler zu simulieren. So lässt sich hier auch "Googlebot"
wählen, um dem Server eine Google-Anfrage vorzutäuschen.
Alternativ kann man aber auch z. B. für den Firefox-Browser
Add-Ons wie "Live HTTP headers" (livehttpheaders.mozdev.org)
nutzen. Diese schneiden alle HTTP-Anfragen mit und zeigen
diese übersichtlich an.
Ein Problem gibt es dabei allerdings in der Regel: Ein Seitenaufruf
erzeugt nicht nur eine Anfrage beim Server, sondern meist
deutlich mehr. Denn auch für alle Bilder, alle JavaScript-
und CSS-Dateien wird jeweils eine Anfrage erzeugt. Daher genügt
es meist, bei den Auswertungen der Header-Daten, einen Blick
auf die erste aufgezeichnete Anfrage zu richten.
Ein kleiner Test
|

Abbildung 3: Enttarnt: Die "Fehlerseite"
sendet einen Code 200.
|
Google weist seit einigen Monaten in den Google Webmaster
Tools auch auf so genannte Soft-404s hin - eine gute Gelegenheit,
die Kenntnisse über Statuscodes in die Praxis umzusetzen.
Bei Soft-404s geht es darum, dass eine nicht existierende
URL (z. B. http://www.suchradar.de/sfdkjhgdylkfjhgsldkjfh)
einen 200-Code (Seite gefunden) zurückgibt, statt einen
4xx-Code und am ehesten einen 404-Code zu liefern. Dies geschieht,
indem eine künstlich geschaffene Informationsseite (mit
einer textlichen Fehlerinformation, aber ohne Fehlercode)
anstelle der eigentlichen Seite geschaltet wird.
Wer die URL http://www.suchradar.de/sfdkjhgdylkfjhgsldkjfh
z. B. über www.urivalet.com
überprüft, erhält dabei die korrekt Antwort
(Server liefert einen 404-Code). Wer allerdings die Fehlerseite
www.bonprix.de/bp/404.htm
überprüft, sieht zwar eine Fehlerseite, erhält
aber einen 200-Code. Google ist also hier nicht in der Lage,
nicht mehr existente URLs als solche zu erkennen, da der Server
bei allen abgefragten URLs antwortet, dass diese stimmen.
Fazit
Wer wissen möchte, ob es sich bei einer Weiterleitung
um eine 301- oder eine 302-Umleitung handelt, sollte
sich auch mit dem HTTP-Protokoll auseinandersetzen und
dessen grundsätzliche Funktion verstehen. Denn
Browser zeigen die jeweiligen Statuscodes meist nicht
an, obwohl diese im Einzelfall für Suchmaschinen
signifikante Unterschiede darstellen können.
|
 |
Über den Autor
Markus Hövener ist Chefredakteur des Magazins
suchradar und geschäftsführender Gesellschafter der SEO-/SEM-Agentur Bloofusion Germany.
E-Mail:
markus@suchradar.de
Markus Hövener (@bloonatic)
bei Twitter:
|
|
|
Das suchradar Print-Abo
Ab 300 Abonnenten (bis 30.09.12) starten wir ein Print-Abo für das suchradar zum Preis von 58,50 € jährlich (inkl. MwSt. und Versand, Preis für Deutschland). Jetzt hier für das Abo anmelden!
Nichts verpassen...
Agenturen & Dienstleister
SEO-/SEM-Agenturen
> Agenturen in Deutschland,
Österreich,
Schweiz
> Agenturen in Berlin,
Bremen, Düsseldorf,
Frankfurt, Hamburg,
Hannover, Innsbruck,
Köln, München,
Wien, Zürich
Weitere Dienstleister:
> Content-Dienstleister
> SEO-/SEM-Tools
Ausgabe 35 (26. April 2012)
Fokus-Thema"Linkaufbau in der Praxis":
> "Schlechte" Links erkennen
> Linkbait
> Linkaufbau in der Praxis
> Linkaufbau mit Beziehung
Außerdem:
> Lokale Suche
> Interview: Mike Blumenthal
> AdWords-Platzhalter
> Facebook-Anzeigen
> Paginierung
> Brandbidding und Recht
> SEOTools für Excel
> strucr.com
> On-Page-Kreativität
Jetzt herunterladen...
Unsere Partner



Weitere Partner...
|