Wer die Google Webmaster Tools zur Überwachung seine Suchmaschinencrawls und Indexanalyse nutzt, wird sich schon oft über Meldungen, wie "Seite konnten nicht gefunden werden", geärgert haben. Mit unter kommen falsche Verweise auf die eigene Webseite von anderen Webseiten und nicht von der eigenen. Anscheinend crawlt Google sogar Seiten, die im Google Webprotokoll erscheinen und wenn man dann einen Tippfehler hat, kann diese auch schon mal aufgenommen werden.
Wie nun mit den 404ern umgehen? Eine einfache und wirksame Methode, nicht existente Seitenaufrufe trotzdem mit Inhalt zu versorgen, ist die Auslieferung der Startseite bei HTTP-Fehlern mit angepassten Fehlerseiten. Dazu muss man in der .htaccess-Datei im Basisverzeichnis der Webseite folgende Zeilen hinzufügen:
ErrorDocument 400 /index.html ErrorDocument 401 /index.html ErrorDocument 402 /index.html ErrorDocument 403 /index.html ErrorDocument 404 /index.html ErrorDocument 500 /index.html
Man sollte das Slash vor der Datei nicht vergessen, da sonst die Seite nicht gefunden wird. Natürlich kann man auch weitere Fehlercodes der 400er und 500er-Blöcke, insofern benötigt, abdecken.