III.2.2.1. Mangelnde Erfassung des WWW

Suchmaschinen haben trotz ihrer großen Zahl an Einträgen nur einen Bruchteil aller tatsächlich im WWW vorhandenen Webseiten erfasst. Dies hat mehrere Gründe: Zum einen werden die meisten Seiten niemals in die Datenbanken der Suchmaschinen aufgenommen, weil sie nicht bei den Suchmaschinen angemeldet oder kaum bis gar nicht verlinkt werden. Zum anderen können Suchmaschinen nicht alle Dateiformate auswerten. Informationen, die sich beispielsweise in Bildern oder Flashschlage den Begriff Flash im Glossar nach-Animationen verstecken, bleiben den Suchmaschinen in aller Regel verborgen.[137] Auch Frames, auf die immer noch viele Websites zurückgreifen, bereiten ihnen Probleme.[138] Durch das Raster fallen auch jene Websites, die ins Netz gestellt wurden, nachdem der Spider das letzte Mal das Netz durchsucht hat, oder die zu jenem Zeitpunkt aufgrund technischer Probleme nicht erreichbar waren.[139] Da die Spider Websites nur in bestimmten Intervallen aufsuchen und Veränderungen nicht in Echtzeit feststellen können, liefert eine Suchmaschine immer ein Abbild der Vergangenheit und niemals den aktuellen Zustand der erfassten Seiten.[140]

Von den Seiten, die von den Spidern tatsächlich besucht werden, wird nur ein Teil in den Datenbanken der Suchmaschinen gespeichert. Der Betreiber einer Website kann das Verhalten eines Spiders über Meta-Angaben im HTML-Dokument oder eine spezielle Steuerungsdatei namens „robots.txt“ beeinflussen und ihn beispielsweise anweisen, den Inhalt der aktuellen Seite nicht in den Index aufzunehmen oder die Links nicht weiter zu verfolgen. Auch eine Archivierung einer Seite kann verhindert werden, d.h. sie wird nicht über die Cacheschlage den Begriff Cache im Glossar nach-Funktion der Suchmaschinen aufrufbar. Daneben haben Websiteinhaber die Möglichkeit, Einspruch gegen die Speicherung einer Seite einzulegen. Unter anderem versuchen Fachverlage auf diese Weise, ihre Inhalte besser zu schützen.[141]

Schließlich soll noch erwähnt werden, dass die Betreiber von Suchmaschinen mit ihren nationalen Ablegern an die Gesetze des jeweiligen Landes gebunden sind. Auf Betreiben des Gesetzgebers, der strafrechtlich relevante Inhalte aus den Suchmaschinen verbannt sehen will, kann es auch bei den automatisch generierten Trefferlisten zum Eingreifen und zur Zensur von Seiten des Suchmaschinenbetreibers kommen. Gerade autoritäre Regime versuchen massiv, den Zugang zu Web-Angeboten zu regulieren. Google, Yahoo und Microsoft standen in der westlichen Öffentlichkeit in der Kritik, da sie im Januar 2006 ihr Angebot in China massiver Zensur unterwarfen und dem Benutzer hauptsächlich solche Seiten präsentierten, die auf der politischen Linie der chinesischen Regierung liegen.[142]



[137] Vgl. Speck 2005, S. 184.

[138] Vgl. Google Inc., <Hilfe für Webmaster. Richtlinien für Webmaster>, online unter: http://www.google.de/support/webmasters/bin/answer.py?answer=35769http://www.google.de/support/webmasters/bin/answer.py?answer=35769 (in einem neuen Fenster), Abruf: 20.10.2006.

[139] Vgl. Google Inc., <Ich kann meine Lieblingsseite nicht in den Suchergebnissen finden. Wie findet Google Webseiten und fügt sie dem Index hinzu?>, online unter: http://www.google.de/support/bin/answer.py?answer=39334&topic=352http://www.google.de/support/bin/answer.py?answer=39334&topic=352 (in einem neuen Fenster), Abruf: 24.06.2006.

[140] Vgl. Klaus Patzwaldt, „Suchmaschinenlandschaften“, in: Kai Lehmann/Michael Schetsche (Hg.), Die Google-Gesellschaft. Vom digitalen Wandel des Wissens, Bielefeld 2005, S. 81.

[141] Vgl. Christine Plass, „Das große Vergessen. Datenschwund im digitalen Zeitalter“, in: Kai Lehmann/Michael Schetsche (Hg.), Die Google-Gesellschaft. Vom digitalen Wandel des Wissens, Bielefeld 2005, S. 44.

[142] Vgl. Florian Rötzer, „Wie man trotz aktiver Beihilfe zur Zensur für die Freiheit kämpft“, 15.02.2006, online unter: http://www.heise.de/tp/r4/artikel/22/22042/1.htmlhttp://www.heise.de/tp/r4/artikel/22/22042/1.html (in einem neuen Fenster), Abruf: 18.10.2006.

„Wer sucht, der findet - oder auch nicht.“PDF-VersionCopyright © 2006 Christoph Bichlmeier