rhetorik.ch aktuell: Vergisst das Netz schnell?

Dass viele Webseiten eine kurze Lebenszeit haben ist schon lange bekannt. Man sprach einmal von einer Halbwertszeit von ein paar Monaten. Die hier genannte Studie bestätigt das. Man muss aber wissen, dass sowohl Private und von Medienhäuser intern viel gespeichert haben, um Material bei Bedarf wieder hervornehmen zu können. Facebook zum Beispiel behält auch gelöschte Facebookseiten intern noch auf. Wenn Videos auf Youtube verschwinden, heisst das nicht, dass das Video weg ist. Ein von einer Webseite weggenommenes Bild ist noch nicht verschwunden. Suchmaschienen wie Google könnte noch Kopien behalten. Ungezählte User auf der ganzen Welt könnten sich das Video auf den eigenen Computer gespeichert haben. (Wir behalten auf rhetorik.ch Kopien von zitierten Artikeln, und Kopien von relevanten Bildern und Videos, und haben das nicht online). Auch passiert es oft, dass online Zeitungen alte Artikel in eine Datenbank werfen und die Artikel dem Publikum nicht mehr zeigen. Die Information ist aber immer noch da. Wir dürfen also trotzdem auch heute noch annehmen, dass die Netzumgebung ein langes Gedächtnis hat.

Spiegel: Studie zur Web-Haltbarkeit, Das Netz vergisst schnell, Von Konrad Lischka

Das Internet vergisst nie? Von wegen. Das Web ist ein extrem flüchtiges Medium - binnen zweieinhalb Jahren ist ein Viertel der wichtigen Online-Quellen zum Arabischen Frühling, dem Schweinegrippe-Ausbruch und Michael Jacksons Tod wieder verschwunden. Info Wenn Historiker in 30 Jahren versuchen sollten, die Reaktion auf den Arabischen Frühling im Web zu analysieren, werden sie vor einem Problem stehen: Viele Quellen im Web dürften verschwunden sein. Das Internet vergisst eben doch, und zwar erstaunlich schnell. Einer Studie der US-Informatiker Hany M. SalahEldeen und Michael L. Nelson von der Old Dominion University zufolge ist heute bereits ein Viertel der 2009 in ausgewählten Tweets verlinkten Quellen zum Aufstand in Ägypten nicht mehr abrufbar. Die Wissenschaftler haben mehr als 11.000 Links in Tweets zu sechs Grossereignissen der Jahre 2009 bis 2012 untersucht. Ihr Ergebnis: Mitte 2012 war gut ein Viertel der 2009 in den ausgewählten Tweets verlinkten Quellen ist nicht mehr abrufbar. Immerhin sieben Prozent der im März 2012 auf Twitter empfohlenen und verlinkten Quellen war nicht mehr erreichbar. Es geht dabei um Videos bei YouTube, Fotos bei Twitpic und Yfrog, Artikel in US-Medien und Blog-Einträge auf Wordpress.com - allesamt zeitgeschichtliche Dokumente, zum Teil wohl auch Primärquellen, wie zum Beispiel Videos aus Ägypten. Die Forscher werden ihre Studie am 25. September bei der Archivierungs-Fachtagung "Theory and Practice of Digital Libraries" vorstellen, ihr Paper wurde von drei Mitgliedern des Auswahlkomitees geprüft und angenommen. Die wesentliche Erkenntnis der Untersuchung: Je länger die Ereignisse zurückliegen, desto weniger der in Tweets verlinkten Quellen sind noch abrufbar. Auch Web-Archive wie das Internet Archive erhalten nur eine Minderheit der empfohlenen Quellen. Die Forscher haben beim von der US-Kongressbibliothek finanzierten Online-Dienst Memento geprüft, ob in einem der dort erfassten Web-Archive Kopien der Inhalte liegen. Bei den Ereignissen aus dem Jahr 2009 waren nur um die 40 Prozent der damals auf Twitter empfohlenen Quellen bei einem der Online-Archive in Kopie hinterlegt. Zwischen 17 und 25 Prozent der untersuchten Webseiten waren weder am ursprünglichen Speicherort noch in einem der Online-Archive erhalten - Hunderte von Videos, Fotos und Artikeln zu den Protesten in Iran, Michael Jacksons Tod und dem Schweinegrippe-Ausbruch sind wohl unwiederbringlich verloren. (...) Während Bibliotheken heute Magazine, Zeitungen und auch E-Paper-Ausgaben archivieren, gibt es nach wie vor keine Langzeitarchivierung des World Wide Web. Die Wirtschaft hat in Deutschland 2008 erfolgreich gegen die Pflicht für Unternehmen lobbyiert, Online-Inhalte bei der Deutschen Nationalbibliothek abzuliefern. Die Deutsche Nationalbibliothek hat zwar einen entsprechenden "erweiterten Sammelauftrag". Auf der Website der DNB heisst es allerdings auch heute noch: "Derzeit werden Webseiten aller Art, z.B. statische und dynamische HTML-Seiten, Weblogs oder Foren, noch nicht gesammelt." Die Nationalbibliothek erarbeite derzeit "die organisatorischen und technischen Grundlagen" zum "automatisierten Einsammeln von Websites". Die langsamen Fortschritte bei der Online-Archivierung überraschen nicht - deutsche Bibliotheken haben nicht einmal genug Geld, um ihre Papierarchive vor Säurefrass zu schützen, von Digitalisierung ganz zu schweigen.

Knill+Knill Kommunikationsberatung

www.rhetorik.ch aktuell: (23. Sep, 2012)

Vergisst das Netz schnell?