Dass viele Webseiten eine kurze Lebenszeit haben ist schon lange bekannt.
Man sprach einmal von einer Halbwertszeit von ein paar Monaten.
Die hier genannte Studie bestätigt das. Man muss aber wissen, dass
sowohl Private und von Medienhäuser intern viel gespeichert
haben, um Material bei Bedarf wieder hervornehmen zu können.
Facebook zum Beispiel behält auch gelöschte Facebookseiten intern noch auf.
Wenn Videos auf Youtube verschwinden, heisst das nicht, dass das Video weg ist. Ein von einer Webseite
weggenommenes Bild ist noch nicht verschwunden.
Suchmaschienen wie Google könnte noch Kopien behalten. Ungezählte User
auf der ganzen Welt könnten sich das Video auf den eigenen Computer gespeichert
haben. (Wir behalten auf rhetorik.ch Kopien von zitierten Artikeln,
und Kopien von relevanten Bildern und Videos, und haben das nicht online).
Auch passiert es oft, dass online Zeitungen alte Artikel in eine
Datenbank werfen und die Artikel dem Publikum nicht mehr zeigen.
Die Information ist aber immer noch da.
Wir dürfen also trotzdem auch heute noch annehmen,
dass die
Netzumgebung ein langes Gedächtnis hat.
Spiegel:
Studie zur Web-Haltbarkeit, Das Netz vergisst schnell, Von Konrad Lischka
Das Internet vergisst nie? Von wegen. Das Web ist ein extrem
flüchtiges Medium - binnen zweieinhalb Jahren ist ein Viertel
der wichtigen Online-Quellen zum Arabischen Frühling, dem
Schweinegrippe-Ausbruch und Michael Jacksons Tod wieder verschwunden.
Info
Wenn Historiker in 30 Jahren versuchen sollten, die Reaktion auf den
Arabischen Frühling im Web zu analysieren, werden sie vor einem
Problem stehen: Viele Quellen im Web dürften verschwunden sein. Das
Internet vergisst eben doch, und zwar erstaunlich schnell. Einer Studie
der US-Informatiker Hany M. SalahEldeen und Michael L. Nelson von der
Old Dominion University zufolge ist heute bereits ein Viertel der 2009 in
ausgewählten Tweets verlinkten Quellen zum Aufstand in Ägypten
nicht mehr abrufbar.
Die Wissenschaftler haben mehr als 11.000 Links in Tweets zu
sechs Grossereignissen der Jahre 2009 bis 2012 untersucht. Ihr Ergebnis:
Mitte 2012 war gut ein Viertel der 2009 in den ausgewählten Tweets
verlinkten Quellen ist nicht mehr abrufbar. Immerhin sieben Prozent
der im März 2012 auf Twitter empfohlenen und verlinkten Quellen
war nicht mehr erreichbar. Es geht dabei um Videos bei YouTube, Fotos
bei Twitpic und Yfrog, Artikel in US-Medien und Blog-Einträge auf
Wordpress.com - allesamt zeitgeschichtliche Dokumente, zum Teil wohl
auch Primärquellen, wie zum Beispiel Videos aus Ägypten.
Die Forscher werden ihre Studie am 25. September bei der
Archivierungs-Fachtagung "Theory and Practice of Digital Libraries"
vorstellen, ihr Paper wurde von drei Mitgliedern des Auswahlkomitees
geprüft und angenommen.
Die wesentliche Erkenntnis der Untersuchung: Je länger die Ereignisse
zurückliegen, desto weniger der in Tweets verlinkten Quellen sind
noch abrufbar. Auch Web-Archive wie das Internet Archive erhalten nur
eine Minderheit der empfohlenen Quellen. Die Forscher haben beim von der
US-Kongressbibliothek finanzierten Online-Dienst Memento geprüft,
ob in einem der dort erfassten Web-Archive Kopien der Inhalte liegen.
Bei den Ereignissen aus dem Jahr 2009 waren nur um die 40 Prozent der
damals auf Twitter empfohlenen Quellen bei einem der Online-Archive in
Kopie hinterlegt. Zwischen 17 und 25 Prozent der untersuchten Webseiten
waren weder am ursprünglichen Speicherort noch in einem der
Online-Archive erhalten - Hunderte von Videos, Fotos und Artikeln zu den
Protesten in Iran, Michael Jacksons Tod und dem Schweinegrippe-Ausbruch
sind wohl unwiederbringlich verloren.
(...)
Während Bibliotheken heute Magazine, Zeitungen und
auch E-Paper-Ausgaben archivieren, gibt es nach wie vor keine
Langzeitarchivierung des World Wide Web. Die Wirtschaft hat in Deutschland
2008 erfolgreich gegen die Pflicht für Unternehmen lobbyiert,
Online-Inhalte bei der Deutschen Nationalbibliothek abzuliefern.
Die Deutsche Nationalbibliothek hat zwar einen entsprechenden "erweiterten
Sammelauftrag". Auf der Website der DNB heisst es allerdings auch
heute noch: "Derzeit werden Webseiten aller Art, z.B. statische und
dynamische HTML-Seiten, Weblogs oder Foren, noch nicht gesammelt." Die
Nationalbibliothek erarbeite derzeit "die organisatorischen und
technischen Grundlagen" zum "automatisierten Einsammeln von Websites".
Die langsamen Fortschritte bei der Online-Archivierung überraschen
nicht - deutsche Bibliotheken haben nicht einmal genug Geld, um ihre
Papierarchive vor Säurefrass zu schützen, von Digitalisierung
ganz zu schweigen.