Internetarchive
Präsentation von Elisabeth Hennecke
Gliederung

1. Das „dunkle digitale Zeitalter“ und Fehler 404
2. Wayback Machine
3. www.archive.org
4. Andere Archive
5. P...
Quelle: www.cartoon.deinmeister.de/zukarch

Das „dunkle digitale Zeitalter“

Schon heute: aus der Anfangszeit des Internet...
Fehler 404
Tritt auf wenn...
… die Seite nicht verfügbar ist
… die Seite nicht mehr existiert
… die Adresse der Seite sich...
www.waybackmachine.org
Vorgehen: URL eingeben
Zeitpunkt auswählen
Seite wird angezeigt
www.archive.org

1996 in San Francisco gegründet
Gemeinnütziges Projekt
Finanzierung: Spenden, Stiftungen, Einnahmen
aus D...
Gründer: Brewster Kahle
Informatiker
Entwickelte diverse frühe Internet-Applikationen
(z.B. Suchdienste, Publikationssoftw...
Was wird archiviert?
Texte: derzeit ca. 2.785.000
werden eingescannt und von Usern
hochgeladen
Neues Projekt: open library...
Audiodateien:
werden von Usern hochgeladen
Live-Aufnahmen: 91.700, andere: 871.000
Filme:
meist mit Creative Common Licens...
Archivierung von Internetseiten
Zur Zeit: 150 Milliarden Seiten archiviert
Exkurs: Archivierungsarten
Crawler = Programm, ...
Warum wird das Internet archiviert?
Verhindern eines „dunklen digitalen Zeitalters“
Bewahrung von „digital-born“ Dokumente...
Weitere Internetarchive und Archive
im Internet
Dazu gehören:
- nationale Webarchive
- themenbezogene Archive (Datenbanken...
Problem: Copyright

Regelungen noch zeitgemäß?
Keine global gültigen Regelungen
„Verwaiste Werke“
Pluspunkt: Copyrightverl...
Problem: Format

Formatvielfalt
Software und Hardware veralten
Allgemein Problem der Langzeitarchivierung von
digitalen Da...
Lösungsmöglichkeit

Hardware-Museum

Emulation

Migration

Wie funktioniert
das?

Aufbewahrung jedes
jemals hergestellten
...
Weitere Probleme
Auswahl
Sicherung vor Hacker- oder Virenangriffen
Inhalte sind ohne Zwischengerät nicht lesbar
Interessen...
Perspektiven
Bedarf an ...
… rechtlichen Regelungen
… standardisierten Formaten
… Klarheit über öffentlich/privat
→ das In...
Internetarchive
Internetarchive
Internetarchive
Nächste SlideShare
Wird geladen in …5
×

Internetarchive

393 Aufrufe

Veröffentlicht am

Veröffentlicht in: Technologie
0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
393
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
11
Aktionen
Geteilt
0
Downloads
0
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Internetarchive

  1. 1. Internetarchive Präsentation von Elisabeth Hennecke
  2. 2. Gliederung 1. Das „dunkle digitale Zeitalter“ und Fehler 404 2. Wayback Machine 3. www.archive.org 4. Andere Archive 5. Probleme 6. Perspektiven
  3. 3. Quelle: www.cartoon.deinmeister.de/zukarch Das „dunkle digitale Zeitalter“ Schon heute: aus der Anfangszeit des Internets sind kaum noch Originaldokumente erhalten Inhalte aus dem Internet verschwinden wieder
  4. 4. Fehler 404 Tritt auf wenn... … die Seite nicht verfügbar ist … die Seite nicht mehr existiert … die Adresse der Seite sich geändert hat (… und bei Tippfehlern) Grund dafür: Hyperlink ist unidirektional konzipiert
  5. 5. www.waybackmachine.org Vorgehen: URL eingeben Zeitpunkt auswählen Seite wird angezeigt
  6. 6. www.archive.org 1996 in San Francisco gegründet Gemeinnütziges Projekt Finanzierung: Spenden, Stiftungen, Einnahmen aus Digitalisierung von Bibliotheksbeständen
  7. 7. Gründer: Brewster Kahle Informatiker Entwickelte diverse frühe Internet-Applikationen (z.B. Suchdienste, Publikationssoftware) Idee: Das gesamte Wissen der Menschheit frei zugänglich machen
  8. 8. Was wird archiviert? Texte: derzeit ca. 2.785.000 werden eingescannt und von Usern hochgeladen Neues Projekt: open library Metadaten jedes jemals veröffentlichten Buchs Ziel: Link zu Volltext
  9. 9. Audiodateien: werden von Usern hochgeladen Live-Aufnahmen: 91.700, andere: 871.000 Filme: meist mit Creative Common License zur Zeit: 503.000 Software: über 64.000 Z.B.: Game Patches, Open Source Software, alle möglichen Freeware-Anwendungen
  10. 10. Archivierung von Internetseiten Zur Zeit: 150 Milliarden Seiten archiviert Exkurs: Archivierungsarten Crawler = Programm, das Seiten aufruft und abfotografiert - Snapshot Crawls - Event Harvesting/Focused Crawls - Selective Harvesting - Manual Crawling
  11. 11. Warum wird das Internet archiviert? Verhindern eines „dunklen digitalen Zeitalters“ Bewahrung von „digital-born“ Dokumenten Recht auf frei zugängliches Wissen Für zukünftige Wissenschaftler: - Entwicklung des Internets - Sprachentwicklung - historische Untersuchung unserer Gesellschaft Hilfe bei „toten Links“ durch Wayback Machine
  12. 12. Weitere Internetarchive und Archive im Internet Dazu gehören: - nationale Webarchive - themenbezogene Archive (Datenbanken) - Projekt Gutenberg: Retrodigitalisate - World Digital Library (UNESCO)
  13. 13. Problem: Copyright Regelungen noch zeitgemäß? Keine global gültigen Regelungen „Verwaiste Werke“ Pluspunkt: Copyrightverletzungen werden auch archiviert
  14. 14. Problem: Format Formatvielfalt Software und Hardware veralten Allgemein Problem der Langzeitarchivierung von digitalen Daten
  15. 15. Lösungsmöglichkeit Hardware-Museum Emulation Migration Wie funktioniert das? Aufbewahrung jedes jemals hergestellten Computers Vorteil Authentizität Authentizität Bereits erprobt, evtl. Qualitätsverbesserung, automatisierbar Nachteil Riesige Auswahl an Computern Kosten Software Lebensdauer von Geräten Herstellung eines Emulators ist sehr aufwendig, noch nicht ausgereift Es werden nur die Inhalte erhalten, nicht authentisch Erstellen eines Regelmäßiges virtuellen Abbilds Umspeichern in neue eines alten Formate Computers mit sämtlichen Hard-und Softwaremerkmalen
  16. 16. Weitere Probleme Auswahl Sicherung vor Hacker- oder Virenangriffen Inhalte sind ohne Zwischengerät nicht lesbar Interessensvielfalt: Autoren, Künstler, Verlage, Produktionsfirmen, Archive, Bibliotheken, die Gesellschaft, der Einzelne (Persönlichkeitsrechte)
  17. 17. Perspektiven Bedarf an ... … rechtlichen Regelungen … standardisierten Formaten … Klarheit über öffentlich/privat → das Internet ist nicht nur Publikationsmedium, sondern auch Kommunikationsmedium Ziel muss sein: nicht nur Daten erhalten, sondern die Datenmenge auch übersichtlich machen!

×