Friedrich Kittlers Digital Legacy

257 Aufrufe

Veröffentlicht am

Challenges, findings and approaches in dealing with complex data collections

Veröffentlicht in: Wissenschaft
0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
257
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
4
Aktionen
Geteilt
0
Downloads
1
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Friedrich Kittlers Digital Legacy

  1. 1. Friedrich Kittler’s digital legacy Challenges, findings and approaches in dealing with complex data collections
  2. 2. Friedrich Kittler‘s digital legacy Kittler‘s legacy Kittler and DH Challenges met at the DLA aka Indexer Mining Kittler
  3. 3. Kittler‘s legacy About Kittler LEHRE.LAT Ruhr-Universität Bochum SS 92 Literatur und Informatik I. Oberseminar WS 92/93 Literatur und Informatik II. Oberseminar Humboldt-Universität zu Berlin SS 94 Oberflächenprogrammierung in C (I). Hauptseminar WS 94/95 Oberflächenprogrammierung in C (II). Hauptseminar. SS 95 Oberflächenprogrammierung in Assembler. Hauptseminar. WS 95/96 Graphikprogrammierung auf Workstations I. Hauptseminar. SS 96 Graphikprogrammierung auf Workstations II. Hauptseminar. WS 96/97 Digitale Signalverarbeitung I. Seminar. SS 97 Digitale Signalverarbeitung II. Seminar. WS 97/98 Computerakustik. Oberseminar. SS 98 Computerakustik. Oberseminar. WS 98/99 Computerakustik II. Oberseminar. WS 99/00 Programmieren in 32-Bit Betriebssystemen und Netzwerken. Hauptseminar. SS 00 Programmieren in 32-Bit-Betriebssystemen und Netzwerken. Hauptseminar. SS 01 Akustik und Computermusik in C. Proseminar. WS 01/02 Akustik und Computermusik in C. Seminar. SS 02 Akustik und Computermusik in C II. Seminar. WS 02/03 Graphikprogrammierung in 32-Bit Betriebssystemen. Hauptseminar. SS 03 Graphikprogrammierung in 32-Bit Betriebssystemen. Hauptseminar. WS 03/04 Graphikprogrammierung in 32-Bit Betriebssystemen. Hauptseminar. SS 04 Graphikprogrammierung in 32-Bit Betriebssystemen. Hauptseminar. WS 04/05 Einführung in die Computergraphik unter Linux I. Seminar. SS 05 Einführung in die Computergraphik unter Linux II. Seminar. WS 05/06 Einführung in die Computergraphik unter Linux I. Seminar. SS 06 Einführung in die Computergraphik unter Linux II. Seminar. WS 06/07 Einführung in die Computergraphik unter Linux I. Seminar. SS 07 Einführung in die Computergraphik unter Linux II. Seminar. WS 07/08 Einführung in die Computergraphik unter Linux I. Proseminar. SS 08 Einführung in die Computergraphik unter Linux II. Proseminar. #2001.13728, text/plain (2003-12-18T23:28:28Z). LEHRE.LAT. In: Bestand A:Kittler/DLA Marbach. hd01-p01:/SAVE [hd, 7.81 KiB]. Friedrich Kittler (c)Luisa Ribas (https://flic.kr/p/6WT3XD). CC BY-NC-ND 2.0
  4. 4. Kittler‘s legacy About Kittler * 12.06.1943  18.10.2011 Friedrich Kittler (c)Luisa Ribas (https://flic.kr/p/6WT3XD). CC BY-NC-ND 2.0
  5. 5. Kittler‘s legacy About Kittler
  6. 6. Kittler‘s legacy Challenges met at DLA Marbach
  7. 7. Kittler‘s legacy DLA Marbach Data carriers FK: 444 + 312 = 756 until now: 281
  8. 8. Kittler‘s legacy DLA Marbach Data files FK: about 1,7 millions Until now: about 26.700
  9. 9. Kopie, Formatmigration .img .vmdk (SGI Disklabel!) PC 4 (Büro, irrelevant) VMware, Daemontools, Virtual Floppy Driver, Ironmaiden/Indexer hd04, hd07[!]: Bitcurator (dd) .img .vmdk .img, .vmdk hd04p01: dd Kopie Kopie .img .vmdk unbekannte Quelle fd001-fd272: ddrescue od001-od047: h2cdimage hd01, hd02, hd03: dd Kittler-PCs und -Datenbestände (ohne klassische AV-Medien) Stand: 5. März 2015 kramski@dla-marbach.de 336 Disketten 104 CD-Rs PC 5 (SGI Büro, irrelevant) hd05, hd06: dd PC 1 (abgelöst, defekt) PC 2 (abgelöst) Externe Platte DLA (xd002) Legende:Todo|ErledigtVolume-ImagesHardware MarbachBerlin .img .iso Kopie, Formatmigration Keine Platte fd273-fd404: ddrescue 312 Disketten (Nachlieferung) PC 3 (aktuell) PC 6 (Reise- Laptop, defekt) hd08: defekt hd09: Bitcurator (dd) PC 7 (Linux- Laptop) .img .img .vmdk Fileserver 24 AV-CDs, -DVDs Mediendokumentation Kittler‘s legacy Content
  10. 10. Kittler‘s legacy Content
  11. 11. • 5 Desktop Computer Kittler‘s legacy Content
  12. 12. • 2 Laptop Kittler‘s legacy Content
  13. 13. • 756 Floppy discs Kittler‘s legacy Content
  14. 14. Kopie, Formatmigration .img .vmdk (SGI Disklabel!) PC 4 (Büro, irrelevant) VMware, Daemontools, Virtual Floppy Driver, Ironmaiden/Indexer hd04, hd07[!]: Bitcurator (dd) .img .vmdk .img, .vmdk hd04p01: dd Kopie Kopie .img .vmdk unbekannte Quelle fd001-fd272: ddrescue od001-od047: h2cdimage hd01, hd02, hd03: dd Kittler-PCs und -Datenbestände (ohne klassische AV-Medien) Stand: 5. März 2015 kramski@dla-marbach.de 336 Disketten 104 CD-Rs PC 5 (SGI Büro, irrelevant) hd05, hd06: dd PC 1 (abgelöst, defekt) PC 2 (abgelöst) Externe Platte DLA (xd002) Legende:Todo|ErledigtVolume-ImagesHardware MarbachBerlin .img .iso Kopie, Formatmigration Keine Platte fd273-fd404: ddrescue 312 Disketten (Nachlieferung) PC 3 (aktuell) PC 6 (Reise- Laptop, defekt) hd08: defekt hd09: Bitcurator (dd) PC 7 (Linux- Laptop) .img .img .vmdk Fileserver 24 AV-CDs, -DVDs Mediendokumentation Kittler‘s legacy Content
  15. 15. Kopie, Formatmigration .img .vmdk (SGI Disklabel!) PC 4 (Büro, irrelevant) VMware, Daemontools, Virtual Floppy Driver, Ironmaiden/Indexer hd04, hd07[!]: Bitcurator (dd) .img .vmdk .img, .vmdk hd04p01: dd Kopie Kopie .img .vmdk unbekannte Quelle fd001-fd272: ddrescue od001-od047: h2cdimage hd01, hd02, hd03: dd Kittler-PCs und -Datenbestände (ohne klassische AV-Medien) Stand: 5. März 2015 kramski@dla-marbach.de 336 Disketten 104 CD-Rs PC 5 (SGI Büro, irrelevant) hd05, hd06: dd PC 1 (abgelöst, defekt) PC 2 (abgelöst) Externe Platte DLA (xd002) Legende:Todo|ErledigtVolume-ImagesHardware MarbachBerlin .img .iso Kopie, Formatmigration Keine Platte fd273-fd404: ddrescue 312 Disketten (Nachlieferung) PC 3 (aktuell) PC 6 (Reise- Laptop, defekt) hd08: defekt hd09: Bitcurator (dd) PC 7 (Linux- Laptop) .img .img .vmdk Fileserver 24 AV-CDs, -DVDs Mediendokumentation Kittler‘s legacy Content
  16. 16. Kopie, Formatmigration .img .vmdk (SGI Disklabel!) PC 4 (Büro, irrelevant) VMware, Daemontools, Virtual Floppy Driver, Ironmaiden/Indexer hd04, hd07[!]: Bitcurator (dd) .img .vmdk .img, .vmdk hd04p01: dd Kopie Kopie .img .vmdk unbekannte Quelle fd001-fd272: ddrescue od001-od047: h2cdimage hd01, hd02, hd03: dd Kittler-PCs und -Datenbestände (ohne klassische AV-Medien) Stand: 5. März 2015 kramski@dla-marbach.de 336 Disketten 104 CD-Rs PC 5 (SGI Büro, irrelevant) hd05, hd06: dd PC 1 (abgelöst, defekt) PC 2 (abgelöst) Externe Platte DLA (xd002) Legende:Todo|ErledigtVolume-ImagesHardware MarbachBerlin .img .iso Kopie, Formatmigration Keine Platte fd273-fd404: ddrescue 312 Disketten (Nachlieferung) PC 3 (aktuell) PC 6 (Reise- Laptop, defekt) hd08: defekt hd09: Bitcurator (dd) PC 7 (Linux- Laptop) .img .img .vmdk Fileserver 24 AV-CDs, -DVDs Mediendokumentation Kittler‘s legacy Content
  17. 17. aka Indexer Intelligend Read-Online Media Identification Engine
  18. 18. aka Indexer Extraction of relevant files
  19. 19. aka Indexer Target • Tool to inventory unstructured digital data before archival ingest • Low-treshold access • High degree of automation • Easy to extent • High performance • Transparent systematics
  20. 20. • Low-treshold access • Web Frontend • Simple Access • Multiple levels of complexity aka Indexer Target
  21. 21. • High degree of automation / extensibility • Logical approach: • Import of file structure into database • Creation of checksums • Identification • Libmagic • Gvfs-info • Tika • Detex aka Indexer Target
  22. 22. aka Indexer System architecture Identification results (MySQL) Indexer IndexerIdentification cascade Indexing of file system Fulltext index (SOLR) Webserver Webclient Autonomous subsystem Sector- Images (Source) Mountpoints (Folder) Indexer
  23. 23. aka Indexer Identification cascade • Filesystem / Checksum
  24. 24. • libmagic aka Indexer Identification cascade
  25. 25. • gvfs-info aka Indexer Identification cascade
  26. 26. • Apache Tika aka Indexer Identification cascade
  27. 27. • Image Magick aka Indexer Identification cascade
  28. 28. • avconv/ffmpeg aka Indexer Identification cascade
  29. 29. • Additional fulltext aka Indexer Identification cascade
  30. 30. FK: about 1,75mio files and folders aka Indexer National Software Reference Library (NSRL)
  31. 31. NSRL hits: about 567.000 application and system files (not from FK) aka Indexer National Software Reference Library (NSRL)
  32. 32. aka Indexer National Software Reference Library (NSRL)
  33. 33. aka Indexer National Software Reference Library (NSRL)
  34. 34. aka Indexer National Software Reference Library (NSRL)
  35. 35. aka Indexer The web interface Search field Native lucene query Search results
  36. 36. aka Indexer Citation of files #2008.869943, application/octet-stream (2008-09-09T18:29:53Z). texlive-module-coollist.source-2008.tar.lzma. In: Bestand A:Kittler/DLA Marbach. hd04-p01:/usr/portage/distfiles [hd, 6.18 KiB]. Adaption of APA citation style by Tabea Lurk

×