Friedrich Kittler’s
digital legacy
Challenges, findings and
approaches in dealing
with complex data
collections
Friedrich Kittler‘s digital legacy
Kittler‘s legacy
Kittler and DH
Challenges met at the DLA
aka Indexer
Mining Kittler
Kittler‘s legacy About Kittler
LEHRE.LAT
Ruhr-Universität Bochum
SS 92 Literatur und Informatik I. Oberseminar
WS 92/93 Li...
Kittler‘s legacy About Kittler
* 12.06.1943
 18.10.2011
Friedrich Kittler (c)Luisa Ribas (https://flic.kr/p/6WT3XD). CC B...
Kittler‘s legacy About Kittler
Kittler‘s legacy
Challenges met at DLA Marbach
Kittler‘s legacy DLA Marbach
Data carriers
FK: 444 + 312 = 756
until now: 281
Kittler‘s legacy DLA Marbach
Data files
FK: about 1,7 millions
Until now: about 26.700
Kopie,
Formatmigration
.img
.vmdk
(SGI Disklabel!)
PC 4 (Büro,
irrelevant)
VMware, Daemontools,
Virtual Floppy Driver,
Iro...
Kittler‘s legacy
Content
• 5 Desktop Computer
Kittler‘s legacy
Content
• 2 Laptop
Kittler‘s legacy
Content
• 756 Floppy discs
Kittler‘s legacy
Content
Kopie,
Formatmigration
.img
.vmdk
(SGI Disklabel!)
PC 4 (Büro,
irrelevant)
VMware, Daemontools,
Virtual Floppy Driver,
Iro...
Kopie,
Formatmigration
.img
.vmdk
(SGI Disklabel!)
PC 4 (Büro,
irrelevant)
VMware, Daemontools,
Virtual Floppy Driver,
Iro...
Kopie,
Formatmigration
.img
.vmdk
(SGI Disklabel!)
PC 4 (Büro,
irrelevant)
VMware, Daemontools,
Virtual Floppy Driver,
Iro...
aka Indexer
Intelligend Read-Online Media Identification Engine
aka Indexer
Extraction of relevant files
aka Indexer
Target
• Tool to inventory unstructured
digital data before archival ingest
• Low-treshold access
• High degre...
• Low-treshold access
• Web Frontend
• Simple Access
• Multiple levels of complexity
aka Indexer
Target
• High degree of automation /
extensibility
• Logical approach:
• Import of file structure into database
• Creation of che...
aka Indexer
System architecture
Identification
results
(MySQL)
Indexer
IndexerIdentification
cascade
Indexing of
file syst...
aka Indexer
Identification cascade
• Filesystem / Checksum
• libmagic
aka Indexer
Identification cascade
• gvfs-info
aka Indexer
Identification cascade
• Apache Tika
aka Indexer
Identification cascade
• Image Magick
aka Indexer
Identification cascade
• avconv/ffmpeg
aka Indexer
Identification cascade
• Additional fulltext
aka Indexer
Identification cascade
FK: about 1,75mio
files and folders
aka Indexer
National Software Reference Library (NSRL)
NSRL hits:
about 567.000
application and system
files (not from FK)
aka Indexer
National Software Reference Library (NSRL)
aka Indexer
National Software Reference Library (NSRL)
aka Indexer
National Software Reference Library (NSRL)
aka Indexer
National Software Reference Library (NSRL)
aka Indexer
The web interface
Search field
Native lucene
query
Search
results
aka Indexer
Citation of files
#2008.869943, application/octet-stream (2008-09-09T18:29:53Z).
texlive-module-coollist.sourc...
Nächste SlideShare
Wird geladen in …5
×

Friedrich Kittlers Digital Legacy

269 Aufrufe

Veröffentlicht am

Challenges, findings and approaches in dealing with complex data collections

Veröffentlicht in: Wissenschaft
0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
269
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
3
Aktionen
Geteilt
0
Downloads
1
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Friedrich Kittlers Digital Legacy

  1. 1. Friedrich Kittler’s digital legacy Challenges, findings and approaches in dealing with complex data collections
  2. 2. Friedrich Kittler‘s digital legacy Kittler‘s legacy Kittler and DH Challenges met at the DLA aka Indexer Mining Kittler
  3. 3. Kittler‘s legacy About Kittler LEHRE.LAT Ruhr-Universität Bochum SS 92 Literatur und Informatik I. Oberseminar WS 92/93 Literatur und Informatik II. Oberseminar Humboldt-Universität zu Berlin SS 94 Oberflächenprogrammierung in C (I). Hauptseminar WS 94/95 Oberflächenprogrammierung in C (II). Hauptseminar. SS 95 Oberflächenprogrammierung in Assembler. Hauptseminar. WS 95/96 Graphikprogrammierung auf Workstations I. Hauptseminar. SS 96 Graphikprogrammierung auf Workstations II. Hauptseminar. WS 96/97 Digitale Signalverarbeitung I. Seminar. SS 97 Digitale Signalverarbeitung II. Seminar. WS 97/98 Computerakustik. Oberseminar. SS 98 Computerakustik. Oberseminar. WS 98/99 Computerakustik II. Oberseminar. WS 99/00 Programmieren in 32-Bit Betriebssystemen und Netzwerken. Hauptseminar. SS 00 Programmieren in 32-Bit-Betriebssystemen und Netzwerken. Hauptseminar. SS 01 Akustik und Computermusik in C. Proseminar. WS 01/02 Akustik und Computermusik in C. Seminar. SS 02 Akustik und Computermusik in C II. Seminar. WS 02/03 Graphikprogrammierung in 32-Bit Betriebssystemen. Hauptseminar. SS 03 Graphikprogrammierung in 32-Bit Betriebssystemen. Hauptseminar. WS 03/04 Graphikprogrammierung in 32-Bit Betriebssystemen. Hauptseminar. SS 04 Graphikprogrammierung in 32-Bit Betriebssystemen. Hauptseminar. WS 04/05 Einführung in die Computergraphik unter Linux I. Seminar. SS 05 Einführung in die Computergraphik unter Linux II. Seminar. WS 05/06 Einführung in die Computergraphik unter Linux I. Seminar. SS 06 Einführung in die Computergraphik unter Linux II. Seminar. WS 06/07 Einführung in die Computergraphik unter Linux I. Seminar. SS 07 Einführung in die Computergraphik unter Linux II. Seminar. WS 07/08 Einführung in die Computergraphik unter Linux I. Proseminar. SS 08 Einführung in die Computergraphik unter Linux II. Proseminar. #2001.13728, text/plain (2003-12-18T23:28:28Z). LEHRE.LAT. In: Bestand A:Kittler/DLA Marbach. hd01-p01:/SAVE [hd, 7.81 KiB]. Friedrich Kittler (c)Luisa Ribas (https://flic.kr/p/6WT3XD). CC BY-NC-ND 2.0
  4. 4. Kittler‘s legacy About Kittler * 12.06.1943  18.10.2011 Friedrich Kittler (c)Luisa Ribas (https://flic.kr/p/6WT3XD). CC BY-NC-ND 2.0
  5. 5. Kittler‘s legacy About Kittler
  6. 6. Kittler‘s legacy Challenges met at DLA Marbach
  7. 7. Kittler‘s legacy DLA Marbach Data carriers FK: 444 + 312 = 756 until now: 281
  8. 8. Kittler‘s legacy DLA Marbach Data files FK: about 1,7 millions Until now: about 26.700
  9. 9. Kopie, Formatmigration .img .vmdk (SGI Disklabel!) PC 4 (Büro, irrelevant) VMware, Daemontools, Virtual Floppy Driver, Ironmaiden/Indexer hd04, hd07[!]: Bitcurator (dd) .img .vmdk .img, .vmdk hd04p01: dd Kopie Kopie .img .vmdk unbekannte Quelle fd001-fd272: ddrescue od001-od047: h2cdimage hd01, hd02, hd03: dd Kittler-PCs und -Datenbestände (ohne klassische AV-Medien) Stand: 5. März 2015 kramski@dla-marbach.de 336 Disketten 104 CD-Rs PC 5 (SGI Büro, irrelevant) hd05, hd06: dd PC 1 (abgelöst, defekt) PC 2 (abgelöst) Externe Platte DLA (xd002) Legende:Todo|ErledigtVolume-ImagesHardware MarbachBerlin .img .iso Kopie, Formatmigration Keine Platte fd273-fd404: ddrescue 312 Disketten (Nachlieferung) PC 3 (aktuell) PC 6 (Reise- Laptop, defekt) hd08: defekt hd09: Bitcurator (dd) PC 7 (Linux- Laptop) .img .img .vmdk Fileserver 24 AV-CDs, -DVDs Mediendokumentation Kittler‘s legacy Content
  10. 10. Kittler‘s legacy Content
  11. 11. • 5 Desktop Computer Kittler‘s legacy Content
  12. 12. • 2 Laptop Kittler‘s legacy Content
  13. 13. • 756 Floppy discs Kittler‘s legacy Content
  14. 14. Kopie, Formatmigration .img .vmdk (SGI Disklabel!) PC 4 (Büro, irrelevant) VMware, Daemontools, Virtual Floppy Driver, Ironmaiden/Indexer hd04, hd07[!]: Bitcurator (dd) .img .vmdk .img, .vmdk hd04p01: dd Kopie Kopie .img .vmdk unbekannte Quelle fd001-fd272: ddrescue od001-od047: h2cdimage hd01, hd02, hd03: dd Kittler-PCs und -Datenbestände (ohne klassische AV-Medien) Stand: 5. März 2015 kramski@dla-marbach.de 336 Disketten 104 CD-Rs PC 5 (SGI Büro, irrelevant) hd05, hd06: dd PC 1 (abgelöst, defekt) PC 2 (abgelöst) Externe Platte DLA (xd002) Legende:Todo|ErledigtVolume-ImagesHardware MarbachBerlin .img .iso Kopie, Formatmigration Keine Platte fd273-fd404: ddrescue 312 Disketten (Nachlieferung) PC 3 (aktuell) PC 6 (Reise- Laptop, defekt) hd08: defekt hd09: Bitcurator (dd) PC 7 (Linux- Laptop) .img .img .vmdk Fileserver 24 AV-CDs, -DVDs Mediendokumentation Kittler‘s legacy Content
  15. 15. Kopie, Formatmigration .img .vmdk (SGI Disklabel!) PC 4 (Büro, irrelevant) VMware, Daemontools, Virtual Floppy Driver, Ironmaiden/Indexer hd04, hd07[!]: Bitcurator (dd) .img .vmdk .img, .vmdk hd04p01: dd Kopie Kopie .img .vmdk unbekannte Quelle fd001-fd272: ddrescue od001-od047: h2cdimage hd01, hd02, hd03: dd Kittler-PCs und -Datenbestände (ohne klassische AV-Medien) Stand: 5. März 2015 kramski@dla-marbach.de 336 Disketten 104 CD-Rs PC 5 (SGI Büro, irrelevant) hd05, hd06: dd PC 1 (abgelöst, defekt) PC 2 (abgelöst) Externe Platte DLA (xd002) Legende:Todo|ErledigtVolume-ImagesHardware MarbachBerlin .img .iso Kopie, Formatmigration Keine Platte fd273-fd404: ddrescue 312 Disketten (Nachlieferung) PC 3 (aktuell) PC 6 (Reise- Laptop, defekt) hd08: defekt hd09: Bitcurator (dd) PC 7 (Linux- Laptop) .img .img .vmdk Fileserver 24 AV-CDs, -DVDs Mediendokumentation Kittler‘s legacy Content
  16. 16. Kopie, Formatmigration .img .vmdk (SGI Disklabel!) PC 4 (Büro, irrelevant) VMware, Daemontools, Virtual Floppy Driver, Ironmaiden/Indexer hd04, hd07[!]: Bitcurator (dd) .img .vmdk .img, .vmdk hd04p01: dd Kopie Kopie .img .vmdk unbekannte Quelle fd001-fd272: ddrescue od001-od047: h2cdimage hd01, hd02, hd03: dd Kittler-PCs und -Datenbestände (ohne klassische AV-Medien) Stand: 5. März 2015 kramski@dla-marbach.de 336 Disketten 104 CD-Rs PC 5 (SGI Büro, irrelevant) hd05, hd06: dd PC 1 (abgelöst, defekt) PC 2 (abgelöst) Externe Platte DLA (xd002) Legende:Todo|ErledigtVolume-ImagesHardware MarbachBerlin .img .iso Kopie, Formatmigration Keine Platte fd273-fd404: ddrescue 312 Disketten (Nachlieferung) PC 3 (aktuell) PC 6 (Reise- Laptop, defekt) hd08: defekt hd09: Bitcurator (dd) PC 7 (Linux- Laptop) .img .img .vmdk Fileserver 24 AV-CDs, -DVDs Mediendokumentation Kittler‘s legacy Content
  17. 17. aka Indexer Intelligend Read-Online Media Identification Engine
  18. 18. aka Indexer Extraction of relevant files
  19. 19. aka Indexer Target • Tool to inventory unstructured digital data before archival ingest • Low-treshold access • High degree of automation • Easy to extent • High performance • Transparent systematics
  20. 20. • Low-treshold access • Web Frontend • Simple Access • Multiple levels of complexity aka Indexer Target
  21. 21. • High degree of automation / extensibility • Logical approach: • Import of file structure into database • Creation of checksums • Identification • Libmagic • Gvfs-info • Tika • Detex aka Indexer Target
  22. 22. aka Indexer System architecture Identification results (MySQL) Indexer IndexerIdentification cascade Indexing of file system Fulltext index (SOLR) Webserver Webclient Autonomous subsystem Sector- Images (Source) Mountpoints (Folder) Indexer
  23. 23. aka Indexer Identification cascade • Filesystem / Checksum
  24. 24. • libmagic aka Indexer Identification cascade
  25. 25. • gvfs-info aka Indexer Identification cascade
  26. 26. • Apache Tika aka Indexer Identification cascade
  27. 27. • Image Magick aka Indexer Identification cascade
  28. 28. • avconv/ffmpeg aka Indexer Identification cascade
  29. 29. • Additional fulltext aka Indexer Identification cascade
  30. 30. FK: about 1,75mio files and folders aka Indexer National Software Reference Library (NSRL)
  31. 31. NSRL hits: about 567.000 application and system files (not from FK) aka Indexer National Software Reference Library (NSRL)
  32. 32. aka Indexer National Software Reference Library (NSRL)
  33. 33. aka Indexer National Software Reference Library (NSRL)
  34. 34. aka Indexer National Software Reference Library (NSRL)
  35. 35. aka Indexer The web interface Search field Native lucene query Search results
  36. 36. aka Indexer Citation of files #2008.869943, application/octet-stream (2008-09-09T18:29:53Z). texlive-module-coollist.source-2008.tar.lzma. In: Bestand A:Kittler/DLA Marbach. hd04-p01:/usr/portage/distfiles [hd, 6.18 KiB]. Adaption of APA citation style by Tabea Lurk

×