MAB and Unicode

212 Aufrufe

Veröffentlicht am

Reinhold Heuvelmann (Die Deutsche Bibliothek, Frankfurt am Main) berichtet von den neusten Entwicklungen des MAB2-Formats, das bereits Unicode / UTF-8 als Zeichensatz vorsieht und um ein zusätzliches Feld (671) erweitert wurde. Das Feld 671 entspricht dem Feld 880 des MARC-21-Formats und kann für andere Schreibvarianten des Titels, Autors usw. genutzt werden. MAB2 schreibt nicht vor, dass im Feld 671 die Originalschrift verankert werden muss; hier könnte auch die transliterierte bzw. transkribierte Fassung der Aufnahme stehen. Die Originalschrift würde dann dementsprechend in die bekannten Felder, die für diese Erweiterung nicht verändert werden mussten, aufgenommen werden.

Veröffentlicht in: Technologie, Reisen
0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
212
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
6
Aktionen
Geteilt
0
Downloads
0
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

MAB and Unicode

  1. 1. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 1 MAB and Unicode • Reinhold Heuvelmann • Die Deutsche Bibliothek, Dept. IT, Office for Data Formats • heuvelmann@dbf.ddb.de
  2. 2. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 2 MAB and Unicode: Overview • MAB • Relationship of MAB and Unicode • History of MAB and Unicode • Multiscript Records • Field 671 „Alternate Graphic Representation“ • Character Set Concordance MAB2 – Unicode • The German Umlaut and Unicode
  3. 3. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 3 MAB • „Maschinelles Austauschformat für Bibliotheken“ = machine-readable exchange format for libraries [in Germany and Austria] • „fount-case“ („Setzkasten“) for the tranport of bibliographic data • „MAB-Auschuss“ = MAB committee • http://www.ddb.de/professionell/mab_e.htm • http://www.ddb.de/professionell/mab.htm
  4. 4. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 4 Relationship of MAB and Unicode • standards • different levels: bibliographic exchange format (higher level) character set (lower level) • different frames: MAB: national / German language Unicode: internationalization • MAB uses Unicode (like other standards: IS0 646 + 5426; 639, 3166, 8601, DIN 1506 ...)
  5. 5. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 5 History of MAB and Unicode (~) • 1999: CJK Libraries • 2000: Unicode in MAB • 2001: Character Set Concordance Original Script and Transliteration • 2002: Original Script and Transliteration: Field 671 • 2003+: Umlaut
  6. 6. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 6 • 030 CODIERTE ANGABEN ZUM DATENSATZ • Position 2: Zeichenvorrat – 1 = MAB-Zeichenvorrat – 3 = DIN 31628, Stufe 1 – 5 = DIN 31628, Stufe 2 – 7 = DIN 31628, Stufe 3 – z = Sonstiger Zeichenvorrat • Position 3: Zeichencode – a = DIN 66003-DRV – b = DIN 66003-IRV – c = DIN 66003 + DIN 31624 – d = ISO 646 (IRV) + ISO 5426 – i = Industriestandard IBM-PC 850 („Diskette“) – u = Unicode / ISO 10646 (UTF 8) – z = Sonstiger Zeichencode
  7. 7. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 7 • 030 CODIERTE ANGABEN ZUM DATENSATZ • Position 7: Transliteration/Transkription – a= Transliteration – b= Transkription – z = keine Angabe
  8. 8. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 8 • 001 965633713 • 004 20021211 • 030 a|1uar|z|||37 • 036aDE • 050 ||||||||a||||| • 051 nk||z|| • 070a292 • 100bBurkhardt, Hans • 102a101292023 • 200bECCV <5, 1998, Freiburg, Breisgau> • 202a2170402-8 • 331 Computer vision • 334 Elektronische Ressource • 335 proceedings Example 1
  9. 9. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 9 Example 1 (continued) • 359 ECCV '98, 5th European Conference on Computer Vision, Freiburg, Germany, June 1998. H. Burkhardt ... (ed.) • 410 Berlin ; Heidelberg • 412 Springer • 501 Lizenzpflichtig • 653 $aOnline-Ressourcen • 700 |28 • 700d|30 • 902s 4129594-8 Maschinelles Sehen • 902f11|Kongress • 902g11|Freiburg <Breisgau, 1998> • 902f11|Online-Publikation
  10. 10. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 10 • 00552nM2.01200024 h • 001 965383385 • 004 20030930 • 030 g|1uar|z|||17 • 036aXA-DE • 037bger • 050 a|b||||||||||| • 051 m|||z||| • 070a292 • 100 Moxter, Adolf • 102a119195186 • 331 ¬¬¬¬Die¬¬¬¬ Grundsätze ordnungsgemäßer Rechnungslegung • 359 von Adolf Moxter • 410 Düsseldorf • 412 IDW-Verl. Example 2
  11. 11. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 11 • 425 2003 • 425a2003 • 433 XXIX, 350 S. • 435 23 cm • 540aISBN 3-8021-1026-9 Pp. : EUR 58.00 • 544aDBL#2003 A 2317 • 544aDBF#2003 A 2317 • 568 02,N44,0131 • 574 03,A42,0404 • 700 |17 • 700 |19 • 700d|10.11f;7.10a/XA-DE • 902g 4011882-4 Deutschland • 902s1 4069454-9 Bilanzierungsgrundsätze • 903 21 Example 2 (continued)
  12. 12. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 12 Multiscript Records
  13. 13. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 13 • 00467nM2.01200024 h • 001 968543774 • 030 g|1daz|a|||17 • 036aXA-DE-NW • 037brus • 100 Giesbrecht, Agnes • 102a122352548 • 331 Echo ljubvi • 335 stichi • 359 Agnes Gizbrecht Example 3a
  14. 14. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 14 • 403 1. Aufl. • 410 Lage-Hörst • 412 BMV-Verl. Burau • 425a2003 • 540aISBN 3-935000-34-0 kart. : EUR 9.90 • 700 |59 Example 3a (continued)
  15. 15. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 15 • 00467nM2.01200024 h • 001 968543774 • 030 g|zuaz|z|||17 • 037brus • 100 Giesbrecht, Agnes • 102a122352548 • 331 [Main title „Echo ljubvi“ in cyrillic script] • 335 [Subtitle „stichi“ in cyrillic script] • 359 [Statement of responsibility „Agnes Gizbrecht“ in cyrillic script] Example 3b
  16. 16. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 16 • 403 1. Aufl. • 410 Lage-Hörst • 412 BMV-Verl. Burau • 425a2003 • 540aISBN 3-935000-34-0 kart. : EUR 9.90 • 700 |59 Example 3b (continued)
  17. 17. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 17 • 00467nM2.01200024 h • 001 968543774 • 030 g|zuaz|a|||17 • 037brus • 100 Giesbrecht, Agnes • 102a122352548 • 331 Echo ljubvi • 335 stichi • 359 Agnes Gizbrecht • 370a[Main title 331 in cyrillic script] • 370a[Subtitle 335 in cyrillic script] Example 3c
  18. 18. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 18 • 403 1. Aufl. • 410 Lage-Hörst • 412 BMV-Verl. Burau • 425a2003 • 540aISBN 3-935000-34-0 kart. : EUR 9.90 • 700 |59 Example 3c (continued)
  19. 19. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 19 • 00467nM2.01200024 h • 001 968543774 • 030 g|zuaz|a|||17 • 037brus • 100 Giesbrecht, Agnes • 102a122352548 • 331 [Main title „Echo ljubvi“ in cyrillic script] • 335 [Subtitle „stichi“ in cyrillic script] • 359 [Statement of responsibility „Agnes Gizbrecht“ in cyrillic script] • 370aEcho ljubvi • 370aStichi Example 3d
  20. 20. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 20 • 403 1. Aufl. • 410 Lage-Hörst • 412 BMV-Verl. Burau • 425a2003 • 540aISBN 3-935000-34-0 kart. : EUR 9.90 • 700 |59 Example 3d (continued)
  21. 21. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 21 Field 671 „Alternate Graphic Representation“ 1 • http://www.ddb.de/professionell/pdf/mab-671.pdf • all information in one record • field-to-field relationship original script <=> transliteration / transscription • suitable for each part of MAB (title, authorities, holdings, adresses) • MARC21 Field 880 as a model („embedded field technique“) • cf. UNIMARC and OCLC|PICA: pairs of fields
  22. 22. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 22 Field 671 „Alternate Graphic Representation“ 2 • fixed part: fieldnumber + indicator + occurence of linked field codes for script + orientation of this field 671 codes for script + orientation of linked field • variable content • Script Code ISO 15924: ~ 100 scripts (http://www.evertype.com/standards/iso15924/ document/fdis15924.pdf)
  23. 23. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 23 Example 3e • 00467nM2.01200024 h • 001 968543774 • 030 g|zuaz|a|||17 • 036aXA-DE-NW • 037brus • 100 Giesbrecht, Agnes • 102a122352548 • 331 Echo ljubvi • 335 stichi • 359 Agnes Gizbrecht • 403 1. Aufl.
  24. 24. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 24 Example 3e (continued) • 540aISBN 3-935000-34-0 kart. : EUR 9.90 • 671 331 01CyrllLatnl[Main title 331 in cyrillic script] • 671 335 01CyrllLatnl[Subtitle 335 in cyrillic script] • 671 359 01CyrllLatnl[Statement of responsibility 359 in cyrillic script] • 700 |59
  25. 25. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 25 Example 3f • 00467nM2.01200024 h • 001 968543774 • 030 g|zuaz|a|||17 • 037brus • 100 Giesbrecht, Agnes • 102a122352548 • 331 [Main title „Echo ljubvi“ in cyrillic script] • 335 [Subtitle „stichi“ in cyrillic script] • 359 [Statement of responsibility „Agnes Gizbrecht“ in cyrillic script]
  26. 26. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 26 Example 3f (continued) • 540aISBN 3-935000-34-0 kart. : EUR 9.90 • 671 331 01LatnlCyrll [Version of main title 331 in roman script] • 671 335 01LatnlCyrll [Version of subtitle 335 in roman script] • 671 359 01LatnlCyrll [Version of statement of responsibility 359 in roman script] • 700 |59
  27. 27. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 27 Example 4 • 00242nM2.01200024 p • 001 121873331 • 002a20000306 • 003 20001212 • 004 20020926 • 030 |azu||||||||| • 065 a||| • 070 1240 • 070a292
  28. 28. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 28 Example 4 (continued) • 671 800 01JpanlLatnl[Version of heading 800 in japanese script] • 671 830 01JpanlLatnl[Version of pseudonym 830 in japanese script] • 800 Yamamoto, Tsunetomo • 801 LoC-NA • 814iSamurai, Zen-Mönch • 815a1659-1719 • 830 Furumaru ¬¬¬¬[Pseud.]¬¬¬¬
  29. 29. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 29 Character Set Concordance MAB2 – Unicode • 1:1-relationship of character positions in – ISO 646 (IRV) + ISO 5426-1983 – Unicode / ISO 10646 • ... if possible • no precombination: „Ó => „A“ + „~“ only single diacritics: „~“ • http://www.ddb.de/professionell/pdf/ mab_unic.pdf
  30. 30. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 30 The German Umlaut and Unicode • U+0308: COMBINING DIAERESIS = double dot above, umlaut = Greek dialytika = double derivative • Double indexing • German way – precombination – postcombination • Proposal to ISO / Unicode
  31. 31. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 31 What next? • Bibliographic Exchange Formats ~ ok • Cataloguing, Typing • Transliteration, Transscription • Storing, Formatting, Converting • Indexing, Sorting • Searching, Finding • Presenting, Printing
  32. 32. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 32 The End • Thank you for your attention and patience

×