SlideShare ist ein Scribd-Unternehmen logo
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 1
MAB and Unicode
• Reinhold Heuvelmann
• Die Deutsche Bibliothek, Dept. IT,
Office for Data Formats
• heuvelmann@dbf.ddb.de
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 2
MAB and Unicode:
Overview
• MAB
• Relationship of MAB and Unicode
• History of MAB and Unicode
• Multiscript Records
• Field 671 „Alternate Graphic Representation“
• Character Set Concordance MAB2 – Unicode
• The German Umlaut and Unicode
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 3
MAB
• „Maschinelles Austauschformat für Bibliotheken“
= machine-readable exchange format for libraries
[in Germany and Austria]
• „fount-case“ („Setzkasten“) for the tranport of
bibliographic data
• „MAB-Auschuss“ = MAB committee
• http://www.ddb.de/professionell/mab_e.htm
• http://www.ddb.de/professionell/mab.htm
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 4
Relationship of MAB and Unicode
• standards
• different levels:
bibliographic exchange format (higher level)
character set (lower level)
• different frames:
MAB: national / German language
Unicode: internationalization
• MAB uses Unicode (like other standards:
IS0 646 + 5426; 639, 3166, 8601, DIN 1506 ...)
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 5
History of MAB and Unicode (~)
• 1999: CJK Libraries
• 2000: Unicode in MAB
• 2001: Character Set Concordance
Original Script and
Transliteration
• 2002: Original Script and
Transliteration: Field 671
• 2003+: Umlaut
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 6
• 030 CODIERTE ANGABEN ZUM DATENSATZ
• Position 2: Zeichenvorrat
– 1 = MAB-Zeichenvorrat
– 3 = DIN 31628, Stufe 1
– 5 = DIN 31628, Stufe 2
– 7 = DIN 31628, Stufe 3
– z = Sonstiger Zeichenvorrat
• Position 3: Zeichencode
– a = DIN 66003-DRV
– b = DIN 66003-IRV
– c = DIN 66003 + DIN 31624
– d = ISO 646 (IRV) + ISO 5426
– i = Industriestandard IBM-PC 850 („Diskette“)
– u = Unicode / ISO 10646 (UTF 8)
– z = Sonstiger Zeichencode
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 7
• 030 CODIERTE ANGABEN ZUM DATENSATZ
• Position 7: Transliteration/Transkription
– a= Transliteration
– b= Transkription
– z = keine Angabe
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 8
• 001 965633713
• 004 20021211
• 030 a|1uar|z|||37
• 036aDE
• 050 ||||||||a|||||
• 051 nk||z||
• 070a292
• 100bBurkhardt, Hans
• 102a101292023
• 200bECCV <5, 1998, Freiburg, Breisgau>
• 202a2170402-8
• 331 Computer vision
• 334 Elektronische Ressource
• 335 proceedings
Example 1
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 9
Example 1 (continued)
• 359 ECCV '98, 5th European Conference on
Computer Vision, Freiburg, Germany, June
1998. H. Burkhardt ... (ed.)
• 410 Berlin ; Heidelberg
• 412 Springer
• 501 Lizenzpflichtig
• 653 $aOnline-Ressourcen
• 700 |28
• 700d|30
• 902s 4129594-8 Maschinelles Sehen
• 902f11|Kongress
• 902g11|Freiburg <Breisgau, 1998>
• 902f11|Online-Publikation
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 10
• 00552nM2.01200024 h
• 001 965383385
• 004 20030930
• 030 g|1uar|z|||17
• 036aXA-DE
• 037bger
• 050 a|b|||||||||||
• 051 m|||z|||
• 070a292
• 100 Moxter, Adolf
• 102a119195186
• 331 ¬¬¬¬Die¬¬¬¬ Grundsätze ordnungsgemäßer Rechnungslegung
• 359 von Adolf Moxter
• 410 Düsseldorf
• 412 IDW-Verl.
Example 2
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 11
• 425 2003
• 425a2003
• 433 XXIX, 350 S.
• 435 23 cm
• 540aISBN 3-8021-1026-9 Pp. : EUR 58.00
• 544aDBL#2003 A 2317
• 544aDBF#2003 A 2317
• 568 02,N44,0131
• 574 03,A42,0404
• 700 |17
• 700 |19
• 700d|10.11f;7.10a/XA-DE
• 902g 4011882-4 Deutschland
• 902s1 4069454-9 Bilanzierungsgrundsätze
• 903 21
Example 2 (continued)
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 12
Multiscript Records
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 13
• 00467nM2.01200024 h
• 001 968543774
• 030 g|1daz|a|||17
• 036aXA-DE-NW
• 037brus
• 100 Giesbrecht, Agnes
• 102a122352548
• 331 Echo ljubvi
• 335 stichi
• 359 Agnes Gizbrecht
Example 3a
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 14
• 403 1. Aufl.
• 410 Lage-Hörst
• 412 BMV-Verl. Burau
• 425a2003
• 540aISBN 3-935000-34-0 kart. : EUR 9.90
• 700 |59
Example 3a (continued)
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 15
• 00467nM2.01200024 h
• 001 968543774
• 030 g|zuaz|z|||17
• 037brus
• 100 Giesbrecht, Agnes
• 102a122352548
• 331 [Main title „Echo ljubvi“ in cyrillic
script]
• 335 [Subtitle „stichi“ in cyrillic script]
• 359 [Statement of responsibility „Agnes
Gizbrecht“ in cyrillic script]
Example 3b
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 16
• 403 1. Aufl.
• 410 Lage-Hörst
• 412 BMV-Verl. Burau
• 425a2003
• 540aISBN 3-935000-34-0 kart. : EUR 9.90
• 700 |59
Example 3b (continued)
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 17
• 00467nM2.01200024 h
• 001 968543774
• 030 g|zuaz|a|||17
• 037brus
• 100 Giesbrecht, Agnes
• 102a122352548
• 331 Echo ljubvi
• 335 stichi
• 359 Agnes Gizbrecht
• 370a[Main title 331 in cyrillic script]
• 370a[Subtitle 335 in cyrillic script]
Example 3c
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 18
• 403 1. Aufl.
• 410 Lage-Hörst
• 412 BMV-Verl. Burau
• 425a2003
• 540aISBN 3-935000-34-0 kart. : EUR 9.90
• 700 |59
Example 3c (continued)
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 19
• 00467nM2.01200024 h
• 001 968543774
• 030 g|zuaz|a|||17
• 037brus
• 100 Giesbrecht, Agnes
• 102a122352548
• 331 [Main title „Echo ljubvi“ in cyrillic
script]
• 335 [Subtitle „stichi“ in cyrillic script]
• 359 [Statement of responsibility „Agnes
Gizbrecht“ in cyrillic script]
• 370aEcho ljubvi
• 370aStichi
Example 3d
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 20
• 403 1. Aufl.
• 410 Lage-Hörst
• 412 BMV-Verl. Burau
• 425a2003
• 540aISBN 3-935000-34-0 kart. : EUR 9.90
• 700 |59
Example 3d (continued)
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 21
Field 671 „Alternate Graphic Representation“
1
• http://www.ddb.de/professionell/pdf/mab-671.pdf
• all information in one record
• field-to-field relationship original script <=>
transliteration / transscription
• suitable for each part of MAB (title, authorities,
holdings, adresses)
• MARC21 Field 880 as a model
(„embedded field technique“)
• cf. UNIMARC and OCLC|PICA: pairs of fields
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 22
Field 671 „Alternate Graphic Representation“
2
• fixed part:
fieldnumber + indicator + occurence of linked field
codes for script + orientation of this field 671
codes for script + orientation of linked field
• variable content
• Script Code ISO 15924: ~ 100 scripts
(http://www.evertype.com/standards/iso15924/
document/fdis15924.pdf)
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 23
Example 3e
• 00467nM2.01200024 h
• 001 968543774
• 030 g|zuaz|a|||17
• 036aXA-DE-NW
• 037brus
• 100 Giesbrecht, Agnes
• 102a122352548
• 331 Echo ljubvi
• 335 stichi
• 359 Agnes Gizbrecht
• 403 1. Aufl.
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 24
Example 3e (continued)
• 540aISBN 3-935000-34-0 kart. : EUR 9.90
• 671 331 01CyrllLatnl[Main title 331 in
cyrillic script]
• 671 335 01CyrllLatnl[Subtitle 335 in
cyrillic script]
• 671 359 01CyrllLatnl[Statement of
responsibility 359
in cyrillic script]
• 700 |59
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 25
Example 3f
• 00467nM2.01200024 h
• 001 968543774
• 030 g|zuaz|a|||17
• 037brus
• 100 Giesbrecht, Agnes
• 102a122352548
• 331 [Main title „Echo ljubvi“ in
cyrillic script]
• 335 [Subtitle „stichi“ in cyrillic
script]
• 359 [Statement of responsibility „Agnes
Gizbrecht“ in cyrillic script]
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 26
Example 3f (continued)
• 540aISBN 3-935000-34-0 kart. : EUR 9.90
• 671 331 01LatnlCyrll [Version of main title
331 in roman script]
• 671 335 01LatnlCyrll [Version of subtitle
335 in roman script]
• 671 359 01LatnlCyrll [Version of statement
of responsibility 359
in roman script]
• 700 |59
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 27
Example 4
• 00242nM2.01200024 p
• 001 121873331
• 002a20000306
• 003 20001212
• 004 20020926
• 030 |azu|||||||||
• 065 a|||
• 070 1240
• 070a292
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 28
Example 4 (continued)
• 671 800 01JpanlLatnl[Version of heading
800 in japanese
script]
• 671 830 01JpanlLatnl[Version of
pseudonym 830
in japanese script]
• 800 Yamamoto, Tsunetomo
• 801 LoC-NA
• 814iSamurai, Zen-Mönch
• 815a1659-1719
• 830 Furumaru ¬¬¬¬[Pseud.]¬¬¬¬
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 29
Character Set Concordance MAB2 – Unicode
• 1:1-relationship of character positions in
– ISO 646 (IRV) + ISO 5426-1983
– Unicode / ISO 10646
• ... if possible
• no precombination: „Ó => „A“ + „~“
only single diacritics: „~“
• http://www.ddb.de/professionell/pdf/
mab_unic.pdf
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 30
The German Umlaut and Unicode
• U+0308: COMBINING DIAERESIS
= double dot above, umlaut
= Greek dialytika
= double derivative
• Double indexing
• German way
– precombination
– postcombination
• Proposal to ISO / Unicode
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 31
What next?
• Bibliographic Exchange Formats
~ ok
• Cataloguing, Typing
• Transliteration, Transscription
• Storing, Formatting, Converting
• Indexing, Sorting
• Searching, Finding
• Presenting, Printing
Die Deutsche Bibliothek Arbeitsstelle Datenformate
Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 32
The End
• Thank you for your attention and
patience

Weitere ähnliche Inhalte

Andere mochten auch

G:\programa de presentaciones de power point
G:\programa de presentaciones de power pointG:\programa de presentaciones de power point
G:\programa de presentaciones de power point
guestfbcffe7c
 
researchbrief(VFAdavid)
researchbrief(VFAdavid)researchbrief(VFAdavid)
researchbrief(VFAdavid)
David Vong
 
Premio Santander Julio 2010
Premio Santander Julio 2010Premio Santander Julio 2010
Premio Santander Julio 2010
Incubadora de Empresas
 
Europa cerrada
Europa cerradaEuropa cerrada
Europa cerrada
guest1d9b70
 
Electronic portfolio
Electronic portfolioElectronic portfolio
Electronic portfolio
mga375
 
ajay cv 2
ajay cv 2ajay cv 2
ajay cv 2
AJAY KUMAR
 
Vocabulario
VocabularioVocabulario
Vocabulario
Kristin Vujevich
 
Ofimunicipal7maio2008
Ofimunicipal7maio2008Ofimunicipal7maio2008
Ofimunicipal7maio2008
Marcelo Estraviz
 
Whosyabuddha design by fire cafe (8-7-2013)
Whosyabuddha  design by fire cafe (8-7-2013) Whosyabuddha  design by fire cafe (8-7-2013)
Whosyabuddha design by fire cafe (8-7-2013)
Kaliber
 
MURAIS NADAL 09
MURAIS NADAL 09MURAIS NADAL 09
MURAIS NADAL 09
colexio
 
Patrocinios
PatrociniosPatrocinios
Patrocinios
Marcelo Estraviz
 
Judith y holofernes
Judith y holofernesJudith y holofernes
Judith y holofernes
Kino Herrero Rodriguez
 
Montandodepto
MontandodeptoMontandodepto
Montandodepto
Marcelo Estraviz
 
Competencias
CompetenciasCompetencias
Competencias
tropss
 
Cepr08 pps act4final2
Cepr08 pps act4final2Cepr08 pps act4final2
Cepr08 pps act4final2
cepr08TAC
 
Cepr08 pps act3_equipo3_final
Cepr08 pps act3_equipo3_finalCepr08 pps act3_equipo3_final
Cepr08 pps act3_equipo3_final
cepr08TAC
 
Capt2011
Capt2011Capt2011
Administracion de inventario con demanda conocida
Administracion de inventario con demanda conocidaAdministracion de inventario con demanda conocida
Administracion de inventario con demanda conocida
promotora socio-politica
 
Prueba
PruebaPrueba
Prueba
gueste151cc
 

Andere mochten auch (20)

G:\programa de presentaciones de power point
G:\programa de presentaciones de power pointG:\programa de presentaciones de power point
G:\programa de presentaciones de power point
 
researchbrief(VFAdavid)
researchbrief(VFAdavid)researchbrief(VFAdavid)
researchbrief(VFAdavid)
 
Premio Santander Julio 2010
Premio Santander Julio 2010Premio Santander Julio 2010
Premio Santander Julio 2010
 
Europa cerrada
Europa cerradaEuropa cerrada
Europa cerrada
 
Electronic portfolio
Electronic portfolioElectronic portfolio
Electronic portfolio
 
ajay cv 2
ajay cv 2ajay cv 2
ajay cv 2
 
Vocabulario
VocabularioVocabulario
Vocabulario
 
Ofimunicipal7maio2008
Ofimunicipal7maio2008Ofimunicipal7maio2008
Ofimunicipal7maio2008
 
Whosyabuddha design by fire cafe (8-7-2013)
Whosyabuddha  design by fire cafe (8-7-2013) Whosyabuddha  design by fire cafe (8-7-2013)
Whosyabuddha design by fire cafe (8-7-2013)
 
MURAIS NADAL 09
MURAIS NADAL 09MURAIS NADAL 09
MURAIS NADAL 09
 
Patrocinios
PatrociniosPatrocinios
Patrocinios
 
Judith y holofernes
Judith y holofernesJudith y holofernes
Judith y holofernes
 
81
8181
81
 
Montandodepto
MontandodeptoMontandodepto
Montandodepto
 
Competencias
CompetenciasCompetencias
Competencias
 
Cepr08 pps act4final2
Cepr08 pps act4final2Cepr08 pps act4final2
Cepr08 pps act4final2
 
Cepr08 pps act3_equipo3_final
Cepr08 pps act3_equipo3_finalCepr08 pps act3_equipo3_final
Cepr08 pps act3_equipo3_final
 
Capt2011
Capt2011Capt2011
Capt2011
 
Administracion de inventario con demanda conocida
Administracion de inventario con demanda conocidaAdministracion de inventario con demanda conocida
Administracion de inventario con demanda conocida
 
Prueba
PruebaPrueba
Prueba
 

Mehr von Reinhold Heuvelmann

Das_Doppelhaus
Das_DoppelhausDas_Doppelhaus
Das_Doppelhaus
Reinhold Heuvelmann
 
Open Access und Lizenzangaben im MARC-Format
Open Access und Lizenzangaben im MARC-FormatOpen Access und Lizenzangaben im MARC-Format
Open Access und Lizenzangaben im MARC-Format
Reinhold Heuvelmann
 
European BIBFRAME Workshop
European BIBFRAME WorkshopEuropean BIBFRAME Workshop
European BIBFRAME Workshop
Reinhold Heuvelmann
 
RDA / MARC / BIBFRAME: some observations
RDA / MARC / BIBFRAME: some observationsRDA / MARC / BIBFRAME: some observations
RDA / MARC / BIBFRAME: some observations
Reinhold Heuvelmann
 
Zum "IFLA Library Reference Model"
Zum "IFLA Library Reference Model"Zum "IFLA Library Reference Model"
Zum "IFLA Library Reference Model"
Reinhold Heuvelmann
 
From enthusiasm to hesitation, and beyond: some German remarks on BIBFRAME
From enthusiasm to hesitation,and beyond: some German remarks on BIBFRAMEFrom enthusiasm to hesitation,and beyond: some German remarks on BIBFRAME
From enthusiasm to hesitation, and beyond: some German remarks on BIBFRAME
Reinhold Heuvelmann
 
Diakritika in Unicode
Diakritika in UnicodeDiakritika in Unicode
Diakritika in Unicode
Reinhold Heuvelmann
 
Open Access und Lizenzangaben in MARC 21 - Update
Open Access und Lizenzangaben in MARC 21 - UpdateOpen Access und Lizenzangaben in MARC 21 - Update
Open Access und Lizenzangaben in MARC 21 - Update
Reinhold Heuvelmann
 
Open Access and License Representation in MARC 21
Open Access and License Representation in MARC 21Open Access and License Representation in MARC 21
Open Access and License Representation in MARC 21
Reinhold Heuvelmann
 
Open Access und Lizenzangaben in MARC 21
Open Access und Lizenzangaben in MARC 21Open Access und Lizenzangaben in MARC 21
Open Access und Lizenzangaben in MARC 21
Reinhold Heuvelmann
 
Overview of Format Activities in Die Deutsche Bibliothek
Overview of Format Activities in Die Deutsche BibliothekOverview of Format Activities in Die Deutsche Bibliothek
Overview of Format Activities in Die Deutsche Bibliothek
Reinhold Heuvelmann
 
Provenance in MARC 21
Provenance in MARC 21Provenance in MARC 21
Provenance in MARC 21
Reinhold Heuvelmann
 
Linked Data at the German National Library
Linked Data at the German National LibraryLinked Data at the German National Library
Linked Data at the German National Library
Reinhold Heuvelmann
 
Entitäten, Relationen und mehr - Erweiterungen in MARC 21 Authority durch di...
Entitäten, Relationen und mehr - Erweiterungen in MARC 21 Authority durch di...Entitäten, Relationen und mehr - Erweiterungen in MARC 21 Authority durch di...
Entitäten, Relationen und mehr - Erweiterungen in MARC 21 Authority durch di...
Reinhold Heuvelmann
 
Some requirements for a future metadata format
Some requirements for a future metadata formatSome requirements for a future metadata format
Some requirements for a future metadata format
Reinhold Heuvelmann
 
BIBFRAME
BIBFRAMEBIBFRAME
GND and URIs: Integration and Identification
GND and URIs: Integration and IdentificationGND and URIs: Integration and Identification
GND and URIs: Integration and Identification
Reinhold Heuvelmann
 
BIBFRAME
BIBFRAMEBIBFRAME
Warum ausgerechnet BIBFRAME?
Warum ausgerechnet BIBFRAME?Warum ausgerechnet BIBFRAME?
Warum ausgerechnet BIBFRAME?
Reinhold Heuvelmann
 
BIBFRAME: Wie geht es weiter?
BIBFRAME: Wie geht es weiter?BIBFRAME: Wie geht es weiter?
BIBFRAME: Wie geht es weiter?
Reinhold Heuvelmann
 

Mehr von Reinhold Heuvelmann (20)

Das_Doppelhaus
Das_DoppelhausDas_Doppelhaus
Das_Doppelhaus
 
Open Access und Lizenzangaben im MARC-Format
Open Access und Lizenzangaben im MARC-FormatOpen Access und Lizenzangaben im MARC-Format
Open Access und Lizenzangaben im MARC-Format
 
European BIBFRAME Workshop
European BIBFRAME WorkshopEuropean BIBFRAME Workshop
European BIBFRAME Workshop
 
RDA / MARC / BIBFRAME: some observations
RDA / MARC / BIBFRAME: some observationsRDA / MARC / BIBFRAME: some observations
RDA / MARC / BIBFRAME: some observations
 
Zum "IFLA Library Reference Model"
Zum "IFLA Library Reference Model"Zum "IFLA Library Reference Model"
Zum "IFLA Library Reference Model"
 
From enthusiasm to hesitation, and beyond: some German remarks on BIBFRAME
From enthusiasm to hesitation,and beyond: some German remarks on BIBFRAMEFrom enthusiasm to hesitation,and beyond: some German remarks on BIBFRAME
From enthusiasm to hesitation, and beyond: some German remarks on BIBFRAME
 
Diakritika in Unicode
Diakritika in UnicodeDiakritika in Unicode
Diakritika in Unicode
 
Open Access und Lizenzangaben in MARC 21 - Update
Open Access und Lizenzangaben in MARC 21 - UpdateOpen Access und Lizenzangaben in MARC 21 - Update
Open Access und Lizenzangaben in MARC 21 - Update
 
Open Access and License Representation in MARC 21
Open Access and License Representation in MARC 21Open Access and License Representation in MARC 21
Open Access and License Representation in MARC 21
 
Open Access und Lizenzangaben in MARC 21
Open Access und Lizenzangaben in MARC 21Open Access und Lizenzangaben in MARC 21
Open Access und Lizenzangaben in MARC 21
 
Overview of Format Activities in Die Deutsche Bibliothek
Overview of Format Activities in Die Deutsche BibliothekOverview of Format Activities in Die Deutsche Bibliothek
Overview of Format Activities in Die Deutsche Bibliothek
 
Provenance in MARC 21
Provenance in MARC 21Provenance in MARC 21
Provenance in MARC 21
 
Linked Data at the German National Library
Linked Data at the German National LibraryLinked Data at the German National Library
Linked Data at the German National Library
 
Entitäten, Relationen und mehr - Erweiterungen in MARC 21 Authority durch di...
Entitäten, Relationen und mehr - Erweiterungen in MARC 21 Authority durch di...Entitäten, Relationen und mehr - Erweiterungen in MARC 21 Authority durch di...
Entitäten, Relationen und mehr - Erweiterungen in MARC 21 Authority durch di...
 
Some requirements for a future metadata format
Some requirements for a future metadata formatSome requirements for a future metadata format
Some requirements for a future metadata format
 
BIBFRAME
BIBFRAMEBIBFRAME
BIBFRAME
 
GND and URIs: Integration and Identification
GND and URIs: Integration and IdentificationGND and URIs: Integration and Identification
GND and URIs: Integration and Identification
 
BIBFRAME
BIBFRAMEBIBFRAME
BIBFRAME
 
Warum ausgerechnet BIBFRAME?
Warum ausgerechnet BIBFRAME?Warum ausgerechnet BIBFRAME?
Warum ausgerechnet BIBFRAME?
 
BIBFRAME: Wie geht es weiter?
BIBFRAME: Wie geht es weiter?BIBFRAME: Wie geht es weiter?
BIBFRAME: Wie geht es weiter?
 

MAB and Unicode

  • 1. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 1 MAB and Unicode • Reinhold Heuvelmann • Die Deutsche Bibliothek, Dept. IT, Office for Data Formats • heuvelmann@dbf.ddb.de
  • 2. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 2 MAB and Unicode: Overview • MAB • Relationship of MAB and Unicode • History of MAB and Unicode • Multiscript Records • Field 671 „Alternate Graphic Representation“ • Character Set Concordance MAB2 – Unicode • The German Umlaut and Unicode
  • 3. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 3 MAB • „Maschinelles Austauschformat für Bibliotheken“ = machine-readable exchange format for libraries [in Germany and Austria] • „fount-case“ („Setzkasten“) for the tranport of bibliographic data • „MAB-Auschuss“ = MAB committee • http://www.ddb.de/professionell/mab_e.htm • http://www.ddb.de/professionell/mab.htm
  • 4. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 4 Relationship of MAB and Unicode • standards • different levels: bibliographic exchange format (higher level) character set (lower level) • different frames: MAB: national / German language Unicode: internationalization • MAB uses Unicode (like other standards: IS0 646 + 5426; 639, 3166, 8601, DIN 1506 ...)
  • 5. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 5 History of MAB and Unicode (~) • 1999: CJK Libraries • 2000: Unicode in MAB • 2001: Character Set Concordance Original Script and Transliteration • 2002: Original Script and Transliteration: Field 671 • 2003+: Umlaut
  • 6. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 6 • 030 CODIERTE ANGABEN ZUM DATENSATZ • Position 2: Zeichenvorrat – 1 = MAB-Zeichenvorrat – 3 = DIN 31628, Stufe 1 – 5 = DIN 31628, Stufe 2 – 7 = DIN 31628, Stufe 3 – z = Sonstiger Zeichenvorrat • Position 3: Zeichencode – a = DIN 66003-DRV – b = DIN 66003-IRV – c = DIN 66003 + DIN 31624 – d = ISO 646 (IRV) + ISO 5426 – i = Industriestandard IBM-PC 850 („Diskette“) – u = Unicode / ISO 10646 (UTF 8) – z = Sonstiger Zeichencode
  • 7. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 7 • 030 CODIERTE ANGABEN ZUM DATENSATZ • Position 7: Transliteration/Transkription – a= Transliteration – b= Transkription – z = keine Angabe
  • 8. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 8 • 001 965633713 • 004 20021211 • 030 a|1uar|z|||37 • 036aDE • 050 ||||||||a||||| • 051 nk||z|| • 070a292 • 100bBurkhardt, Hans • 102a101292023 • 200bECCV <5, 1998, Freiburg, Breisgau> • 202a2170402-8 • 331 Computer vision • 334 Elektronische Ressource • 335 proceedings Example 1
  • 9. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 9 Example 1 (continued) • 359 ECCV '98, 5th European Conference on Computer Vision, Freiburg, Germany, June 1998. H. Burkhardt ... (ed.) • 410 Berlin ; Heidelberg • 412 Springer • 501 Lizenzpflichtig • 653 $aOnline-Ressourcen • 700 |28 • 700d|30 • 902s 4129594-8 Maschinelles Sehen • 902f11|Kongress • 902g11|Freiburg <Breisgau, 1998> • 902f11|Online-Publikation
  • 10. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 10 • 00552nM2.01200024 h • 001 965383385 • 004 20030930 • 030 g|1uar|z|||17 • 036aXA-DE • 037bger • 050 a|b||||||||||| • 051 m|||z||| • 070a292 • 100 Moxter, Adolf • 102a119195186 • 331 ¬¬¬¬Die¬¬¬¬ Grundsätze ordnungsgemäßer Rechnungslegung • 359 von Adolf Moxter • 410 Düsseldorf • 412 IDW-Verl. Example 2
  • 11. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 11 • 425 2003 • 425a2003 • 433 XXIX, 350 S. • 435 23 cm • 540aISBN 3-8021-1026-9 Pp. : EUR 58.00 • 544aDBL#2003 A 2317 • 544aDBF#2003 A 2317 • 568 02,N44,0131 • 574 03,A42,0404 • 700 |17 • 700 |19 • 700d|10.11f;7.10a/XA-DE • 902g 4011882-4 Deutschland • 902s1 4069454-9 Bilanzierungsgrundsätze • 903 21 Example 2 (continued)
  • 12. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 12 Multiscript Records
  • 13. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 13 • 00467nM2.01200024 h • 001 968543774 • 030 g|1daz|a|||17 • 036aXA-DE-NW • 037brus • 100 Giesbrecht, Agnes • 102a122352548 • 331 Echo ljubvi • 335 stichi • 359 Agnes Gizbrecht Example 3a
  • 14. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 14 • 403 1. Aufl. • 410 Lage-Hörst • 412 BMV-Verl. Burau • 425a2003 • 540aISBN 3-935000-34-0 kart. : EUR 9.90 • 700 |59 Example 3a (continued)
  • 15. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 15 • 00467nM2.01200024 h • 001 968543774 • 030 g|zuaz|z|||17 • 037brus • 100 Giesbrecht, Agnes • 102a122352548 • 331 [Main title „Echo ljubvi“ in cyrillic script] • 335 [Subtitle „stichi“ in cyrillic script] • 359 [Statement of responsibility „Agnes Gizbrecht“ in cyrillic script] Example 3b
  • 16. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 16 • 403 1. Aufl. • 410 Lage-Hörst • 412 BMV-Verl. Burau • 425a2003 • 540aISBN 3-935000-34-0 kart. : EUR 9.90 • 700 |59 Example 3b (continued)
  • 17. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 17 • 00467nM2.01200024 h • 001 968543774 • 030 g|zuaz|a|||17 • 037brus • 100 Giesbrecht, Agnes • 102a122352548 • 331 Echo ljubvi • 335 stichi • 359 Agnes Gizbrecht • 370a[Main title 331 in cyrillic script] • 370a[Subtitle 335 in cyrillic script] Example 3c
  • 18. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 18 • 403 1. Aufl. • 410 Lage-Hörst • 412 BMV-Verl. Burau • 425a2003 • 540aISBN 3-935000-34-0 kart. : EUR 9.90 • 700 |59 Example 3c (continued)
  • 19. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 19 • 00467nM2.01200024 h • 001 968543774 • 030 g|zuaz|a|||17 • 037brus • 100 Giesbrecht, Agnes • 102a122352548 • 331 [Main title „Echo ljubvi“ in cyrillic script] • 335 [Subtitle „stichi“ in cyrillic script] • 359 [Statement of responsibility „Agnes Gizbrecht“ in cyrillic script] • 370aEcho ljubvi • 370aStichi Example 3d
  • 20. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 20 • 403 1. Aufl. • 410 Lage-Hörst • 412 BMV-Verl. Burau • 425a2003 • 540aISBN 3-935000-34-0 kart. : EUR 9.90 • 700 |59 Example 3d (continued)
  • 21. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 21 Field 671 „Alternate Graphic Representation“ 1 • http://www.ddb.de/professionell/pdf/mab-671.pdf • all information in one record • field-to-field relationship original script <=> transliteration / transscription • suitable for each part of MAB (title, authorities, holdings, adresses) • MARC21 Field 880 as a model („embedded field technique“) • cf. UNIMARC and OCLC|PICA: pairs of fields
  • 22. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 22 Field 671 „Alternate Graphic Representation“ 2 • fixed part: fieldnumber + indicator + occurence of linked field codes for script + orientation of this field 671 codes for script + orientation of linked field • variable content • Script Code ISO 15924: ~ 100 scripts (http://www.evertype.com/standards/iso15924/ document/fdis15924.pdf)
  • 23. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 23 Example 3e • 00467nM2.01200024 h • 001 968543774 • 030 g|zuaz|a|||17 • 036aXA-DE-NW • 037brus • 100 Giesbrecht, Agnes • 102a122352548 • 331 Echo ljubvi • 335 stichi • 359 Agnes Gizbrecht • 403 1. Aufl.
  • 24. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 24 Example 3e (continued) • 540aISBN 3-935000-34-0 kart. : EUR 9.90 • 671 331 01CyrllLatnl[Main title 331 in cyrillic script] • 671 335 01CyrllLatnl[Subtitle 335 in cyrillic script] • 671 359 01CyrllLatnl[Statement of responsibility 359 in cyrillic script] • 700 |59
  • 25. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 25 Example 3f • 00467nM2.01200024 h • 001 968543774 • 030 g|zuaz|a|||17 • 037brus • 100 Giesbrecht, Agnes • 102a122352548 • 331 [Main title „Echo ljubvi“ in cyrillic script] • 335 [Subtitle „stichi“ in cyrillic script] • 359 [Statement of responsibility „Agnes Gizbrecht“ in cyrillic script]
  • 26. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 26 Example 3f (continued) • 540aISBN 3-935000-34-0 kart. : EUR 9.90 • 671 331 01LatnlCyrll [Version of main title 331 in roman script] • 671 335 01LatnlCyrll [Version of subtitle 335 in roman script] • 671 359 01LatnlCyrll [Version of statement of responsibility 359 in roman script] • 700 |59
  • 27. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 27 Example 4 • 00242nM2.01200024 p • 001 121873331 • 002a20000306 • 003 20001212 • 004 20020926 • 030 |azu||||||||| • 065 a||| • 070 1240 • 070a292
  • 28. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 28 Example 4 (continued) • 671 800 01JpanlLatnl[Version of heading 800 in japanese script] • 671 830 01JpanlLatnl[Version of pseudonym 830 in japanese script] • 800 Yamamoto, Tsunetomo • 801 LoC-NA • 814iSamurai, Zen-Mönch • 815a1659-1719 • 830 Furumaru ¬¬¬¬[Pseud.]¬¬¬¬
  • 29. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 29 Character Set Concordance MAB2 – Unicode • 1:1-relationship of character positions in – ISO 646 (IRV) + ISO 5426-1983 – Unicode / ISO 10646 • ... if possible • no precombination: „Ó => „A“ + „~“ only single diacritics: „~“ • http://www.ddb.de/professionell/pdf/ mab_unic.pdf
  • 30. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 30 The German Umlaut and Unicode • U+0308: COMBINING DIAERESIS = double dot above, umlaut = Greek dialytika = double derivative • Double indexing • German way – precombination – postcombination • Proposal to ISO / Unicode
  • 31. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 31 What next? • Bibliographic Exchange Formats ~ ok • Cataloguing, Typing • Transliteration, Transscription • Storing, Formatting, Converting • Indexing, Sorting • Searching, Finding • Presenting, Printing
  • 32. Die Deutsche Bibliothek Arbeitsstelle Datenformate Staatsbibliothek zu Berlin - Preußischer Kulturbesitz, 7. Oktober 2003 32 The End • Thank you for your attention and patience