Was ist sichtbar? Status Quo und Zukunft der Erschließung
      von wissenschaftlichen Inhalten in deutschen Open-Access-
      Repositorien




                                                Was BER für Berlin ist,
                                                sind Metadaten für deutsche
                                                Open-Access-Repositorien!


                                                              12. InetBib-Tagung 2013, 4. März 2013
Photo by ND Strupler: http://flic.kr/p/5DkJkY                           Maxi Kindling & Paul Vierkant
Wohin geht die Reise?


 • 2012 Census of Open Access Repositories in Germany
    • Metadatenformate
    • Sets
    • Standards
 • Datenräume
    • OAN        Census          BASE




 •   Wann sind wir endlich da?
2012 Census of
 Open Access Repositories in Germany



 141
                                             Repositories in                                             Amount of Items in
                                               Germany                                                   the Bundesländer

                                                              4                                                            60k

 Open Access Repositories
                                                                               1                                                                  1k
                                                                  5                                                              30k
                                                                                                                     31k
                                                      2


                                                                                                                                                        63k
                                                              11
 SIZE
                                                                                                                           18k
                                                                                       11


 HOSTING                                                                  2                 8                                                6k              8k




 VALUE-ADDED SERVICES                        27                                                           198k
 LANGUAGE                                                             1
                                                                                   4
                                                                                                                                       7k
                                                                                                                                                       15k




 SOFTWARE
                                                          8                                                          54k


 DINI                                            4                                                              6k



 REGISTRIES                                  3                                                            10k



 OPEN ACCESS
                                                     28                   22                                         78k
                                                                                                                                            117k




METADATA FORMATS
   99%            4%          30%         43%                         13%                       66%

   Simple       Qualified    XMetaDiss   XMetaDiss-                   METS                      Epicur
 Dublin Core   Dublin Core                 Plus
                                                                                                                urn:nbn:de:kobv:11-100204211
Sets
<setSpec>open_access</setSpec>




     18%
Sets
<setSpec>doc-type:article</setSpec>
<setSpec>doc-type:Text</setSpec>




     17%
Sets
<setSpec>ddc:510</setSpec>




     65%
Standards                                                          1




ISO-Norm 639-3                                          ISO-Norm 8601
  deu, eng                                                 YYYY-MM-DD




      54%                                                                  88%
        1
            (200 randomly chosen items getestet gegen das DINI-Zertifikat 2010, überprüft am 2012-09-20)
Datenräume
 Census DINI
               31%
         39%
Open Access Netzwerk


Initiiert durch:                          Projektpartner:
                                                Computer- und Medienservice
                                                Institut für Bibliotheks- und
                                                Informationswissenschaft (seit 2009)




   Gefördert                                    Fachbereich Mathematik/Informatik


        von:
                   2007-2009, 2009-2012
OAN-Datenraum
•   44 DINI-zertifizierte              Datenraum
    Repositorien (03/13)
•   Datenworkflow
                                      •   280.000 Datensätze
    • Aggregation
                                      •   ~ 150.000 Open-Access-
    • Harmonisierung
                                          Volltexte (03/13)
    • Volltext-Link-Finder &
      Indexierung
    • Klassifikation & Deduplikation
•   Webbasiertes Administrations-
    Tool
•   DINI-OAI-Validator
Herkunft
              9k                  20k Berlin   50k Baden-Württemberg      112k Nordrhein-Westfalen
         Sachsen




0.28m
              6k          7k            8k
        Branden-      Hessen        Bayern
            burg

                                                 45k Schleswig-Holstein

            2.8k         5.5k
        Nieder-     Saarland            7.4k
        sachsen                   Thüringen
            2k
        Bremen              5k
                   Rheinland-
                          Pfalz
        1.2k HH




36m
Sprache
            21k Unknown   113k English   134k German




   8%
unbekannt
              13k Other




 34%
unbekannt
Dokumenttyp
  16%                                    94k
                                     Reports, Papers,

unbekannt                   16k
                             Books
                                        Lectures
                                                                      34k
                                                                      Theses


                                                                                    0.43k Images



                  30k                     46k
                  Other                   unknown or
                                           incorrect
                                                                               58k
             1.2k Reviews
                                                                        Article, Journals

            0.029k Sheet Music

                  0.35k Videos




                                                                                          1.22m             1.2m
                                                                                         Reports, Papers,      Books
                                                                                            Lectures
                                                                          1.43m                                            0.48m
                                                                                                                           Primary
                                                                               Theses                                       Data
                                                                                                                                     0.05m Reviews
                                                                                                                                        0.049m Maps




 61%
                                                         2.9m
                                                                                                                                           0.048m Sheet Music
                                                                                                                                              0.029m Audio
                                                             Images
                                                                                                                                                0.02m Videos




                                                                                        22m
                                                                                                                                                 0.003m Software




unbekannt                                  6.63m
                                              Article, Journals
                                                                                                    unknown or incorrect
DDC-Sachgruppe
  33%
                                                         Technology                                   74.7k

                                                  Science
                                                                       23.7k



unbekannt   Social Sciences                      59.3k


                        Arts and
                       Recreation
                                    3.3k                                                           92k
                                                                                                    unknown or
                                                                                                    incorrect
                History and Geography   3.2k



                                                 17.7k
            Computer Science

                                    Philosophy and Psychology   3.4k



                                                       Language 1.5k


                                                                       Religion 0.8k

                                                                                               Literature 0.9k




92%
                                                                                                                       0.91m         Technology




                                                                                                                                    0.8m              Science




                                                          33.1m
                                                                                                                                              0.73m         Social Sciences




                                                                                                                                               0.27m       Arts and Recreation




unbekannt
                                                                        Unknown or Incorrect                                                   0.2m       History and Geography



                                                                                                                                        0.22m          Computer Science



                                                                                                                                    0.14m      Philosophy and Psychology


                                                                                                                                     Language 0.09m


                                                                                                                            Religion 0.047m

                                                                                                                 Literature 0.04m
Wann sind wir endlich da?

• OAN-Datenraum gewährleistet
  Interoperabilität und Sichtbarkeit
  durch Standardkonformität!
• DINI-Zertifikat macht Sinn!
• DINI-Datenraum DINI-Zertifikat 2013
  geht neue Wege!

Was ist sichtbar? Status Quo und Zukunft der Erschließung von wissenschaftlichen Inhalten in deutschen Open-Access-Repositorien

  • 1.
    Was ist sichtbar?Status Quo und Zukunft der Erschließung von wissenschaftlichen Inhalten in deutschen Open-Access- Repositorien Was BER für Berlin ist, sind Metadaten für deutsche Open-Access-Repositorien! 12. InetBib-Tagung 2013, 4. März 2013 Photo by ND Strupler: http://flic.kr/p/5DkJkY Maxi Kindling & Paul Vierkant
  • 2.
    Wohin geht dieReise? • 2012 Census of Open Access Repositories in Germany • Metadatenformate • Sets • Standards • Datenräume • OAN Census BASE • Wann sind wir endlich da?
  • 3.
    2012 Census of Open Access Repositories in Germany 141 Repositories in Amount of Items in Germany the Bundesländer 4 60k Open Access Repositories 1 1k 5 30k 31k 2 63k 11 SIZE 18k 11 HOSTING 2 8 6k 8k VALUE-ADDED SERVICES 27 198k LANGUAGE 1 4 7k 15k SOFTWARE 8 54k DINI 4 6k REGISTRIES 3 10k OPEN ACCESS 28 22 78k 117k METADATA FORMATS 99% 4% 30% 43% 13% 66% Simple Qualified XMetaDiss XMetaDiss- METS Epicur Dublin Core Dublin Core Plus urn:nbn:de:kobv:11-100204211
  • 4.
  • 5.
  • 6.
  • 7.
    Standards 1 ISO-Norm 639-3 ISO-Norm 8601 deu, eng YYYY-MM-DD 54% 88% 1 (200 randomly chosen items getestet gegen das DINI-Zertifikat 2010, überprüft am 2012-09-20)
  • 8.
  • 9.
    Open Access Netzwerk Initiiertdurch: Projektpartner: Computer- und Medienservice Institut für Bibliotheks- und Informationswissenschaft (seit 2009) Gefördert Fachbereich Mathematik/Informatik von: 2007-2009, 2009-2012
  • 10.
    OAN-Datenraum • 44 DINI-zertifizierte Datenraum Repositorien (03/13) • Datenworkflow • 280.000 Datensätze • Aggregation • ~ 150.000 Open-Access- • Harmonisierung Volltexte (03/13) • Volltext-Link-Finder & Indexierung • Klassifikation & Deduplikation • Webbasiertes Administrations- Tool • DINI-OAI-Validator
  • 11.
    Herkunft 9k 20k Berlin 50k Baden-Württemberg 112k Nordrhein-Westfalen Sachsen 0.28m 6k 7k 8k Branden- Hessen Bayern burg 45k Schleswig-Holstein 2.8k 5.5k Nieder- Saarland 7.4k sachsen Thüringen 2k Bremen 5k Rheinland- Pfalz 1.2k HH 36m
  • 12.
    Sprache 21k Unknown 113k English 134k German 8% unbekannt 13k Other 34% unbekannt
  • 13.
    Dokumenttyp 16% 94k Reports, Papers, unbekannt 16k Books Lectures 34k Theses 0.43k Images 30k 46k Other unknown or incorrect 58k 1.2k Reviews Article, Journals 0.029k Sheet Music 0.35k Videos 1.22m 1.2m Reports, Papers, Books Lectures 1.43m 0.48m Primary Theses Data 0.05m Reviews 0.049m Maps 61% 2.9m 0.048m Sheet Music 0.029m Audio Images 0.02m Videos 22m 0.003m Software unbekannt 6.63m Article, Journals unknown or incorrect
  • 14.
    DDC-Sachgruppe 33% Technology 74.7k Science 23.7k unbekannt Social Sciences 59.3k Arts and Recreation 3.3k 92k unknown or incorrect History and Geography 3.2k 17.7k Computer Science Philosophy and Psychology 3.4k Language 1.5k Religion 0.8k Literature 0.9k 92% 0.91m Technology 0.8m Science 33.1m 0.73m Social Sciences 0.27m Arts and Recreation unbekannt Unknown or Incorrect 0.2m History and Geography 0.22m Computer Science 0.14m Philosophy and Psychology Language 0.09m Religion 0.047m Literature 0.04m
  • 15.
    Wann sind wirendlich da? • OAN-Datenraum gewährleistet Interoperabilität und Sichtbarkeit durch Standardkonformität! • DINI-Zertifikat macht Sinn! • DINI-Datenraum DINI-Zertifikat 2013 geht neue Wege!