SlideShare ist ein Scribd-Unternehmen logo
FHP:-)
                                                                                   FHP:-)
                   Fachbereich für Informationswissenschaften der Fachhochschule
                                              Potsdam


                                                                                    1




                    Mikroformate für Bibliographische Daten
                  Vergleich verschiedener Konzepte zur semantischen
                                          Annotation
                                 Carsten M. Schulze
06.11.08




                                   6. November 2008
Carsten Schulze
FHP:-)
                                                                               FHP:-)
                                        Übersicht

                                                                                2


                  Warum brauchen wir Mikroformate für bibliographische
                  Daten?
                  –   Der Kontext von bibliographischen Daten im Web
                  –   Produktion und Nachnutzung von bibliographischen Daten
                      für die Wissenschaft
                  –   Probleme der Nachnutzung von bibliographischen Daten
                  –   Lösungsansätze
06.11.08




                  Mikroformate für bibliographische Daten
Carsten Schulze




                  –   COinS, unAPI, Citation Microformat, (eRDF) und RDFa
FHP:-)
                                                                                   FHP:-)
                                     Bibliographische Daten

                                                                                    3

                  Zur Identifikation und zur formalen Beschreibung einer Schrift
                  wichtige Daten in standardisierter Reihenfolge
                  [DIN 1505, 1]
                  bibliographische Angaben in digitaler Form
                   –   Formalerschließung. NICHT Sacherschließung
                  keine definierte Präsentationsform
                   –   abhängig von Wissensgemeinde
06.11.08




                  keine definierten Bestandteile
                   –   abhängig von Kontext
Carsten Schulze




                  Überbegriff: Metadaten
                   –   formal, inhaltlich, Nutzung, Rechte
FHP:-)
                                                                FHP:-)
                  Bibliographische Daten: Präsentationsformen

                                                                 4




                              bibliographische Daten
06.11.08
Carsten Schulze
Carsten Schulze   06.11.08




                                      5




                             <HTML>
                                          FHP:-)
                                          FHP:-)
Bibliographische Daten: Entstehung und




                                                                                  FHP:-)
                                                                                  FHP:-)
                                    Rezeption
                                                                                   6




                  Wissenschaftler
06.11.08




                                                             Organisation von Information
Carsten Schulze




                                    bibliographische Daten
FHP:-)
                                                                    FHP:-)
                              Literaturverwaltung

                                                                     7
                                              Literaturverwaltung




                  Wissenschaftler
06.11.08
Carsten Schulze
FHP:-)
                                                                                    FHP:-)
                                   Literaturverwaltung: Import

                                                                                     8
             Literaturverwaltung

                                                    bibliographische Daten im Web

                                       Copy&Paste
06.11.08
Carsten Schulze
FHP:-)
                                                                                                 FHP:-)
                                    Literaturverwaltung: Import

                                                                                                     9
              Literaturverwaltung

                                                     bibliographische Daten im Web


                                                                       bibliographische Daten als
                                                                     textbasiertes Austauschformat


                                         Importfilter + Copy&Paste
06.11.08
Carsten Schulze
FHP:-)
                                                                                                  FHP:-)
                                    Literaturverwaltung: Import

                                                                                                      10
              Literaturverwaltung

                                                        bibliographische Daten im Web


                                                                        bibliographische Daten als
                                                                      textbasiertes Austauschformat




                                                          bibliographische Daten
06.11.08




                                                            als standardisiertes
                                                            Übergabeprotokoll
                                        Effizienz durch direkten Import
Carsten Schulze
FHP:-)
                                                                                                   FHP:-)
                                    Literaturverwaltung: Import

                                                                                                       11
              Literaturverwaltung

                                                        bibliographische Daten im Web

                                        Copy&Paste


                        Interoperabilität ???                            bibliographische Daten als
                                                                       textbasiertes Austauschformat


                                           Importfilter + Copy&Paste


                                                          bibliographische Daten
06.11.08




                                                            als standardisiertes
                                                            Übergabeprotokoll
                                        Effizienz durch direkten Import
Carsten Schulze
FHP:-)
                                                                               FHP:-)
                              Metadateneinbindung in HTML

                                                                               12


                  Eine Möglichkeit:
                   –   Einbindung im <head>-Bereich von HTML-Seiten
                   –   bekannt durch Dublin Core
                  Dublin Core Metadata Initiative (DCMI)
                   –   Dublin Core Metadata Element Set (DCMES)
                   –   Dublin Core Metadata Terms (DCTERMS)
06.11.08




                   –   Beschreibung von Webressourcen
                  andere Vokabulare:
Carsten Schulze




                   –   FOAF                             , address, Time etc.
FHP:-)
                                                           FHP:-)
                  Metadateneinbindung in HTML: Nachteile

                            Autor, Titel, Datum etc.       13



   Metadateneinbindung im
       <head>-Bereich

                                Web Dokument
                             Inhalt 1
                             Inhalt 2
                             Inhalt 3
                             Inhalt 4
06.11.08




                                ...
Carsten Schulze
Carsten Schulze   06.11.08



                                  Beispiel I
                             14




                                  FHP:-)
                                  FHP:-)
FHP:-)
                                   FHP:-)
                                   15




                  Mehrdeutigkeit
                      ----
                   ambiguity
06.11.08
Carsten Schulze
FHP:-)
                                                           FHP:-)
                  Metadateneinbindung in HTML: Nachteile

                            Autor, Titel, Datum etc.       16



   Metadateneinbindung im
       <head>-Bereich

                                Web Dokument
                             Inhalt 1
                             Inhalt 2
                             Inhalt 3
                             Inhalt 4
06.11.08




                                ...
Carsten Schulze
FHP:-)
                                                                    FHP:-)
                                    Semantic Web: RDF

                                                                    17


                  beschreibt Ressourcen und ihre Beziehungen
                  ausgedrückt durch Tripel
                   –   Ressource, Eigenschaft, Wert
                   Subjekt                        Objekt /Subjekt
                                     Prädikat

                  domänenkontrollierte Bedeutung
06.11.08




                   –   Namespaces
Carsten Schulze
FHP:-)
                                                                                             FHP:-)
                                  RDF-Syntax: XML Serialisierung

                                                                                              18

                  <rdf:RDF
                  xmlns:rdf=quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#quot;
                  xmlns:dcterms=quot;http://purl.org/dc/terms/quot;
                  xmlns:bibo=quot;http://purl.org/ontology/bibo/quot;>
                  <rdf:Description rdf:about=quot;http://www.collidoscope.de/markup/APA.html#ref5quot;>
                          <dcterms:date>1993</dcterms:date>
                          <bibo:contributer rdf:parseType=quot;Resourcequot;>
                             <rdf:type rdf:resource=quot;http://xmlns.com/foaf/0.1/Personquot;/>
                             <foaf:family_name xml:lang=quot;enquot;>Okuda</foaf:family_name>
06.11.08




                             <foaf:givenname xml:lang=quot;enquot;>M.</foaf:givenname>
                          </bibo:contributer>
                  </rdf:Description>
Carsten Schulze




                  [...]
FHP:-)
                                                                                          FHP:-)
                                           RDF-Syntax: Turtle

                                                                                          19



                  @prefix      dcterms:    <http://purl.org/dc/terms/>.

                  @prefix      foaf:       <http://xmlns.com/foaf/0.1/>.

                  @prefix      bibo:       <http://purl.org/ontology/bibo/>


                  :ref5     dcterms:date       quot;1993quot; ;

                            bibo:contributer   [ a    foaf:Person;

                                                      foaf:family_name     quot;Okudaquot;@en ;
                                                      foaf:givenname       quot;M.quot;@en ] .
06.11.08




                  [...]
Carsten Schulze
FHP:-)
                                                                FHP:-)
                              Semantic Web: Probleme

                                                                20
                  Nicht zur Rezeption durch Menschen geeignet
                  „schwer zu verstehende“ Spezifikationen
                  bisher wenig Anwendungen
                  Nutzen schwer zu vermitteln
                  Henne-Ei-Problem
06.11.08
Carsten Schulze
FHP:-)
                                                                        FHP:-)
                                          Mikroformate

                                                                         21
                  „Semantic Web von Unten“
                  entstanden im Web 2.0-Kontext
                   –   Microformats.org
                   –   Kontakt-, Kalender-, Lizenzinformationen etc.
                  Datenformatierungen: zeichnen Daten dort semantisch aus, wo
                  sie rezipiert werden: in HTML
                   –   humans first machines second...
06.11.08




                  nutzen die HTML-Infrastruktur
Carsten Schulze




                   –   HTML-Attribut @class etc.
                  Semantik stützt sich auf Konventionen
FHP:-)
                                                               FHP:-)
                                                               22

                                    MICROFORMTAS
                  „Designed for humans first and machines second,
                               microformats are a set of
                                      simple, open
                                      data formats
                  built upon existing and widely adopted standards.“
06.11.08




                                    microformats.org
Carsten Schulze
Carsten Schulze   06.11.08




                                  Beispiel II
                             23




                                  FHP:-)
                                  FHP:-)
FHP:-)
                                                                            FHP:-)
                                Mikroformate: Definition

                                                                            24
                   Meine Definition:
                     Jede Konvention, die (X)HTML-Infrastruktur nutzt, um
                     Daten semantisch zu annotieren.
                   Mikroformat ∉ Microformat / Microformat ∈ Mikroformat



              Mikroformate                                  Microformats
                 COinS
                                                             ●
                                                               hCard
06.11.08




               ●

               ●
                 (unAPI)
                                                             ●
                                                               hCalendar
                 Microformats
                                                             ●
                                                               hCitation
Carsten Schulze




               ●

               ●
                 eRDF / RDFa
                                                             ●
                                                               etc.
FHP:-)
                                                                           FHP:-)
                                        Mikroformate: Vorteile

                                                                           25
                  eher zugänglich als SW-Technologien
                                                                 The Web
                   –   humans fist...
                   –   einfache Syntax
                  keine Redundanzen
                   –   abhängig vom MF-Konzept
                  Einbindung ins SW (durch GRDDL ...)
                  direkter Nutzen / Problemlösung
06.11.08




                  z. T. schon Anwendungen vorhanden
Carsten Schulze




                  Interaktion mit dem Browser
                   –   Screen Scraping
FHP:-)
                                                                    FHP:-)
                  Mikroformate für bibliographische Daten

                                                                     26
                                                    SW-Applikationen




                                                    Literaturverwaltung
06.11.08
Carsten Schulze
Carsten Schulze   06.11.08




                             COinS
                                     27




                                          FHP:-)
                                          FHP:-)
FHP:-)
                                                                               FHP:-)
                                   OpenURL COinS

                                                                               28
                                                           Basis-URL
                  http://www.openurl.de/?
                  ctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:jou
                  rnal&rft.title=Ariadne&rft.aulast=Chudnov&rft.atitle=Openi
                  ng+up+OpenURLs+with+Autodiscovery&rft.issue=43&rft.iss
                  n=1361-3200&rft.date=2005-04&rft_id=http://www.aria
                  dne.ac.uk/issue43/chudnov/&url_ver=Z39.88-2004
06.11.08
Carsten Schulze




                                    OpenURL KEV ContextObject
FHP:-)
                                                                                 FHP:-)
                                          OpenURL COinS

                                                                                 29
                     Context Object in SPAN (COinS)
                     OpenURL Standard Z39.88
                      –   Key Encoded Value (KEV) ContextObject
                           ●
                               Key[1]=Value[1]&Key[2]=Value[2]&Key[n]=Value[n]




                     COinS Syntax:
06.11.08




                  <span class=“Z3988“ title=“OpenURL-KEV-ContextObject“>
Carsten Schulze
Carsten Schulze   06.11.08




                              Beispiel III
                             30




                                  FHP:-)
                                  FHP:-)
FHP:-)
                                                                            FHP:-)
                                    COinS: Diskussion

                                                                            31


                  Vorteile:
                   –   einfache Syntax, hohe Softwareunterstützung, weite
                       Verbreitung
                  Nachteile:
                   –   begrenzt durch OpenURL-Standard (skaliert nicht)
                   –   keine Relationen, redundante Daten
06.11.08
Carsten Schulze
Carsten Schulze   06.11.08




                             unAPI
                                     32




                                          FHP:-)
                                          FHP:-)
FHP:-)
                                                                                        FHP:-)
                                                unAPI

                                                                                            33
                  Aussprache beliebig
                  besteht aus drei Teilen:
                   –   Mikroformat / Konvention zur Identifikation
                        ●
                            <abbr class=“unapi-id“ title=“urn:isbn:1590598148“>
                   –   <link>-Tag automatische Erkennung der unAPI-Server
                        ●
                            <link rel=“unapi-server“ type=“application/xml“ title=“unAPI“
                            href=“unapi.php“ />
06.11.08




                   –   unAPI-Server bestehend aus drei HTTP-Funktionen
Carsten Schulze




                                                +       strukturierte
                                                        Datenbasis
FHP:-)
                                                                                                     FHP:-)
                           unAPI: Content Negotiation

                                                                                                      34




     Anwendung                                                                                  unAPI-Server
                                    1. Anfrage: http://example.com/unapi.php



                                      2. Antwort: Liste von Formaten in XML


                        3. Anfrage: http://example.com/unapi.php?id=urn:isbn:1590598148



                            4. Antwort: Liste von Formaten für die übergebene ID in XML
06.11.08




                  5. Anfrage: http://example.com/unapi.php?id=urn:isbn:1590598148&format=mods
Carsten Schulze




                                 6. Antwort: Datensatz in dem gewünschten Format
Carsten Schulze   06.11.08




                              Beispiel IV
                             35




                                  FHP:-)
                                  FHP:-)
FHP:-)
                                                               FHP:-)
                                     unAPI: Diskussion

                                                               36


                  Vorteile:
                   –   frei definierbare Datenformate
                   –   keine Redundanzen
                   –   Transport digitaler Objekte
                  Nachteile:
                   –   erhöhter Programmieraufwand
06.11.08




                   –   strukturierte Datenbasis erforderlich
                   –   kein bidirektionaler Transport
Carsten Schulze
Carsten Schulze   06.11.08




                             hCite / h3988
                                             37




                                                  FHP:-)
                                                  FHP:-)
FHP:-)
                                                                               FHP:-)
                                     Citation Microformat

                                                                               38


                  nutzt bereits bestehende Microformats (Compound)
                  soll definierte Probleme lösen
                  Definition der Bestandteile basiert auf formalen Verfahren
                   –   real world examples
                        ●
                            Bestandteile bibliographischer Beschreibung
                        ●
                            Kategorien bibliographischer Formate
06.11.08




                  es existieren mittlerweile zwei Markup-Vorschläge
                   –   hCite und h3988
Carsten Schulze
FHP:-)
                                                                                                FHP:-)
                                               hCite: Syntax

                                                                                                 39

                  <div class=“hcite“>
                     <div class=“monograph“> / <div class=“type“>Monograph
                       <span class=quot;author firstauthorquot;>
                           <span class=quot;family-namequot;>Allsopp</span>,
                           <span class=quot;given-namequot;>John</span>
                       </span>
                       (<span class=quot;yearquot;>2006</span>):
                       <span class=quot;titlequot;>Microformats: empowering your Markup for
                       Web 2.0</span>
                     </div>
06.11.08




                  </div>
Carsten Schulze




                               Darstellung:

                               Allsopp, John (2006): Microformats: empowering your Markup for Web 2.0
FHP:-)
                                                                                                  FHP:-)
                                                h3988: Syntax

                                                                                                   40

                  <div class=“h3988 mfo“>
                     <span class=quot;au vcardquot;>
                       <span class=quot;fn nquot;>
                           <span class=quot;family-namequot;>Allsopp</span>,
                           <span class=quot;given-namequot;>John</span>
                       </span>
                       (<span class=quot;datequot;>2006</span>):
                       <span class=quot;btitlequot;>Microformats: empowering your Markup for Web
                       2.0</span>
                  </div>
06.11.08
Carsten Schulze




                                 Darstellung:

                                 Allsopp, John (2006): Microformats: empowering your Markup for Web 2.0
FHP:-)
                                                                           FHP:-)
                          Citation Microformat: Diskussion

                                                                           41


                  Vorteile:
                   –   einfache Syntax
                   –   keine Redundanzen
                   –   hohe Softwareunterstützung (ist zu erwarten)
                  Nachteile:
                   –   Anpassungen nur durch quasidemokratischen Prozess
                       (skaliert nicht)
06.11.08




                   –   wenig oder keine Relationen
Carsten Schulze
Carsten Schulze   06.11.08




                             RDFa
                                    42




                                         FHP:-)
                                         FHP:-)
FHP:-)
                                                                                             FHP:-)
                                         eRDF & RDFa

                                                                                             43


                       ähnliche Ansätze: Einbettung von RDF in HTML
                       unterschiedliche Ausdrucksfähigkeit
                                                   Interpretation durch
                                                   eRDF-Parser
                  (X)HTML + eRDF                                                XHTML + RDFa

                                            RDF-Teilmenge

                                            RDF-Teilmenge
06.11.08




                                                 RDF
Carsten Schulze




                                                                      Interpretation durch
                                                                      RDFa-Parser
FHP:-)
                                                                          FHP:-)
                                            RDFa

                                                                          44


                  erweitert XHTML mit neuen Attribute:
                   –   @about, @property, @resource, @datatype, @typeof
                  Nutzung von Compact URIs (CURIEs)
                   xmlns:bibo=“http://purl.org/ontology/bibo/“
                   <span typeof=“bibo:Article“>
                   --> http://purl.org/ontology/bibo/Article
06.11.08
Carsten Schulze
Carsten Schulze   06.11.08




                                  Beispiel V
                             45




                                  FHP:-)
                                  FHP:-)
FHP:-)
                                                                          FHP:-)
                                      RDFa: Diskussion

                                                                          46

                  Vorteile RDFa:
                   –   Nutzung von Namespaces (skaliert)
                   –   hohe RDF-Aussagekraft
                   –   Relationen
                   –   W3C-Recommendation (14.10.2008)
                   –   Daten sind Teil des Semantic Web
06.11.08




                  Nachteile RDFa
                   –   teilweise komplizierte Verschachtelung notwendig
Carsten Schulze




                   –   noch wenig Anwendungen
FHP:-)
                                                                            FHP:-)
                                  Zusammenfassung

                                                                            47


                  interoperable bibliographische Daten sind für ein
                  effizientes wissenschaftliches Arbeiten unverzichtbar
                  Semantic Web Technologien sind teilweise kompliziert und
                  es gibt nur wenige Anwendungen
                  Mikroformate sind eine einfache Art Daten semantisch in
                  HTML auszuzeichnen
                  es gibt mehrere Konzepte von Mikroformaten für
06.11.08




                  bibliographische Daten
                  ein Vergleich dieser Konzepte ist nur für den konkreten
Carsten Schulze




                  Anwendungsfall sinnvoll





                                         FHP:-)
                                         FHP:-)
                                         48




                  Vielen Dank für ihre
                    Aufmerksamkeit!
                  www.collidoscope.de
06.11.08
Carsten Schulze

Weitere ähnliche Inhalte

Andere mochten auch

6 Beispiele für die nützliche Anwendung von Mikroformaten
6 Beispiele für die nützliche Anwendung von Mikroformaten6 Beispiele für die nützliche Anwendung von Mikroformaten
6 Beispiele für die nützliche Anwendung von Mikroformaten
Michael Jendryschik
 
Offener Katalog - Nachnutzung von Metadaten über eine serviceorientierte Syst...
Offener Katalog - Nachnutzung von Metadaten über eine serviceorientierte Syst...Offener Katalog - Nachnutzung von Metadaten über eine serviceorientierte Syst...
Offener Katalog - Nachnutzung von Metadaten über eine serviceorientierte Syst...
Martin Blenkle
 
Die drei dicken B des Bibliothekswesens
Die drei dicken B des Bibliothekswesens Die drei dicken B des Bibliothekswesens
Die drei dicken B des Bibliothekswesens
Christian Hauschke
 
Not our patrons
Not our patronsNot our patrons
Not our patrons
Christian Hauschke
 
MOOC und OER - Warum, wieso, weshalb, wozu?
MOOC und OER - Warum, wieso, weshalb, wozu?MOOC und OER - Warum, wieso, weshalb, wozu?
MOOC und OER - Warum, wieso, weshalb, wozu?
Martin Ebner
 
Expocicion final
Expocicion finalExpocicion final
Expocicion final
Juan Pavon ortiz
 
JIF, altmetrics, Bibliometrie & Co. Was ist das und wie hilft es mir bei mein...
JIF, altmetrics, Bibliometrie & Co. Was ist das und wie hilft es mir bei mein...JIF, altmetrics, Bibliometrie & Co. Was ist das und wie hilft es mir bei mein...
JIF, altmetrics, Bibliometrie & Co. Was ist das und wie hilft es mir bei mein...
Daniel Beucke
 

Andere mochten auch (9)

6 Beispiele für die nützliche Anwendung von Mikroformaten
6 Beispiele für die nützliche Anwendung von Mikroformaten6 Beispiele für die nützliche Anwendung von Mikroformaten
6 Beispiele für die nützliche Anwendung von Mikroformaten
 
COinS und Zotero
COinS und ZoteroCOinS und Zotero
COinS und Zotero
 
Offener Katalog - Nachnutzung von Metadaten über eine serviceorientierte Syst...
Offener Katalog - Nachnutzung von Metadaten über eine serviceorientierte Syst...Offener Katalog - Nachnutzung von Metadaten über eine serviceorientierte Syst...
Offener Katalog - Nachnutzung von Metadaten über eine serviceorientierte Syst...
 
Die drei dicken B des Bibliothekswesens
Die drei dicken B des Bibliothekswesens Die drei dicken B des Bibliothekswesens
Die drei dicken B des Bibliothekswesens
 
Not our patrons
Not our patronsNot our patrons
Not our patrons
 
MOOC und OER - Warum, wieso, weshalb, wozu?
MOOC und OER - Warum, wieso, weshalb, wozu?MOOC und OER - Warum, wieso, weshalb, wozu?
MOOC und OER - Warum, wieso, weshalb, wozu?
 
Keynote WissKom12
Keynote WissKom12Keynote WissKom12
Keynote WissKom12
 
Expocicion final
Expocicion finalExpocicion final
Expocicion final
 
JIF, altmetrics, Bibliometrie & Co. Was ist das und wie hilft es mir bei mein...
JIF, altmetrics, Bibliometrie & Co. Was ist das und wie hilft es mir bei mein...JIF, altmetrics, Bibliometrie & Co. Was ist das und wie hilft es mir bei mein...
JIF, altmetrics, Bibliometrie & Co. Was ist das und wie hilft es mir bei mein...
 

Mehr von Carsten Klee

Friend of a friend (foaf)
Friend of a friend (foaf)Friend of a friend (foaf)
Friend of a friend (foaf)Carsten Klee
 
Metadaten und Zeitungen
Metadaten und ZeitungenMetadaten und Zeitungen
Metadaten und ZeitungenCarsten Klee
 
Linked data und digitalisierungsprojekte
Linked data und digitalisierungsprojekteLinked data und digitalisierungsprojekte
Linked data und digitalisierungsprojekteCarsten Klee
 
easyM2R
easyM2ReasyM2R
easyM2R
Carsten Klee
 
Ibi klee 2014-04-15
Ibi klee 2014-04-15Ibi klee 2014-04-15
Ibi klee 2014-04-15
Carsten Klee
 

Mehr von Carsten Klee (7)

Metadaten
MetadatenMetadaten
Metadaten
 
Friend of a friend (foaf)
Friend of a friend (foaf)Friend of a friend (foaf)
Friend of a friend (foaf)
 
Fedora
FedoraFedora
Fedora
 
Metadaten und Zeitungen
Metadaten und ZeitungenMetadaten und Zeitungen
Metadaten und Zeitungen
 
Linked data und digitalisierungsprojekte
Linked data und digitalisierungsprojekteLinked data und digitalisierungsprojekte
Linked data und digitalisierungsprojekte
 
easyM2R
easyM2ReasyM2R
easyM2R
 
Ibi klee 2014-04-15
Ibi klee 2014-04-15Ibi klee 2014-04-15
Ibi klee 2014-04-15
 

Mikroformate fuer bibliographische Daten

  • 1. FHP:-) FHP:-) Fachbereich für Informationswissenschaften der Fachhochschule Potsdam 1 Mikroformate für Bibliographische Daten Vergleich verschiedener Konzepte zur semantischen Annotation Carsten M. Schulze 06.11.08 6. November 2008 Carsten Schulze
  • 2. FHP:-) FHP:-) Übersicht 2 Warum brauchen wir Mikroformate für bibliographische Daten? – Der Kontext von bibliographischen Daten im Web – Produktion und Nachnutzung von bibliographischen Daten für die Wissenschaft – Probleme der Nachnutzung von bibliographischen Daten – Lösungsansätze 06.11.08 Mikroformate für bibliographische Daten Carsten Schulze – COinS, unAPI, Citation Microformat, (eRDF) und RDFa
  • 3. FHP:-) FHP:-) Bibliographische Daten 3 Zur Identifikation und zur formalen Beschreibung einer Schrift wichtige Daten in standardisierter Reihenfolge [DIN 1505, 1] bibliographische Angaben in digitaler Form – Formalerschließung. NICHT Sacherschließung keine definierte Präsentationsform – abhängig von Wissensgemeinde 06.11.08 keine definierten Bestandteile – abhängig von Kontext Carsten Schulze Überbegriff: Metadaten – formal, inhaltlich, Nutzung, Rechte
  • 4. FHP:-) FHP:-) Bibliographische Daten: Präsentationsformen 4 bibliographische Daten 06.11.08 Carsten Schulze
  • 5. Carsten Schulze 06.11.08 5 <HTML> FHP:-) FHP:-)
  • 6. Bibliographische Daten: Entstehung und FHP:-) FHP:-) Rezeption 6 Wissenschaftler 06.11.08 Organisation von Information Carsten Schulze bibliographische Daten
  • 7. FHP:-) FHP:-) Literaturverwaltung 7 Literaturverwaltung Wissenschaftler 06.11.08 Carsten Schulze
  • 8. FHP:-) FHP:-) Literaturverwaltung: Import 8 Literaturverwaltung bibliographische Daten im Web Copy&Paste 06.11.08 Carsten Schulze
  • 9. FHP:-) FHP:-) Literaturverwaltung: Import 9 Literaturverwaltung bibliographische Daten im Web bibliographische Daten als textbasiertes Austauschformat Importfilter + Copy&Paste 06.11.08 Carsten Schulze
  • 10. FHP:-) FHP:-) Literaturverwaltung: Import 10 Literaturverwaltung bibliographische Daten im Web bibliographische Daten als textbasiertes Austauschformat bibliographische Daten 06.11.08 als standardisiertes Übergabeprotokoll Effizienz durch direkten Import Carsten Schulze
  • 11. FHP:-) FHP:-) Literaturverwaltung: Import 11 Literaturverwaltung bibliographische Daten im Web Copy&Paste Interoperabilität ??? bibliographische Daten als textbasiertes Austauschformat Importfilter + Copy&Paste bibliographische Daten 06.11.08 als standardisiertes Übergabeprotokoll Effizienz durch direkten Import Carsten Schulze
  • 12. FHP:-) FHP:-) Metadateneinbindung in HTML 12 Eine Möglichkeit: – Einbindung im <head>-Bereich von HTML-Seiten – bekannt durch Dublin Core Dublin Core Metadata Initiative (DCMI) – Dublin Core Metadata Element Set (DCMES) – Dublin Core Metadata Terms (DCTERMS) 06.11.08 – Beschreibung von Webressourcen andere Vokabulare: Carsten Schulze – FOAF , address, Time etc.
  • 13. FHP:-) FHP:-) Metadateneinbindung in HTML: Nachteile Autor, Titel, Datum etc. 13 Metadateneinbindung im <head>-Bereich Web Dokument Inhalt 1 Inhalt 2 Inhalt 3 Inhalt 4 06.11.08 ... Carsten Schulze
  • 14. Carsten Schulze 06.11.08 Beispiel I 14 FHP:-) FHP:-)
  • 15. FHP:-) FHP:-) 15 Mehrdeutigkeit ---- ambiguity 06.11.08 Carsten Schulze
  • 16. FHP:-) FHP:-) Metadateneinbindung in HTML: Nachteile Autor, Titel, Datum etc. 16 Metadateneinbindung im <head>-Bereich Web Dokument Inhalt 1 Inhalt 2 Inhalt 3 Inhalt 4 06.11.08 ... Carsten Schulze
  • 17. FHP:-) FHP:-) Semantic Web: RDF 17 beschreibt Ressourcen und ihre Beziehungen ausgedrückt durch Tripel – Ressource, Eigenschaft, Wert Subjekt Objekt /Subjekt Prädikat domänenkontrollierte Bedeutung 06.11.08 – Namespaces Carsten Schulze
  • 18. FHP:-) FHP:-) RDF-Syntax: XML Serialisierung 18 <rdf:RDF xmlns:rdf=quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#quot; xmlns:dcterms=quot;http://purl.org/dc/terms/quot; xmlns:bibo=quot;http://purl.org/ontology/bibo/quot;> <rdf:Description rdf:about=quot;http://www.collidoscope.de/markup/APA.html#ref5quot;> <dcterms:date>1993</dcterms:date> <bibo:contributer rdf:parseType=quot;Resourcequot;> <rdf:type rdf:resource=quot;http://xmlns.com/foaf/0.1/Personquot;/> <foaf:family_name xml:lang=quot;enquot;>Okuda</foaf:family_name> 06.11.08 <foaf:givenname xml:lang=quot;enquot;>M.</foaf:givenname> </bibo:contributer> </rdf:Description> Carsten Schulze [...]
  • 19. FHP:-) FHP:-) RDF-Syntax: Turtle 19 @prefix dcterms: <http://purl.org/dc/terms/>. @prefix foaf: <http://xmlns.com/foaf/0.1/>. @prefix bibo: <http://purl.org/ontology/bibo/> :ref5 dcterms:date quot;1993quot; ; bibo:contributer [ a foaf:Person; foaf:family_name quot;Okudaquot;@en ; foaf:givenname quot;M.quot;@en ] . 06.11.08 [...] Carsten Schulze
  • 20. FHP:-) FHP:-) Semantic Web: Probleme 20 Nicht zur Rezeption durch Menschen geeignet „schwer zu verstehende“ Spezifikationen bisher wenig Anwendungen Nutzen schwer zu vermitteln Henne-Ei-Problem 06.11.08 Carsten Schulze
  • 21. FHP:-) FHP:-) Mikroformate 21 „Semantic Web von Unten“ entstanden im Web 2.0-Kontext – Microformats.org – Kontakt-, Kalender-, Lizenzinformationen etc. Datenformatierungen: zeichnen Daten dort semantisch aus, wo sie rezipiert werden: in HTML – humans first machines second... 06.11.08 nutzen die HTML-Infrastruktur Carsten Schulze – HTML-Attribut @class etc. Semantik stützt sich auf Konventionen
  • 22. FHP:-) FHP:-) 22 MICROFORMTAS „Designed for humans first and machines second, microformats are a set of simple, open data formats built upon existing and widely adopted standards.“ 06.11.08 microformats.org Carsten Schulze
  • 23. Carsten Schulze 06.11.08 Beispiel II 23 FHP:-) FHP:-)
  • 24. FHP:-) FHP:-) Mikroformate: Definition 24 Meine Definition: Jede Konvention, die (X)HTML-Infrastruktur nutzt, um Daten semantisch zu annotieren. Mikroformat ∉ Microformat / Microformat ∈ Mikroformat Mikroformate Microformats COinS ● hCard 06.11.08 ● ● (unAPI) ● hCalendar Microformats ● hCitation Carsten Schulze ● ● eRDF / RDFa ● etc.
  • 25. FHP:-) FHP:-) Mikroformate: Vorteile 25 eher zugänglich als SW-Technologien The Web – humans fist... – einfache Syntax keine Redundanzen – abhängig vom MF-Konzept Einbindung ins SW (durch GRDDL ...) direkter Nutzen / Problemlösung 06.11.08 z. T. schon Anwendungen vorhanden Carsten Schulze Interaktion mit dem Browser – Screen Scraping
  • 26. FHP:-) FHP:-) Mikroformate für bibliographische Daten 26 SW-Applikationen Literaturverwaltung 06.11.08 Carsten Schulze
  • 27. Carsten Schulze 06.11.08 COinS 27 FHP:-) FHP:-)
  • 28. FHP:-) FHP:-) OpenURL COinS 28 Basis-URL http://www.openurl.de/? ctx_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:jou rnal&rft.title=Ariadne&rft.aulast=Chudnov&rft.atitle=Openi ng+up+OpenURLs+with+Autodiscovery&rft.issue=43&rft.iss n=1361-3200&rft.date=2005-04&rft_id=http://www.aria dne.ac.uk/issue43/chudnov/&url_ver=Z39.88-2004 06.11.08 Carsten Schulze OpenURL KEV ContextObject
  • 29. FHP:-) FHP:-) OpenURL COinS 29 Context Object in SPAN (COinS) OpenURL Standard Z39.88 – Key Encoded Value (KEV) ContextObject ● Key[1]=Value[1]&Key[2]=Value[2]&Key[n]=Value[n] COinS Syntax: 06.11.08 <span class=“Z3988“ title=“OpenURL-KEV-ContextObject“> Carsten Schulze
  • 30. Carsten Schulze 06.11.08 Beispiel III 30 FHP:-) FHP:-)
  • 31. FHP:-) FHP:-) COinS: Diskussion 31 Vorteile: – einfache Syntax, hohe Softwareunterstützung, weite Verbreitung Nachteile: – begrenzt durch OpenURL-Standard (skaliert nicht) – keine Relationen, redundante Daten 06.11.08 Carsten Schulze
  • 32. Carsten Schulze 06.11.08 unAPI 32 FHP:-) FHP:-)
  • 33. FHP:-) FHP:-) unAPI 33 Aussprache beliebig besteht aus drei Teilen: – Mikroformat / Konvention zur Identifikation ● <abbr class=“unapi-id“ title=“urn:isbn:1590598148“> – <link>-Tag automatische Erkennung der unAPI-Server ● <link rel=“unapi-server“ type=“application/xml“ title=“unAPI“ href=“unapi.php“ /> 06.11.08 – unAPI-Server bestehend aus drei HTTP-Funktionen Carsten Schulze + strukturierte Datenbasis
  • 34. FHP:-) FHP:-) unAPI: Content Negotiation 34 Anwendung unAPI-Server 1. Anfrage: http://example.com/unapi.php 2. Antwort: Liste von Formaten in XML 3. Anfrage: http://example.com/unapi.php?id=urn:isbn:1590598148 4. Antwort: Liste von Formaten für die übergebene ID in XML 06.11.08 5. Anfrage: http://example.com/unapi.php?id=urn:isbn:1590598148&format=mods Carsten Schulze 6. Antwort: Datensatz in dem gewünschten Format
  • 35. Carsten Schulze 06.11.08 Beispiel IV 35 FHP:-) FHP:-)
  • 36. FHP:-) FHP:-) unAPI: Diskussion 36 Vorteile: – frei definierbare Datenformate – keine Redundanzen – Transport digitaler Objekte Nachteile: – erhöhter Programmieraufwand 06.11.08 – strukturierte Datenbasis erforderlich – kein bidirektionaler Transport Carsten Schulze
  • 37. Carsten Schulze 06.11.08 hCite / h3988 37 FHP:-) FHP:-)
  • 38. FHP:-) FHP:-) Citation Microformat 38 nutzt bereits bestehende Microformats (Compound) soll definierte Probleme lösen Definition der Bestandteile basiert auf formalen Verfahren – real world examples ● Bestandteile bibliographischer Beschreibung ● Kategorien bibliographischer Formate 06.11.08 es existieren mittlerweile zwei Markup-Vorschläge – hCite und h3988 Carsten Schulze
  • 39. FHP:-) FHP:-) hCite: Syntax 39 <div class=“hcite“> <div class=“monograph“> / <div class=“type“>Monograph <span class=quot;author firstauthorquot;> <span class=quot;family-namequot;>Allsopp</span>, <span class=quot;given-namequot;>John</span> </span> (<span class=quot;yearquot;>2006</span>): <span class=quot;titlequot;>Microformats: empowering your Markup for Web 2.0</span> </div> 06.11.08 </div> Carsten Schulze Darstellung: Allsopp, John (2006): Microformats: empowering your Markup for Web 2.0
  • 40. FHP:-) FHP:-) h3988: Syntax 40 <div class=“h3988 mfo“> <span class=quot;au vcardquot;> <span class=quot;fn nquot;> <span class=quot;family-namequot;>Allsopp</span>, <span class=quot;given-namequot;>John</span> </span> (<span class=quot;datequot;>2006</span>): <span class=quot;btitlequot;>Microformats: empowering your Markup for Web 2.0</span> </div> 06.11.08 Carsten Schulze Darstellung: Allsopp, John (2006): Microformats: empowering your Markup for Web 2.0
  • 41. FHP:-) FHP:-) Citation Microformat: Diskussion 41 Vorteile: – einfache Syntax – keine Redundanzen – hohe Softwareunterstützung (ist zu erwarten) Nachteile: – Anpassungen nur durch quasidemokratischen Prozess (skaliert nicht) 06.11.08 – wenig oder keine Relationen Carsten Schulze
  • 42. Carsten Schulze 06.11.08 RDFa 42 FHP:-) FHP:-)
  • 43. FHP:-) FHP:-) eRDF & RDFa 43 ähnliche Ansätze: Einbettung von RDF in HTML unterschiedliche Ausdrucksfähigkeit Interpretation durch eRDF-Parser (X)HTML + eRDF XHTML + RDFa RDF-Teilmenge RDF-Teilmenge 06.11.08 RDF Carsten Schulze Interpretation durch RDFa-Parser
  • 44. FHP:-) FHP:-) RDFa 44 erweitert XHTML mit neuen Attribute: – @about, @property, @resource, @datatype, @typeof Nutzung von Compact URIs (CURIEs) xmlns:bibo=“http://purl.org/ontology/bibo/“ <span typeof=“bibo:Article“> --> http://purl.org/ontology/bibo/Article 06.11.08 Carsten Schulze
  • 45. Carsten Schulze 06.11.08 Beispiel V 45 FHP:-) FHP:-)
  • 46. FHP:-) FHP:-) RDFa: Diskussion 46 Vorteile RDFa: – Nutzung von Namespaces (skaliert) – hohe RDF-Aussagekraft – Relationen – W3C-Recommendation (14.10.2008) – Daten sind Teil des Semantic Web 06.11.08 Nachteile RDFa – teilweise komplizierte Verschachtelung notwendig Carsten Schulze – noch wenig Anwendungen
  • 47. FHP:-) FHP:-) Zusammenfassung 47 interoperable bibliographische Daten sind für ein effizientes wissenschaftliches Arbeiten unverzichtbar Semantic Web Technologien sind teilweise kompliziert und es gibt nur wenige Anwendungen Mikroformate sind eine einfache Art Daten semantisch in HTML auszuzeichnen es gibt mehrere Konzepte von Mikroformaten für 06.11.08 bibliographische Daten ein Vergleich dieser Konzepte ist nur für den konkreten Carsten Schulze Anwendungsfall sinnvoll
  • 48.  FHP:-) FHP:-) 48 Vielen Dank für ihre Aufmerksamkeit! www.collidoscope.de 06.11.08 Carsten Schulze