Vortrag im Rahmen des Workshops "KIM-Workshop: Vom Datensilo ins Semantic Web - Interoperabilität von Metadaten" auf dem 4. Leipziger Kongress für Information und Bibliothek
Grundlegendes zu Datenformaten und ihrer Standardisierung mit Schwerpunkt auf Microformats. Es werden keine konkreten Formate forgestellt, sondern allgemeine Prinzipien und Kodierungen (XML, JSON etc.)
Vortrag im Rahmen des Workshops "KIM-Workshop: Vom Datensilo ins Semantic Web - Interoperabilität von Metadaten" auf dem 4. Leipziger Kongress für Information und Bibliothek
Grundlegendes zu Datenformaten und ihrer Standardisierung mit Schwerpunkt auf Microformats. Es werden keine konkreten Formate forgestellt, sondern allgemeine Prinzipien und Kodierungen (XML, JSON etc.)
AVISPADOR ist ein integriertes Beratungs- und Analystenhaus. Wir sind in Deutschland
verwurzelt, europäisch orientiert und zugleich global vernetzt. Wir unterstützen
Menschen in Unternehmen bei wichtigen Entscheidungen zur IT-Strategie, Technologie,
Organisation, sowie der Transformation von (IT-)basierten Geschäftsmodellen
Der Einsatz von Customer-Outplacement- Maßnahmen bedarf einer sorgfältigen und systematischen Planung. Das Management unprofitabler Kundenbeziehungen ist ein dynamischer Prozess und kann in sechs Phasen unterteilt werden.
Diese Phasen beinhalten sowohl Reflektion als auch Aktion, sowohl Analyse als auch Umsetzung, kurzfristige sowie langfristige Maßnahmen.
Themen u.a.: Diskussion um Haftentlassung, Teures Wohneigentum, Bubble Tea-Geschichte. Zweiwöchentliche Nachrichten aus Politik, Wirtschaft und Gesellschaft der Republik China (Taiwan). Herausgegeben von der Taipeh-Vertretung München.
Durch den neuen Erschließungsstandard „Resource Description and Access“ (RDA) lassen sich bibliografische Daten sowie Normdaten Semantic-Web-konform repräsentieren. Der Vortrag soll aufzeigen, welche Auswirkungen RDA auf die Katalogisierung in Bibliotheken und den Zugang zu den erschlossenen Ressourcen im Semantic Web hat. Anhand erster Erfahrungen aus praktischen Umsetzungen wird erläutert, wie bibliografische Daten durch RDA und Linked-Data-Technologien besser zugänglich gemacht und vor allem nachgenutzt werden können.
Vorlesung Semantic Web Technologien, HTWG Konstanz WS 2009/2010.
Veranstaltung #1
Diese Folien wurden in der Einführungsveranstaltung präsentiert. Es wird der Weg des Semantic Web bis heute beschrieben und ein Ausblick darauf gegeben, wo es hinführen soll.
AVISPADOR ist ein integriertes Beratungs- und Analystenhaus. Wir sind in Deutschland
verwurzelt, europäisch orientiert und zugleich global vernetzt. Wir unterstützen
Menschen in Unternehmen bei wichtigen Entscheidungen zur IT-Strategie, Technologie,
Organisation, sowie der Transformation von (IT-)basierten Geschäftsmodellen
Der Einsatz von Customer-Outplacement- Maßnahmen bedarf einer sorgfältigen und systematischen Planung. Das Management unprofitabler Kundenbeziehungen ist ein dynamischer Prozess und kann in sechs Phasen unterteilt werden.
Diese Phasen beinhalten sowohl Reflektion als auch Aktion, sowohl Analyse als auch Umsetzung, kurzfristige sowie langfristige Maßnahmen.
Themen u.a.: Diskussion um Haftentlassung, Teures Wohneigentum, Bubble Tea-Geschichte. Zweiwöchentliche Nachrichten aus Politik, Wirtschaft und Gesellschaft der Republik China (Taiwan). Herausgegeben von der Taipeh-Vertretung München.
Durch den neuen Erschließungsstandard „Resource Description and Access“ (RDA) lassen sich bibliografische Daten sowie Normdaten Semantic-Web-konform repräsentieren. Der Vortrag soll aufzeigen, welche Auswirkungen RDA auf die Katalogisierung in Bibliotheken und den Zugang zu den erschlossenen Ressourcen im Semantic Web hat. Anhand erster Erfahrungen aus praktischen Umsetzungen wird erläutert, wie bibliografische Daten durch RDA und Linked-Data-Technologien besser zugänglich gemacht und vor allem nachgenutzt werden können.
Vorlesung Semantic Web Technologien, HTWG Konstanz WS 2009/2010.
Veranstaltung #1
Diese Folien wurden in der Einführungsveranstaltung präsentiert. Es wird der Weg des Semantic Web bis heute beschrieben und ein Ausblick darauf gegeben, wo es hinführen soll.
Die "Semantic Web Recommendations" und das Jena FrameworkJulian Maicher
Semantic Web: Nach dem Web 2.0 ein neues Schlagwort das für die Weiterentwicklung des World Wide Web stehen soll.
In diesem Paper geht es um die Empfehlungen des W3C für das Semantic Web und um eine Implementierung dieser Semantic Web Recommendations, das Jena Framework.
Dieses Paper wurde im Rahmen des Proseminars "Softwarequalität und -sicherheit" an der Universität Paderborn erstellt.
Der dazugehörige Seminarvortrag:
http://www.slideshare.net/jmaicher/die-semantic-web-recommendations-und-das-jena-framework-4808117
Teaching and Learning Experience Design – der Ruf nach besserer Lehre: aber wie?Isa Jahnke
Der Ruf danach, dass es bessere Lehre geben muss oder das Lehre verbessert werden sollte, ist nicht neu. Es gibt auch schon seit längerer Zeit Rufe danach, dass Lehre der Forschung in Universitäten gleichgestellt werden soll. (Und in den letzten Jahren ist in Deutschland auch einiges an positiven Entwicklungen geschehen, z.B. durch die Aktivitäten des Stifterverbands). Wie kann die Verbesserung der Lehre weitergehen? Fehlt etwas in dieser Entwicklung? Ja, sagt dieser Beitrag, der zum Nachdenken und Diskutieren anregen soll. In diesem Beitrag wird ein forschungsbasierter Ansatz zur Diskussion gestellt. Es wird argumentiert, dass Lehre nur dann besser wird, wenn es mit den Prinzipen der Wissenschaft und Forschung angegangen wird (d.h. gestalten, Daten erheben, auswerten, verbessern). Es benötigt neue Verhaltensregeln oder -prinzipien bei der Gestaltung von Lehrveranstaltungen. Das bedeutet zum Beispiel das Prinzipien der Evidenzbasierung und wissenschaftliche Herangehensweisen im Lehr-Lerndesign als zentrales Fundament etabliert werden sollte. Evidenzbasierung hier meint, folgt man der Logik der Forschung, dass Lehrveranstaltungen als Intervention verstanden werden. Mit dieser Intervention werden Studierende befähigt, bestimmte vorab festgelegte Kompetenzen zu entwickeln. Und die Frage, die sich bei jeder Lehr-Lernveranstaltung dann stellt, ist, ob diese Objectives bzw. Learning Outcomes auch erreicht wurden. Klar ist, dass die subjektive Lehrevaluation der Studierenden oder auch die Notengebnung nicht ausreichen, um diese Frage zu beantworten. Hierfür gibt es eine Reihe von Methoden, die genutzt werden können, z.B. aus dem Bereich des User- / Learning Experience Design. Diese Methoden umfassen unter anderem Usability-Tests, Learner Experience Studies, Pre-/Post-Tests, und Follow-up Interviews. Diese können zur Gestaltung und Erfassung von effektiven, effizienten und ansprechenden digitalen Lerndesigns verwendet (Reigeluth 1983, Honebein & Reigeluth, 2022).
Der Beitrag will die Entwicklung zur Verbesserung von Lehre weiter pushen. Neue Ideen in die Bewegung bringen. Als Gründungsvizepräsidentin der UTN hab ich die Chance, hier ein neues Fundament für eine gesamte Uni zu legen. Wird das Gelingen? Ist dieser Ansatz, den ich hier vorstelle, eine erfolgsversprechende Option dafür? Hier können sich die TeilnehmerInnen an dieser Entwicklung beteiligen.
2. Ausgangspunkt: Das World Wide Web (WWW)
Einschränkungen des WWW
Semantic Web
Problemstellung, Intention, Worum geht‘s?
Wissensrepräsentation
Mikroformate
RDF, RDF / XML
(Ontologien)
Anwendung: FOAF
Sitzungsüberblick
3. Beschreiben Sie sich und Ihren Freundeskreis mit den
Begriffen aus FOAF in RDF / XML. Das FOAF-Vokabular finden
Sie erläutert unter http://xmlns.com/foaf/spec/.
Prüfen Sie Ihre Arbeit mit dem W3C-Validator unter
http://www.w3.org/RDF/Validator („Triples and Graph“)
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-
syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:foaf="http://xmlns.com/foaf/0.1/">
<!– Hier kommt das FOAF-XML rein -->
</rdf:RDF>
Sitzungsaufgaben
4. Speichern Sie Ihre XML-Datei und einen Screenshot Ihres
von http://www.w3.org/RDF/Validator generierten
Graphen in einem Zip-Archiv und laden Sie Ihr Werk in
WoMS hoch.
Registrierungstoken: http://womsvm.hki.uni-
koeln.de/register/veranstaltung/QnO1DG8NeUTrizQR
Sitzungsaufgaben
18. „Magic“ II:
Ranking: Sortierung der Treffer von hochrelevanten zu
weniger relevanten Treffern
It‘s magic?
19.
20. „Magic“ II:
Ranking: Sortierung der Treffer von hochrelevanten zu
weniger relevanten Treffern
„Magic“ III:
Performance:
It‘s magic?
21. „What‘s wrong with the web?“ – die Grenzen des WWW
I. „Wer ist Jan Wieners?“
Suchanfrage: Wieners
[Wer], [ist] weniger relevante Suchterme
tf-idf-maß
World Wide Web
22. tf-idf-Maß:
Termfrequenz: Häufigkeit des (Such)Terms / der Wortform im
jeweiligen Dokument
Bestimmung der Trennschärfe einer Wortform: Inverse
Document Frequency (IDF), Inverse Dokumenthäufigkeit
Annahme: Eine Wortform, die nur in wenigen Titelaufnahmen
des Gesamtbestandes anzutreffen ist, verfügt über eine
höhere Trennschärfe als eine Wortform, die sich in
zahlreichen Titelaufnahmen findet.
𝐼𝐷𝐹 = log(
𝑇𝑖𝑡𝑒𝑙 𝑖𝑛 𝐷𝐵
𝑇𝑟𝑒𝑓𝑓𝑒𝑟 𝑆𝑢𝑐ℎ𝑡𝑒𝑟𝑚 𝑖𝑛 𝐷𝐵
)
23.
24.
25.
26.
27. „What‘s wrong with the web?“ – die Grenzen des WWW
II. „Zeige mir Fotos von Paris“
Suchmaschinen versuchen (mitunter), die Bedeutung
eines Bildes / das im Bild dargestellt durch den Kontext
zu erschließen:
Dateiname
Text, der sich in Bildnähe befindet
28. „What‘s wrong with the
web?“ – die Grenzen des
WWW
III. „Finde Musik, die ich
mögen könnte“
Knackpunkt:
Hintergrundwissen –
Welche Musik mag ich
derzeit? (Musikgeschmack
verändert sich mitunter)
World Wide Web
29. Oh weh, was
meint sie / er
damit bloß???
Knackpunkt: Den Computermechanismen
mangelt‘s an Wissen!
„knowledge gap“:
Probleme im Verständnis natürlicher
Sprache
Interpretation des Inhaltes von Bildern
oder anderen multimedialen Dingen
Computer verfügt nicht über
Hintergrundwissen über das der
Benutzer / die Benutzerin verfügt
Computer verfügt nicht über
Hintergrundwissen über die Benutzerin
/ den Benutzer
31. Ach so ist das gemeint!
…hätte sie / er das nicht
gleich sagen können?!?
ToDo: Wissenslücke zwischen
Benutzer und Computer
mindern
Bereitstellung von Wissen
in einer Art und Weise, in
der es von Computern
verarbeitet werden und für
weiteres Schließen
verwendet werden kann
Z.B.: Bereitstellung von
(semantischen)
Metainformationen, die die
Inhalte der Website
beschreiben (description,
keywords, etc.)
35. Konzept des Semantic Web formuliert 1996 von Tim
Berners-Lee
Kerntechnologien (logikbasierte Sprachen zur
Representation von Wissen und (automatisiertem)
Schließen) entwickelt im Forschungsfeld der
Künstlichen Intelligenz.
Standards: W3C
Ursprüngliche Intention: Annotation – Anreicherung
der Inhalte im WWW durch Metadaten
Semantic Web
38. „Designed for humans first and machines second,
microformats are a set of simple, open data formats built
upon existing and widely adopted standards.”
(http://microformats.org/)
Mikroformate
43. Extensible Markup Language (XML)
„Wohlgeformtheit“?
Gültigkeit (Validität)?
DTD?
XML Schema? Schematron? RELAX NG?
XML?
44. Natürlichsprachige Aussage:
Die Webseite „http://www.example.org“ hat einen Urheber namens Jan Wieners.
Die Aussage besteht aus dem Gegenstand der Aussage,
einer Eigenschaft des Gegenstandes und einem Wert für diese Eigenschaft.
In RDF Terminologie wird der Gegenstand der Aussage als Subjekt (subject), die
Eigenschaft als Prädikat (predicate) und Wert der Eigenschaft als Objekt (object)
bezeichnet.
Subjekt, Prädikat und Objekt bilden ein Tripel.
RDF Grundkonzepte
45. Ein oder mehrere Tripel bilden einen RDF-
Graphen:
RDF (Graphen)modell
Subject A Object A
Predicate A
Object B
Predicate B
46. Bestandteile der Aussage getrennt von Leerzeichen
URI in spitzen Klammern
Eigenschaftswerte in Anführungszeichen
Standardnotationsformate: N-Triple, Turtle, etc.
„Das HTML-Dokument index.html wurde von Jan
Wieners erstellt“:
ex:index.html dc:creator “Jan Wieners“
N-Tripel Notation
47. Namespaces / Namensräume
Klassen und Eigenschaften unterhalb des gleichen URI
bilden einen Namespace.
Beispiel: Dublin Core
http://purl.org/dc/elements/1.1/title
http://purl.org/dc/elements/1.1/creator
http://purl.org/dc/elements/1.1/date
FOAF
http://xmlns.com/foaf/0.1
RDF
56. „The FOAF ("Friend of a Friend") project is a community
driven effort to define an RDF vocabulary for expressing
metadata about people, and their interests, relationships
and activities.”
Grundaufbau eines FOAF-Dokumentes:
RDF / XML und FOAF
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:foaf="http://xmlns.com/foaf/0.1/">
<!– Hier kommt das FOAF-XML rein -->
</rdf:RDF>
57. Hinzufügen einer Person und eines Namens:
RDF / XML und FOAF
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:foaf="http://xmlns.com/foaf/0.1/">
<foaf:Person>
<foaf:name>Jan Wieners</foaf:name>
</foaf:Person>
</rdf:RDF>
58. Hinzufügen einer Email-Adresse:
RDF / XML und FOAF
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:foaf="http://xmlns.com/foaf/0.1/">
<foaf:Person>
<foaf:name>Jan Wieners</foaf:name>
<foaf:mbox rdf:resource="mailto:jan.wieners@uni-koeln.de"/>
</foaf:Person>
</rdf:RDF>
Zwei Arten, mit dem WWW zu arbeiten: Gezieltes Auffinden
Internet vs. WWW
WWW: Sehr großer Ressourcenfundus:
Dokumente bzw. Textuelle Information (HTML-Dokumente, PDF, etc.)
Bilder
Videodateien
Konzepte: Das WWW…
bietet Mechanismen, um auf Dokumente des Internets zugreifen zu können HTTP, sowie die Eindeutige Referenzierung von Inhalten: URL
bietet eine Syntax (HTML), um Dokumente anzuzeigen und miteinander zu verknüpfen (Hyperlinks)
Aufruf einer Website - HTTP
Client stellt Anfrage an Server
Server beantwortet Anfrage, d.h. liefert ein Dokument / eine Ressource zurück
HTML definiert eine Syntax, die von Rechnern verstanden werden kann HTML sagt dem Rechner, wie das Dokument angezeigt werden soll
…
1989 am CERN entwickelt
Intention: Austausch von Forschungsergebnissen
Vannevar Bush [ˌvæˈniː.vɚ] KBE (1890 in Everett, Massachusetts; † 30. Juni 1974 in Belmont, Massachusetts) war ein US-amerikanischer Ingenieur und Analogrechner-Pionier. Bush war eine der wichtigsten Personen der US-Kriegsführung im Zweiten Weltkrieg, er entwickelte in seinem 1945 publizierten Essay As we may think das Konzept des Memex (Memory Extender), der als ein Vorläufer des Personal Computers und des Hypertextes gilt.
Der Memex (Memory Extender; dt. etwa: Gedächtnis-Erweiterer) ist ein als möglichst menschengerechtes, einfach bedienbares Wissensfindungs- und Verwertungssystem konzipierter Kompakt-Analog-Rechner, der 1945 von Vannevar Bush im Artikel As We May Think (Atlantic Monthly, Juli 1945, S. 101 ff.) fiktiv vorgestellt wurde.
…die Nadel im Heuhaufen…?
Probleme:
Prüfung der Suchergebnisse auf Benutzerseite - daran haben wir uns gewöhnt
Gefahr / Dilemma: Die Suchanfrage ist überspezifiziert Durch Angabe weiterer Suchterme schränken wir die Trefferliste erneut ein
Weiteres Problem: Es könnten Seiten im WWW existieren, die sich mit dem Suchbegriff beschäftigen, ihn jedoch nicht nennen, z.B. Jan W.
(Zunehmendes Problem „Filter Bubble“: Wir bekommen nur die Suchergebnisse, die Suchmaschinenanbieter für uns vorsehen)
Discovr
Paradigmenwechsel: von passiver Rechenleistung zu aktiver Rechenleistung (Verständnis der Inhalte)
Das Semantic Web will Computern helfen, die Bedeutung hinter den Webseiten zu "verstehen“
Das derzeitige WWW dreht sich um Dokumente
Das Semantic Web dreht sich um Dinge (Menschen, Musik, Filme), um Konzepte
Eine Möglichkeit: Einbettung semantischer Information in HTML-Seiten
Paradigmenwechsel: von passiver Rechenleistung zu aktiver Rechenleistung (Verständnis der Inhalte)
Das Semantic Web will Computern helfen, die Bedeutung hinter den Webseiten zu "verstehen“
Das derzeitige WWW dreht sich um Dokumente
Das Semantic Web dreht sich um Dinge (Menschen, Musik, Filme), um Konzepte
Eine Möglichkeit: Einbettung semantischer Information in HTML-Seiten
Ein Knackpunkt: Das Semantic Web macht Arbeit. Benutzerinnen und Benutzer müssen neben Inhalten auch Metadaten, d.h. beschreibende Inhalte bereitstellen
Bei Webseiten: Mikroformate
Wissensrepräsentation: Ontologien und Ontologiesprachen
(Ontologie: Wissenschaft vom Sein des Seienden)
Ontologien werden formuliert in formalen Sprachen mit einer wohldefinierten Syntax
Ontologien gründen auf der Arbeit von Gemeinschaften (Communities)
RDF und OWL = am häufigsten verwendete Sprachen
Ontologien
Leichtgewichtige: Unterscheidungen zwischen Klassen, Instanzen und Eigenschaften, jedoch nur minimale Beschreibung der Konzepte
Schwergewichtige: Machen‘s möglich, präziser zu beschreiben, wie Klassen von anderen Klassen abgeleitet sind
In der Praxis: leichtgewichtige Ontologien
The Resource Description Framework (RDF)
Erfunden, um Ressourcen im WWW zu beschreiben
Anders als Mikroformate: Machines first
Domänenunabhängig, d.h. kann auch dazu verwendet werden, Entitäten der realen Welt zu beschreiben
RDF ist eine einfache Modellierungssprache, ist jedoch die Grundlage für komplexere Sprachen wie OWL
(Binäre) Relationen
RDF-Graphen lassen sich visuell darstellen: (Subjekt und Objekt sind dann die Knoten, Prädikate die Kanten im Graphen)
Namensraum
Vordefiniert, selbst definierter Namensraum
Ontologie
URL
Frag
findet die Namen aller afrikanischen Hauptstädte und das Land, in dem sich die jeweilige Hauptstadt befindet.ezeichen = Variablen