Im Vortrag werden zunächst die Grundlagen der Metadatenverarbeitung vorgestellt. Mit Anleihen aus dem Kontext der Linguistik werden Syntax und Semantik von Metadaten in der räumlichen Datenverarbeitung erläutert. Es folgt eine kurze Übersicht zur Bedeutung von Ontologien und es wird auf die Pragmatik als dritte Disziplin der Semiotik verwiesen. Aus dem Mangel an Pragmatik können die aktuellen Schwächen von Metadaten-Formaten und Katalogen abgeleitet werden. Im Ausblick wird erläutert, wie der grundlegenden Mangel an semiotischer Pragmatik überwunden werden kann. Einfache Beispielen sollen helfen, den linguistischen Fachjargon in einen räumlichen Kontext zu setzen.
Mit Anleihen aus dem Kontext der Linguistik werden Syntax und Semantik von Metadaten in der räumlichen Datenverarbeitung erläutert. Es folgt eine kurze Übersicht zur Bedeutung von Ontologien und es wird auf die Pragmatik als dritte Disziplin der Semiotik verwiesen. Aus dem Mangel an Pragmatik können die aktuellen Schwächen von Metadaten-Formaten und Katalogen abgeleitet werden. Im Ausblick wird erläutert, wie der grundlegenden Mangel an semiotischer Pragmatik überwunden werden kann. Einfache Beispielen sollen helfen, den linguistischen Fachjargon in einen räumlichen Kontext zu setzen.
The document outlines metadata schemas including VRA Core, CDWA, MODS, and Qualified Dublin Core. It provides examples of element names and discusses using elements and sub-elements to describe works, images, agents, dates, measurements, materials, and other attributes in a structured format. Worksheets are provided to practice entering sample values for different elements to gain experience with metadata schemas.
Riley, Jenn. "Metadata for Visual Resources." Summer Educational Institute for Visual Resources and Image Management, University of New Mexico, June 9, 2011.
The document discusses the Global Land Tool Network's Social Tenure Domain Model (STDM) and its transition to an online platform. STDM is a land information tool that documents land tenure for formal and informal land rights. It is implemented using open-source software and aligned with the Land Administration Domain Model. Future development of STDM includes adding a file-based data store, online components, and security/privacy features to share data securely over the web. This will allow for online household surveys, mapping, reporting, and open data access to scale STDM's documentation of land rights.
The document provides an introduction to Dublin Core metadata, including its history and development. It describes Dublin Core elements, refinements, vocabularies, and provides examples of Dublin Core records at both the collection and item levels, including records for manuscripts, books, and other resources.
The document discusses the Social Tenure Domain Model (STDM) and plans for an online version called STDM-Online. STDM is a land information tool developed by GLTN to document land tenure, including informal and customary arrangements. STDM-Online will make this data available securely online using open-source software like PostGIS and open standards. It will allow users to record household information, map land parcels, and generate reports while hosting the software and maintaining the system. STDM aims to document land rights at a large scale affordably and promote more inclusive land administration systems.
Mit Anleihen aus dem Kontext der Linguistik werden Syntax und Semantik von Metadaten in der räumlichen Datenverarbeitung erläutert. Es folgt eine kurze Übersicht zur Bedeutung von Ontologien und es wird auf die Pragmatik als dritte Disziplin der Semiotik verwiesen. Aus dem Mangel an Pragmatik können die aktuellen Schwächen von Metadaten-Formaten und Katalogen abgeleitet werden. Im Ausblick wird erläutert, wie der grundlegenden Mangel an semiotischer Pragmatik überwunden werden kann. Einfache Beispielen sollen helfen, den linguistischen Fachjargon in einen räumlichen Kontext zu setzen.
The document outlines metadata schemas including VRA Core, CDWA, MODS, and Qualified Dublin Core. It provides examples of element names and discusses using elements and sub-elements to describe works, images, agents, dates, measurements, materials, and other attributes in a structured format. Worksheets are provided to practice entering sample values for different elements to gain experience with metadata schemas.
Riley, Jenn. "Metadata for Visual Resources." Summer Educational Institute for Visual Resources and Image Management, University of New Mexico, June 9, 2011.
The document discusses the Global Land Tool Network's Social Tenure Domain Model (STDM) and its transition to an online platform. STDM is a land information tool that documents land tenure for formal and informal land rights. It is implemented using open-source software and aligned with the Land Administration Domain Model. Future development of STDM includes adding a file-based data store, online components, and security/privacy features to share data securely over the web. This will allow for online household surveys, mapping, reporting, and open data access to scale STDM's documentation of land rights.
The document provides an introduction to Dublin Core metadata, including its history and development. It describes Dublin Core elements, refinements, vocabularies, and provides examples of Dublin Core records at both the collection and item levels, including records for manuscripts, books, and other resources.
The document discusses the Social Tenure Domain Model (STDM) and plans for an online version called STDM-Online. STDM is a land information tool developed by GLTN to document land tenure, including informal and customary arrangements. STDM-Online will make this data available securely online using open-source software like PostGIS and open standards. It will allow users to record household information, map land parcels, and generate reports while hosting the software and maintaining the system. STDM aims to document land rights at a large scale affordably and promote more inclusive land administration systems.
Cognitive Computing in der Finanzindustrie
Semantik in der Prozessautomation
Unterschiedliche Datentypen, komplexe und sich ändernde regulatorischen Anforderungen, wachsende und Multi-Channel-orientierte Kundenbasis sowie erhöhte Bedeutung des Risikoumfelds – dies sind gegenwärtig die Herausforderungen, mit denen die Banken und Versicherungen konfrontiert werden.
Die semantische Technologie von Cogito kombiniert die Fähigkeit, die Bedeutung von Wörtern im Kontext zu verstehen mit einer Hochleistungsplattform, die die Verarbeitung von grossen Mengen an Text mit höchster Präzision gewährleistet. Durch die tiefgehende Analyse von Inhalten aller Art wandelt die semantische Technologie die Daten in verwertbares Wissen um, das in der gesamten Organisation genutzt werden kann, um in einer Vielzahl an Operationen und Prozessen einen Zusatznutzen zu generieren.
Wenn die Kunden ihre Bedürfnisse im Rahmen ihres Verständnisses der Materie und mit ihren eigenen Worten ausdrücken, bietet die Lösung den Organisationen die einzigartige Gelegenheit, den Bedarf des Kunden auch zu decken. Egal, welchen Kanal der Kunde nutzt – ein Self-Service-Systeme oder Live-Kunden-Support – die Lösung versetzt das Unternehmen in die Lage, ohne eine aufwendige und wiederholende Übersetzung der Aussage in die Sprache des Finanzinstitutes sofort zu reagieren und gegenüber dem Kunden als freundlich und einfühlsam wahrgenommen zu werden.
Das Cognitive Computing von Cogito ermöglicht die Automatisierung einer Vielzahl von informations-intensiven, teuren und fehleranfälligen Prozessen des Finanz- und Versicherungssektors. Die intelligente Automatisierung des Schadenmanagements, der Überprüfung der Vertragsintegrität und der Interaktionen mit dem Kunden bringen messbare ROI, die die Kosten reduziert und für eine schnellere und genauere Verarbeitung jeden Schritts in der Anspruchsbearbeitung sorgt. Dank der an das menschliche Verständnis der Texte angelehnte Methodik von Cogito kann eine Reihe von zeitaufwändigen und komplexen Aktivitäten wie z.B. die Bewertung der Ansprüche, Kundenbetreuung in unterschiedlichsten Kanälen, Extraktion der Codes der Krankenkassen und Versicherung für die Erstattung der Kosten usw. automatisiert werden.
Im Vortrag werden zunächst die Grundlagen der Metadatenverarbeitung vorgestellt. Mit Anleihen aus dem Kontext der Linguistik werden Syntax und Semantik von Metadaten in der räumlichen Datenverarbeitung erläutert. Es folgt eine kurze Übersicht zur Bedeutung von Ontologien und es wird auf die Pragmatik als dritte Disziplin der Semiotik verwiesen. Aus dem Mangel an Pragmatik können die aktuellen Schwächen von Metadaten-Formaten und Katalogen abgeleitet werden. Im Ausblick wird erläutert, wie der grundlegenden Mangel an semiotischer Pragmatik überwunden werden kann. Einfache Beispielen sollen helfen, den linguistischen Fachjargon in einen räumlichen Kontext zu setzen.
Durch den neuen Erschließungsstandard „Resource Description and Access“ (RDA) lassen sich bibliografische Daten sowie Normdaten Semantic-Web-konform repräsentieren. Der Vortrag soll aufzeigen, welche Auswirkungen RDA auf die Katalogisierung in Bibliotheken und den Zugang zu den erschlossenen Ressourcen im Semantic Web hat. Anhand erster Erfahrungen aus praktischen Umsetzungen wird erläutert, wie bibliografische Daten durch RDA und Linked-Data-Technologien besser zugänglich gemacht und vor allem nachgenutzt werden können.
Session zu Mikroformaten und COinS von Lambert Heller und Christian Hauschke beim KIM-Workshop "Metadaten, Mikroformate und Semantic Web" am 13. April 2010 in der ETH Zürich.
DVW Seminar zu Freier Software und Freien DatenArnulf Christl
Eine Einführung in die Open Source Entwicklung im Geodatenbereich. Vortrag zum DVW Seminar in Dresden im November 2016. Open Source, Open Data und Open Standards ermöglichen die Bereitstellung von Geodaten zur allgemeinen Nutzung, sie es zu privaten oder kommerziellen Nutzung. Als internationale Vertretung agiert die OSGeo Foundation, im deutschsprachigen Raum übernimmt der FOSSGIS e.V. diese Aufgabe.
STDM Online Architecture and Services for Land AdministrationArnulf Christl
Most people-to-land relationships worldwide are not recognized, identified or documented. Existing land administration systems are incomplete and do not perform. Lack of know-how, short lived projects and proprietary systems lock-in users and governments. Alternatives are needed. The Social Tenure Domain Model Software (STDM) is based on open standards and Open Source Software to avoid these common pitfalls.
The talk tells the story of how Open Source GIS developers founded the geospatial standards organization OGC in the early 1990s, long before the term “Open Source” was even coined. The story goes on to describe how Open Source geospatial activists founded OSGeo in 2006, why the current big topic is Open Data and how it all ties together.
This need for openness is intrinsic to geospatial because any location makes sense only relative to other location data. Interoperability is a must.
This document summarizes an INSPIRE workshop organized by OSGeo members. The agenda included short presentations from representatives of public administration, the EU Commission, and industry. Speakers included individuals from organizations like Ordnance Survey GB, the EEA, JRC, regional governments in Germany and Austria, the UK MetOffice, GeoCat, Occam Labs, metaspatial, and the Joint Research Center. Many speakers discussed their roles working with geospatial data and standards, and their goals in supporting INSPIRE. Common challenges mentioned were the need for more coordination, funding, and communication to help with INSPIRE implementation and maintenance.
Open Standards, Open Source, Open Data. Zuviel des Guten?Arnulf Christl
Ein Vortrag von der FOSSGIS Konferenz 2013 in Rapperswil, Schweiz. Die Online Version dieses Vortrags finden Sie unter: http://metaspatial.net/conferences/fossgis2013_open.html
Der Vortrag beleuchtet ausnahmsweise mal die Schattenseiten dieser drei Gesellen, denn: Ja, es gibt sie, z.B.
* behindern Standards Innovation,
* zerstört Open Source bewährte Geschäftsmodelle und
* Open Data fördert das Chaos.
Eine konstruktive Herangehensweise zeigt, dass es lediglich gilt diese Schattenseiten auzuleuchten, um das volle Potential expliziter Offenheit ausschöpfen zu können.
Weitere ähnliche Inhalte
Ähnlich wie Neue Wege Fuer Metadaten - FOSSGIS 2010
Cognitive Computing in der Finanzindustrie
Semantik in der Prozessautomation
Unterschiedliche Datentypen, komplexe und sich ändernde regulatorischen Anforderungen, wachsende und Multi-Channel-orientierte Kundenbasis sowie erhöhte Bedeutung des Risikoumfelds – dies sind gegenwärtig die Herausforderungen, mit denen die Banken und Versicherungen konfrontiert werden.
Die semantische Technologie von Cogito kombiniert die Fähigkeit, die Bedeutung von Wörtern im Kontext zu verstehen mit einer Hochleistungsplattform, die die Verarbeitung von grossen Mengen an Text mit höchster Präzision gewährleistet. Durch die tiefgehende Analyse von Inhalten aller Art wandelt die semantische Technologie die Daten in verwertbares Wissen um, das in der gesamten Organisation genutzt werden kann, um in einer Vielzahl an Operationen und Prozessen einen Zusatznutzen zu generieren.
Wenn die Kunden ihre Bedürfnisse im Rahmen ihres Verständnisses der Materie und mit ihren eigenen Worten ausdrücken, bietet die Lösung den Organisationen die einzigartige Gelegenheit, den Bedarf des Kunden auch zu decken. Egal, welchen Kanal der Kunde nutzt – ein Self-Service-Systeme oder Live-Kunden-Support – die Lösung versetzt das Unternehmen in die Lage, ohne eine aufwendige und wiederholende Übersetzung der Aussage in die Sprache des Finanzinstitutes sofort zu reagieren und gegenüber dem Kunden als freundlich und einfühlsam wahrgenommen zu werden.
Das Cognitive Computing von Cogito ermöglicht die Automatisierung einer Vielzahl von informations-intensiven, teuren und fehleranfälligen Prozessen des Finanz- und Versicherungssektors. Die intelligente Automatisierung des Schadenmanagements, der Überprüfung der Vertragsintegrität und der Interaktionen mit dem Kunden bringen messbare ROI, die die Kosten reduziert und für eine schnellere und genauere Verarbeitung jeden Schritts in der Anspruchsbearbeitung sorgt. Dank der an das menschliche Verständnis der Texte angelehnte Methodik von Cogito kann eine Reihe von zeitaufwändigen und komplexen Aktivitäten wie z.B. die Bewertung der Ansprüche, Kundenbetreuung in unterschiedlichsten Kanälen, Extraktion der Codes der Krankenkassen und Versicherung für die Erstattung der Kosten usw. automatisiert werden.
Im Vortrag werden zunächst die Grundlagen der Metadatenverarbeitung vorgestellt. Mit Anleihen aus dem Kontext der Linguistik werden Syntax und Semantik von Metadaten in der räumlichen Datenverarbeitung erläutert. Es folgt eine kurze Übersicht zur Bedeutung von Ontologien und es wird auf die Pragmatik als dritte Disziplin der Semiotik verwiesen. Aus dem Mangel an Pragmatik können die aktuellen Schwächen von Metadaten-Formaten und Katalogen abgeleitet werden. Im Ausblick wird erläutert, wie der grundlegenden Mangel an semiotischer Pragmatik überwunden werden kann. Einfache Beispielen sollen helfen, den linguistischen Fachjargon in einen räumlichen Kontext zu setzen.
Durch den neuen Erschließungsstandard „Resource Description and Access“ (RDA) lassen sich bibliografische Daten sowie Normdaten Semantic-Web-konform repräsentieren. Der Vortrag soll aufzeigen, welche Auswirkungen RDA auf die Katalogisierung in Bibliotheken und den Zugang zu den erschlossenen Ressourcen im Semantic Web hat. Anhand erster Erfahrungen aus praktischen Umsetzungen wird erläutert, wie bibliografische Daten durch RDA und Linked-Data-Technologien besser zugänglich gemacht und vor allem nachgenutzt werden können.
Session zu Mikroformaten und COinS von Lambert Heller und Christian Hauschke beim KIM-Workshop "Metadaten, Mikroformate und Semantic Web" am 13. April 2010 in der ETH Zürich.
Ähnlich wie Neue Wege Fuer Metadaten - FOSSGIS 2010 (16)
DVW Seminar zu Freier Software und Freien DatenArnulf Christl
Eine Einführung in die Open Source Entwicklung im Geodatenbereich. Vortrag zum DVW Seminar in Dresden im November 2016. Open Source, Open Data und Open Standards ermöglichen die Bereitstellung von Geodaten zur allgemeinen Nutzung, sie es zu privaten oder kommerziellen Nutzung. Als internationale Vertretung agiert die OSGeo Foundation, im deutschsprachigen Raum übernimmt der FOSSGIS e.V. diese Aufgabe.
STDM Online Architecture and Services for Land AdministrationArnulf Christl
Most people-to-land relationships worldwide are not recognized, identified or documented. Existing land administration systems are incomplete and do not perform. Lack of know-how, short lived projects and proprietary systems lock-in users and governments. Alternatives are needed. The Social Tenure Domain Model Software (STDM) is based on open standards and Open Source Software to avoid these common pitfalls.
The talk tells the story of how Open Source GIS developers founded the geospatial standards organization OGC in the early 1990s, long before the term “Open Source” was even coined. The story goes on to describe how Open Source geospatial activists founded OSGeo in 2006, why the current big topic is Open Data and how it all ties together.
This need for openness is intrinsic to geospatial because any location makes sense only relative to other location data. Interoperability is a must.
This document summarizes an INSPIRE workshop organized by OSGeo members. The agenda included short presentations from representatives of public administration, the EU Commission, and industry. Speakers included individuals from organizations like Ordnance Survey GB, the EEA, JRC, regional governments in Germany and Austria, the UK MetOffice, GeoCat, Occam Labs, metaspatial, and the Joint Research Center. Many speakers discussed their roles working with geospatial data and standards, and their goals in supporting INSPIRE. Common challenges mentioned were the need for more coordination, funding, and communication to help with INSPIRE implementation and maintenance.
Open Standards, Open Source, Open Data. Zuviel des Guten?Arnulf Christl
Ein Vortrag von der FOSSGIS Konferenz 2013 in Rapperswil, Schweiz. Die Online Version dieses Vortrags finden Sie unter: http://metaspatial.net/conferences/fossgis2013_open.html
Der Vortrag beleuchtet ausnahmsweise mal die Schattenseiten dieser drei Gesellen, denn: Ja, es gibt sie, z.B.
* behindern Standards Innovation,
* zerstört Open Source bewährte Geschäftsmodelle und
* Open Data fördert das Chaos.
Eine konstruktive Herangehensweise zeigt, dass es lediglich gilt diese Schattenseiten auzuleuchten, um das volle Potential expliziter Offenheit ausschöpfen zu können.
Firmenprofil: Metaspatial berät in allen Fragen zu Karten- und Geodaten-Anwendungen, GIS und GDI. Zu den Dienstleistungen zählt Wissensvermittlung, Erstellung von Studien, Unterstützung bei Ausschreibungen und professionelle Projektleitung.
Resource Oriented Future for Geospatial DataArnulf Christl
This talk introduces to several buzz words appearing in the context of SDI. After detailing some of the better known acronyms they are put into an architectural context and related to the Resource Oriented Architecture (ROA).
The legacy definition of a Spatial Data Infrastructure (SDI) is an infrastructure to provide interactively connected access to spatial data and metadata using software tools. In more recent definitions of SDI it translates into "Spatial Data on the Internet". The main reason for this shift in perspective is that there is no need to define a separate infrastructure for spatial data if a perfectly well organized infrastructre is already in place (the Internet and the Web).
In the last section ROA concepts are mapped to current Web and Internet technologies and a perspective of the evolution of SDI is given.
The OSGeo Foundation: Professionally Leveraging Open Source GeospatialArnulf Christl
The OSGeo Foundation is a global non-profit organization that supports open source geospatial software. It provides resources for projects, promotes open data and standards, and organizes conferences like FOSS4G. OSGeo has a board of directors and committees that oversee its growing number of projects. It sees open source as superior to proprietary software and aims to support open source globally.
A short introduction to the term "Openness" as it is used by three different organizations in the geospatial domain, the OGC, OSGeo and OSM - plus an outlook where we should be going.
The relationship of four OSGeo projects OpenLayers, Mapbender, GeoMajas and MapFish can be summarized as follows:
OpenLayers is a JavaScript library that is used by web developers to add maps to their web sites and applications.
Mapbender is a server software package used by geo portal administrators to maintain and monitor services, deploy applications, maintain users and allow secured access to services through proxy facade. MapFish is a development framework used by geospatial software developers to implement web map applications, depending on OpenLayers as the single viewing component. GeoMajas is a self contained Web GIS software package implemented in Java using HTML and JavaScript front ends.
Modern metadata catalogs use ontologies and thesauri to create hierarchical and polyhierarchical indexes. But catalogs still seem to miss the needs of both consumers and producers of geospatail data alike. A concise introduction to the syntax and semantics of geospatial metadata shows how to get there and that it misses pragmatics (the third semiotic discipline). One path to solve this problem is to automize metadata generation by better linking IT and to allow more interaction of actors.
The document discusses the nature of software and data. It argues that software is immaterial and can be easily copied, unlike physical property. However, data is often treated as property subject to restriction. The presenter argues that restricting the sharing of software and data goes against the nature of software and prevents it from reaching its full potential. OSGeo aims to promote sharing of open source geospatial software and data to create public benefit on a global scale.
Eine Typisierung von Mapbender, OpenLayers und MapFishArnulf Christl
Ein Vergleich der OSGeo web mapping Software. OpenLayers ist eine JavaScript-Bibliothek für Web-Entwickler. Mapbender ist ein Softwarepaket zum Management von GDI in Geoportalen. MapFish ist ein Entwickler-Framework für komplexe WebGIS Anwendungen. Natürlich kann man alle drei auch in den jeweils anderen Kontexten einsetzen, bezahlt das aber mit deutlichen Mehraufwänden. Nachfolgend werden die Gemeinsamkeiten und Unterschiede der drei OSGeo-Projekte detailliert vorgestellt.
IV. Jornadas Sig Libre: The State of OSGeo and the Global SDIArnulf Christl
The current State of OSGeo: Overview of the established OSGeo software products, incubating projects, local chapter and conference activities and some politics. And as always: What is different about software in general.
Vorstellung des Leistunsspektrum der Firma WhereGroup GmbH & Co KG. Der Foliensatz erläutert die Zusammenhänge von Freie Software Lizenzen und Open Source Methoden und stellt die von der Wheregroup verwendete Softwarepalette vor. Die Wheregroup hat sich auf agile Projektsteuerung mit Scrum spezialisiert und verbindet diese Methode mit traditionellen V-Modell XT Vorgehensmodellen.
OSM, Oeffentliche Geodaten und DatenqualitaetArnulf Christl
Diese Präsentation stellt zunächst einige Grundlagen der Open Source Softwareentwicklung vor und erläutert Freie Software Lizenzen. Anschließend wird erarbeitet, wie dieses Konzet auf Kartenwerke übertragen werden kann. Es folgt eine kurze Einführung in OpenStreetMap, Hinweise auf Crowd-Sourcing Qualitätsmanagement und OSM-Werkzeuge. Es folgt ein kurzer Vergleich von OpenStreetMap mit GoogleMaps.
In einem Exkurs wird das deutsche Emmissions- und Schadstoffkataster PRTR vorgestellt, in dem Geodaten aus OpenStreetMap genutzt und mit amtlichen Daten überlagert werden.
Im Ausblick wird progonstiziert, dass Open Source Software stärker mit "Crowd Source" Geodaten und "Volunteered Geographic Information" zusammen eingesetzt wird und diese mit amtlichen Informationen stärker zusammenwachsen werden. Der Zugriff auf alle Daten muss für alle ermöglicht werden. Dabei muss sowohl die staatliche, als auch private Datenhoheit gewährleistet bleiben.
2. Arnulf Christl: Neue Wege für Metadaten
Metadaten
Metadaten enthalten beschreibende Informationen über Daten. In der räumlichen Datenver
arbeitung ist die Verfügbarkeit von Metadaten eine grundsätzliche Voraussetzung für die
sinnvolle Anwendung und Nutzung von Geodaten, Diensten und Anwendungen.
Zwei Beispiele für unterschiedliche Metadaten
Metadaten zu einem Orthophoto können unter anderem folgende Informationen bereitstellen
(die Liste ist unvollständig):
● Räumlicher Ausschnitt
● Koordinatensystem, Projektion
● Format oder Zugriffsmöglichkeiten
● Datum der Aufnahme
● Auflösung des Originalbildes
● Farbkanäle
● Aufnahmegerät
○ Digital
○ Analog
● Bearbeitungsschritte
○ Ausschnitt
○ Entzerrung
○ Schattenaufhellung
○ Kontrast und Farbanpassung
○ etc.
Andere Geodaten benötigen andere Informationen, für die Karten eines StauInformations
dienstes wären unter anderem folgende Aspekte wichtig:
● Koordinatensystem, Projektion
● Datum der letzten Aktualisierung
● Format oder Zugriffsmöglichkeiten
● Ursprung der geometrischen Grundlage
● Aktualität der geometrischen Grundlage
● Aufnahmeart
○ Datenerhebung durch Verkehrsüberwachung (amtlich)
○ Meldungen durch Autofahrer (freiwillig, verifiziert)
● Prognosestatus
○ Statistische Auswertung
○ Berücksichtigung von Baustellen
○ etc.
Die meisten dieser Metadaten liegen heute bereits digital vor. Statt sie in einer vorgegebenen
Syntax hierarchisch strukturiert für einen Metadatenkatalog "abzutippen", sollten sie einfach
offen gelegt werden. Das heißt nicht, dass alle Daten sofort gemeinfrei werden, sondern le
2 FOSSGIS 2009
3. Arnulf Christl: Neue Wege für Metadaten
diglich, dass dem Suchenden die Möglichkeit an die Hand gegeben wird selbst herauszufin
den, welche Metadaten er braucht.
Syntax und Semantik von Metadaten
Die Struktur von Metadaten können unter Aspekten der Syntax und der Semantik analysiert
werden. Die Syntax beschreibt Geodaten rein formal, während sich die Semantik auf deren
Bedeutung bezieht. Beide sind wichtige Voraussetzungen für die Nutzung von Geodaten
und Diensten im Netz. Syntax und Semantik sind Disziplinen der Semiotik, die durch die Leh
re von den Beziehungen der Zeichen zu den Zeichenbenutzern (Pragmatik [1]) vollendet
wird; und genau hier liegt das Problem.
Doch zunächst zur Syntax: Ein Teil der oben beschriebenen Metadaten kann so harmonisiert
werden, dass sie für beide Beispiele im gleichen Format angegeben werden können. Diese
Informationen beziehen sich dann auf die Syntax. Dazu zählen das Koordinatensystem und
die Projektion, die aus einer definierten Liste ausgewählt, oder direkt als Funktionen mit Pa
rametern definiert werden können. Das Format oder die Zugriffsmöglichkeiten können eben
falls in einer für beide Geodaten gleichen Form beschrieben werden. Hier können Verweise
auf klare Definitionen wie z.B. Standards gegeben werden, seien es dejure Standards der
ISO4, offene Industriestandards des OGC5 oder proprietäre Formate wie sie von Bing, Yahoo
oder Google vorgegeben werden, und für die technische Beschreibungen vorliegen. Diese
Informationen beziehen sich auf die Syntax der Geodaten. Die Syntax beschreibt sozusagen
die Grammatik. Ein Beispiel aus der Linguistik verdeutlicht diesen Aspekt: Der Satz "Ich bin
ein Tisch, deshalb werden Schwäne grün" ist rein syntaktisch richtig, auch wenn ich in Wirk
lichkeit kein Tisch bin, noch dies grüne Schwäne bedingen würde.
Semantische Informationen sind ungleich komplexer und weniger greifbar, da sie weniger gut
strukturiert werden als die Syntax. Semantische Informationen beschreiben die Daten auf in
haltlicher Ebene und beziehen sich auf Sinnzusammenhänge. Der Sinnzusammenhang ist
ein wichtiges Kriterium zur Auffindbarkeit von Geodaten und Diensten. Die mangelnde Abbil
dung von Sinnzusammenhängen in technischen (syntaktischen) Metadatenbeschreibungen
führt dazu, dass Katalogsuchen oft nicht zu den gewünschten Ergebnissen führen.
Ontologien
Die Ontologie ist die Lehre vom "Sein der Dinge". Eine Ontologie beschreibt die Beziehungen
von Sinnzusammenhängen und bringt sie in einen definierten Kontext. Erst das Akzeptieren
und die Anwendung einer gemeinsamen Ontologie oder eines Sinnzusammenhangs ermög
licht Kommunikation. Gruninger und Lee [2] unterscheiden drei Anwendungsfelder: Kommu
nikation, automatisches Schließen und Repräsentation sowie Wiederverwendung von Wis
sen. Sollen zwei Programme (z.B. WebSuchmaschinen oder SoftwareAgenten) miteinander
kommunizieren, so müssen sie entweder selbst die Interpretationsvorschrift für die Daten in
4 International Organization for Standardization, http://www.iso.org/
5 Open Geospatial Consortium, http://www.opengeospatial.org/
FOSSGIS 2010 3
4. Arnulf Christl: Neue Wege für Metadaten
sich tragen (sind also datenabhängig), oder aber sie liefern diese in Form von Metadaten ei
ner beiden Seiten zugänglichen Ontologie mit. Hier werden Metadaten als Form der Kommu
nikation verstanden, mit Hilfe derer Metadaten überhaupt erst interpretierbar werden.
Ontologie werden ebenfalls benötigt, um die Regeln einer Syntax zu kommunizieren. Bezo
gen auf die oben gegebenen Beispiele beschreibt die Ontologie des OGC verschiedene
Dienste (Services) in mehreren "Lehren" (StandardDokumenten). Dabei werden gemeinsa
me SinnGrundlagen in übergeordneten "Lehren" oder Standards zusammengefasst. Um
beim Beispiel zu bleiben, schreibt der "OGC Commons Standard" vor, dass alle drei großen
Dienste (WMS6, WFS7, WCS8) ein CapabilitiesDokument bereitstellen müssen. Der Com
monsStandard verweist zusätzlich auf die EPSG (European Petroleum Survey Group), in
der die Beschreibung von Koordinatensystemen und Projektionen definiert sind. In diesen
wird angenommen, dass klar ist, wie eine Rechenoperation ausgeführt wird oder was eine
Gleitkommazahl ist, hier wird implizit Bezug auf Grundrechenoperationen genommen.
Wie ist nun die Ontologie der Grundrechenoperationen zustande
gekommen und warum addieren wir heute mit arabischen Zahlen?
Weil "2 + 2 nach Adam Rise 4 macht" [3]. Adam Rise (siehe Abbil
dung 1) hat mit seinen grundlegenden Werken in deutscher Spra
che (damals war Latein die Sprache der Gelehrten) entscheidend
dazu beigetragen, dass die römischen Zahlzeichen durch die nach
dem Stellenwertsystem strukturierten indischarabischen Zahlzei
Abb. 1: Adam Rise chen ersetzt wurden. Er hat diese Ontologie bekannt gemacht und
damit Akzeptanz für die Anwendung geschaffen. Wir können fest
halten, dass sowohl Syntax, als auch Semantik auf Ontologien basieren.
Ontologien, auf der die Seman
tik eines Geodatensatzes oder
Dienstes aufbauen können, sind
oft fachspezifisch. Ein Beispiel
ist die ozeanographische For
schung, deren Ontologien von
mehreren eigens geschaffenen
Organisationen [4], [5] aufge
baut und mit modernen Kommu
nikationsmethoden (siehe Abbil
dung 2) diskutiert, gepflegt und
im besten Fall auch genutzt wer
den.
Die Ontologien der Ozeanogra
phie verweisen auf andere, Abb. 2: Werkzeug zum kollaborativen Aufbau von Ontologien
6 OGC Web Map Service, KartenDienst Standard
7 OGC Web Feature Service, GeometrieDienst Standard
8 OGC Web Coverage Service, RasterdatenDienst Standard
4 FOSSGIS 2009
5. Arnulf Christl: Neue Wege für Metadaten
grundlegende Sinnzusammenhänge, ohne die ihnen eine gemeinsame Grundlage fehlen
würde, bin hin zum Beispiel oben im Jahr 1524 und bei Adam Rise.
REST Technik mit Sinn verbinden
Die technische Lösung für
einen Verweis im Internet, ist
typischerweise ein Verweis
in der Ausprägung einer
URL. Ein häufig auftretendes
technisches Problem ist die
mangelnde und brüchige
VerweisBindung (Linking,
oder "VerLinkung"), die in
meist wenig hilfreichen HTTP
404 (File not found) Status
codes endet (siehe Abbil Abb. 3: Typische HTTP Statuscode 404 Fehlermeldung [6]
dung 3).
Die Lebensdauer von Verweisen (Adressen) kann sehr einfach durch die konsequente Nut
zung der technischen Möglichkeiten erhöht werden. Das RESTArchitekturparadigma be
schreibt genau diesen Prozess. Das HTTP Applikationsprotokoll9 des Internet bietet bereits
alle erforderlichen Eigenschaften, z.B. den HTTP Statuscodes der 3er Serie "Umleitung"
statt den der 4er Serie "File not found" (404)10. Leider sind die meisten Anbieter jedoch noch
nicht für diese Technologie sensibilisiert, weshalb sie nicht oft zur Anwendung kommt. Der
Statuscode "Umleitung" spezifiziert die neue Adresse der Ressource:
301 Moved Permanently
Die angeforderte Ressource steht ab sofort unter der im „Loca
tion“HeaderFeld angegebenen Adresse bereit. Die alte Adresse
ist nicht länger gültig.
Der Begriff "Ressource" ist hier im Kontext von REST und der Resource Oriented Architec
ture (ROA) sehr allgemein zu verstehen. Ein OCG WMS Dienst ist genauso wie ein PDFDo
kument aus der Perspektive des Internet nichts weiter als eine Ressource. Die Darstellung ei
ner Karte, also das Ergebnis einer GetMapAnfrage, ist eine Repräsentation dieser Ressour
ce. Das CapabilitiesDokument des OCG WMS Dienstes ist nichts weiter als eine andere Re
präsentation der gleichen Ressource.
Im CapabilitiesDokument eines Dienstes ist der Zugang zu allen anderen Repräsentationen
enthalten, sei es eine Liste der Ebenen des Dienstes, die unterstützten Koordinatensysteme,
Bildformate, LegendenElemente oder weitere Aspekte. Deshalb kommt dem Capabilities
Dokument eine ganz zentrale Bedeutung zu, vor allem der "OnlineResource". Ohne diese
9 World Wide Web Consortium (W3C); http://www.w3.org/hier_kommt_ein_404
10 Internet Engineering Task Force (IETF); RFD 2616; http://www.ietf.org/rfc/rfc2616.txt
FOSSGIS 2010 5
6. Arnulf Christl: Neue Wege für Metadaten
Adresse ist der Dienst schlichtweg nicht erreichbar. Diese Repräsentation eines Kartendiens
tes ist aus Perspektive des weltweiten Netzwerkverbundes die wichtigste Metainformation
überhaupt. Die hier vermerkte URL ist der seidene Faden an dem die gesamte weitere Nutz
barkeit des Dienstes hängt. Deshalb halten aktuelle Geoportale und Metadatenkataloge Ko
pien der CapabilitiesDokumente vor und überprüfen in regelmäßigen Abständen die Verfüg
barkeit und die Aktualität der Kopie. Entdeckt der MonitoringProzess eine Änderung, schlägt
er Alarm und benachrichtigt über eine AboFunktion11 alle registrierten Benutzer, die dies
wünschen (ob Mensch oder Maschine).
Eine Änderung dieser Adresse darf nicht unbemerkt erfolgen, sie muss sofort und überall,
am besten automatisiert, berichtigt werden, z.B. über RSS12. Wenn der Dienst auch für Ma
schinen weiter auffindbar sein soll, darf die alte Adresse nicht einfach gelöscht werden, denn
das würde nur in die Sackgasse 404 führen. Stattdessen muss der Webserver mit einem
Statuscode 301 (permanently moved) antworten und im LocationFeld des Headers die neue
Adresse angeben. Wenn das CapabilitiesDokument, und vor allem die OnlineResource
URL stimmen, können alle weiteren Informationen hergeleitet werden, da sie in dem maschi
nenlesbaren XML Dokument in einer definierten Syntax hinterlegt sind.
Hierarchische Kataloge durch digitale Fundgruben ersetzen
Selbst wenn die technische Hürde "toter Links" überwunden wird, bleiben Geodaten häufig
dennoch trotz umfangreicher, technischer Metadatenbeständen unauffindbar, da die Abbil
dung von Sinnzusammenhängen in herkömmlichen, hierarchisch strukturierten Katalogen
nicht möglich ist. In den weiter oben gezeigten Beispielen sind die Informationen zu Entzer
rung und Schattenaufhellung für sich genommen genauso wichtig, wie es zu wissen gilt, ob
die Aufnahmeart der Verkehrsüberwachung amtlichen Charakter hat oder durch freiwillige
Meldungen von Autofahrern erfolgt. Beide Informationen lassen sich aber schwerlich gemein
sam in einem Metadatenblatt oder Katalog abbilden, da sie strukturell unterschiedlichen On
tologien angehören. Deshalb sollten alle bereits verfügbaren digitalen Metadaten über Ver
weise (URL) an die Geodaten (Ressourcen) gebunden werden, um sie vollständig für die Su
che nutzbar zu machen. So werden Metadaten in Wert gesetzt.
Weitere Einschränkungen bei der Bereitstellung von Geodatendiensten sind hausgemacht
und teilweise nicht einmal technischer Natur, z.B. wenn die verwendete Software Unmengen
von Daten über eine einzige Adresse bereitstellt. Ein typisches Beispiel sind Karten und
Geodatendienste, die mehrere hundert oder sogar tausend Ebenen enthalten. Diese lassen
sich mit aktuellen, technisch durchaus der INSPIRERichtlinie genüge leistenden Metadaten
zwar beschreiben, die dort hinterlegten Informationen sind aber ohne Modifikation nicht für
die Weiterverarbeitung zu gebrauchen.
Anwender müssen sämtliche Metadaten und die Daten selbst mit ihren eigenen Ontologien
durchsuchen können. Die Syntax der Suche wird durch die Technologie vorgegeben. Sie
sollte möglichst einfach sein, da sie von den Anwendern erlernt werden muss . Ein viel zitier
11 GeoportalRLP: http://www.geoportal.rlp.de/mediawiki/index.php/Monitoring_abonnieren
12 Really Simple Syndication
6 FOSSGIS 2009
7. Arnulf Christl: Neue Wege für Metadaten
tes Beispiel ist die einfache GoogleSuche, der es reicht mit einem einzigen Textfeld (oft)
sinnvolle Ergebnisse zu liefern. Die digitale Verfügbarkeit von Metainformationen kommt den
Bedürfnissen der GeodatenAnwender entgegen und entlastet den Anbieter davon, sein ei
genes Angebot nach für ihn unbekannten Kriterien zu strukturieren und zu beschreiben.
Kommunikationsprozesse erfolgen vor allem zwischen Anwendern, schon allein weil deren
Zahl viel höher ist als die der Anbieter. Alle die an diesem Prozessen teilnehmen, können
sich in den Bereiche betätigen für die sie qualifiziert sind und die sie interessieren.
Im Web 2.0 gibt es eine Vielzahl technischer Möglichkeiten, um diese Kommunikation kom
fortabel und einfach zu gestalten. Ein aktuelles Beispiel, das bereits einen Teil dieser Mög
lichkeiten nutzt, ist das Webbasierte WMS Server Repository Geopole13. Hier können Diens
te eingetragen, angezeigt und bewertet, sowie Informationen über neue Dienste und geän
derte Metadaten per RSS14 abonniert werden.
In der Übergangsphase, während die Datenanbieter noch lernen die Technologie korrekt ein
zusetzen, können Anwender DienstRessourcen in Repositories15 eintragen und mit Einträ
gen in Diskussionsforen, Wikis und originären Metadatenquellen verbinden. So entsteht eine
heterogene Menge unsortierter Information unterschiedlicher Ontologien. Dadurch wird der
Prozess der Organisation dynamisch und verlagert sich vom Anbieter zum Anwender. Der
kategorisierende Prozess erfolgt jetzt bei der Suche, die mit einfacher, klar strukturierter Syn
tax aber hoch fachspezifischer Semantik erfolgt. Problem gelöst.
Kontakt zum Autor:
Arnulf Christl
Metaspatial
Heerstr. 162
0228 9768424
arnulf.christl@metaspatial.net
Literatur
[1] Kepa Korta, John Perry: Pragmatics, http://plato.stanford.edu/entries/pragmatics/, 2006
[2] Gruninger, M., Lee, J.: Ontology applications and design. Comm. ACM 45(2), 3941 (2002)
[3] Rise, Adams: Rechenbuch auff Linien und Ziphren in allerley Hanthierung, Annaberg, 1524
[4] Marine Metadata Interoperability http://marinemetadata.org/; 2010
[5] Ocean Data Standards http://www.oceandatastandards.org/; 2010
13 WMS Server Repository, http://www.geopole.org/
14 Really Simple Syndication, http://www.rssboard.org/rssspecification
15 Ablage, Fundgrube, Verwahrungsort: http://dict.leo.org/ende?lang=de&search=Repository
FOSSGIS 2010 7