Vernetzte juristische Fachvokabulare als
Bausteine für das Semantic Web
Mag. Blumauer Andreas
Semantic Web Company
www.semantic-web.at
www.poolparty.biz
Semantic Web Company GmbH

Gegründet 2001 in Wien
>20 Experts im Bereich semantischer Technologien
Produkt: PoolParty Suite (seit 2009)
Kunden: Globale Konzerne, NPOs, NGOs und GOs
Geschäftsführer, Wirtschaftsinformatiker
Kunden aus ‚wissensintensiven„ Branchen
• Pearson
• Daimler
• Nintendo
• Ministry of Finance (AUT)
• Roche
• Credit Suisse • Council of EU
• Education Services (AUS)
• World Bank • Wolters Kluwer • Wood Mackenzie • Bank of America
Kunden aus der öffentlichen
Verwaltung
AT

Ministry of Finance - https://www.bmf.gv.at

AT

Geological Survey - http://www.geologie.ac.at/

AUS

Education Services - http://www.esa.edu.au

AUS

Healthdirect - http://www.healthdirect.org.au

NOR

Directorate of Immigration - http://www.udi.no/

SUI

Swiss Federal Archives - http://www.bar.admin.ch/

UK

Centre for Ecology & Hydrology - http://www.ceh.ac.uk

EU

European Commission - http://ec.europa.eu/

EU

Council of the EU - http://www.consilium.europa.eu

EU

European Country of Origin Network – http://ecoi.net
Die Vortragsthemen
Informationsquellen zu bestimmten Rechtsgebieten wie Steuerrecht oder Zollrecht sind üblicher Weise
mannigfaltig, kaum vernetzt und aus unterschiedlichsten Stakeholder-Perspektiven verfasst worden. Eine der
größten Herausforderungen, denen sich viele juristische Berufe im Zeitalter von ' Big Data' stellen müssen, ist die

kontextabhängige Vernetzung unterschiedlichster
Informationsbestände entlang eines Entscheidungsprozesses.
gezielte und

Mit Hilfe kontrollierter Vokabulare und juristischer Thesauri , die auf Basis global anerkannter
Technologiestandards entwickelt werden, können Fachinformationen gezielt und automatisiert vernetzt werden.

Werden Linked

Data Standards wie SKOS

('Simple Knowledge Organization System') eingesetzt, so

organisationsübergreifende und multilinguale
Informationsvernetzung auf effizientere Weise als je zuvor.
gelingt darüberhinaus die

Zahlreiche Organisationen und ihre Fachvokabulare wie z.B. das Amt für Veröffentlichungen der Europäischen

Union (EuroVoc), das Schweizerische Bundesgericht (Jurivoc) oder das Leibniz-Informationszentrum Wirtschaft
(STW Thesaurus) haben bereits standard-basierte Vokabulare veröffentlicht, die in den nächsten Jahren den
Status von Eckpfeilern für ein globales semantisches Web erlangen können.
Der Vortrag stellt die Anforderungen

an ein Thesaurus-System des Bundesministeriums für

Finanzen dar, sowie ein Lösungskonzept, das u.a. auf die Verwendung

Linked Data Standards abzielt.

von offenen
Warum Fachvokabulare?

 Fachvokabulare: Glossare, Taxonomien, Thesauri,
Ontologien

 Fachvokabulare helfen, den Kontext eines

Informationsobjekts genauer zu bestimmen, und damit die
Bedeutung eines Begriffs zu determinieren

 Die Notwendigkeit von permanent adressierbaren

Referenzpunkten in einem babylonischen Sprachengeflecht
wird immer offensichtlicher
Was bedeutet Kaffee?
Kaffee

•
•
•
•
•

Stärke
Größe
Milch?
Schokolade?
Preis
Warum vernetzte Fachvokabulare?

bmvit

BM.I

Verwaltungsreform

Lebensministerium

Search

bmask
Standard basierte, vernetzte Fachthesauri

50 Mrd.
Fakten

•
•
•
•

EuroVoc
Thesaurus
Sozial-Wissenschaften
DBPedia
Standard-Thesaurus
Wirtschaft

http://vocabulary.wolterskluwer.de/arbeitsrecht/10913
Beispiel: Education Services Australia
SKOS-Thesauri in der Verwaltung

 Eurovoc (EU)

 ST Wirtschaft (Leibniz Gesellschaft)

 ESCO (EU)

 Polythematic SH (CZ)

 Jurivoc (SUI)

 Canadian SH (Can)

 ScoT (AUS)

 Worldbank Taxonomy (WBG)

 Agrovoc (UN)

 Arbeitsrechts-Thesaurus (Wolters Kluwer)

 GEMET (EEA)

 Reegle Thesaurus (REEEP)

 GeoThesaurus (AT)

 Demnächst: Steuerrechts-Thesaurus (AT)
Simple Knowledge Organization System (SKOS)

Umsatzsteuer
http://voc.org.com/core/77

altLabel

Mwst

--- -- ----- -- ------Umsatzsteuer-------- --- ------- -- Café---- ----- ------- ---- ---

http://voc.org.com/core/176

narrower

Gastronomie

Café
http://voc.org.com/core/44

Gastro

--- --Mwst--- ------ -------- -- ---- -- ---- ---- --- --Gastronomie--- ----- ---- ---- ---- -- ------ -------- ----
Use Cases für SKOS entlang des
Content Life Cycles
Fallbeispiel:
WM-Werkzeug für das Finanzressort
 Verbesserung / Vereinfachung des Annotationsprozesses

(“hoher redaktioneller Aufwand notwendig, Schlagworte,
Synonyme etc. zu jedem einzelnen Dokument zu
vergeben”)

 Suche auf Basis der Bedeutung eines Suchbegriffs
(“Expertensprache, Umgangsprache, Synonyme,
ähnliche Begriffe, …”)

 Aufbau und Einsatz von Ressort-spezifischen Fach-Thesauri
(Steuerrecht, Zollrecht, …)
Vereinfachung des
Annotationsprozesses
Zu den vorgeschlagenen Tags kann Kontextinformation aus dem Wissensgraph angezeigt werden.
Extraktion von Enititäten mit PoolParty
Import von Excel, Word, PDF, CSV, XML, SKOS/RDF; integrierbar mit Oracle, SharePoint,
Google, Mindbreeze, FirstSpirit, Drupal, Wordpress, …
FINDOK: Konzept-basierte Suche
Semi-automatische Erstellung von
semantischen Fachvokabularen
Österreichischer Steuerrechtsthesaurus Grundstruktur
Allgemeinbegriffe - Synonymverwaltung
Kontakt

Mag. Andreas Blumauer

CEO, Semantic Web Company
+43 1 4021235
a.blumauer@semantic-web.at

www.semantic-web.at
www.poolparty.biz

Partner network

IRIS 2014 - Vernetzte juristische Fachvokabulare als Bausteine für das Semantic Web

  • 1.
    Vernetzte juristische Fachvokabulareals Bausteine für das Semantic Web Mag. Blumauer Andreas Semantic Web Company www.semantic-web.at www.poolparty.biz
  • 2.
    Semantic Web CompanyGmbH Gegründet 2001 in Wien >20 Experts im Bereich semantischer Technologien Produkt: PoolParty Suite (seit 2009) Kunden: Globale Konzerne, NPOs, NGOs und GOs Geschäftsführer, Wirtschaftsinformatiker
  • 3.
    Kunden aus ‚wissensintensiven„Branchen • Pearson • Daimler • Nintendo • Ministry of Finance (AUT) • Roche • Credit Suisse • Council of EU • Education Services (AUS) • World Bank • Wolters Kluwer • Wood Mackenzie • Bank of America
  • 4.
    Kunden aus deröffentlichen Verwaltung AT Ministry of Finance - https://www.bmf.gv.at AT Geological Survey - http://www.geologie.ac.at/ AUS Education Services - http://www.esa.edu.au AUS Healthdirect - http://www.healthdirect.org.au NOR Directorate of Immigration - http://www.udi.no/ SUI Swiss Federal Archives - http://www.bar.admin.ch/ UK Centre for Ecology & Hydrology - http://www.ceh.ac.uk EU European Commission - http://ec.europa.eu/ EU Council of the EU - http://www.consilium.europa.eu EU European Country of Origin Network – http://ecoi.net
  • 5.
    Die Vortragsthemen Informationsquellen zubestimmten Rechtsgebieten wie Steuerrecht oder Zollrecht sind üblicher Weise mannigfaltig, kaum vernetzt und aus unterschiedlichsten Stakeholder-Perspektiven verfasst worden. Eine der größten Herausforderungen, denen sich viele juristische Berufe im Zeitalter von ' Big Data' stellen müssen, ist die kontextabhängige Vernetzung unterschiedlichster Informationsbestände entlang eines Entscheidungsprozesses. gezielte und Mit Hilfe kontrollierter Vokabulare und juristischer Thesauri , die auf Basis global anerkannter Technologiestandards entwickelt werden, können Fachinformationen gezielt und automatisiert vernetzt werden. Werden Linked Data Standards wie SKOS ('Simple Knowledge Organization System') eingesetzt, so organisationsübergreifende und multilinguale Informationsvernetzung auf effizientere Weise als je zuvor. gelingt darüberhinaus die Zahlreiche Organisationen und ihre Fachvokabulare wie z.B. das Amt für Veröffentlichungen der Europäischen Union (EuroVoc), das Schweizerische Bundesgericht (Jurivoc) oder das Leibniz-Informationszentrum Wirtschaft (STW Thesaurus) haben bereits standard-basierte Vokabulare veröffentlicht, die in den nächsten Jahren den Status von Eckpfeilern für ein globales semantisches Web erlangen können. Der Vortrag stellt die Anforderungen an ein Thesaurus-System des Bundesministeriums für Finanzen dar, sowie ein Lösungskonzept, das u.a. auf die Verwendung Linked Data Standards abzielt. von offenen
  • 6.
    Warum Fachvokabulare?  Fachvokabulare:Glossare, Taxonomien, Thesauri, Ontologien  Fachvokabulare helfen, den Kontext eines Informationsobjekts genauer zu bestimmen, und damit die Bedeutung eines Begriffs zu determinieren  Die Notwendigkeit von permanent adressierbaren Referenzpunkten in einem babylonischen Sprachengeflecht wird immer offensichtlicher
  • 8.
  • 9.
  • 10.
    Standard basierte, vernetzteFachthesauri 50 Mrd. Fakten • • • • EuroVoc Thesaurus Sozial-Wissenschaften DBPedia Standard-Thesaurus Wirtschaft http://vocabulary.wolterskluwer.de/arbeitsrecht/10913
  • 11.
  • 12.
    SKOS-Thesauri in derVerwaltung  Eurovoc (EU)  ST Wirtschaft (Leibniz Gesellschaft)  ESCO (EU)  Polythematic SH (CZ)  Jurivoc (SUI)  Canadian SH (Can)  ScoT (AUS)  Worldbank Taxonomy (WBG)  Agrovoc (UN)  Arbeitsrechts-Thesaurus (Wolters Kluwer)  GEMET (EEA)  Reegle Thesaurus (REEEP)  GeoThesaurus (AT)  Demnächst: Steuerrechts-Thesaurus (AT)
  • 13.
    Simple Knowledge OrganizationSystem (SKOS) Umsatzsteuer http://voc.org.com/core/77 altLabel Mwst --- -- ----- -- ------Umsatzsteuer-------- --- ------- -- Café---- ----- ------- ---- --- http://voc.org.com/core/176 narrower Gastronomie Café http://voc.org.com/core/44 Gastro --- --Mwst--- ------ -------- -- ---- -- ---- ---- --- --Gastronomie--- ----- ---- ---- ---- -- ------ -------- ----
  • 14.
    Use Cases fürSKOS entlang des Content Life Cycles
  • 15.
    Fallbeispiel: WM-Werkzeug für dasFinanzressort  Verbesserung / Vereinfachung des Annotationsprozesses (“hoher redaktioneller Aufwand notwendig, Schlagworte, Synonyme etc. zu jedem einzelnen Dokument zu vergeben”)  Suche auf Basis der Bedeutung eines Suchbegriffs (“Expertensprache, Umgangsprache, Synonyme, ähnliche Begriffe, …”)  Aufbau und Einsatz von Ressort-spezifischen Fach-Thesauri (Steuerrecht, Zollrecht, …)
  • 16.
    Vereinfachung des Annotationsprozesses Zu denvorgeschlagenen Tags kann Kontextinformation aus dem Wissensgraph angezeigt werden.
  • 17.
    Extraktion von Enititätenmit PoolParty Import von Excel, Word, PDF, CSV, XML, SKOS/RDF; integrierbar mit Oracle, SharePoint, Google, Mindbreeze, FirstSpirit, Drupal, Wordpress, …
  • 18.
  • 19.
  • 20.
  • 21.
  • 22.
    Kontakt Mag. Andreas Blumauer CEO,Semantic Web Company +43 1 4021235 a.blumauer@semantic-web.at www.semantic-web.at www.poolparty.biz Partner network