Linked Government Data
data.gv.at – Semantic Web Meetup

Andreas Langegger
http://www.langegger.at
Wien, 8. April 2010
WWW
                                                            Semantic Web
                                 Apple                              Web of Data
         V. Bush: Memex        HyperCard
                                (lokal)
          (theoretisch)




             1945               1985            1990           2010>

                                           Dokumente +        Dinge +
                                           Hyperlinks         Beziehungen
                                           > für Menschen     > maschinenlesbar

Jacob Nielson, 1995: “Before
                     the workshop, hypertext had been
considered a somewhat esoteric concept of interest to a
few fanatics only.”
(gemeint war 1. Hypertext Workshop 1987)
Semantic Web
•  Theoretisch betrachtet:
  ▫  Anstatt verknüpfter Webseiten: riesiger globaler Datengraph
  ▫  Beziehungen (Kanten) mit wohldefinierter Semantik
                  hat Hauptstadt    Wien          ist Bürgermeister von

     Österreich                                                     Häupl
                  Einwohnerzahl    8.376.761           ist ein


                                                 Bürgermeister

•  Interoperable Daten
  ▫  global verteilte Daten können einfach verküpft werden
  ▫  Graph ist einfach erweiterbar
  ▫  URI als eindeutige Bezeichner für alle „Dinge“
Wer definiert Semantik?
   •  Jeder, Experten, Gruppen
   •  Vokabulare (terminologische Ontologien)
      ▫  Beziehungen sind selbst „Dinge“, die man genauso beschreibt:

                                        hat Hauptstadt
                             ist eine
                                                                        Weist einem (Bundes-)land eine
                                                     Beschreibung       Hauptstadt zu.
           Beziehungseigenschaft

          Beschreibung                   ist eine                                 Bürgermeister
                                                                    ist eine
Beschreibt Beziehungen zwischen
     verschiedenen Dingen                       Klasse von Dingen



   •  Existierende Vokabulare können leicht erweitert werden
      ▫  Dinge können beliebig verknüpft werden => verteilte Graphen
4 Linked Data Prinzipien
1.  URI = global eindeutige ID für alle „Dinge“
  ▫  Für Web-Dokumente, aber auch rein abstrakte Dinge
  ▫  zB. http://dbpedia.org/resource/Linked_Data
2.  Genauer: HTTP URI verwenden
  ▫  Kann von HTTP Client (z.B. Browser) „aufgelöst“ werden:



3.  Webserver soll strukturierte
    Beschreibung des Dings liefern und
4.  weitere Informationen über
    Beziehungen zu anderen Dingen
Linked Data – Anwendungen
•  Wissenschaft & Forschung
•  Social Web, Web 3.0
•  Businessanwendungen
•  Semantic Desktop (cluug startup)
•  eGov 3.0:
  ▫  Open Government Data
  ▫  Offizielle und third-party Services, APIs
Open Government Data
                                 Keine personenbezogenen Daten!
•  Geoinformation
•  Volkszählung
•  Mikrozensus
•  BIP, Budget
•  Aktuelle Arbeitslosenzahlen
•  Subventionen & Förderungen
•  Parlamentverhandlungen
•  Gesetze
•  help.gv.at
•  ...
Linked Open Government Data
•  Open Government Data als
   Linked Data veröffentlichen!

   Warum??
                                  €€!!!
Daten sind Ressourcen!
•  Gesammelt werden sie ohnehin
  ▫  Warum in Datensilos behalten?
  ▫  Bereits mit Steuergeld finanziert           €€€??
•  Daten verwerten!!
  ▫  Effizienz
  ▫  Wettbewerb
  ▫  Besserer Zugang für Wirtschaft und Bürger
•  Vgl. Open Source => neue Märkte!
  ▫  neue Dienstleistungen
  ▫  Besser, aktueller, schneller, billiger...
Win-win!
•  Offene Systeme ermöglichen externes Engagement
  ▫  Croud sourcing
     z.B. Goldcorp (CA), youXcity...
  ▫  Viele Experten in der Bevölkerung
     die politisch nicht aktiv sind!
  ▫  Professionelle Amateure (z.B. OpenStreetMap)
  ▫  Mashups & neuartige Anwendungen durch Dritte
  ▫  Visualisierungen & Kombination von Daten =>
     Fehler passieren, können schneller aufgedeckt werden
Warum Linked Data?
•  Offenes, standardisiertes Beschreibungsformat
•  Modular
•  Skaliert
•  Integration ohne zusätzliche Kosten
•  Generisch




                        Linked Data Standards
Warum Linked Data?
•  Unterstützt strukturierte Abfragen à la SQL

  Wie hoch waren Steuerbelastung, Inflation und BIP/
  Kopf in den Jahren 1990-2009?



                       Liste alle Bezirke von Wien, in denen es mehr als X
                       private Schulen pro 10.000 Einwohner gibt.



      Liste alle Parlamentsabgeordneten der Partei X, die
      für Gesetz Y gestimmt haben.
Warum Linked Data?
•  Unterstützt Beschreibungslogiken
  ▫  erlauben autom. natürliches Schließen durch Deduktion
  ▫  => implizites Wissen


           Häupl ist Bürgermeister
                                             Häupl ist Politiker
         Bürgermeister sind Politiker
iElect UK – iPhone App
dc BIKES




           This information shown on the maps is all being pulled from
           the DC Data Catalog:
           * Bicycle Lane
           * Bike Routes
           * DC Boundary Map
           * Metro Stations
           * DC Neighborhood Clusters Shapefile
           * DC Streets Shapefile
           * Waterbodies Shapefiles
           * Parks ShapefileThe shopping information is from
           Craigslist.
Wie?
•  Quellen sammeln
  ▫    „low hanging fruit“
  ▫    Katalog

•  Rohdaten/RDFizing
  ▫    nach Priorität/Effekt
  ▫    viele existierende Tools


•  Silos öffnen
  ▫    Lobbying
  ▫    Rechtliche Basis
CONTEST!!!
Creative space for digital public sector

Keynote: Andreas Langegger

  • 1.
    Linked Government Data data.gv.at– Semantic Web Meetup Andreas Langegger http://www.langegger.at Wien, 8. April 2010
  • 2.
    WWW Semantic Web Apple Web of Data V. Bush: Memex HyperCard (lokal) (theoretisch) 1945 1985 1990 2010> Dokumente + Dinge + Hyperlinks Beziehungen > für Menschen > maschinenlesbar Jacob Nielson, 1995: “Before the workshop, hypertext had been considered a somewhat esoteric concept of interest to a few fanatics only.” (gemeint war 1. Hypertext Workshop 1987)
  • 3.
    Semantic Web •  Theoretischbetrachtet: ▫  Anstatt verknüpfter Webseiten: riesiger globaler Datengraph ▫  Beziehungen (Kanten) mit wohldefinierter Semantik hat Hauptstadt Wien ist Bürgermeister von Österreich Häupl Einwohnerzahl 8.376.761 ist ein Bürgermeister •  Interoperable Daten ▫  global verteilte Daten können einfach verküpft werden ▫  Graph ist einfach erweiterbar ▫  URI als eindeutige Bezeichner für alle „Dinge“
  • 4.
    Wer definiert Semantik? •  Jeder, Experten, Gruppen •  Vokabulare (terminologische Ontologien) ▫  Beziehungen sind selbst „Dinge“, die man genauso beschreibt: hat Hauptstadt ist eine Weist einem (Bundes-)land eine Beschreibung Hauptstadt zu. Beziehungseigenschaft Beschreibung ist eine Bürgermeister ist eine Beschreibt Beziehungen zwischen verschiedenen Dingen Klasse von Dingen •  Existierende Vokabulare können leicht erweitert werden ▫  Dinge können beliebig verknüpft werden => verteilte Graphen
  • 5.
    4 Linked DataPrinzipien 1.  URI = global eindeutige ID für alle „Dinge“ ▫  Für Web-Dokumente, aber auch rein abstrakte Dinge ▫  zB. http://dbpedia.org/resource/Linked_Data 2.  Genauer: HTTP URI verwenden ▫  Kann von HTTP Client (z.B. Browser) „aufgelöst“ werden: 3.  Webserver soll strukturierte Beschreibung des Dings liefern und 4.  weitere Informationen über Beziehungen zu anderen Dingen
  • 6.
    Linked Data –Anwendungen •  Wissenschaft & Forschung •  Social Web, Web 3.0 •  Businessanwendungen •  Semantic Desktop (cluug startup) •  eGov 3.0: ▫  Open Government Data ▫  Offizielle und third-party Services, APIs
  • 7.
    Open Government Data Keine personenbezogenen Daten! •  Geoinformation •  Volkszählung •  Mikrozensus •  BIP, Budget •  Aktuelle Arbeitslosenzahlen •  Subventionen & Förderungen •  Parlamentverhandlungen •  Gesetze •  help.gv.at •  ...
  • 8.
    Linked Open GovernmentData •  Open Government Data als Linked Data veröffentlichen! Warum?? €€!!!
  • 9.
    Daten sind Ressourcen! • Gesammelt werden sie ohnehin ▫  Warum in Datensilos behalten? ▫  Bereits mit Steuergeld finanziert €€€?? •  Daten verwerten!! ▫  Effizienz ▫  Wettbewerb ▫  Besserer Zugang für Wirtschaft und Bürger •  Vgl. Open Source => neue Märkte! ▫  neue Dienstleistungen ▫  Besser, aktueller, schneller, billiger...
  • 10.
    Win-win! •  Offene Systemeermöglichen externes Engagement ▫  Croud sourcing z.B. Goldcorp (CA), youXcity... ▫  Viele Experten in der Bevölkerung die politisch nicht aktiv sind! ▫  Professionelle Amateure (z.B. OpenStreetMap) ▫  Mashups & neuartige Anwendungen durch Dritte ▫  Visualisierungen & Kombination von Daten => Fehler passieren, können schneller aufgedeckt werden
  • 11.
    Warum Linked Data? • Offenes, standardisiertes Beschreibungsformat •  Modular •  Skaliert •  Integration ohne zusätzliche Kosten •  Generisch Linked Data Standards
  • 12.
    Warum Linked Data? • Unterstützt strukturierte Abfragen à la SQL Wie hoch waren Steuerbelastung, Inflation und BIP/ Kopf in den Jahren 1990-2009? Liste alle Bezirke von Wien, in denen es mehr als X private Schulen pro 10.000 Einwohner gibt. Liste alle Parlamentsabgeordneten der Partei X, die für Gesetz Y gestimmt haben.
  • 13.
    Warum Linked Data? • Unterstützt Beschreibungslogiken ▫  erlauben autom. natürliches Schließen durch Deduktion ▫  => implizites Wissen Häupl ist Bürgermeister Häupl ist Politiker Bürgermeister sind Politiker
  • 14.
    iElect UK –iPhone App
  • 16.
    dc BIKES This information shown on the maps is all being pulled from the DC Data Catalog: * Bicycle Lane * Bike Routes * DC Boundary Map * Metro Stations * DC Neighborhood Clusters Shapefile * DC Streets Shapefile * Waterbodies Shapefiles * Parks ShapefileThe shopping information is from Craigslist.
  • 17.
    Wie? •  Quellen sammeln ▫  „low hanging fruit“ ▫  Katalog •  Rohdaten/RDFizing ▫  nach Priorität/Effekt ▫  viele existierende Tools •  Silos öffnen ▫  Lobbying ▫  Rechtliche Basis
  • 18.
  • 19.
    Creative space fordigital public sector