SlideShare ist ein Scribd-Unternehmen logo
1 von 47
Downloaden Sie, um offline zu lesen
LOD2 CKAN Workshop Wien - 15.6.2011
Warum?
Kernfragen


✓ Welche Lizenz?
✓ Welche Formate?
✓ Welche Inhalte?
✓ Dann:
  ✓ Aktualität
  ✓ Vollständigkeit
  ✓ Bezugsraum, ...
Informationsarchitektur
Daten-Ökosystem
Beispiel: Ausgaben UK
November 2011:
Veröffentlichung Ausgaben der zentralen
Regierung > £ 25.000, lokal: > £ 500
7 Monate später

•   557 Datenpakete

•   588 Behörden

•   3327 Tabellen (CSV, Excel, HTML)
Datenbereinigung

         •   Abruf per CKAN-API (data.gov.uk)

         •   Formatkonvertierung (SQLite)

         •   Vereinheitlichung von Ministerien und
             Behörden (Google Spreadsheet)

         •   Verbindung mit OpenCorporates
             (Unternehmens-Registernummern)

         •   Als neues CKAN-Paket bereit gestellt
             (ckan.net)
Weiternutzung
Was ist CKAN? (I)

•   Open Source-Projekt, etwa 12
    Kernentwickler

•   Nutzer: data.gov.uk, data.norge.no, hri.fi,
    register.data.overheid.nl, iatiregistry.org

•   ckan.net und ~ 24 Community-Instanzen
Was ist CKAN? (II)
•   Datenkatalog, kein Repositorium

    •   (Archiv & Speicherung als Erweiterung)

•   flexibles Metadatenschema

    •   Kernelemente ~ Dublin Core + Ressourcen

•   Versionierung aller Metadaten
Was ist CKAN? (III)
•   Ein Wiki für Metadaten

•   Vision: GitHub/SourceForge für
    Datenquellen

•   Community von aktiven Datennutzern
    einbinden (auch für Regierungsseiten)

•   Verschiedene Metaphern (CPAN = Perl
    Packet-Verzeichnis)
Beispiel: LOD Cloud
Metadaten

•   Kernelemente und “Extras”

•   anpassbare Formulare im
    Webfrontend

•   durch data.gov.uk:
    Konventionen für Extra-Felder
    (auch in data.norge.no, hri.fi,
    overheid.nl)
Theming
Content Management

•   “Wordpresser”-Erweiterung
    zur Anbindung an
    Wordpress

•   Integration mit Drupal bei
    data.gov.uk (Open Source)
Geodaten (I)
Geodaten (II)
•   CSW-Harvester und Endpunkt

•   GEMINI 2.1 (~> INSPIRE)

•   sammelt Kataloge aus England und
    den anghängten Ländern

•   Übergabe via Ordnance Survey an EC

•   Experimentelle Geo-Suche, WMS-
    Preview
Publisher



•   Institutionen-Modell

•   Freischaltung von Behörden

•   Nutzergruppen
Moderierte Eingaben
Schnittstelle
•   REST-API mit JSON und RDF-Support

•   Bibliotheken für Python, PHP, Ruby

•   Nutzung:

    •   Paketimport (Excel-Sheets)

    •   Metadatenanreicherung
Metadatenbereinigung
publicdata.eu

•   Portal als Forschungs-Prototyp für data.eu

•   Föderierung von Datenkatalogen aus
    Europa

•   Integration & Anreicherung der Metadaten

•   Standardisierung von DCat
Scraping
DCat
•   Standardisierungsdiskussion läuft (Workshop
    Anfang Mai)

•   Partner: RPI, CTIC, LOD2, CSI Piemonte etc.

•   RDF mit DC Terms und Ressourcen

•   Gemeinsame Harvesting-API

•   datacatalogs.org

•   GLD WG im W3C neu gestartet

•   SKOS?
•   430 Teilnehmer aus 23 EU-Staaten

•   Preisvergabe bei der Digital Assembly
Apps-Katalog
Ressourcen

           •      CKAN Projektseite - http://ckan.org

           •      CKAN Wiki - http//wiki.ckan.net

           •      PublicData.eu-Portal - http://publicdata.eu

           •      Open Data Manual - http://www.opendatamanual.org

           •      Open Defintion - http://opendefintion.org

           •      Allg. Informationen - http://opengovernmentdata.org/




Folien: CC-BY, Friedrich Lindenberg, genutzte Bilder: London Traffic Lights (Wikimedia
Commons); Francis Maude at data.gov.uk Event (Guardian), Screenshots
Teil II: Hands-on
Technik

•   Python-Anwendung, Pylons MVC-
    Framework

•   PostgreSQL-Datenbank

•   Apache/mod_wsgi oder uwsgi

•   Optionale Abh.: Apache Solr, RabbitMQ
Modularisierung
Installation

•   Debian Packages für Ubuntu LTS

•   Extensions werden als Packages verteilt

•   Solr und RabbitMQ getrennt installieren
Anpassung
•   ckanext-exampletheme ableiten

•   Formulare als Python-Modul anpassen

•   Themes sind Template-Overlays

•   HTML-Struktur enspricht Wordpress

•   Lokalisierung via transifex.net
Sicherheit
•   Authentifizierung via Login, OpenID, API Key

•   Authorisierung via Rollen und Aktionen

    •   ACL für jedes Packet, jede Gruppe

    •   globale Defaults sind konfigurierbar

    •   AuthzGroups für Nutzergruppen
API

•   /api/X/rest - Versioniert

•   /api/2/rest/package - REST Collection (GET,
    POST), auf Entities: GET, PUT.

•   Beispiele in ckanext-pdeu/scripts
Revisionen

•   Copy on Write in Spiegel-Tabelle

•   Revisionen können gelöscht werden

•   Quelle für RSS-Feeds
Queue
•   Hintergrundverarbeitung durch Queue

    •   Solr Index Aktualisierung

    •   Triple Store sync

    •   Archivierung

    •   Webhooks
Speicherung

•   Noch im Beta-Stadium

•   Nutzt Dateisystemabstraktion (OFS)

    •   S3, Archive.org, Google Storage

    •   REST Forward, Pairtree Dateisystem

Weitere ähnliche Inhalte

Andere mochten auch

Introduction to CKAN
Introduction to CKANIntroduction to CKAN
Introduction to CKANOKCon2013
 
Drupal, CKAN and Public Data. DrupalGov 08 february 2016
Drupal, CKAN and Public Data. DrupalGov 08 february 2016Drupal, CKAN and Public Data. DrupalGov 08 february 2016
Drupal, CKAN and Public Data. DrupalGov 08 february 2016Steven De Costa
 
Abstracts Master Thesen MSc-Upgrade 05
Abstracts Master Thesen MSc-Upgrade 05Abstracts Master Thesen MSc-Upgrade 05
Abstracts Master Thesen MSc-Upgrade 05PR PLUS GmbH
 
Presentation CANON 500D
Presentation CANON 500DPresentation CANON 500D
Presentation CANON 500Derreip
 
Objet direct@md day2011
Objet direct@md day2011Objet direct@md day2011
Objet direct@md day2011MDDAY11
 
Deutsch crowndfunding
Deutsch crowndfundingDeutsch crowndfunding
Deutsch crowndfundingedelweis999
 
Livre blanc le_changement_2_0
Livre blanc le_changement_2_0Livre blanc le_changement_2_0
Livre blanc le_changement_2_0Raphaël Moraly
 
Carrières en informatique informatique et société - samuel grandmaison - no...
Carrières en informatique   informatique et société - samuel grandmaison - no...Carrières en informatique   informatique et société - samuel grandmaison - no...
Carrières en informatique informatique et société - samuel grandmaison - no...samuel-grandmaison
 
"Stiefkind Dokumentation" im Unternehmensprozess - Max Brändle
"Stiefkind Dokumentation" im Unternehmensprozess - Max Brändle"Stiefkind Dokumentation" im Unternehmensprozess - Max Brändle
"Stiefkind Dokumentation" im Unternehmensprozess - Max Brändletecom
 
Présentation What Heroes Wear - Paris Dauphine
Présentation What Heroes Wear - Paris DauphinePrésentation What Heroes Wear - Paris Dauphine
Présentation What Heroes Wear - Paris DauphineNathanaël Ghisalberti
 
Manipulation Circuits Logiques : Manipulation n 2
Manipulation Circuits Logiques : Manipulation n 2Manipulation Circuits Logiques : Manipulation n 2
Manipulation Circuits Logiques : Manipulation n 2Mohamed Khalfaoui
 
Bestes Smartphone-Zubehör für optimale Tierfotografie - Fotofreak360
Bestes Smartphone-Zubehör für optimale Tierfotografie - Fotofreak360Bestes Smartphone-Zubehör für optimale Tierfotografie - Fotofreak360
Bestes Smartphone-Zubehör für optimale Tierfotografie - Fotofreak360fotofreak360
 
Toile de fond technologique de l'AFNIC
Toile de fond technologique de l'AFNICToile de fond technologique de l'AFNIC
Toile de fond technologique de l'AFNICalg2801
 
Hibernate3.2官方中文参考手册
Hibernate3.2官方中文参考手册Hibernate3.2官方中文参考手册
Hibernate3.2官方中文参考手册yiditushe
 

Andere mochten auch (20)

Introduction to CKAN
Introduction to CKANIntroduction to CKAN
Introduction to CKAN
 
Drupal, CKAN and Public Data. DrupalGov 08 february 2016
Drupal, CKAN and Public Data. DrupalGov 08 february 2016Drupal, CKAN and Public Data. DrupalGov 08 february 2016
Drupal, CKAN and Public Data. DrupalGov 08 february 2016
 
Minicurso de CKAN
Minicurso de CKANMinicurso de CKAN
Minicurso de CKAN
 
Abstracts Master Thesen MSc-Upgrade 05
Abstracts Master Thesen MSc-Upgrade 05Abstracts Master Thesen MSc-Upgrade 05
Abstracts Master Thesen MSc-Upgrade 05
 
Français iv premier partiel
Français iv  premier partielFrançais iv  premier partiel
Français iv premier partiel
 
Presentation CANON 500D
Presentation CANON 500DPresentation CANON 500D
Presentation CANON 500D
 
Pibg aizat
Pibg aizatPibg aizat
Pibg aizat
 
Objet direct@md day2011
Objet direct@md day2011Objet direct@md day2011
Objet direct@md day2011
 
Science politique
Science politiqueScience politique
Science politique
 
Deutsch crowndfunding
Deutsch crowndfundingDeutsch crowndfunding
Deutsch crowndfunding
 
Livre blanc le_changement_2_0
Livre blanc le_changement_2_0Livre blanc le_changement_2_0
Livre blanc le_changement_2_0
 
Carrières en informatique informatique et société - samuel grandmaison - no...
Carrières en informatique   informatique et société - samuel grandmaison - no...Carrières en informatique   informatique et société - samuel grandmaison - no...
Carrières en informatique informatique et société - samuel grandmaison - no...
 
"Stiefkind Dokumentation" im Unternehmensprozess - Max Brändle
"Stiefkind Dokumentation" im Unternehmensprozess - Max Brändle"Stiefkind Dokumentation" im Unternehmensprozess - Max Brändle
"Stiefkind Dokumentation" im Unternehmensprozess - Max Brändle
 
Présentation What Heroes Wear - Paris Dauphine
Présentation What Heroes Wear - Paris DauphinePrésentation What Heroes Wear - Paris Dauphine
Présentation What Heroes Wear - Paris Dauphine
 
salon auto pour smscl2012
salon auto pour smscl2012salon auto pour smscl2012
salon auto pour smscl2012
 
Manipulation Circuits Logiques : Manipulation n 2
Manipulation Circuits Logiques : Manipulation n 2Manipulation Circuits Logiques : Manipulation n 2
Manipulation Circuits Logiques : Manipulation n 2
 
Bestes Smartphone-Zubehör für optimale Tierfotografie - Fotofreak360
Bestes Smartphone-Zubehör für optimale Tierfotografie - Fotofreak360Bestes Smartphone-Zubehör für optimale Tierfotografie - Fotofreak360
Bestes Smartphone-Zubehör für optimale Tierfotografie - Fotofreak360
 
Toile de fond technologique de l'AFNIC
Toile de fond technologique de l'AFNICToile de fond technologique de l'AFNIC
Toile de fond technologique de l'AFNIC
 
Ost 1 10256 84
Ost 1 10256 84Ost 1 10256 84
Ost 1 10256 84
 
Hibernate3.2官方中文参考手册
Hibernate3.2官方中文参考手册Hibernate3.2官方中文参考手册
Hibernate3.2官方中文参考手册
 

Ähnlich wie CKAN by Friedrich Lindenberg

Linked Open Data Pilotprojekt Österreich - LOD Pilot AT
Linked Open Data Pilotprojekt Österreich - LOD Pilot ATLinked Open Data Pilotprojekt Österreich - LOD Pilot AT
Linked Open Data Pilotprojekt Österreich - LOD Pilot ATMartin Kaltenböck
 
Repository Usage Statistics and the Open Research Analytics Service
Repository Usage Statistics and the Open Research Analytics ServiceRepository Usage Statistics and the Open Research Analytics Service
Repository Usage Statistics and the Open Research Analytics ServiceOpenAIRE
 
16. DINI-Jahrestagung: Linked Data und Repositorien
16. DINI-Jahrestagung: Linked Data und Repositorien16. DINI-Jahrestagung: Linked Data und Repositorien
16. DINI-Jahrestagung: Linked Data und RepositorienPascal-Nicolas Becker
 
Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?
Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?
Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?KurtStockinger
 
Der Kölner UniversitätsGesamtkatalog - Praktischer Einsatz des KUG mit OpenBi...
Der Kölner UniversitätsGesamtkatalog - Praktischer Einsatz des KUG mit OpenBi...Der Kölner UniversitätsGesamtkatalog - Praktischer Einsatz des KUG mit OpenBi...
Der Kölner UniversitätsGesamtkatalog - Praktischer Einsatz des KUG mit OpenBi...flimm
 
Icinga 2009 at Nagios Workshop
Icinga 2009 at Nagios WorkshopIcinga 2009 at Nagios Workshop
Icinga 2009 at Nagios WorkshopIcinga
 
OpenAIRE guidelines for data and literature repositories webinar_28022017
OpenAIRE guidelines for data and literature repositories webinar_28022017OpenAIRE guidelines for data and literature repositories webinar_28022017
OpenAIRE guidelines for data and literature repositories webinar_28022017Jessica Rex
 
Überblick zum DFG-Projekt OCR-D
Überblick zum DFG-Projekt OCR-DÜberblick zum DFG-Projekt OCR-D
Überblick zum DFG-Projekt OCR-Dcneudecker
 
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...Dennis Zielke
 
Drupal Austria Roadshow in Klagenfurt
Drupal Austria Roadshow in KlagenfurtDrupal Austria Roadshow in Klagenfurt
Drupal Austria Roadshow in Klagenfurtdasjo
 
Back to the future - Plone 5.2 und Python 3 Migration am Beispiel Onkopedia
Back to the future - Plone 5.2 und Python 3 Migration am Beispiel OnkopediaBack to the future - Plone 5.2 und Python 3 Migration am Beispiel Onkopedia
Back to the future - Plone 5.2 und Python 3 Migration am Beispiel OnkopediaAndreas Jung
 
SCAPE Skalierbare Langzeitarchivierung
SCAPE Skalierbare LangzeitarchivierungSCAPE Skalierbare Langzeitarchivierung
SCAPE Skalierbare LangzeitarchivierungSven Schlarb
 
Grosse Projekte in der Wissenschaft am Beispiel von NextGEOSS
Grosse Projekte in der Wissenschaft am Beispiel von NextGEOSSGrosse Projekte in der Wissenschaft am Beispiel von NextGEOSS
Grosse Projekte in der Wissenschaft am Beispiel von NextGEOSSWolfgang Ksoll
 
Ist GraphQL das bessere REST
Ist GraphQL das bessere RESTIst GraphQL das bessere REST
Ist GraphQL das bessere RESTMartin Abraham
 
ALTO, PAGE & Co. Formate für Volltexte
ALTO, PAGE & Co. Formate für VolltexteALTO, PAGE & Co. Formate für Volltexte
ALTO, PAGE & Co. Formate für Volltextecneudecker
 

Ähnlich wie CKAN by Friedrich Lindenberg (20)

Linked Open Data Pilotprojekt Österreich - LOD Pilot AT
Linked Open Data Pilotprojekt Österreich - LOD Pilot ATLinked Open Data Pilotprojekt Österreich - LOD Pilot AT
Linked Open Data Pilotprojekt Österreich - LOD Pilot AT
 
Repository Usage Statistics and the Open Research Analytics Service
Repository Usage Statistics and the Open Research Analytics ServiceRepository Usage Statistics and the Open Research Analytics Service
Repository Usage Statistics and the Open Research Analytics Service
 
16. DINI-Jahrestagung: Linked Data und Repositorien
16. DINI-Jahrestagung: Linked Data und Repositorien16. DINI-Jahrestagung: Linked Data und Repositorien
16. DINI-Jahrestagung: Linked Data und Repositorien
 
Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?
Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?
Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?
 
Der Kölner UniversitätsGesamtkatalog - Praktischer Einsatz des KUG mit OpenBi...
Der Kölner UniversitätsGesamtkatalog - Praktischer Einsatz des KUG mit OpenBi...Der Kölner UniversitätsGesamtkatalog - Praktischer Einsatz des KUG mit OpenBi...
Der Kölner UniversitätsGesamtkatalog - Praktischer Einsatz des KUG mit OpenBi...
 
Icinga 2009 at Nagios Workshop
Icinga 2009 at Nagios WorkshopIcinga 2009 at Nagios Workshop
Icinga 2009 at Nagios Workshop
 
Docker Workbench
Docker WorkbenchDocker Workbench
Docker Workbench
 
DSpace 5 und Linked (Open) Data
DSpace 5 und Linked (Open) DataDSpace 5 und Linked (Open) Data
DSpace 5 und Linked (Open) Data
 
OpenAIRE guidelines for data and literature repositories webinar_28022017
OpenAIRE guidelines for data and literature repositories webinar_28022017OpenAIRE guidelines for data and literature repositories webinar_28022017
OpenAIRE guidelines for data and literature repositories webinar_28022017
 
Oracle und Docker
Oracle und DockerOracle und Docker
Oracle und Docker
 
Überblick zum DFG-Projekt OCR-D
Überblick zum DFG-Projekt OCR-DÜberblick zum DFG-Projekt OCR-D
Überblick zum DFG-Projekt OCR-D
 
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
 
Drupal Austria Roadshow in Klagenfurt
Drupal Austria Roadshow in KlagenfurtDrupal Austria Roadshow in Klagenfurt
Drupal Austria Roadshow in Klagenfurt
 
Back to the future - Plone 5.2 und Python 3 Migration am Beispiel Onkopedia
Back to the future - Plone 5.2 und Python 3 Migration am Beispiel OnkopediaBack to the future - Plone 5.2 und Python 3 Migration am Beispiel Onkopedia
Back to the future - Plone 5.2 und Python 3 Migration am Beispiel Onkopedia
 
Fachliche Vernetzung von Repositories auf europäischer Ebene - das Beispiel N...
Fachliche Vernetzung von Repositories auf europäischer Ebene - das Beispiel N...Fachliche Vernetzung von Repositories auf europäischer Ebene - das Beispiel N...
Fachliche Vernetzung von Repositories auf europäischer Ebene - das Beispiel N...
 
SCAPE Skalierbare Langzeitarchivierung
SCAPE Skalierbare LangzeitarchivierungSCAPE Skalierbare Langzeitarchivierung
SCAPE Skalierbare Langzeitarchivierung
 
Grosse Projekte in der Wissenschaft am Beispiel von NextGEOSS
Grosse Projekte in der Wissenschaft am Beispiel von NextGEOSSGrosse Projekte in der Wissenschaft am Beispiel von NextGEOSS
Grosse Projekte in der Wissenschaft am Beispiel von NextGEOSS
 
Ist GraphQL das bessere REST
Ist GraphQL das bessere RESTIst GraphQL das bessere REST
Ist GraphQL das bessere REST
 
ALTO, PAGE & Co. Formate für Volltexte
ALTO, PAGE & Co. Formate für VolltexteALTO, PAGE & Co. Formate für Volltexte
ALTO, PAGE & Co. Formate für Volltexte
 
171211 kitodo
171211 kitodo171211 kitodo
171211 kitodo
 

Mehr von Semantic Web Company

How Enterprise Architecture & Knowledge Graph Technologies Can Scale Business...
How Enterprise Architecture & Knowledge Graph Technologies Can Scale Business...How Enterprise Architecture & Knowledge Graph Technologies Can Scale Business...
How Enterprise Architecture & Knowledge Graph Technologies Can Scale Business...Semantic Web Company
 
Introduction to Knowledge Graphs and Semantic AI
Introduction to Knowledge Graphs and Semantic AIIntroduction to Knowledge Graphs and Semantic AI
Introduction to Knowledge Graphs and Semantic AISemantic Web Company
 
Deep Text Analytics - How to extract hidden information and aboutness from text
Deep Text Analytics - How to extract hidden information and aboutness from textDeep Text Analytics - How to extract hidden information and aboutness from text
Deep Text Analytics - How to extract hidden information and aboutness from textSemantic Web Company
 
Leveraging Knowledge Graphs in your Enterprise Knowledge Management System
Leveraging Knowledge Graphs in your Enterprise Knowledge Management SystemLeveraging Knowledge Graphs in your Enterprise Knowledge Management System
Leveraging Knowledge Graphs in your Enterprise Knowledge Management SystemSemantic Web Company
 
Linking SharePoint Documents with Structured Data
Linking SharePoint Documents with Structured DataLinking SharePoint Documents with Structured Data
Linking SharePoint Documents with Structured DataSemantic Web Company
 
The Fast Track to Knowledge Engineering
The Fast Track to Knowledge EngineeringThe Fast Track to Knowledge Engineering
The Fast Track to Knowledge EngineeringSemantic Web Company
 
Leveraging Taxonomy Management with Machine Learning
Leveraging Taxonomy Management with Machine LearningLeveraging Taxonomy Management with Machine Learning
Leveraging Taxonomy Management with Machine LearningSemantic Web Company
 
PoolParty GraphSearch - The Fusion of Search, Recommendation and Analytics
PoolParty GraphSearch - The Fusion of Search, Recommendation and AnalyticsPoolParty GraphSearch - The Fusion of Search, Recommendation and Analytics
PoolParty GraphSearch - The Fusion of Search, Recommendation and AnalyticsSemantic Web Company
 
Semantics as the Basis of Advanced Cognitive Computing
Semantics as the Basis of Advanced Cognitive ComputingSemantics as the Basis of Advanced Cognitive Computing
Semantics as the Basis of Advanced Cognitive ComputingSemantic Web Company
 
PoolParty 6.0 - Climbing the Semantic Ladder
PoolParty 6.0 - Climbing the Semantic LadderPoolParty 6.0 - Climbing the Semantic Ladder
PoolParty 6.0 - Climbing the Semantic LadderSemantic Web Company
 
PoolParty Semantic Suite - Release 6.0 (Technical Overview)
PoolParty Semantic Suite - Release 6.0 (Technical Overview)PoolParty Semantic Suite - Release 6.0 (Technical Overview)
PoolParty Semantic Suite - Release 6.0 (Technical Overview)Semantic Web Company
 
Taxonomies and Ontologies – The Yin and Yang of Knowledge Modelling
Taxonomies and Ontologies – The Yin and Yang of Knowledge ModellingTaxonomies and Ontologies – The Yin and Yang of Knowledge Modelling
Taxonomies and Ontologies – The Yin and Yang of Knowledge ModellingSemantic Web Company
 
PROPEL . Austrian's Roadmap for Enterprise Linked Data
PROPEL . Austrian's Roadmap for Enterprise Linked DataPROPEL . Austrian's Roadmap for Enterprise Linked Data
PROPEL . Austrian's Roadmap for Enterprise Linked DataSemantic Web Company
 

Mehr von Semantic Web Company (20)

How Enterprise Architecture & Knowledge Graph Technologies Can Scale Business...
How Enterprise Architecture & Knowledge Graph Technologies Can Scale Business...How Enterprise Architecture & Knowledge Graph Technologies Can Scale Business...
How Enterprise Architecture & Knowledge Graph Technologies Can Scale Business...
 
Introduction to Knowledge Graphs and Semantic AI
Introduction to Knowledge Graphs and Semantic AIIntroduction to Knowledge Graphs and Semantic AI
Introduction to Knowledge Graphs and Semantic AI
 
Deep Text Analytics - How to extract hidden information and aboutness from text
Deep Text Analytics - How to extract hidden information and aboutness from textDeep Text Analytics - How to extract hidden information and aboutness from text
Deep Text Analytics - How to extract hidden information and aboutness from text
 
Leveraging Knowledge Graphs in your Enterprise Knowledge Management System
Leveraging Knowledge Graphs in your Enterprise Knowledge Management SystemLeveraging Knowledge Graphs in your Enterprise Knowledge Management System
Leveraging Knowledge Graphs in your Enterprise Knowledge Management System
 
Linking SharePoint Documents with Structured Data
Linking SharePoint Documents with Structured DataLinking SharePoint Documents with Structured Data
Linking SharePoint Documents with Structured Data
 
The Fast Track to Knowledge Engineering
The Fast Track to Knowledge EngineeringThe Fast Track to Knowledge Engineering
The Fast Track to Knowledge Engineering
 
Semantic AI
Semantic AISemantic AI
Semantic AI
 
BrightTALK - Semantic AI
BrightTALK - Semantic AI BrightTALK - Semantic AI
BrightTALK - Semantic AI
 
PoolParty Semantic Classifier
PoolParty Semantic ClassifierPoolParty Semantic Classifier
PoolParty Semantic Classifier
 
Leveraging Taxonomy Management with Machine Learning
Leveraging Taxonomy Management with Machine LearningLeveraging Taxonomy Management with Machine Learning
Leveraging Taxonomy Management with Machine Learning
 
Taxonomies put in the right place
Taxonomies put in the right placeTaxonomies put in the right place
Taxonomies put in the right place
 
PoolParty GraphSearch - The Fusion of Search, Recommendation and Analytics
PoolParty GraphSearch - The Fusion of Search, Recommendation and AnalyticsPoolParty GraphSearch - The Fusion of Search, Recommendation and Analytics
PoolParty GraphSearch - The Fusion of Search, Recommendation and Analytics
 
Semantics as the Basis of Advanced Cognitive Computing
Semantics as the Basis of Advanced Cognitive ComputingSemantics as the Basis of Advanced Cognitive Computing
Semantics as the Basis of Advanced Cognitive Computing
 
Structured Content Meets Taxonomy
Structured Content Meets TaxonomyStructured Content Meets Taxonomy
Structured Content Meets Taxonomy
 
PoolParty 6.0 - Climbing the Semantic Ladder
PoolParty 6.0 - Climbing the Semantic LadderPoolParty 6.0 - Climbing the Semantic Ladder
PoolParty 6.0 - Climbing the Semantic Ladder
 
PoolParty Semantic Suite - Release 6.0 (Technical Overview)
PoolParty Semantic Suite - Release 6.0 (Technical Overview)PoolParty Semantic Suite - Release 6.0 (Technical Overview)
PoolParty Semantic Suite - Release 6.0 (Technical Overview)
 
Taxonomies and Ontologies – The Yin and Yang of Knowledge Modelling
Taxonomies and Ontologies – The Yin and Yang of Knowledge ModellingTaxonomies and Ontologies – The Yin and Yang of Knowledge Modelling
Taxonomies and Ontologies – The Yin and Yang of Knowledge Modelling
 
PROPEL . Austrian's Roadmap for Enterprise Linked Data
PROPEL . Austrian's Roadmap for Enterprise Linked DataPROPEL . Austrian's Roadmap for Enterprise Linked Data
PROPEL . Austrian's Roadmap for Enterprise Linked Data
 
Taxonomy Quality Assessment
Taxonomy Quality AssessmentTaxonomy Quality Assessment
Taxonomy Quality Assessment
 
Taxonomy-Driven UX
Taxonomy-Driven UXTaxonomy-Driven UX
Taxonomy-Driven UX
 

CKAN by Friedrich Lindenberg

  • 1. LOD2 CKAN Workshop Wien - 15.6.2011
  • 2.
  • 3.
  • 5. Kernfragen ✓ Welche Lizenz? ✓ Welche Formate? ✓ Welche Inhalte? ✓ Dann: ✓ Aktualität ✓ Vollständigkeit ✓ Bezugsraum, ...
  • 9. November 2011: Veröffentlichung Ausgaben der zentralen Regierung > £ 25.000, lokal: > £ 500
  • 10.
  • 11. 7 Monate später • 557 Datenpakete • 588 Behörden • 3327 Tabellen (CSV, Excel, HTML)
  • 12. Datenbereinigung • Abruf per CKAN-API (data.gov.uk) • Formatkonvertierung (SQLite) • Vereinheitlichung von Ministerien und Behörden (Google Spreadsheet) • Verbindung mit OpenCorporates (Unternehmens-Registernummern) • Als neues CKAN-Paket bereit gestellt (ckan.net)
  • 13.
  • 15.
  • 16. Was ist CKAN? (I) • Open Source-Projekt, etwa 12 Kernentwickler • Nutzer: data.gov.uk, data.norge.no, hri.fi, register.data.overheid.nl, iatiregistry.org • ckan.net und ~ 24 Community-Instanzen
  • 17. Was ist CKAN? (II) • Datenkatalog, kein Repositorium • (Archiv & Speicherung als Erweiterung) • flexibles Metadatenschema • Kernelemente ~ Dublin Core + Ressourcen • Versionierung aller Metadaten
  • 18. Was ist CKAN? (III) • Ein Wiki für Metadaten • Vision: GitHub/SourceForge für Datenquellen • Community von aktiven Datennutzern einbinden (auch für Regierungsseiten) • Verschiedene Metaphern (CPAN = Perl Packet-Verzeichnis)
  • 20. Metadaten • Kernelemente und “Extras” • anpassbare Formulare im Webfrontend • durch data.gov.uk: Konventionen für Extra-Felder (auch in data.norge.no, hri.fi, overheid.nl)
  • 22. Content Management • “Wordpresser”-Erweiterung zur Anbindung an Wordpress • Integration mit Drupal bei data.gov.uk (Open Source)
  • 24. Geodaten (II) • CSW-Harvester und Endpunkt • GEMINI 2.1 (~> INSPIRE) • sammelt Kataloge aus England und den anghängten Ländern • Übergabe via Ordnance Survey an EC • Experimentelle Geo-Suche, WMS- Preview
  • 25. Publisher • Institutionen-Modell • Freischaltung von Behörden • Nutzergruppen
  • 27. Schnittstelle • REST-API mit JSON und RDF-Support • Bibliotheken für Python, PHP, Ruby • Nutzung: • Paketimport (Excel-Sheets) • Metadatenanreicherung
  • 29. publicdata.eu • Portal als Forschungs-Prototyp für data.eu • Föderierung von Datenkatalogen aus Europa • Integration & Anreicherung der Metadaten • Standardisierung von DCat
  • 31.
  • 32.
  • 33. DCat • Standardisierungsdiskussion läuft (Workshop Anfang Mai) • Partner: RPI, CTIC, LOD2, CSI Piemonte etc. • RDF mit DC Terms und Ressourcen • Gemeinsame Harvesting-API • datacatalogs.org • GLD WG im W3C neu gestartet • SKOS?
  • 34. 430 Teilnehmer aus 23 EU-Staaten • Preisvergabe bei der Digital Assembly
  • 36. Ressourcen • CKAN Projektseite - http://ckan.org • CKAN Wiki - http//wiki.ckan.net • PublicData.eu-Portal - http://publicdata.eu • Open Data Manual - http://www.opendatamanual.org • Open Defintion - http://opendefintion.org • Allg. Informationen - http://opengovernmentdata.org/ Folien: CC-BY, Friedrich Lindenberg, genutzte Bilder: London Traffic Lights (Wikimedia Commons); Francis Maude at data.gov.uk Event (Guardian), Screenshots
  • 38. Technik • Python-Anwendung, Pylons MVC- Framework • PostgreSQL-Datenbank • Apache/mod_wsgi oder uwsgi • Optionale Abh.: Apache Solr, RabbitMQ
  • 40. Installation • Debian Packages für Ubuntu LTS • Extensions werden als Packages verteilt • Solr und RabbitMQ getrennt installieren
  • 41. Anpassung • ckanext-exampletheme ableiten • Formulare als Python-Modul anpassen • Themes sind Template-Overlays • HTML-Struktur enspricht Wordpress • Lokalisierung via transifex.net
  • 42.
  • 43. Sicherheit • Authentifizierung via Login, OpenID, API Key • Authorisierung via Rollen und Aktionen • ACL für jedes Packet, jede Gruppe • globale Defaults sind konfigurierbar • AuthzGroups für Nutzergruppen
  • 44. API • /api/X/rest - Versioniert • /api/2/rest/package - REST Collection (GET, POST), auf Entities: GET, PUT. • Beispiele in ckanext-pdeu/scripts
  • 45. Revisionen • Copy on Write in Spiegel-Tabelle • Revisionen können gelöscht werden • Quelle für RSS-Feeds
  • 46. Queue • Hintergrundverarbeitung durch Queue • Solr Index Aktualisierung • Triple Store sync • Archivierung • Webhooks
  • 47. Speicherung • Noch im Beta-Stadium • Nutzt Dateisystemabstraktion (OFS) • S3, Archive.org, Google Storage • REST Forward, Pairtree Dateisystem