Presentation at the OGD2011 conference taking place in Vienna on the 16th of June 2011 as well as at the LOD2 CKAn workshop on 15th of June 2011: CKAN by Friedrich Lindenberg, Open Knowledge Foundation.
(License: CC-BY 3.0)
12. Datenbereinigung
• Abruf per CKAN-API (data.gov.uk)
• Formatkonvertierung (SQLite)
• Vereinheitlichung von Ministerien und
Behörden (Google Spreadsheet)
• Verbindung mit OpenCorporates
(Unternehmens-Registernummern)
• Als neues CKAN-Paket bereit gestellt
(ckan.net)
16. Was ist CKAN? (I)
• Open Source-Projekt, etwa 12
Kernentwickler
• Nutzer: data.gov.uk, data.norge.no, hri.fi,
register.data.overheid.nl, iatiregistry.org
• ckan.net und ~ 24 Community-Instanzen
17. Was ist CKAN? (II)
• Datenkatalog, kein Repositorium
• (Archiv & Speicherung als Erweiterung)
• flexibles Metadatenschema
• Kernelemente ~ Dublin Core + Ressourcen
• Versionierung aller Metadaten
18. Was ist CKAN? (III)
• Ein Wiki für Metadaten
• Vision: GitHub/SourceForge für
Datenquellen
• Community von aktiven Datennutzern
einbinden (auch für Regierungsseiten)
• Verschiedene Metaphern (CPAN = Perl
Packet-Verzeichnis)
20. Metadaten
• Kernelemente und “Extras”
• anpassbare Formulare im
Webfrontend
• durch data.gov.uk:
Konventionen für Extra-Felder
(auch in data.norge.no, hri.fi,
overheid.nl)
24. Geodaten (II)
• CSW-Harvester und Endpunkt
• GEMINI 2.1 (~> INSPIRE)
• sammelt Kataloge aus England und
den anghängten Ländern
• Übergabe via Ordnance Survey an EC
• Experimentelle Geo-Suche, WMS-
Preview
25. Publisher
• Institutionen-Modell
• Freischaltung von Behörden
• Nutzergruppen
29. publicdata.eu
• Portal als Forschungs-Prototyp für data.eu
• Föderierung von Datenkatalogen aus
Europa
• Integration & Anreicherung der Metadaten
• Standardisierung von DCat
33. DCat
• Standardisierungsdiskussion läuft (Workshop
Anfang Mai)
• Partner: RPI, CTIC, LOD2, CSI Piemonte etc.
• RDF mit DC Terms und Ressourcen
• Gemeinsame Harvesting-API
• datacatalogs.org
• GLD WG im W3C neu gestartet
• SKOS?
34. • 430 Teilnehmer aus 23 EU-Staaten
• Preisvergabe bei der Digital Assembly
40. Installation
• Debian Packages für Ubuntu LTS
• Extensions werden als Packages verteilt
• Solr und RabbitMQ getrennt installieren
41. Anpassung
• ckanext-exampletheme ableiten
• Formulare als Python-Modul anpassen
• Themes sind Template-Overlays
• HTML-Struktur enspricht Wordpress
• Lokalisierung via transifex.net
42.
43. Sicherheit
• Authentifizierung via Login, OpenID, API Key
• Authorisierung via Rollen und Aktionen
• ACL für jedes Packet, jede Gruppe
• globale Defaults sind konfigurierbar
• AuthzGroups für Nutzergruppen
44. API
• /api/X/rest - Versioniert
• /api/2/rest/package - REST Collection (GET,
POST), auf Entities: GET, PUT.
• Beispiele in ckanext-pdeu/scripts
45. Revisionen
• Copy on Write in Spiegel-Tabelle
• Revisionen können gelöscht werden
• Quelle für RSS-Feeds
46. Queue
• Hintergrundverarbeitung durch Queue
• Solr Index Aktualisierung
• Triple Store sync
• Archivierung
• Webhooks
47. Speicherung
• Noch im Beta-Stadium
• Nutzt Dateisystemabstraktion (OFS)
• S3, Archive.org, Google Storage
• REST Forward, Pairtree Dateisystem