SlideShare ist ein Scribd-Unternehmen logo
1 von 44
Downloaden Sie, um offline zu lesen
OntoPiA e il knowledge Graph della
Pubblica Amministrazione Italiana
Giorgia Lodi
Meetup #AperiTech di GraphRM
Data is a network
“A single road only takes us to places between two locations; roads real value
comes from being part of a network. Data works in the same way: it is not just
having more data that unlocks its value, but linking it together. Data is not
individual datasets, it is a network”
2
Standard del Web Semantico
3	
Href link non tipato)
Risorse: Documenti Web
HTML con link non tipati (href)
Standard del Web Semantico
4	
E se facessimo la stessa cosa con i dati?
Href link non tipato)
Risorse: Documenti Web
HTML con link non tipati (href)
5	
2007
Linked Open Data Cloud
Linked Open Data Cloud
6	
28 giugno
2018
Standard Web Semantico: RDF
7	
•  Un modello per I dati nel web dove I dati sono espressi sottoforma di Triple
•  Soggetto Predicato Oggetto
•  Ogni entità è identificata univocamente da un URI (Uniform Resource Identifier)
•  Il Soggetto e il Predicato hanno sempre un URI
•  L’Oggetto può anche essere un valore predefinito (Literale)
•  Le triple sono interconnesse quando condividono la stessa entità
•  Il risultato è un grafo interconnesso di triple (Linked Data)
dpedia:Rome
dbpedia:Italy
dbpedia:country foaf:homepage
“Roma”
http://www.italia.it/en/home.html
Potete provare a navigare
http://dbpedia.org/page/Rome
Vantaggi dell’RDF
•  E’ un modello di rappresentazione dei dati pensato per il Web
•  E’ basato su standard del Web
•  Consente nativamente di abilitare l’integrazione tra I dati
•  Fornisce un meccanismo per risolvere l’identitià delle cose
•  Nativamente fornisce meccanismi per garantire
interoperabilità semantica
•  E’ usato insieme al linguaggio per interrogare I dati (i.e.,
SPARQL)
•  I dati sono così associati a delle API che facilitano
l’interrogazione da parte delle macchine
Ma non li usa nessuno!!
9
Ma non li usa nessuno!!
10
Ma non li usa nessuno!!
11
Ma non li usa nessuno!!
12	
Google
knowledge
graph
Ma non li usa nessuno!!
13
Da dove iniziare?
Nel 2012 AgID
pubblicava le linee
guida per
“Interoperabilità
semantica
attraverso I Linked
Open Data”
OntoPiA – la rete di ontologie e
vocabolari controllati della Pubblica
Amministrazione
Meetup #AperiTech di GraphRM
16	
Cos’è OntoPiA e a cosa serve
•  Definisce un linguaggio comune per l’interscambio di dati
(interoperabilità semantica)
•  Definisce un modello formale, elaborabile da dispositivi digitali e
leggibile da umani (i.e., superamento della logica delle specifiche
scritte in soli file PDF!)
•  Apre la strada alla creazione di dati nativamente collegati, i.e.,
fornisce gli schemi dati per creare, interrogare il “grafo della
conoscenza” (knowledge graph) della PA italiana
•  ONTOLOGIA: una specifica formale ed
esplicita di rappresentazione
(concettualizzazione) condivisa di un
dominio di conoscenza, definita sulla
base di requisiti specifici
•  VOCABOLARIO CONTROLLATO: una serie
di termini e codici standard predefiniti e
autorizzati, preselezionati al fine di
indicizzare e recuperare informazioni
.
17
17	
OntoPiA- rete di ontologie e vocabolari controllati
18	
FACILITARE LO SVILUPPO
DI NUOVI SISTEMI
INFORMATIVI
	
AGEVOLARE LO SCAMBIO DI
DATI
ABILITARE L’INTEGRAZIONE
TRA DATI PROVENIENTI DA
SORGENTI DIVERSE
STANDARDIZZAZIONE DEI
DATI (APERTI)
OntoPiA – perché?
19	
OntoPiA e i principi del modello FAIR
•  Findable: si usano URI permanenti per identificare concetti e relazioni
nella rete di ontologie e termini nei vocabolari controllati
•  Accessible: si utilizzano protocolli standard aperti per l’accesso sul
Web (i.e. HTTP(S)) and per l’interrogazione dei dati (i.e. SPARQL)
•  Interoperable: si utilizzano protocolli standard aperti per modellare i
dati i.e. RDF e OWL
•  Reusable: tutte le ontologie e i vocabolari controllati sono pubblici,
rilasciati secondo una licenza aperta (CC-BY 4.0) e sono collegati ad
altre ontologie standard (de facto) disponibili nel Web dei Dati
Più serializzazioni disponibili
RDF/XML, RDF/turtle, JSON-LD
URI in inglese e persistenti – uso di w3id.org
https://w3id.org/italia/onto/… , https://w3id.org/italia/controlled-vocabulary/…
https://w3id.org/italia/data/….
Riuso indiretto di ontologie esistenti
Multilinguismo (etichette e descrizioni in ITA e ENG)
Navigazione html delle ontologie e dei vocabolari e interrogazione via
SPARQL
http://ontopia.daf.teamdigitale.it/sparql
o 
Agile eXtreme Design, Ontology Design Pattern
F
A
I
R
OntoPiA - Principi
.
21
21	
OntoPiA – Approccio tecnico in a nutshell
Vocabolari
controllati
Ontologie Profilo
Applicativo
Italiano
(AP_IT)
Classe Proprietà
Restrizione
Concetto
Ontologie e vocabolari controllati esterni del Web Semantico
Allineamenti esterni (aligns)
Componente
Ontologia
coinvoltaIn
associataA
importa
closeMatch, exactMatch,
relatedMatch, sameAs
importa
subClassOf, subPropertyOf, equivalent*
Versioning
23
23	
OntoPiA – Stack ontologico
24	
OntoPiA vista come rete
.
25
25	
L’attuale OntoPiA in numeri
25 ONTOLOGIE PUBBLICATE 1 IN FASE DI SVILUPPO
2 IN FASE DI REVISIONE 2 ONTOLOGIE PER METADATI
264 CLASSES
22 VOCABOLARI CONTROLLATI
1 MAPPING TRA DUE VOCABOLARI CONTROLLATI
~10800 AXIOMS
26	
OntoPiA-UI
Navigazione
HTML via LODE
(open source)
Navigazione HTML
via LodView
(open source) Interrogazione
machine-to-machine
via SPARQL endpoint
Visualizzazione
grafica (WebOWL)
https://github.com/italia/OntoPiA-UI
Esempio di interrogazioni sui dati
•  COLLABORAZIONE CON CENTRI DI RICERCA
STLab – Semantic Technologies Laboratory del CNR, Sapienza
Università di Roma
•  COLLABORAZIONE CON PUBBLICHE AMMINISTRAZIONI
e.g.,ISTAT, MIBAC, Regione Piemonte, ANAC, Comuni di
Palermo e Udine, Provincia Autonoma di Trento
•  COINVOLGIMENTO DEGLI UTENTI FINALI
Disponibile su Github: chiunque può SEMPRE commentare e/o
proporre cambiamenti e correzioni
https://github.com/italia/daf-ontologie-vocabolari-controllati
.
28
28	
OntoPiA- coinvolgimento PA e utenti
OntoNetHub
•  Un’applicazione web implementata per la gestione della rete di
ontologie
•  Consente operazione di caricamento, cancellazione e
indicizzazione degli elementi delle ontologie della rete
•  Progettata come estensione di Apache Stanbol e rilasciata come
container Docker
https://github.com/teamdigitale/ontonethub
OntoPiA – chi la usa
•  DAF - Catalogo ontologie e vocabolari
controllati
•  DAF semantic tagging
•  Harvesting di metadati
•  Alcuni interessanti riusi da PA e Aziende
30
DAF – Data & Analytics Framework
Meetup #AperiTech di GraphRM
DAF – Data & Analytics Framework
•  Sistema legale
•  presupposti normativi alle attività di valorizzazione del patrimonio informativo
pubblico, preservando la privacy
•  Gruppo di specialisti (data scientist + data engineer)
•  disegna la strategia, usa ed evolve la piattaforma
•  analizza i dati, creando storie e data application
•  supporta le PA
•  Piattaforma Nazionale Digitale dei Dati
•  conserva, integra e standardizza i dati delle PA
•  Implementa meccanismi di apprendimento automatico
•  Redistribuisce dati (API) e li visualizza (portale dei dati)
Data & Analytics Framework
https://dataportal.daf.teamdigitale.it/
34
34	
OntoPiA – Catalogo versione Alpha
35
35	
Federazione di cataloghi usando OntoPiA
35
Ministero Beni e Attività culturali
http://dati.beniculturali.it/
Regione Toscana – piattaforma CKAN
http://dati.toscana.it/catalog.rdf Comune di Palermo – piattaforma
proprietaria
https://opendata.comune.palermo.it/
dcat/dcat.php
DCAT-AP_IT – estensione
per CKAN implementata
sull’ontologia di
metadatazione di OntoPiA
Uso del vocabolario
controllato delle licenze
DAF
Creare il knowledge graph dal DAF –
Data & Analytics Framework
Meetup #AperiTech di GraphRM
Gestione flusso per triplificazione
37
Script R2RML
E’ nostra intenzione
pubblicare i
mapping
presumibilmente
nel repo delle
ontologie
Gestione Flusso per triplificazione
39
Gestione Flusso per triplificazione
40
Gestione Flusso per triplificazione
41
Primi risultati preliminari
•  Linked Open Data dell’archivio storico dei comuni utilizzando 3 dataset
•  Tabella dei Comuni ANPR (storico) – file principale
•  Dataset degli ultimi Comuni d’Italia di ISTAT
•  Dataset dell’archivio storico dei Comuni
Il dataset finale è modellato secondo l’ontologia CLV-AP_IT (Core Location
Vocabulary – Italian Application Profile)
•  Linked Open Data preliminari dell’Indice della Pubblica Amministrazione
•  Il Dataset è collegato al precedente
Il dataset è modellato secondo l’ontologia COV-AP_IT (Core Organization
Vocabulary – Italian Application Profile)
Non ancora pubblicati nello SPARQL endpoint - nelle prossime settimane
43
43	
Attuali e futuri lavori
SVILUPPO ONTOLOGIE
Stabilizzazione di alcune ontologie
Definizione di nuove sulla base degli ecosistemi del piano triennale
Definizione della documentazione online
PRODUZIONE E PUBBLICAZIONE DEI LINKED (OPEN) DATA
Produzione di altri Linked Open Data per estendere l’attuale knowledge
graph
SVILUPPO CATALOGO ONTOLOGIE
Abilitare la ricerca generale e per singoli elementi delle ontologie, in
quest’ultimo caso via indicizzatore già disponibile OntonetHub
Grazie per l’attenzione!
Meetup #AperiTech di GraphRM

Weitere ähnliche Inhalte

Was ist angesagt?

NLP techniques for log analysis
NLP techniques for log analysisNLP techniques for log analysis
NLP techniques for log analysisJacob Perkins
 
RDBMS to Graph
RDBMS to GraphRDBMS to Graph
RDBMS to GraphNeo4j
 
Graph based real-time inventory and topology for network automation - webinar...
Graph based real-time inventory and topology for network automation - webinar...Graph based real-time inventory and topology for network automation - webinar...
Graph based real-time inventory and topology for network automation - webinar...Neo4j
 
Property graph vs. RDF Triplestore comparison in 2020
Property graph vs. RDF Triplestore comparison in 2020Property graph vs. RDF Triplestore comparison in 2020
Property graph vs. RDF Triplestore comparison in 2020Ontotext
 
Neo4j for Total Cost Visibility
Neo4j for Total Cost VisibilityNeo4j for Total Cost Visibility
Neo4j for Total Cost VisibilityNeo4j
 
Knowledge Graphs for Transformation: Dynamic Context for the Intelligent Ente...
Knowledge Graphs for Transformation: Dynamic Context for the Intelligent Ente...Knowledge Graphs for Transformation: Dynamic Context for the Intelligent Ente...
Knowledge Graphs for Transformation: Dynamic Context for the Intelligent Ente...Neo4j
 
Workshop - Neo4j Graph Data Science
Workshop - Neo4j Graph Data ScienceWorkshop - Neo4j Graph Data Science
Workshop - Neo4j Graph Data ScienceNeo4j
 
https://www.slideshare.net/neo4j/a-fusion-of-machine-learning-and-graph-analy...
https://www.slideshare.net/neo4j/a-fusion-of-machine-learning-and-graph-analy...https://www.slideshare.net/neo4j/a-fusion-of-machine-learning-and-graph-analy...
https://www.slideshare.net/neo4j/a-fusion-of-machine-learning-and-graph-analy...Neo4j
 
Changes and Bugs: Mining and Predicting Development Activities
Changes and Bugs: Mining and Predicting Development ActivitiesChanges and Bugs: Mining and Predicting Development Activities
Changes and Bugs: Mining and Predicting Development ActivitiesThomas Zimmermann
 
Introduction to Graph Databases
Introduction to Graph DatabasesIntroduction to Graph Databases
Introduction to Graph DatabasesMax De Marzi
 
Large Language Models - Chat AI.pdf
Large Language Models - Chat AI.pdfLarge Language Models - Chat AI.pdf
Large Language Models - Chat AI.pdfDavid Rostcheck
 
The Future of AI is Generative not Discriminative 5/26/2021
The Future of AI is Generative not Discriminative 5/26/2021The Future of AI is Generative not Discriminative 5/26/2021
The Future of AI is Generative not Discriminative 5/26/2021Steve Omohundro
 
Introduction to Knowledge Graphs: Data Summit 2020
Introduction to Knowledge Graphs: Data Summit 2020Introduction to Knowledge Graphs: Data Summit 2020
Introduction to Knowledge Graphs: Data Summit 2020Enterprise Knowledge
 
Overview of Decentralized Identity
Overview of Decentralized IdentityOverview of Decentralized Identity
Overview of Decentralized IdentityJim Flynn
 
Getting Started with Knowledge Graphs
Getting Started with Knowledge GraphsGetting Started with Knowledge Graphs
Getting Started with Knowledge GraphsPeter Haase
 
LinkML Intro July 2022.pptx PLEASE VIEW THIS ON ZENODO
LinkML Intro July 2022.pptx PLEASE VIEW THIS ON ZENODOLinkML Intro July 2022.pptx PLEASE VIEW THIS ON ZENODO
LinkML Intro July 2022.pptx PLEASE VIEW THIS ON ZENODOChris Mungall
 
Knowledge graph use cases in natural language generation
Knowledge graph use cases in natural language generationKnowledge graph use cases in natural language generation
Knowledge graph use cases in natural language generationElena Simperl
 
Introduction to Knowledge Graphs
Introduction to Knowledge GraphsIntroduction to Knowledge Graphs
Introduction to Knowledge Graphsmukuljoshi
 
Using Knowledge Graphs to Predict Customer Needs and Improve Quality
Using Knowledge Graphs to Predict Customer Needs and Improve QualityUsing Knowledge Graphs to Predict Customer Needs and Improve Quality
Using Knowledge Graphs to Predict Customer Needs and Improve QualityNeo4j
 

Was ist angesagt? (20)

NLP techniques for log analysis
NLP techniques for log analysisNLP techniques for log analysis
NLP techniques for log analysis
 
RDBMS to Graph
RDBMS to GraphRDBMS to Graph
RDBMS to Graph
 
Graph based real-time inventory and topology for network automation - webinar...
Graph based real-time inventory and topology for network automation - webinar...Graph based real-time inventory and topology for network automation - webinar...
Graph based real-time inventory and topology for network automation - webinar...
 
Property graph vs. RDF Triplestore comparison in 2020
Property graph vs. RDF Triplestore comparison in 2020Property graph vs. RDF Triplestore comparison in 2020
Property graph vs. RDF Triplestore comparison in 2020
 
Neo4j for Total Cost Visibility
Neo4j for Total Cost VisibilityNeo4j for Total Cost Visibility
Neo4j for Total Cost Visibility
 
Knowledge Graphs for Transformation: Dynamic Context for the Intelligent Ente...
Knowledge Graphs for Transformation: Dynamic Context for the Intelligent Ente...Knowledge Graphs for Transformation: Dynamic Context for the Intelligent Ente...
Knowledge Graphs for Transformation: Dynamic Context for the Intelligent Ente...
 
Workshop - Neo4j Graph Data Science
Workshop - Neo4j Graph Data ScienceWorkshop - Neo4j Graph Data Science
Workshop - Neo4j Graph Data Science
 
https://www.slideshare.net/neo4j/a-fusion-of-machine-learning-and-graph-analy...
https://www.slideshare.net/neo4j/a-fusion-of-machine-learning-and-graph-analy...https://www.slideshare.net/neo4j/a-fusion-of-machine-learning-and-graph-analy...
https://www.slideshare.net/neo4j/a-fusion-of-machine-learning-and-graph-analy...
 
Changes and Bugs: Mining and Predicting Development Activities
Changes and Bugs: Mining and Predicting Development ActivitiesChanges and Bugs: Mining and Predicting Development Activities
Changes and Bugs: Mining and Predicting Development Activities
 
Introduction to Graph Databases
Introduction to Graph DatabasesIntroduction to Graph Databases
Introduction to Graph Databases
 
Large Language Models - Chat AI.pdf
Large Language Models - Chat AI.pdfLarge Language Models - Chat AI.pdf
Large Language Models - Chat AI.pdf
 
The Future of AI is Generative not Discriminative 5/26/2021
The Future of AI is Generative not Discriminative 5/26/2021The Future of AI is Generative not Discriminative 5/26/2021
The Future of AI is Generative not Discriminative 5/26/2021
 
Introduction to Knowledge Graphs: Data Summit 2020
Introduction to Knowledge Graphs: Data Summit 2020Introduction to Knowledge Graphs: Data Summit 2020
Introduction to Knowledge Graphs: Data Summit 2020
 
Overview of Decentralized Identity
Overview of Decentralized IdentityOverview of Decentralized Identity
Overview of Decentralized Identity
 
Getting Started with Knowledge Graphs
Getting Started with Knowledge GraphsGetting Started with Knowledge Graphs
Getting Started with Knowledge Graphs
 
LinkML Intro July 2022.pptx PLEASE VIEW THIS ON ZENODO
LinkML Intro July 2022.pptx PLEASE VIEW THIS ON ZENODOLinkML Intro July 2022.pptx PLEASE VIEW THIS ON ZENODO
LinkML Intro July 2022.pptx PLEASE VIEW THIS ON ZENODO
 
Knowledge graph use cases in natural language generation
Knowledge graph use cases in natural language generationKnowledge graph use cases in natural language generation
Knowledge graph use cases in natural language generation
 
Generative AI
Generative AIGenerative AI
Generative AI
 
Introduction to Knowledge Graphs
Introduction to Knowledge GraphsIntroduction to Knowledge Graphs
Introduction to Knowledge Graphs
 
Using Knowledge Graphs to Predict Customer Needs and Improve Quality
Using Knowledge Graphs to Predict Customer Needs and Improve QualityUsing Knowledge Graphs to Predict Customer Needs and Improve Quality
Using Knowledge Graphs to Predict Customer Needs and Improve Quality
 

Ähnlich wie Il "Knowledge Graph" della Pubblica Amministrazione Italiana

OntoPiA e il knowledge graph della pubblica amministrazione italiana
OntoPiA e il knowledge graph della pubblica amministrazione italianaOntoPiA e il knowledge graph della pubblica amministrazione italiana
OntoPiA e il knowledge graph della pubblica amministrazione italianaGiorgia Lodi
 
L'ontologia dei contratti pubblici nella rete di ontologie OntoPiA
L'ontologia dei contratti pubblici nella rete di ontologie OntoPiAL'ontologia dei contratti pubblici nella rete di ontologie OntoPiA
L'ontologia dei contratti pubblici nella rete di ontologie OntoPiAGiorgia Lodi
 
Linked Open Data di Vittorio Di Tomaso
Linked Open Data di Vittorio Di TomasoLinked Open Data di Vittorio Di Tomaso
Linked Open Data di Vittorio Di TomasoCELI
 
Presentazione piattaforma semantica per gestione della conoscenza (scuole)
Presentazione piattaforma semantica per gestione della conoscenza (scuole)Presentazione piattaforma semantica per gestione della conoscenza (scuole)
Presentazione piattaforma semantica per gestione della conoscenza (scuole)Matteo Busanelli
 
Ontologie per i linked open data / Stefano De Luca, Paola De Caro, Claudia C...
Ontologie per i linked open  data / Stefano De Luca, Paola De Caro, Claudia C...Ontologie per i linked open  data / Stefano De Luca, Paola De Caro, Claudia C...
Ontologie per i linked open data / Stefano De Luca, Paola De Caro, Claudia C...libriedocumenti
 
Po Fesr 2014-2020 e gli Open Data
Po Fesr 2014-2020 e gli Open DataPo Fesr 2014-2020 e gli Open Data
Po Fesr 2014-2020 e gli Open DataDaniele Mondello
 
Linee guida web PA: formati, licenze, classificazione, open data
Linee guida web PA: formati, licenze, classificazione, open dataLinee guida web PA: formati, licenze, classificazione, open data
Linee guida web PA: formati, licenze, classificazione, open dataGianfranco Andriola
 
2015-06 Roberto Boselli, Dal dato non strutturato alle ontologie
2015-06 Roberto Boselli, Dal dato non strutturato alle ontologie2015-06 Roberto Boselli, Dal dato non strutturato alle ontologie
2015-06 Roberto Boselli, Dal dato non strutturato alle ontologieAndrea Rossetti
 
Formez PA : workshop "R-Innovare i servizi per il lavoro" - Roma, 28 novembre...
Formez PA : workshop "R-Innovare i servizi per il lavoro" - Roma, 28 novembre...Formez PA : workshop "R-Innovare i servizi per il lavoro" - Roma, 28 novembre...
Formez PA : workshop "R-Innovare i servizi per il lavoro" - Roma, 28 novembre...INPSDG
 
Sviluppo di ontologie per gli Open Data
Sviluppo di ontologie per gli Open DataSviluppo di ontologie per gli Open Data
Sviluppo di ontologie per gli Open DataGiorgia Lodi
 
Presentazione Cama_Primiceri_Atro
Presentazione Cama_Primiceri_AtroPresentazione Cama_Primiceri_Atro
Presentazione Cama_Primiceri_AtroBernadetteCama
 
The Knowledge Gap (Busanelli - Proscia)
The Knowledge Gap (Busanelli - Proscia)The Knowledge Gap (Busanelli - Proscia)
The Knowledge Gap (Busanelli - Proscia)Imola Informatica
 
Interfacce applicative al Sistema di Catalogazione del progetto MESSIAH
Interfacce applicative  al Sistema di Catalogazione del progetto MESSIAHInterfacce applicative  al Sistema di Catalogazione del progetto MESSIAH
Interfacce applicative al Sistema di Catalogazione del progetto MESSIAHCostantino Landino
 
2d. lezione ss bd e standard
2d. lezione ss bd e standard2d. lezione ss bd e standard
2d. lezione ss bd e standardMau-Messenger
 
Andrea Gazzarini "Linked Data in Practice: risorse, strumenti ed utilizzi"
Andrea Gazzarini "Linked Data in Practice: risorse, strumenti ed utilizzi"Andrea Gazzarini "Linked Data in Practice: risorse, strumenti ed utilizzi"
Andrea Gazzarini "Linked Data in Practice: risorse, strumenti ed utilizzi"GIDIF-RBM
 
Practical Linked Data: risorse, strumenti, utilizzi
Practical Linked Data: risorse, strumenti, utilizziPractical Linked Data: risorse, strumenti, utilizzi
Practical Linked Data: risorse, strumenti, utilizzi@CULT Srl
 

Ähnlich wie Il "Knowledge Graph" della Pubblica Amministrazione Italiana (20)

OntoPiA e il knowledge graph della pubblica amministrazione italiana
OntoPiA e il knowledge graph della pubblica amministrazione italianaOntoPiA e il knowledge graph della pubblica amministrazione italiana
OntoPiA e il knowledge graph della pubblica amministrazione italiana
 
L'ontologia dei contratti pubblici nella rete di ontologie OntoPiA
L'ontologia dei contratti pubblici nella rete di ontologie OntoPiAL'ontologia dei contratti pubblici nella rete di ontologie OntoPiA
L'ontologia dei contratti pubblici nella rete di ontologie OntoPiA
 
Linked Open Data di Vittorio Di Tomaso
Linked Open Data di Vittorio Di TomasoLinked Open Data di Vittorio Di Tomaso
Linked Open Data di Vittorio Di Tomaso
 
Presentazione piattaforma semantica per gestione della conoscenza (scuole)
Presentazione piattaforma semantica per gestione della conoscenza (scuole)Presentazione piattaforma semantica per gestione della conoscenza (scuole)
Presentazione piattaforma semantica per gestione della conoscenza (scuole)
 
Ontologie per i linked open data / Stefano De Luca, Paola De Caro, Claudia C...
Ontologie per i linked open  data / Stefano De Luca, Paola De Caro, Claudia C...Ontologie per i linked open  data / Stefano De Luca, Paola De Caro, Claudia C...
Ontologie per i linked open data / Stefano De Luca, Paola De Caro, Claudia C...
 
Po Fesr 2014-2020 e gli Open Data
Po Fesr 2014-2020 e gli Open DataPo Fesr 2014-2020 e gli Open Data
Po Fesr 2014-2020 e gli Open Data
 
ALIADA
ALIADAALIADA
ALIADA
 
Linee guida web PA: formati, licenze, classificazione, open data
Linee guida web PA: formati, licenze, classificazione, open dataLinee guida web PA: formati, licenze, classificazione, open data
Linee guida web PA: formati, licenze, classificazione, open data
 
2015-06 Roberto Boselli, Dal dato non strutturato alle ontologie
2015-06 Roberto Boselli, Dal dato non strutturato alle ontologie2015-06 Roberto Boselli, Dal dato non strutturato alle ontologie
2015-06 Roberto Boselli, Dal dato non strutturato alle ontologie
 
Formez PA : workshop "R-Innovare i servizi per il lavoro" - Roma, 28 novembre...
Formez PA : workshop "R-Innovare i servizi per il lavoro" - Roma, 28 novembre...Formez PA : workshop "R-Innovare i servizi per il lavoro" - Roma, 28 novembre...
Formez PA : workshop "R-Innovare i servizi per il lavoro" - Roma, 28 novembre...
 
Modelli concettuali e architetture Object-Oriented per la progettazione e lo ...
Modelli concettuali e architetture Object-Oriented per la progettazione e lo ...Modelli concettuali e architetture Object-Oriented per la progettazione e lo ...
Modelli concettuali e architetture Object-Oriented per la progettazione e lo ...
 
Sviluppo di ontologie per gli Open Data
Sviluppo di ontologie per gli Open DataSviluppo di ontologie per gli Open Data
Sviluppo di ontologie per gli Open Data
 
Presentazione Cama_Primiceri_Atro
Presentazione Cama_Primiceri_AtroPresentazione Cama_Primiceri_Atro
Presentazione Cama_Primiceri_Atro
 
Semantic Search Engine
Semantic Search EngineSemantic Search Engine
Semantic Search Engine
 
Presentazione sce
Presentazione scePresentazione sce
Presentazione sce
 
The Knowledge Gap (Busanelli - Proscia)
The Knowledge Gap (Busanelli - Proscia)The Knowledge Gap (Busanelli - Proscia)
The Knowledge Gap (Busanelli - Proscia)
 
Interfacce applicative al Sistema di Catalogazione del progetto MESSIAH
Interfacce applicative  al Sistema di Catalogazione del progetto MESSIAHInterfacce applicative  al Sistema di Catalogazione del progetto MESSIAH
Interfacce applicative al Sistema di Catalogazione del progetto MESSIAH
 
2d. lezione ss bd e standard
2d. lezione ss bd e standard2d. lezione ss bd e standard
2d. lezione ss bd e standard
 
Andrea Gazzarini "Linked Data in Practice: risorse, strumenti ed utilizzi"
Andrea Gazzarini "Linked Data in Practice: risorse, strumenti ed utilizzi"Andrea Gazzarini "Linked Data in Practice: risorse, strumenti ed utilizzi"
Andrea Gazzarini "Linked Data in Practice: risorse, strumenti ed utilizzi"
 
Practical Linked Data: risorse, strumenti, utilizzi
Practical Linked Data: risorse, strumenti, utilizziPractical Linked Data: risorse, strumenti, utilizzi
Practical Linked Data: risorse, strumenti, utilizzi
 

Mehr von GraphRM

A gentle introduction to random and strategic networks
A gentle introduction to random and strategic networksA gentle introduction to random and strategic networks
A gentle introduction to random and strategic networksGraphRM
 
How to leverage Kafka data streams with Neo4j
How to leverage Kafka data streams with Neo4jHow to leverage Kafka data streams with Neo4j
How to leverage Kafka data streams with Neo4jGraphRM
 
From zero to gremlin hero - Part I
From zero to gremlin hero - Part IFrom zero to gremlin hero - Part I
From zero to gremlin hero - Part IGraphRM
 
Topology Visualization at Sysdig
Topology Visualization at SysdigTopology Visualization at Sysdig
Topology Visualization at SysdigGraphRM
 
Tecniche per la Visualizzazione di Grafi di Grandi Dimensioni Basate sulla Co...
Tecniche per la Visualizzazione di Grafi di Grandi Dimensioni Basate sulla Co...Tecniche per la Visualizzazione di Grafi di Grandi Dimensioni Basate sulla Co...
Tecniche per la Visualizzazione di Grafi di Grandi Dimensioni Basate sulla Co...GraphRM
 
aRangodb, un package per l'utilizzo di ArangoDB con R
aRangodb, un package per l'utilizzo di ArangoDB con RaRangodb, un package per l'utilizzo di ArangoDB con R
aRangodb, un package per l'utilizzo di ArangoDB con RGraphRM
 
The power of the cosmos in a DB .... CosmosDB
The power of the cosmos in a DB .... CosmosDBThe power of the cosmos in a DB .... CosmosDB
The power of the cosmos in a DB .... CosmosDBGraphRM
 
OrientDB graph e l'importanza di una relazione mancante
OrientDB graph e l'importanza di una relazione mancanteOrientDB graph e l'importanza di una relazione mancante
OrientDB graph e l'importanza di una relazione mancanteGraphRM
 
Elastic loves Graphs
Elastic loves GraphsElastic loves Graphs
Elastic loves GraphsGraphRM
 
From text to entities: Information Extraction in the Era of Knowledge Graphs
From text to entities: Information Extraction in the Era of Knowledge GraphsFrom text to entities: Information Extraction in the Era of Knowledge Graphs
From text to entities: Information Extraction in the Era of Knowledge GraphsGraphRM
 
Graph analysis over relational database
Graph analysis over relational databaseGraph analysis over relational database
Graph analysis over relational databaseGraphRM
 
GraphRM - Introduzione al Graph modelling
GraphRM  - Introduzione al Graph modellingGraphRM  - Introduzione al Graph modelling
GraphRM - Introduzione al Graph modellingGraphRM
 
GraphQL ♥︎ GraphDB
GraphQL ♥︎ GraphDBGraphQL ♥︎ GraphDB
GraphQL ♥︎ GraphDBGraphRM
 
Costruiamo un motore di raccomandazione con Neo4J - Workshop 25/1/2018
Costruiamo un motore di raccomandazione con Neo4J - Workshop 25/1/2018Costruiamo un motore di raccomandazione con Neo4J - Workshop 25/1/2018
Costruiamo un motore di raccomandazione con Neo4J - Workshop 25/1/2018GraphRM
 

Mehr von GraphRM (14)

A gentle introduction to random and strategic networks
A gentle introduction to random and strategic networksA gentle introduction to random and strategic networks
A gentle introduction to random and strategic networks
 
How to leverage Kafka data streams with Neo4j
How to leverage Kafka data streams with Neo4jHow to leverage Kafka data streams with Neo4j
How to leverage Kafka data streams with Neo4j
 
From zero to gremlin hero - Part I
From zero to gremlin hero - Part IFrom zero to gremlin hero - Part I
From zero to gremlin hero - Part I
 
Topology Visualization at Sysdig
Topology Visualization at SysdigTopology Visualization at Sysdig
Topology Visualization at Sysdig
 
Tecniche per la Visualizzazione di Grafi di Grandi Dimensioni Basate sulla Co...
Tecniche per la Visualizzazione di Grafi di Grandi Dimensioni Basate sulla Co...Tecniche per la Visualizzazione di Grafi di Grandi Dimensioni Basate sulla Co...
Tecniche per la Visualizzazione di Grafi di Grandi Dimensioni Basate sulla Co...
 
aRangodb, un package per l'utilizzo di ArangoDB con R
aRangodb, un package per l'utilizzo di ArangoDB con RaRangodb, un package per l'utilizzo di ArangoDB con R
aRangodb, un package per l'utilizzo di ArangoDB con R
 
The power of the cosmos in a DB .... CosmosDB
The power of the cosmos in a DB .... CosmosDBThe power of the cosmos in a DB .... CosmosDB
The power of the cosmos in a DB .... CosmosDB
 
OrientDB graph e l'importanza di una relazione mancante
OrientDB graph e l'importanza di una relazione mancanteOrientDB graph e l'importanza di una relazione mancante
OrientDB graph e l'importanza di una relazione mancante
 
Elastic loves Graphs
Elastic loves GraphsElastic loves Graphs
Elastic loves Graphs
 
From text to entities: Information Extraction in the Era of Knowledge Graphs
From text to entities: Information Extraction in the Era of Knowledge GraphsFrom text to entities: Information Extraction in the Era of Knowledge Graphs
From text to entities: Information Extraction in the Era of Knowledge Graphs
 
Graph analysis over relational database
Graph analysis over relational databaseGraph analysis over relational database
Graph analysis over relational database
 
GraphRM - Introduzione al Graph modelling
GraphRM  - Introduzione al Graph modellingGraphRM  - Introduzione al Graph modelling
GraphRM - Introduzione al Graph modelling
 
GraphQL ♥︎ GraphDB
GraphQL ♥︎ GraphDBGraphQL ♥︎ GraphDB
GraphQL ♥︎ GraphDB
 
Costruiamo un motore di raccomandazione con Neo4J - Workshop 25/1/2018
Costruiamo un motore di raccomandazione con Neo4J - Workshop 25/1/2018Costruiamo un motore di raccomandazione con Neo4J - Workshop 25/1/2018
Costruiamo un motore di raccomandazione con Neo4J - Workshop 25/1/2018
 

Il "Knowledge Graph" della Pubblica Amministrazione Italiana

  • 1. OntoPiA e il knowledge Graph della Pubblica Amministrazione Italiana Giorgia Lodi Meetup #AperiTech di GraphRM
  • 2. Data is a network “A single road only takes us to places between two locations; roads real value comes from being part of a network. Data works in the same way: it is not just having more data that unlocks its value, but linking it together. Data is not individual datasets, it is a network” 2
  • 3. Standard del Web Semantico 3 Href link non tipato) Risorse: Documenti Web HTML con link non tipati (href)
  • 4. Standard del Web Semantico 4 E se facessimo la stessa cosa con i dati? Href link non tipato) Risorse: Documenti Web HTML con link non tipati (href)
  • 6. Linked Open Data Cloud 6 28 giugno 2018
  • 7. Standard Web Semantico: RDF 7 •  Un modello per I dati nel web dove I dati sono espressi sottoforma di Triple •  Soggetto Predicato Oggetto •  Ogni entità è identificata univocamente da un URI (Uniform Resource Identifier) •  Il Soggetto e il Predicato hanno sempre un URI •  L’Oggetto può anche essere un valore predefinito (Literale) •  Le triple sono interconnesse quando condividono la stessa entità •  Il risultato è un grafo interconnesso di triple (Linked Data) dpedia:Rome dbpedia:Italy dbpedia:country foaf:homepage “Roma” http://www.italia.it/en/home.html Potete provare a navigare http://dbpedia.org/page/Rome
  • 8. Vantaggi dell’RDF •  E’ un modello di rappresentazione dei dati pensato per il Web •  E’ basato su standard del Web •  Consente nativamente di abilitare l’integrazione tra I dati •  Fornisce un meccanismo per risolvere l’identitià delle cose •  Nativamente fornisce meccanismi per garantire interoperabilità semantica •  E’ usato insieme al linguaggio per interrogare I dati (i.e., SPARQL) •  I dati sono così associati a delle API che facilitano l’interrogazione da parte delle macchine
  • 9. Ma non li usa nessuno!! 9
  • 10. Ma non li usa nessuno!! 10
  • 11. Ma non li usa nessuno!! 11
  • 12. Ma non li usa nessuno!! 12 Google knowledge graph
  • 13. Ma non li usa nessuno!! 13
  • 14. Da dove iniziare? Nel 2012 AgID pubblicava le linee guida per “Interoperabilità semantica attraverso I Linked Open Data”
  • 15. OntoPiA – la rete di ontologie e vocabolari controllati della Pubblica Amministrazione Meetup #AperiTech di GraphRM
  • 16. 16 Cos’è OntoPiA e a cosa serve •  Definisce un linguaggio comune per l’interscambio di dati (interoperabilità semantica) •  Definisce un modello formale, elaborabile da dispositivi digitali e leggibile da umani (i.e., superamento della logica delle specifiche scritte in soli file PDF!) •  Apre la strada alla creazione di dati nativamente collegati, i.e., fornisce gli schemi dati per creare, interrogare il “grafo della conoscenza” (knowledge graph) della PA italiana
  • 17. •  ONTOLOGIA: una specifica formale ed esplicita di rappresentazione (concettualizzazione) condivisa di un dominio di conoscenza, definita sulla base di requisiti specifici •  VOCABOLARIO CONTROLLATO: una serie di termini e codici standard predefiniti e autorizzati, preselezionati al fine di indicizzare e recuperare informazioni . 17 17 OntoPiA- rete di ontologie e vocabolari controllati
  • 18. 18 FACILITARE LO SVILUPPO DI NUOVI SISTEMI INFORMATIVI AGEVOLARE LO SCAMBIO DI DATI ABILITARE L’INTEGRAZIONE TRA DATI PROVENIENTI DA SORGENTI DIVERSE STANDARDIZZAZIONE DEI DATI (APERTI) OntoPiA – perché?
  • 19. 19 OntoPiA e i principi del modello FAIR •  Findable: si usano URI permanenti per identificare concetti e relazioni nella rete di ontologie e termini nei vocabolari controllati •  Accessible: si utilizzano protocolli standard aperti per l’accesso sul Web (i.e. HTTP(S)) and per l’interrogazione dei dati (i.e. SPARQL) •  Interoperable: si utilizzano protocolli standard aperti per modellare i dati i.e. RDF e OWL •  Reusable: tutte le ontologie e i vocabolari controllati sono pubblici, rilasciati secondo una licenza aperta (CC-BY 4.0) e sono collegati ad altre ontologie standard (de facto) disponibili nel Web dei Dati
  • 20. Più serializzazioni disponibili RDF/XML, RDF/turtle, JSON-LD URI in inglese e persistenti – uso di w3id.org https://w3id.org/italia/onto/… , https://w3id.org/italia/controlled-vocabulary/… https://w3id.org/italia/data/…. Riuso indiretto di ontologie esistenti Multilinguismo (etichette e descrizioni in ITA e ENG) Navigazione html delle ontologie e dei vocabolari e interrogazione via SPARQL http://ontopia.daf.teamdigitale.it/sparql o  Agile eXtreme Design, Ontology Design Pattern F A I R OntoPiA - Principi
  • 21. . 21 21 OntoPiA – Approccio tecnico in a nutshell Vocabolari controllati Ontologie Profilo Applicativo Italiano (AP_IT) Classe Proprietà Restrizione Concetto Ontologie e vocabolari controllati esterni del Web Semantico Allineamenti esterni (aligns) Componente Ontologia coinvoltaIn associataA importa closeMatch, exactMatch, relatedMatch, sameAs importa subClassOf, subPropertyOf, equivalent*
  • 25. . 25 25 L’attuale OntoPiA in numeri 25 ONTOLOGIE PUBBLICATE 1 IN FASE DI SVILUPPO 2 IN FASE DI REVISIONE 2 ONTOLOGIE PER METADATI 264 CLASSES 22 VOCABOLARI CONTROLLATI 1 MAPPING TRA DUE VOCABOLARI CONTROLLATI ~10800 AXIOMS
  • 26. 26 OntoPiA-UI Navigazione HTML via LODE (open source) Navigazione HTML via LodView (open source) Interrogazione machine-to-machine via SPARQL endpoint Visualizzazione grafica (WebOWL) https://github.com/italia/OntoPiA-UI
  • 28. •  COLLABORAZIONE CON CENTRI DI RICERCA STLab – Semantic Technologies Laboratory del CNR, Sapienza Università di Roma •  COLLABORAZIONE CON PUBBLICHE AMMINISTRAZIONI e.g.,ISTAT, MIBAC, Regione Piemonte, ANAC, Comuni di Palermo e Udine, Provincia Autonoma di Trento •  COINVOLGIMENTO DEGLI UTENTI FINALI Disponibile su Github: chiunque può SEMPRE commentare e/o proporre cambiamenti e correzioni https://github.com/italia/daf-ontologie-vocabolari-controllati . 28 28 OntoPiA- coinvolgimento PA e utenti
  • 29. OntoNetHub •  Un’applicazione web implementata per la gestione della rete di ontologie •  Consente operazione di caricamento, cancellazione e indicizzazione degli elementi delle ontologie della rete •  Progettata come estensione di Apache Stanbol e rilasciata come container Docker https://github.com/teamdigitale/ontonethub
  • 30. OntoPiA – chi la usa •  DAF - Catalogo ontologie e vocabolari controllati •  DAF semantic tagging •  Harvesting di metadati •  Alcuni interessanti riusi da PA e Aziende 30
  • 31. DAF – Data & Analytics Framework Meetup #AperiTech di GraphRM
  • 32. DAF – Data & Analytics Framework •  Sistema legale •  presupposti normativi alle attività di valorizzazione del patrimonio informativo pubblico, preservando la privacy •  Gruppo di specialisti (data scientist + data engineer) •  disegna la strategia, usa ed evolve la piattaforma •  analizza i dati, creando storie e data application •  supporta le PA •  Piattaforma Nazionale Digitale dei Dati •  conserva, integra e standardizza i dati delle PA •  Implementa meccanismi di apprendimento automatico •  Redistribuisce dati (API) e li visualizza (portale dei dati)
  • 33. Data & Analytics Framework https://dataportal.daf.teamdigitale.it/
  • 34. 34 34 OntoPiA – Catalogo versione Alpha
  • 35. 35 35 Federazione di cataloghi usando OntoPiA 35 Ministero Beni e Attività culturali http://dati.beniculturali.it/ Regione Toscana – piattaforma CKAN http://dati.toscana.it/catalog.rdf Comune di Palermo – piattaforma proprietaria https://opendata.comune.palermo.it/ dcat/dcat.php DCAT-AP_IT – estensione per CKAN implementata sull’ontologia di metadatazione di OntoPiA Uso del vocabolario controllato delle licenze DAF
  • 36. Creare il knowledge graph dal DAF – Data & Analytics Framework Meetup #AperiTech di GraphRM
  • 37. Gestione flusso per triplificazione 37
  • 38. Script R2RML E’ nostra intenzione pubblicare i mapping presumibilmente nel repo delle ontologie
  • 39. Gestione Flusso per triplificazione 39
  • 40. Gestione Flusso per triplificazione 40
  • 41. Gestione Flusso per triplificazione 41
  • 42. Primi risultati preliminari •  Linked Open Data dell’archivio storico dei comuni utilizzando 3 dataset •  Tabella dei Comuni ANPR (storico) – file principale •  Dataset degli ultimi Comuni d’Italia di ISTAT •  Dataset dell’archivio storico dei Comuni Il dataset finale è modellato secondo l’ontologia CLV-AP_IT (Core Location Vocabulary – Italian Application Profile) •  Linked Open Data preliminari dell’Indice della Pubblica Amministrazione •  Il Dataset è collegato al precedente Il dataset è modellato secondo l’ontologia COV-AP_IT (Core Organization Vocabulary – Italian Application Profile) Non ancora pubblicati nello SPARQL endpoint - nelle prossime settimane
  • 43. 43 43 Attuali e futuri lavori SVILUPPO ONTOLOGIE Stabilizzazione di alcune ontologie Definizione di nuove sulla base degli ecosistemi del piano triennale Definizione della documentazione online PRODUZIONE E PUBBLICAZIONE DEI LINKED (OPEN) DATA Produzione di altri Linked Open Data per estendere l’attuale knowledge graph SVILUPPO CATALOGO ONTOLOGIE Abilitare la ricerca generale e per singoli elementi delle ontologie, in quest’ultimo caso via indicizzatore già disponibile OntonetHub
  • 44. Grazie per l’attenzione! Meetup #AperiTech di GraphRM