SlideShare ist ein Scribd-Unternehmen logo
1 von 10
Downloaden Sie, um offline zu lesen
1
Tutorial CIDOC-CRM SPARQL sur les données du
BritishMuseum à
http://collection.britishmuseum.org
Auteur : Thomas Francart – thomas.francart@sparna.fr
Date de création : 04/06/2018
Date de dernière modification : 13/09/2018
Version : 2
License : CC-by-nc-sa https://creativecommons.org/licenses/by-nc-sa/4.0/ Attribution-
NonCommercial-ShareAlike 4.0 International
Table des matières
Objectifs........................................................................................................................................2
1. Lire la Documentation ..........................................................................................................2
Documentation du CIDOC-CRM...................................................................................................2
Documentation du British Museum.............................................................................................2
2. A la recherche de Turner.......................................................................................................2
Sur le web...................................................................................................................................2
Sur ResearchSpace......................................................................................................................3
Sur le service SPARQL..................................................................................................................3
3. Recherchez les activités de Production de Turner ...............................................................5
4. Recherchez les oeuvres/objets créés par Turner .................................................................6
5. Les images des œuvres .........................................................................................................8
6. Les dates des œuvres............................................................................................................9
7. Et maintenant… une timeline !.............................................................................................9
8. Les sujets des œuvres de Turner...........................................................................................9
2
Objectifs
Ce tutorial permet d’appréhender l’implémentation du CIDOC-CRM faite par le British
Museum sur son service SPARQL https://collection.britishmuseum.org. Il permet également
de rentrer « pas à pas » dans la documentation du CIDOC-CRM.
Il a pour objectif d’expliquer :
o Comment interagir avec le service SPARQL et les pages de notices pour retrouver
l’information cherchée ;
o L’utilisation du CIDOC-CRM pour la modélisation des données, pour les auteurs, les
productions d’œuvre, les mots-clés et les dates des œuvres ;
o Comment écrire les requêtes SPARQL correspondantes ;
A la fin de ce tutorial vous devriez être capable de réutiliser les données du British Museum
pour générer une timeline sur un service en ligne. Cela démontre le potentiel de réutilisation
des données ouvertes pour des utilisations innovantes.
1. Lire la Documentation
Documentation du CIDOC-CRM
Naviguez à www.cidoc-crm.org/versions-of-the-cidoc-crm.
Consultez la version PDF de la dernière version du CIDOC-CRM. C’est la documentation de
référence du modèle.
Documentation du British Museum
Naviguez à https://confluence.ontotext.com/display/ResearchSpace
Naviguez sous “RS Ontology / BM mapping” et consultez le diagramme. Le diagramme est
fourni en annexe de ce document. Dans ce diagramme nous utiliserons :
 La partie “Bibliographie” pour les personnes, en haut à gauche ;
 La partie “Production”;
 La partie “Object” au centre, et la partie « Subject » juste en-dessous ;
Depuis cette même page cliquez sur le lien « mapping manual for endpoint site draft 0.98a.pdf ».
Ce document explique les choix faits pour le mapping des données du BritishMuseum vers le
CIDOC-CRM.
2. A la recherche de Turner
Sur le web
 Recherchez “Turner” sur votre moteur de recherche préféré ;
 Consultez sa page Wikipedia (“Joseph Mallord William Turner”).
3
Sur ResearchSpace
 Allez à https://public.researchspace.org et recherchez un “Actor” avec le label "Turner,
Joseph Mallord William" (exactement cette chaine de caractère, en tenant compte de
la virgule et des majuscules) ;
 Regardez la vue “table” et cliquez sur “Joseph Mallord William Turner”
 Cliquez sur l’onglet “All properties” en bas à droite de la page de notice de Turner ;
Sur le service SPARQL
 Allez sur le endpoint https://collection.britishmuseum.org/resource/sparql.
 Recherchez n’importe quoi avec le même label "Turner, Joseph Mallord William";
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
SELECT ?anything WHERE {
?anything rdfs:label "Turner, Joseph Mallord William" .
}
 Cliquez sur l’URI pour consulter la notice de cet objet
(http://collection.britishmuseum.org/id/person-institution/49003/appellation/1)
4
 Dans la section “Incoming Statements” :
o Passez votre souris sur “is identified by” pour voir son URI ;
o Lisez la documentation de la propriété P131 dans la spécification du CIDOC-
CRM pour comprendre sa sémantique ;
o Trouvez ce lien dans l’image du mapping BM, dans la partie en haut à gauche ;
o Cliquez sur “Joseph Mallord William Turner” et naviguez vers la page de notice
de Turner (http://collection.britishmuseum.org/id/person-institution/49003)
 Adaptez la requête SPARQL pour sélectionnez “l’URI de la personne qui s’appelle
“Turner, Joseph Mallord William” "
5
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX crm: <http://www.cidoc-crm.org/cidoc-crm/>
SELECT * WHERE {
?person a crm:E21_Person .
?person crm:P131_is_identified_by ?appellation .
?appellation rdfs:label "Turner, Joseph Mallord William" .
}
3. Recherchez les activités de Production de Turner
 Dans la section “Incoming Statements” de la page de notice de Turner, cherchez les
liens “carried out by”. Vous pouvez filtrer la liste en cherchant “carried” dans la boite de
filtrage au-dessus ;
o Passez votre souris sur “carried out by” pour récupérer son URI ;
o Recherchez et lisez sa définition dans la spécification du CIDOC-CRM ;
o Trouvez le lien correspondant dans le diagramme de mapping ; Notez qu’il
apparait à plusieurs endroits, essayez de trouver « le bon » ;
o Notez que l’activité de Production qui relie le créateur de l’œuvre fait elle-même
partie d’une activité de Production principale qui l’englobe, ainsi que d’autres
activités de production qui portent des informations différentes ;
o Repérez l’activité de production qui porte l’information de date ;
6
 Enrichissez la query pour sélectionner les URI des activités de Production de Turner.
Vous pouvez utiliser la propriété (non CIDOC-CRM) rs:displayLabel pour
sélectionner des libellés pour ces activités ;
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX crm: <http://www.cidoc-crm.org/cidoc-crm/>
PREFIX rs: <http://www.researchspace.org/ontology/>
SELECT ?event ?eventLabel WHERE {
?person a crm:E21_Person .
?person crm:P131_is_identified_by ?appellation .
?appellation rdfs:label "Turner, Joseph Mallord William" .
?event crm:P14_carried_out_by ?person .
?event rs:displayLabel ?eventLabel .
} ORDER BY ?event
4. Recherchez les oeuvres/objets créés par Turner
 Pouvez-vous trouver, à partir du diagramme de mapping et en naviguant dans les
fiches des évènements, les liens permettant de passer des activités de production de
Turner aux objets produits ? il faut pour cela remonter sur l’ « évènement principal » ;
 Lisez les documentations des propriétés correspondantes ;
 Adaptez la query pour sélectionner les URIs des objets créés par Turner ;
7
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX crm: <http://www.cidoc-crm.org/cidoc-crm/>
PREFIX rs: <http://www.researchspace.org/ontology/>
SELECT ?thing WHERE {
?person a crm:E21_Person .
?person crm:P131_is_identified_by ?appellation .
?appellation rdfs:label "Turner, Joseph Mallord William" .
?event crm:P14_carried_out_by ?person .
?superEvent crm:P9_consists_of ?event .
?thing crm:P108i_was_produced_by ?superEvent .
}
 A partir de la notice d’une URI d’œuvre, pouvez-vous trouver toutes les façons de
sélectionner le titre de l’œuvre ? quelle est la façon « CIDOC-CRM » de trouver le
titre ?
 Lise la documentation de la propriété correspondante ;
 Adaptez la query pour sélectionner le titre de toutes les œuvres de Turner ;
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX crm: <http://www.cidoc-crm.org/cidoc-crm/>
PREFIX rs: <http://www.researchspace.org/ontology/>
8
SELECT ?title ?thing WHERE {
?person a crm:E21_Person .
?person crm:P131_is_identified_by ?appellation .
?appellation rdfs:label "Turner, Joseph Mallord William" .
?event crm:P14_carried_out_by ?person .
?superEvent crm:P9_consists_of ?event .
?thing crm:P108i_was_produced_by ?superEvent .
?thing crm:P102_has_title/rdfs:label ?title .
} ORDER BY ?thingLabel
o BONUS 1 : sauriez-vous simplifier la query en utilisant des « Property Path » SPARQL
pour la réécrire en une seule ligne ?
o BONUS 2 : sauriez-vous compter le nombre d’œuvres produites par Turner ?
5. Les images des œuvres
o Trouvez comment accédez aux images (et à la « représentation principale ») d’une
œuvre ;
o Il y a 2 types de lien : un lien CIDOC-CRM et un lien « propriétaire » ;
o Consultez la documentation de la propriété CIDOC-CRM correspondante ;
o Améliorez la query pour sélectionner, en plus du titre, le lien vers une image de l’œuvre ;
essayez avec la propriété CIDOC-CRM, puis avec la propriété spécifique au British
Museum. Que constatez-vous ?
o Copiez-coller une URL d’image dans votre navigateur pour vérifier qu’on accède bien à
une image ;
9
Vous avez lu les 8 premières pages de ce tutorial.
Pour lire la version complète de 13 pages contenant
toutes les requêtes SPARQL et la génération de la
timeline, contactez-moi à
thomas.francart@sparna.fr
6. Les dates des œuvres
7. Et maintenant… une timeline !
8. Les sujets des œuvres de Turner
1

Weitere ähnliche Inhalte

Ähnlich wie SPARQL sur les données CIDOC-CRM du British Museum

Analyse des imprimantes multifonction pour un usage bureautique
Analyse des imprimantes multifonction pour un usage bureautiqueAnalyse des imprimantes multifonction pour un usage bureautique
Analyse des imprimantes multifonction pour un usage bureautiqueGuillaume MOCQUET
 
Les professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesLes professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesGautier Poupeau
 
A la découverte du Web sémantique
A la découverte du Web sémantiqueA la découverte du Web sémantique
A la découverte du Web sémantiqueGautier Poupeau
 
Présentation du CIDOC CRM 20101209
Présentation du CIDOC CRM 20101209Présentation du CIDOC CRM 20101209
Présentation du CIDOC CRM 20101209Patrick Le Boeuf
 
Principes Relationnels et Concepts Oracle
Principes Relationnelset Concepts OraclePrincipes Relationnelset Concepts Oracle
Principes Relationnels et Concepts Oraclewebreaker
 

Ähnlich wie SPARQL sur les données CIDOC-CRM du British Museum (9)

C2i d4 scd-amu 2016
C2i d4 scd-amu 2016C2i d4 scd-amu 2016
C2i d4 scd-amu 2016
 
Rapport panama papers
Rapport panama papersRapport panama papers
Rapport panama papers
 
Formation FRBRoo 201407
Formation FRBRoo 201407Formation FRBRoo 201407
Formation FRBRoo 201407
 
Analyse des imprimantes multifonction pour un usage bureautique
Analyse des imprimantes multifonction pour un usage bureautiqueAnalyse des imprimantes multifonction pour un usage bureautique
Analyse des imprimantes multifonction pour un usage bureautique
 
Les professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesLes professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de données
 
A la découverte du Web sémantique
A la découverte du Web sémantiqueA la découverte du Web sémantique
A la découverte du Web sémantique
 
Taweb projet pyramide
Taweb projet pyramideTaweb projet pyramide
Taweb projet pyramide
 
Présentation du CIDOC CRM 20101209
Présentation du CIDOC CRM 20101209Présentation du CIDOC CRM 20101209
Présentation du CIDOC CRM 20101209
 
Principes Relationnels et Concepts Oracle
Principes Relationnelset Concepts OraclePrincipes Relationnelset Concepts Oracle
Principes Relationnels et Concepts Oracle
 

Mehr von Thomas Francart

SPARQL introduction and training (130+ slides with exercices)
SPARQL introduction and training (130+ slides with exercices)SPARQL introduction and training (130+ slides with exercices)
SPARQL introduction and training (130+ slides with exercices)Thomas Francart
 
SPARQL queries on CIDOC-CRM data of BritishMuseum
SPARQL queries on CIDOC-CRM data of BritishMuseumSPARQL queries on CIDOC-CRM data of BritishMuseum
SPARQL queries on CIDOC-CRM data of BritishMuseumThomas Francart
 
SKOS Play @ semweb.pro 2014
SKOS Play @ semweb.pro 2014SKOS Play @ semweb.pro 2014
SKOS Play @ semweb.pro 2014Thomas Francart
 
Web of Data - Introduction (english)
Web of Data - Introduction (english)Web of Data - Introduction (english)
Web of Data - Introduction (english)Thomas Francart
 
Partager et réutiliser des données sur le web
Partager et réutiliser des données sur le webPartager et réutiliser des données sur le web
Partager et réutiliser des données sur le webThomas Francart
 

Mehr von Thomas Francart (9)

SPARQL introduction and training (130+ slides with exercices)
SPARQL introduction and training (130+ slides with exercices)SPARQL introduction and training (130+ slides with exercices)
SPARQL introduction and training (130+ slides with exercices)
 
SPARQL queries on CIDOC-CRM data of BritishMuseum
SPARQL queries on CIDOC-CRM data of BritishMuseumSPARQL queries on CIDOC-CRM data of BritishMuseum
SPARQL queries on CIDOC-CRM data of BritishMuseum
 
JSON-LD
JSON-LDJSON-LD
JSON-LD
 
Solr formation Sparna
Solr formation SparnaSolr formation Sparna
Solr formation Sparna
 
SKOS Play @ semweb.pro 2014
SKOS Play @ semweb.pro 2014SKOS Play @ semweb.pro 2014
SKOS Play @ semweb.pro 2014
 
Web of Data - Introduction (english)
Web of Data - Introduction (english)Web of Data - Introduction (english)
Web of Data - Introduction (english)
 
Partager et réutiliser des données sur le web
Partager et réutiliser des données sur le webPartager et réutiliser des données sur le web
Partager et réutiliser des données sur le web
 
RDFS : une introduction
RDFS : une introductionRDFS : une introduction
RDFS : une introduction
 
Skos play
Skos playSkos play
Skos play
 

SPARQL sur les données CIDOC-CRM du British Museum

  • 1. 1 Tutorial CIDOC-CRM SPARQL sur les données du BritishMuseum à http://collection.britishmuseum.org Auteur : Thomas Francart – thomas.francart@sparna.fr Date de création : 04/06/2018 Date de dernière modification : 13/09/2018 Version : 2 License : CC-by-nc-sa https://creativecommons.org/licenses/by-nc-sa/4.0/ Attribution- NonCommercial-ShareAlike 4.0 International Table des matières Objectifs........................................................................................................................................2 1. Lire la Documentation ..........................................................................................................2 Documentation du CIDOC-CRM...................................................................................................2 Documentation du British Museum.............................................................................................2 2. A la recherche de Turner.......................................................................................................2 Sur le web...................................................................................................................................2 Sur ResearchSpace......................................................................................................................3 Sur le service SPARQL..................................................................................................................3 3. Recherchez les activités de Production de Turner ...............................................................5 4. Recherchez les oeuvres/objets créés par Turner .................................................................6 5. Les images des œuvres .........................................................................................................8 6. Les dates des œuvres............................................................................................................9 7. Et maintenant… une timeline !.............................................................................................9 8. Les sujets des œuvres de Turner...........................................................................................9
  • 2. 2 Objectifs Ce tutorial permet d’appréhender l’implémentation du CIDOC-CRM faite par le British Museum sur son service SPARQL https://collection.britishmuseum.org. Il permet également de rentrer « pas à pas » dans la documentation du CIDOC-CRM. Il a pour objectif d’expliquer : o Comment interagir avec le service SPARQL et les pages de notices pour retrouver l’information cherchée ; o L’utilisation du CIDOC-CRM pour la modélisation des données, pour les auteurs, les productions d’œuvre, les mots-clés et les dates des œuvres ; o Comment écrire les requêtes SPARQL correspondantes ; A la fin de ce tutorial vous devriez être capable de réutiliser les données du British Museum pour générer une timeline sur un service en ligne. Cela démontre le potentiel de réutilisation des données ouvertes pour des utilisations innovantes. 1. Lire la Documentation Documentation du CIDOC-CRM Naviguez à www.cidoc-crm.org/versions-of-the-cidoc-crm. Consultez la version PDF de la dernière version du CIDOC-CRM. C’est la documentation de référence du modèle. Documentation du British Museum Naviguez à https://confluence.ontotext.com/display/ResearchSpace Naviguez sous “RS Ontology / BM mapping” et consultez le diagramme. Le diagramme est fourni en annexe de ce document. Dans ce diagramme nous utiliserons :  La partie “Bibliographie” pour les personnes, en haut à gauche ;  La partie “Production”;  La partie “Object” au centre, et la partie « Subject » juste en-dessous ; Depuis cette même page cliquez sur le lien « mapping manual for endpoint site draft 0.98a.pdf ». Ce document explique les choix faits pour le mapping des données du BritishMuseum vers le CIDOC-CRM. 2. A la recherche de Turner Sur le web  Recherchez “Turner” sur votre moteur de recherche préféré ;  Consultez sa page Wikipedia (“Joseph Mallord William Turner”).
  • 3. 3 Sur ResearchSpace  Allez à https://public.researchspace.org et recherchez un “Actor” avec le label "Turner, Joseph Mallord William" (exactement cette chaine de caractère, en tenant compte de la virgule et des majuscules) ;  Regardez la vue “table” et cliquez sur “Joseph Mallord William Turner”  Cliquez sur l’onglet “All properties” en bas à droite de la page de notice de Turner ; Sur le service SPARQL  Allez sur le endpoint https://collection.britishmuseum.org/resource/sparql.  Recherchez n’importe quoi avec le même label "Turner, Joseph Mallord William"; PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> SELECT ?anything WHERE { ?anything rdfs:label "Turner, Joseph Mallord William" . }  Cliquez sur l’URI pour consulter la notice de cet objet (http://collection.britishmuseum.org/id/person-institution/49003/appellation/1)
  • 4. 4  Dans la section “Incoming Statements” : o Passez votre souris sur “is identified by” pour voir son URI ; o Lisez la documentation de la propriété P131 dans la spécification du CIDOC- CRM pour comprendre sa sémantique ; o Trouvez ce lien dans l’image du mapping BM, dans la partie en haut à gauche ; o Cliquez sur “Joseph Mallord William Turner” et naviguez vers la page de notice de Turner (http://collection.britishmuseum.org/id/person-institution/49003)  Adaptez la requête SPARQL pour sélectionnez “l’URI de la personne qui s’appelle “Turner, Joseph Mallord William” "
  • 5. 5 PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> PREFIX crm: <http://www.cidoc-crm.org/cidoc-crm/> SELECT * WHERE { ?person a crm:E21_Person . ?person crm:P131_is_identified_by ?appellation . ?appellation rdfs:label "Turner, Joseph Mallord William" . } 3. Recherchez les activités de Production de Turner  Dans la section “Incoming Statements” de la page de notice de Turner, cherchez les liens “carried out by”. Vous pouvez filtrer la liste en cherchant “carried” dans la boite de filtrage au-dessus ; o Passez votre souris sur “carried out by” pour récupérer son URI ; o Recherchez et lisez sa définition dans la spécification du CIDOC-CRM ; o Trouvez le lien correspondant dans le diagramme de mapping ; Notez qu’il apparait à plusieurs endroits, essayez de trouver « le bon » ; o Notez que l’activité de Production qui relie le créateur de l’œuvre fait elle-même partie d’une activité de Production principale qui l’englobe, ainsi que d’autres activités de production qui portent des informations différentes ; o Repérez l’activité de production qui porte l’information de date ;
  • 6. 6  Enrichissez la query pour sélectionner les URI des activités de Production de Turner. Vous pouvez utiliser la propriété (non CIDOC-CRM) rs:displayLabel pour sélectionner des libellés pour ces activités ; PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> PREFIX crm: <http://www.cidoc-crm.org/cidoc-crm/> PREFIX rs: <http://www.researchspace.org/ontology/> SELECT ?event ?eventLabel WHERE { ?person a crm:E21_Person . ?person crm:P131_is_identified_by ?appellation . ?appellation rdfs:label "Turner, Joseph Mallord William" . ?event crm:P14_carried_out_by ?person . ?event rs:displayLabel ?eventLabel . } ORDER BY ?event 4. Recherchez les oeuvres/objets créés par Turner  Pouvez-vous trouver, à partir du diagramme de mapping et en naviguant dans les fiches des évènements, les liens permettant de passer des activités de production de Turner aux objets produits ? il faut pour cela remonter sur l’ « évènement principal » ;  Lisez les documentations des propriétés correspondantes ;  Adaptez la query pour sélectionner les URIs des objets créés par Turner ;
  • 7. 7 PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> PREFIX crm: <http://www.cidoc-crm.org/cidoc-crm/> PREFIX rs: <http://www.researchspace.org/ontology/> SELECT ?thing WHERE { ?person a crm:E21_Person . ?person crm:P131_is_identified_by ?appellation . ?appellation rdfs:label "Turner, Joseph Mallord William" . ?event crm:P14_carried_out_by ?person . ?superEvent crm:P9_consists_of ?event . ?thing crm:P108i_was_produced_by ?superEvent . }  A partir de la notice d’une URI d’œuvre, pouvez-vous trouver toutes les façons de sélectionner le titre de l’œuvre ? quelle est la façon « CIDOC-CRM » de trouver le titre ?  Lise la documentation de la propriété correspondante ;  Adaptez la query pour sélectionner le titre de toutes les œuvres de Turner ; PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> PREFIX crm: <http://www.cidoc-crm.org/cidoc-crm/> PREFIX rs: <http://www.researchspace.org/ontology/>
  • 8. 8 SELECT ?title ?thing WHERE { ?person a crm:E21_Person . ?person crm:P131_is_identified_by ?appellation . ?appellation rdfs:label "Turner, Joseph Mallord William" . ?event crm:P14_carried_out_by ?person . ?superEvent crm:P9_consists_of ?event . ?thing crm:P108i_was_produced_by ?superEvent . ?thing crm:P102_has_title/rdfs:label ?title . } ORDER BY ?thingLabel o BONUS 1 : sauriez-vous simplifier la query en utilisant des « Property Path » SPARQL pour la réécrire en une seule ligne ? o BONUS 2 : sauriez-vous compter le nombre d’œuvres produites par Turner ? 5. Les images des œuvres o Trouvez comment accédez aux images (et à la « représentation principale ») d’une œuvre ; o Il y a 2 types de lien : un lien CIDOC-CRM et un lien « propriétaire » ; o Consultez la documentation de la propriété CIDOC-CRM correspondante ; o Améliorez la query pour sélectionner, en plus du titre, le lien vers une image de l’œuvre ; essayez avec la propriété CIDOC-CRM, puis avec la propriété spécifique au British Museum. Que constatez-vous ? o Copiez-coller une URL d’image dans votre navigateur pour vérifier qu’on accède bien à une image ;
  • 9. 9 Vous avez lu les 8 premières pages de ce tutorial. Pour lire la version complète de 13 pages contenant toutes les requêtes SPARQL et la génération de la timeline, contactez-moi à thomas.francart@sparna.fr 6. Les dates des œuvres 7. Et maintenant… une timeline ! 8. Les sujets des œuvres de Turner
  • 10. 1