SlideShare ist ein Scribd-Unternehmen logo
1 von 20
Downloaden Sie, um offline zu lesen
Construction automatique
                 d’ontologie à partir de
          spécifications de base de données
                    M. Kamel, N. Aussenac-Gilles
                     (IRIT – IC3, Toulouse, France)
                       aussenac@irit.fr, Kamel@irit.fr

                  Projet ANR Masse de données GEONTO
             Partenaires : LRI-IASI, LIUPPA – Desi et IGN-COGIT


IC 2009                                                           1
Construction d'ontologie à partir de spécifications de BD


Problématique :
construction d’ontologies à partir de textes

          Textes      Analyse du contenu linguistique
                        Approches linguistiques
                           Exploitation des relations syntaxiques et de
                           connaissances sur la langue
     Extraction
 termes - relations        Patrons d’extraction (de termes / de
                           relations)
    Modélisation
                        Approches statistiques
     ontologie             Exploitation des régularités de séquences de
                           termes (co-occurrences, segments répétés
                           …)
                           Clustering
                      Exploiter la structure des textes et la
                      mise en forme matérielle
IC 2009                                                                                     2
Construction d'ontologie à partir de spécifications de BD



Contexte : GEONTO
                             Textes
             BD-TOPO            Spécifications de bases de données
                                Documents XML ayant le même XML schéma
                                Sémantique des tags : précise, définit des concepts
                                et des relations
            Spécifications   Méthode
                                Applicable à plusieurs bases de données
                                Automatique
          Extraction
      Concepts - relations   Ontologies obtenues
                                Une ontologie par BD
                                Alignement des ontologies et intervention humaine
          Construction          vers une ontologie unique de référence
           ontologie         Validation
                                Comparaison entre ontologie extraite et une
                                ontologie existante tirée des mêmes spécifications
 OntoTOPO



IC 2009                                                                                           3
Construction d'ontologie à partir de spécifications de BD

    Textes : spécifications de BDTopo

Concepts présents
dans les champs:
  - Domaine
  - Classe
  - Regroupement
  - Attribut
  - Valeur d’attribut




   IC 2009                                                                       4
Construction d'ontologie à partir de spécifications de BD

     Textes : spécifications de BDTopo

Rel. hiérarchique
est-un :

- Domaine / Classe
- Classe / Regroup.
- Attribut / Valeur d’attrib.
- Valeur d’attrib. / Regroup.




    IC 2009                                                                            5
Construction d'ontologie à partir de spécifications de BD


    Textes : spécifications de BDTopo

Autres relations
sémantiques

 Classe / Attribut qualitatif



Propriétés

  Classe / Attribut quantitatif




   IC 2009                                                                               6
Construction d'ontologie à partir de spécifications de BD

   Textes : spécifications de BDTopo

Information contenue
dans les champs
définition,
modélisation
géométrique, etc.




  IC 2009                                                                       7
Construction d'ontologie à partir de spécifications de BD


Méthode
     Prendre en compte la structure hiérarchique du texte / XML schema
          Concepts
          Relations entre concepts
          Noyau d’ontologie
     Écriture de règles d’extraction de concepts et de relations

     Exploiter le texte rédigé
          Nouveaux concepts
          Nouvelles relations
          Enrichir le noyau d’ontologie
     Définition de patrons lexico-syntaxiques

     Combiner les deux approches au sein d’un même logiciel
          Plate-forme GATE




IC 2009                                                                                          8
Construction d'ontologie à partir de spécifications de BD

Méthode : 1 – exploiter les spécifications XML




IC 2009                                                                        9
Construction d'ontologie à partir de spécifications de BD

Méthode : 2- exploiter le texte en LN
  Identification de relations
          Identité
           -   Chef-lieu de canton : chef-lieu de canton
          Synonymie
           - Cascade : Chute d’eau
           - Terrain de sport : équipement sportif de plein air
          Relations lexicales :partie_de, ensemble_de, relations spatiales …
 <classe>
 <nom_classe> Tronçon de route </nom_classe>
 <définition> Portion de voie de communication destin e aux automobilistes >/definition>
                                               destinée
 </classe>

 (({Token.lemme== quot;portionquot;}|{Token.lemme== quot;partiequot;}|…)
       ({Token.lemme== quot;dequot;}) ({NounChunk}) :annot
 ) - - > annot.ANNOT = {kind=quot;Partiequot;, rule=quot;Rule1quot;}


IC 2009                                                                                                   10
Construction d'ontologie à partir de spécifications de BD

Mise en œuvre à l’aide de GATE
                            Spec.
                             S1                              Règle1 : règle de création de concepts et de
                                                             relations sémantiques à partir du XML schema


          Règle 1      GATE                                  Patrons : patrons lexico-syntaxiques



                    Spec.                      Onto. O1
                     S1




  Patrons           GATE

                                                                                        Onto. O2
                    Spec.
                     S2                            GATE


                                    Règles 2
IC 2009                                                                                                         11
Construction d'ontologie à partir de spécifications de BD

Résultat : Premier noyau d’ontologie




          Concepts
          Relation hiérarchique est-un
          Relation sémantique a-pour-Franchissement
          Propriété a-pour-Département-gestionnaire
IC 2009                                                                                 12
Construction d'ontologie à partir de spécifications de BD

Résultat : ontologie enrichie




          Relation sémantique partie-de
          Propriété destinée aux automobilistes


IC 2009                                                                                  13
Construction d'ontologie à partir de spécifications de BD

Évaluation : ontologie disponible
Comparaison avec une ontologie COGIT (F.Laurens)

  Exploitation de la structure visuelle
des documents de spécification
  Concepts introduits par l’expert
   Réarrangement des concepts




IC 2009                                                                                         14
Construction d'ontologie à partir de spécifications de BD


Évaluation : Comparaison des ontologies

COGIT              IRIT




IC 2009                                                                         15
Construction d'ontologie à partir de spécifications de BD

Évaluation : Comparaison des ontologies



                                Onto_COGIT                          Onto_IRIT
      Nombre de concepts           615                                  1251
      Profondeur                    6                                      6
      Relation hiérarchique         oui                                  oui
      quot;est-un quot;
      Propriétés                   non                                   oui
      Relation de méronymie        non                                   oui
      Relations conceptuelles      non                                   oui
      autres
      Mode de construction       Supervisé                        Non supervisé



IC 2009                                                                                     16
Construction d'ontologie à partir de spécifications de BD

Évaluation :
incohérences liées aux spécifications

      1) Hiérarchie entre concepts



             Classement = « Autre classement »
             Définition : Route qui ne fait partie ni du réseau autoroutier,
                finition
             ni du réseau national, ni du réseau départemental (voir ci-
             dessus).
             Regroupement : Voies goudronnées (voies communales,
             chemins ruraux ou voies privées) | Rues | Rues piétonnes




IC 2009                                                                                         17
Construction d'ontologie à partir de spécifications de BD

Évaluation :
incohérences liées aux spécifications

    2) Nature des relations conceptuelles


              Voies de Communication                                   (domaine)

                              est-un

                                                                       (classe)




IC 2009                                                                                      18
Construction d'ontologie à partir de spécifications de BD




Conclusion
     Extraction d’ontologie à partir d’éléments
     complémentaires des textes
          Structure XML (contexte très favorable)
          Contenu rédigé
          (mise en forme : énumérations, listes …)
     Uniformité de traitement (GATE)
          Règles Jape
          Patrons
     Qualité de l’ontologie
          Traces sur l’origine des concepts et relations
          Riche en relations autres que hiérarchiques
          Exhaustive, reflet fidèle des spécifications
IC 2009                                                                                   19
Construction d'ontologie à partir de spécifications de BD



Perspectives
    Enrichir la chaîne de traitement
          Utiliser les résultats d’un extracteur de termes
          Aider au choix terme / concept
          Définir de nouveaux patrons (termes plus spécifiques,
          identification de relation)

    Développer une interface de validation /
    correction humaine
          Quand faire intervenir l’expert ?
             Au moment de détecter les incohérences et corriger chaque
             ontologie individuelle
             au fur et à mesure de l’alignement
             à la fin de l’alignement

IC 2009                                                                                      20

Weitere ähnliche Inhalte

Andere mochten auch

Sérialisation des transactions
Sérialisation des transactionsSérialisation des transactions
Sérialisation des transactionsVincent Englebert
 
Politic of a local authority for the protection of ocean activate - Marie-Chr...
Politic of a local authority for the protection of ocean activate - Marie-Chr...Politic of a local authority for the protection of ocean activate - Marie-Chr...
Politic of a local authority for the protection of ocean activate - Marie-Chr...Surfrider Foundation Europe
 
Innovations technologiques en voile handi - JJ Dubois
Innovations technologiques en voile handi -  JJ DuboisInnovations technologiques en voile handi -  JJ Dubois
Innovations technologiques en voile handi - JJ DuboisCREPS de Montpellier
 
Algunas dimensiones profesionalizacion_docentes_representaciones_temas_agenda...
Algunas dimensiones profesionalizacion_docentes_representaciones_temas_agenda...Algunas dimensiones profesionalizacion_docentes_representaciones_temas_agenda...
Algunas dimensiones profesionalizacion_docentes_representaciones_temas_agenda...Gustavo Guinle
 
Soho Restaurant Buisnes menu
Soho Restaurant Buisnes menuSoho Restaurant Buisnes menu
Soho Restaurant Buisnes menusrul864
 
Debat d'orientation sur les fp pour 2012 rapport d'information 616 senat, se...
Debat d'orientation sur les fp pour 2012  rapport d'information 616 senat, se...Debat d'orientation sur les fp pour 2012  rapport d'information 616 senat, se...
Debat d'orientation sur les fp pour 2012 rapport d'information 616 senat, se...Ministère de l'Économie et des Finances
 
[DAF 2014] Multi-device : Mieux qualifier son audience
[DAF 2014] Multi-device : Mieux qualifier son audience[DAF 2014] Multi-device : Mieux qualifier son audience
[DAF 2014] Multi-device : Mieux qualifier son audienceAT Internet
 
Au sujet de CPN | Clinical Psychiatry Network | Premier réseau en Belgique po...
Au sujet de CPN | Clinical Psychiatry Network | Premier réseau en Belgique po...Au sujet de CPN | Clinical Psychiatry Network | Premier réseau en Belgique po...
Au sujet de CPN | Clinical Psychiatry Network | Premier réseau en Belgique po...Connected Concepts
 
Gamme Volkswagen 2012
Gamme Volkswagen 2012Gamme Volkswagen 2012
Gamme Volkswagen 2012Cedric5
 
L'Europe au XVIII° siècle
L'Europe au XVIII° siècleL'Europe au XVIII° siècle
L'Europe au XVIII° siècleCéline Langlet
 
Programme Ag UFFRB / UFE 2013
Programme Ag UFFRB / UFE  2013 Programme Ag UFFRB / UFE  2013
Programme Ag UFFRB / UFE 2013 Bâle Région Mag
 
Llamada Movistar
Llamada MovistarLlamada Movistar
Llamada Movistarbertab9216
 
Agenda 2000 Y El Tratado De Niza
Agenda 2000 Y El Tratado De NizaAgenda 2000 Y El Tratado De Niza
Agenda 2000 Y El Tratado De NizaMavi Pastor
 
Vidéo, Formation et Entraînement - Quelques usages à l’ENVSN
Vidéo, Formation et Entraînement - Quelques usages à l’ENVSNVidéo, Formation et Entraînement - Quelques usages à l’ENVSN
Vidéo, Formation et Entraînement - Quelques usages à l’ENVSNCREPS de Montpellier
 

Andere mochten auch (20)

Sérialisation des transactions
Sérialisation des transactionsSérialisation des transactions
Sérialisation des transactions
 
Politic of a local authority for the protection of ocean activate - Marie-Chr...
Politic of a local authority for the protection of ocean activate - Marie-Chr...Politic of a local authority for the protection of ocean activate - Marie-Chr...
Politic of a local authority for the protection of ocean activate - Marie-Chr...
 
Baromobile2014
Baromobile2014Baromobile2014
Baromobile2014
 
Innovations technologiques en voile handi - JJ Dubois
Innovations technologiques en voile handi -  JJ DuboisInnovations technologiques en voile handi -  JJ Dubois
Innovations technologiques en voile handi - JJ Dubois
 
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristechRapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
 
Algunas dimensiones profesionalizacion_docentes_representaciones_temas_agenda...
Algunas dimensiones profesionalizacion_docentes_representaciones_temas_agenda...Algunas dimensiones profesionalizacion_docentes_representaciones_temas_agenda...
Algunas dimensiones profesionalizacion_docentes_representaciones_temas_agenda...
 
Soho Restaurant Buisnes menu
Soho Restaurant Buisnes menuSoho Restaurant Buisnes menu
Soho Restaurant Buisnes menu
 
Debat d'orientation sur les fp pour 2012 rapport d'information 616 senat, se...
Debat d'orientation sur les fp pour 2012  rapport d'information 616 senat, se...Debat d'orientation sur les fp pour 2012  rapport d'information 616 senat, se...
Debat d'orientation sur les fp pour 2012 rapport d'information 616 senat, se...
 
[DAF 2014] Multi-device : Mieux qualifier son audience
[DAF 2014] Multi-device : Mieux qualifier son audience[DAF 2014] Multi-device : Mieux qualifier son audience
[DAF 2014] Multi-device : Mieux qualifier son audience
 
Au sujet de CPN | Clinical Psychiatry Network | Premier réseau en Belgique po...
Au sujet de CPN | Clinical Psychiatry Network | Premier réseau en Belgique po...Au sujet de CPN | Clinical Psychiatry Network | Premier réseau en Belgique po...
Au sujet de CPN | Clinical Psychiatry Network | Premier réseau en Belgique po...
 
Gamme Volkswagen 2012
Gamme Volkswagen 2012Gamme Volkswagen 2012
Gamme Volkswagen 2012
 
100N Proceso Pago
100N Proceso Pago100N Proceso Pago
100N Proceso Pago
 
L'Europe au XVIII° siècle
L'Europe au XVIII° siècleL'Europe au XVIII° siècle
L'Europe au XVIII° siècle
 
Programme Ag UFFRB / UFE 2013
Programme Ag UFFRB / UFE  2013 Programme Ag UFFRB / UFE  2013
Programme Ag UFFRB / UFE 2013
 
Eluard
EluardEluard
Eluard
 
Livret fiscal du createur dgfip fevrier 2011
Livret fiscal du createur dgfip fevrier 2011Livret fiscal du createur dgfip fevrier 2011
Livret fiscal du createur dgfip fevrier 2011
 
Llamada Movistar
Llamada MovistarLlamada Movistar
Llamada Movistar
 
Agenda 2000 Y El Tratado De Niza
Agenda 2000 Y El Tratado De NizaAgenda 2000 Y El Tratado De Niza
Agenda 2000 Y El Tratado De Niza
 
Aao istanbul oct 2014
Aao istanbul oct 2014 Aao istanbul oct 2014
Aao istanbul oct 2014
 
Vidéo, Formation et Entraînement - Quelques usages à l’ENVSN
Vidéo, Formation et Entraînement - Quelques usages à l’ENVSNVidéo, Formation et Entraînement - Quelques usages à l’ENVSN
Vidéo, Formation et Entraînement - Quelques usages à l’ENVSN
 

Ähnlich wie Construction automatique d'ontologies à partir de spécifications de bases de données

Projet COM02.ppt
Projet COM02.pptProjet COM02.ppt
Projet COM02.pptPtidej Team
 
Moteurs de recherche et web sémantique
Moteurs de recherche et web sémantiqueMoteurs de recherche et web sémantique
Moteurs de recherche et web sémantiqueAntidot
 
Explorer des actualités multimédia dans le Web de données
Explorer des actualités multimédia dans le Web de donnéesExplorer des actualités multimédia dans le Web de données
Explorer des actualités multimédia dans le Web de donnéesConférence IC 2009
 
Modèles de données et langages de description ouverts 2021-2022 - 1
Modèles de données et langages de description ouverts   2021-2022 - 1Modèles de données et langages de description ouverts   2021-2022 - 1
Modèles de données et langages de description ouverts 2021-2022 - 1François-Xavier Boffy
 

Ähnlich wie Construction automatique d'ontologies à partir de spécifications de bases de données (6)

Projet COM02.ppt
Projet COM02.pptProjet COM02.ppt
Projet COM02.ppt
 
LMO02.ppt
LMO02.pptLMO02.ppt
LMO02.ppt
 
Le studio SAPHIR pour segmenter et décrire des documents audiovisuels, visuel...
Le studio SAPHIR pour segmenter et décrire des documents audiovisuels, visuel...Le studio SAPHIR pour segmenter et décrire des documents audiovisuels, visuel...
Le studio SAPHIR pour segmenter et décrire des documents audiovisuels, visuel...
 
Moteurs de recherche et web sémantique
Moteurs de recherche et web sémantiqueMoteurs de recherche et web sémantique
Moteurs de recherche et web sémantique
 
Explorer des actualités multimédia dans le Web de données
Explorer des actualités multimédia dans le Web de donnéesExplorer des actualités multimédia dans le Web de données
Explorer des actualités multimédia dans le Web de données
 
Modèles de données et langages de description ouverts 2021-2022 - 1
Modèles de données et langages de description ouverts   2021-2022 - 1Modèles de données et langages de description ouverts   2021-2022 - 1
Modèles de données et langages de description ouverts 2021-2022 - 1
 

Mehr von Conférence IC 2009

Conception assistée d’une ontologie à partir d’une conceptualisation consensu...
Conception assistée d’une ontologie à partir d’une conceptualisation consensu...Conception assistée d’une ontologie à partir d’une conceptualisation consensu...
Conception assistée d’une ontologie à partir d’une conceptualisation consensu...Conférence IC 2009
 
Sémantique des folksonomies: structuration collaborative et assistée
Sémantique des folksonomies: structuration collaborative et assistéeSémantique des folksonomies: structuration collaborative et assistée
Sémantique des folksonomies: structuration collaborative et assistéeConférence IC 2009
 
Outil de gestion des connaissances d’une Interconnexion de Communautés de Pra...
Outil de gestion des connaissances d’une Interconnexion de Communautés de Pra...Outil de gestion des connaissances d’une Interconnexion de Communautés de Pra...
Outil de gestion des connaissances d’une Interconnexion de Communautés de Pra...Conférence IC 2009
 
Tentative de cartographie des besoins, solutions et sujets de recherche ouver...
Tentative de cartographie des besoins, solutions et sujets de recherche ouver...Tentative de cartographie des besoins, solutions et sujets de recherche ouver...
Tentative de cartographie des besoins, solutions et sujets de recherche ouver...Conférence IC 2009
 
Enrichissement automatique d’une base de connaissances biologiques à l’aide d...
Enrichissement automatique d’une base de connaissances biologiques à l’aide d...Enrichissement automatique d’une base de connaissances biologiques à l’aide d...
Enrichissement automatique d’une base de connaissances biologiques à l’aide d...Conférence IC 2009
 
Evaluation d'associations sémantiques dans une ontologie de domaine
Evaluation d'associations sémantiques dans une ontologie de domaineEvaluation d'associations sémantiques dans une ontologie de domaine
Evaluation d'associations sémantiques dans une ontologie de domaineConférence IC 2009
 
Ontologies étendues pour l'annotation sémantique
Ontologies étendues pour l'annotation sémantiqueOntologies étendues pour l'annotation sémantique
Ontologies étendues pour l'annotation sémantiqueConférence IC 2009
 
Modélisation systématique de recommandations de pratique clinique: une étude ...
Modélisation systématique de recommandations de pratique clinique: une étude ...Modélisation systématique de recommandations de pratique clinique: une étude ...
Modélisation systématique de recommandations de pratique clinique: une étude ...Conférence IC 2009
 
Connaissances opérationnelles pour la conception automatique de légendes de c...
Connaissances opérationnelles pour la conception automatique de légendes de c...Connaissances opérationnelles pour la conception automatique de légendes de c...
Connaissances opérationnelles pour la conception automatique de légendes de c...Conférence IC 2009
 
Patrons de gestion des changements OWL
Patrons de gestion des changements OWLPatrons de gestion des changements OWL
Patrons de gestion des changements OWLConférence IC 2009
 
Construction automatique d’ontologies à partir d’une base de données relation...
Construction automatique d’ontologies à partir d’une base de données relation...Construction automatique d’ontologies à partir d’une base de données relation...
Construction automatique d’ontologies à partir d’une base de données relation...Conférence IC 2009
 
Indexation de photos sociales par propagation sur une hiérarchie de concepts
Indexation de photos sociales par propagation sur une hiérarchie de conceptsIndexation de photos sociales par propagation sur une hiérarchie de concepts
Indexation de photos sociales par propagation sur une hiérarchie de conceptsConférence IC 2009
 
Gradients de prototypicalité appliqués à la personnalisation d'ontologies
Gradients de prototypicalité appliqués à la personnalisation d'ontologiesGradients de prototypicalité appliqués à la personnalisation d'ontologies
Gradients de prototypicalité appliqués à la personnalisation d'ontologiesConférence IC 2009
 
Démarches sémantiques de recherche d'information sur le Web
Démarches sémantiques de recherche d'information sur le WebDémarches sémantiques de recherche d'information sur le Web
Démarches sémantiques de recherche d'information sur le WebConférence IC 2009
 
Méta-modèle général de description de ressources terminologiques et ontologiques
Méta-modèle général de description de ressources terminologiques et ontologiquesMéta-modèle général de description de ressources terminologiques et ontologiques
Méta-modèle général de description de ressources terminologiques et ontologiquesConférence IC 2009
 
SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...
SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...
SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...Conférence IC 2009
 
COBRA : Une plate-forme de RàPC basée sur des ontologies
COBRA : Une plate-forme de RàPC basée sur des ontologiesCOBRA : Une plate-forme de RàPC basée sur des ontologies
COBRA : Une plate-forme de RàPC basée sur des ontologiesConférence IC 2009
 
Alignement entre ontologie de domaine et la Snomed: trois études de cas
Alignement entre ontologie de domaine et la Snomed: trois études de casAlignement entre ontologie de domaine et la Snomed: trois études de cas
Alignement entre ontologie de domaine et la Snomed: trois études de casConférence IC 2009
 
Une démarche de conception de services d’information et de communication dédi...
Une démarche de conception de services d’information et de communication dédi...Une démarche de conception de services d’information et de communication dédi...
Une démarche de conception de services d’information et de communication dédi...Conférence IC 2009
 
Ontologies pour l'aide à la décision publique et prise en compte des doxas
Ontologies pour l'aide à la décision publique et prise en compte des doxasOntologies pour l'aide à la décision publique et prise en compte des doxas
Ontologies pour l'aide à la décision publique et prise en compte des doxasConférence IC 2009
 

Mehr von Conférence IC 2009 (20)

Conception assistée d’une ontologie à partir d’une conceptualisation consensu...
Conception assistée d’une ontologie à partir d’une conceptualisation consensu...Conception assistée d’une ontologie à partir d’une conceptualisation consensu...
Conception assistée d’une ontologie à partir d’une conceptualisation consensu...
 
Sémantique des folksonomies: structuration collaborative et assistée
Sémantique des folksonomies: structuration collaborative et assistéeSémantique des folksonomies: structuration collaborative et assistée
Sémantique des folksonomies: structuration collaborative et assistée
 
Outil de gestion des connaissances d’une Interconnexion de Communautés de Pra...
Outil de gestion des connaissances d’une Interconnexion de Communautés de Pra...Outil de gestion des connaissances d’une Interconnexion de Communautés de Pra...
Outil de gestion des connaissances d’une Interconnexion de Communautés de Pra...
 
Tentative de cartographie des besoins, solutions et sujets de recherche ouver...
Tentative de cartographie des besoins, solutions et sujets de recherche ouver...Tentative de cartographie des besoins, solutions et sujets de recherche ouver...
Tentative de cartographie des besoins, solutions et sujets de recherche ouver...
 
Enrichissement automatique d’une base de connaissances biologiques à l’aide d...
Enrichissement automatique d’une base de connaissances biologiques à l’aide d...Enrichissement automatique d’une base de connaissances biologiques à l’aide d...
Enrichissement automatique d’une base de connaissances biologiques à l’aide d...
 
Evaluation d'associations sémantiques dans une ontologie de domaine
Evaluation d'associations sémantiques dans une ontologie de domaineEvaluation d'associations sémantiques dans une ontologie de domaine
Evaluation d'associations sémantiques dans une ontologie de domaine
 
Ontologies étendues pour l'annotation sémantique
Ontologies étendues pour l'annotation sémantiqueOntologies étendues pour l'annotation sémantique
Ontologies étendues pour l'annotation sémantique
 
Modélisation systématique de recommandations de pratique clinique: une étude ...
Modélisation systématique de recommandations de pratique clinique: une étude ...Modélisation systématique de recommandations de pratique clinique: une étude ...
Modélisation systématique de recommandations de pratique clinique: une étude ...
 
Connaissances opérationnelles pour la conception automatique de légendes de c...
Connaissances opérationnelles pour la conception automatique de légendes de c...Connaissances opérationnelles pour la conception automatique de légendes de c...
Connaissances opérationnelles pour la conception automatique de légendes de c...
 
Patrons de gestion des changements OWL
Patrons de gestion des changements OWLPatrons de gestion des changements OWL
Patrons de gestion des changements OWL
 
Construction automatique d’ontologies à partir d’une base de données relation...
Construction automatique d’ontologies à partir d’une base de données relation...Construction automatique d’ontologies à partir d’une base de données relation...
Construction automatique d’ontologies à partir d’une base de données relation...
 
Indexation de photos sociales par propagation sur une hiérarchie de concepts
Indexation de photos sociales par propagation sur une hiérarchie de conceptsIndexation de photos sociales par propagation sur une hiérarchie de concepts
Indexation de photos sociales par propagation sur une hiérarchie de concepts
 
Gradients de prototypicalité appliqués à la personnalisation d'ontologies
Gradients de prototypicalité appliqués à la personnalisation d'ontologiesGradients de prototypicalité appliqués à la personnalisation d'ontologies
Gradients de prototypicalité appliqués à la personnalisation d'ontologies
 
Démarches sémantiques de recherche d'information sur le Web
Démarches sémantiques de recherche d'information sur le WebDémarches sémantiques de recherche d'information sur le Web
Démarches sémantiques de recherche d'information sur le Web
 
Méta-modèle général de description de ressources terminologiques et ontologiques
Méta-modèle général de description de ressources terminologiques et ontologiquesMéta-modèle général de description de ressources terminologiques et ontologiques
Méta-modèle général de description de ressources terminologiques et ontologiques
 
SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...
SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...
SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémi...
 
COBRA : Une plate-forme de RàPC basée sur des ontologies
COBRA : Une plate-forme de RàPC basée sur des ontologiesCOBRA : Une plate-forme de RàPC basée sur des ontologies
COBRA : Une plate-forme de RàPC basée sur des ontologies
 
Alignement entre ontologie de domaine et la Snomed: trois études de cas
Alignement entre ontologie de domaine et la Snomed: trois études de casAlignement entre ontologie de domaine et la Snomed: trois études de cas
Alignement entre ontologie de domaine et la Snomed: trois études de cas
 
Une démarche de conception de services d’information et de communication dédi...
Une démarche de conception de services d’information et de communication dédi...Une démarche de conception de services d’information et de communication dédi...
Une démarche de conception de services d’information et de communication dédi...
 
Ontologies pour l'aide à la décision publique et prise en compte des doxas
Ontologies pour l'aide à la décision publique et prise en compte des doxasOntologies pour l'aide à la décision publique et prise en compte des doxas
Ontologies pour l'aide à la décision publique et prise en compte des doxas
 

Construction automatique d'ontologies à partir de spécifications de bases de données

  • 1. Construction automatique d’ontologie à partir de spécifications de base de données M. Kamel, N. Aussenac-Gilles (IRIT – IC3, Toulouse, France) aussenac@irit.fr, Kamel@irit.fr Projet ANR Masse de données GEONTO Partenaires : LRI-IASI, LIUPPA – Desi et IGN-COGIT IC 2009 1
  • 2. Construction d'ontologie à partir de spécifications de BD Problématique : construction d’ontologies à partir de textes Textes Analyse du contenu linguistique Approches linguistiques Exploitation des relations syntaxiques et de connaissances sur la langue Extraction termes - relations Patrons d’extraction (de termes / de relations) Modélisation Approches statistiques ontologie Exploitation des régularités de séquences de termes (co-occurrences, segments répétés …) Clustering Exploiter la structure des textes et la mise en forme matérielle IC 2009 2
  • 3. Construction d'ontologie à partir de spécifications de BD Contexte : GEONTO Textes BD-TOPO Spécifications de bases de données Documents XML ayant le même XML schéma Sémantique des tags : précise, définit des concepts et des relations Spécifications Méthode Applicable à plusieurs bases de données Automatique Extraction Concepts - relations Ontologies obtenues Une ontologie par BD Alignement des ontologies et intervention humaine Construction vers une ontologie unique de référence ontologie Validation Comparaison entre ontologie extraite et une ontologie existante tirée des mêmes spécifications OntoTOPO IC 2009 3
  • 4. Construction d'ontologie à partir de spécifications de BD Textes : spécifications de BDTopo Concepts présents dans les champs: - Domaine - Classe - Regroupement - Attribut - Valeur d’attribut IC 2009 4
  • 5. Construction d'ontologie à partir de spécifications de BD Textes : spécifications de BDTopo Rel. hiérarchique est-un : - Domaine / Classe - Classe / Regroup. - Attribut / Valeur d’attrib. - Valeur d’attrib. / Regroup. IC 2009 5
  • 6. Construction d'ontologie à partir de spécifications de BD Textes : spécifications de BDTopo Autres relations sémantiques Classe / Attribut qualitatif Propriétés Classe / Attribut quantitatif IC 2009 6
  • 7. Construction d'ontologie à partir de spécifications de BD Textes : spécifications de BDTopo Information contenue dans les champs définition, modélisation géométrique, etc. IC 2009 7
  • 8. Construction d'ontologie à partir de spécifications de BD Méthode Prendre en compte la structure hiérarchique du texte / XML schema Concepts Relations entre concepts Noyau d’ontologie Écriture de règles d’extraction de concepts et de relations Exploiter le texte rédigé Nouveaux concepts Nouvelles relations Enrichir le noyau d’ontologie Définition de patrons lexico-syntaxiques Combiner les deux approches au sein d’un même logiciel Plate-forme GATE IC 2009 8
  • 9. Construction d'ontologie à partir de spécifications de BD Méthode : 1 – exploiter les spécifications XML IC 2009 9
  • 10. Construction d'ontologie à partir de spécifications de BD Méthode : 2- exploiter le texte en LN Identification de relations Identité - Chef-lieu de canton : chef-lieu de canton Synonymie - Cascade : Chute d’eau - Terrain de sport : équipement sportif de plein air Relations lexicales :partie_de, ensemble_de, relations spatiales … <classe> <nom_classe> Tronçon de route </nom_classe> <définition> Portion de voie de communication destin e aux automobilistes >/definition> destinée </classe> (({Token.lemme== quot;portionquot;}|{Token.lemme== quot;partiequot;}|…) ({Token.lemme== quot;dequot;}) ({NounChunk}) :annot ) - - > annot.ANNOT = {kind=quot;Partiequot;, rule=quot;Rule1quot;} IC 2009 10
  • 11. Construction d'ontologie à partir de spécifications de BD Mise en œuvre à l’aide de GATE Spec. S1 Règle1 : règle de création de concepts et de relations sémantiques à partir du XML schema Règle 1 GATE Patrons : patrons lexico-syntaxiques Spec. Onto. O1 S1 Patrons GATE Onto. O2 Spec. S2 GATE Règles 2 IC 2009 11
  • 12. Construction d'ontologie à partir de spécifications de BD Résultat : Premier noyau d’ontologie Concepts Relation hiérarchique est-un Relation sémantique a-pour-Franchissement Propriété a-pour-Département-gestionnaire IC 2009 12
  • 13. Construction d'ontologie à partir de spécifications de BD Résultat : ontologie enrichie Relation sémantique partie-de Propriété destinée aux automobilistes IC 2009 13
  • 14. Construction d'ontologie à partir de spécifications de BD Évaluation : ontologie disponible Comparaison avec une ontologie COGIT (F.Laurens) Exploitation de la structure visuelle des documents de spécification Concepts introduits par l’expert Réarrangement des concepts IC 2009 14
  • 15. Construction d'ontologie à partir de spécifications de BD Évaluation : Comparaison des ontologies COGIT IRIT IC 2009 15
  • 16. Construction d'ontologie à partir de spécifications de BD Évaluation : Comparaison des ontologies Onto_COGIT Onto_IRIT Nombre de concepts 615 1251 Profondeur 6 6 Relation hiérarchique oui oui quot;est-un quot; Propriétés non oui Relation de méronymie non oui Relations conceptuelles non oui autres Mode de construction Supervisé Non supervisé IC 2009 16
  • 17. Construction d'ontologie à partir de spécifications de BD Évaluation : incohérences liées aux spécifications 1) Hiérarchie entre concepts Classement = « Autre classement » Définition : Route qui ne fait partie ni du réseau autoroutier, finition ni du réseau national, ni du réseau départemental (voir ci- dessus). Regroupement : Voies goudronnées (voies communales, chemins ruraux ou voies privées) | Rues | Rues piétonnes IC 2009 17
  • 18. Construction d'ontologie à partir de spécifications de BD Évaluation : incohérences liées aux spécifications 2) Nature des relations conceptuelles Voies de Communication (domaine) est-un (classe) IC 2009 18
  • 19. Construction d'ontologie à partir de spécifications de BD Conclusion Extraction d’ontologie à partir d’éléments complémentaires des textes Structure XML (contexte très favorable) Contenu rédigé (mise en forme : énumérations, listes …) Uniformité de traitement (GATE) Règles Jape Patrons Qualité de l’ontologie Traces sur l’origine des concepts et relations Riche en relations autres que hiérarchiques Exhaustive, reflet fidèle des spécifications IC 2009 19
  • 20. Construction d'ontologie à partir de spécifications de BD Perspectives Enrichir la chaîne de traitement Utiliser les résultats d’un extracteur de termes Aider au choix terme / concept Définir de nouveaux patrons (termes plus spécifiques, identification de relation) Développer une interface de validation / correction humaine Quand faire intervenir l’expert ? Au moment de détecter les incohérences et corriger chaque ontologie individuelle au fur et à mesure de l’alignement à la fin de l’alignement IC 2009 20