SlideShare une entreprise Scribd logo
1  sur  42
Télécharger pour lire hors ligne
Journée OSIDMESH
    Montpellier – 23/10/2009


Analyses de textes avec
 TreeCloud et Lexico3

      Philippe Gambette
Plan

• Nuages de mots
• Nuages améliorés
• Analyses plus fines
Plan

• Nuages de mots
• Nuages améliorés
• Analyses plus fines
Nuages de mots

• Construits depuis l'ensemble des mots d'un texte
• Taille de police liée à la fréquence
• Se sont popularisés avec Wordle
• Donnent un bon aperçu d'un texte




                                                  Nuages Wordle des mots les plus utilisés
                                                   début 2009 dans les blogs des Top 100
                                                            politique et high-tech de Wikio
                     http://aixtal.blogspot.com/2009/04/web-de-quoi-parlent-les-blogs.html
Nuages de mots

• Construits depuis l'ensemble des mots d'un texte
• Taille de police liée à la fréquence
• Se sont popularisés avec Wordle
• Donnent un bon aperçu d'un texte
Nuages de mots

• Construits depuis l'ensemble des mots d'un texte
• Taille de police liée à la fréquence
• Se sont popularisés avec Wordle
• Donnent un bon aperçu d'un texte




GoogleImage(obama inaugural address wordle)
Nuages de mots
• Construits depuis l'ensemble des mots d'un texte
• Taille de police liée à la fréquence
• Se sont popularisés avec Wordle




GoogleImage(obama inaugural address wordle)
Nuages de mots
• Construits depuis l'ensemble des mots d'un texte
• Taille de police liée à la fréquence
• Se sont popularisés avec Wordle




GoogleImage(obama inaugural address wordle)
Plan

• Nuages de mots
• Nuages améliorés
• Analyses plus fines
Nuages de mots améliorés

Ajouter de l'information extraite du texte :
• pâleur pour exprimer la désuétude dans Amazon
• tags partagés en rouge dans del.icio.us
• regrouper les tags cooccurrents sur la même ligne
                        Hassan-Montero & Herrero-Solana, InScit'06
• optimiser l'espace vide et la proximité sémantique
                                         Kaser & Lemire, WWW'07
• “topigraphy”: placement 2D d'après la cooccurrence
       Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
Nuages de tags/mots améliorés

Ajouter de l'information extraite du texte :
• pâleur pour exprimer la désuétude dans Amazon
• tags partagés en rouge dans del.icio.us
• regrouper les tags cooccurrents sur la même ligne
                        Hassan-Montero & Herrero-Solana, InScit'06
• optimiser l'espace vide et la proximité sémantique
                                         Kaser & Lemire, WWW'07
• “topigraphy”: placement 2D d'après la cooccurrence
       Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
Nuages de tags/mots améliorés

Ajouter de l'information extraite du texte :
• pâleur pour exprimer la désuétude dans Amazon
• tags partagés en rouge dans del.icio.us
• regrouper les tags cooccurrents sur la même ligne
                        Hassan-Montero & Herrero-Solana, InScit'06
• optimiser l'espace vide et la proximité sémantique
                                         Kaser & Lemire, WWW'07
• “topigraphy”: placement 2D d'après la cooccurrence
       Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
Nuages de tags/mots améliorés

Ajouter de l'information extraite du texte :
• pâleur pour exprimer la désuétude dans Amazon
• tags partagés en rouge dans del.icio.us
• regrouper les tags cooccurrents sur la même ligne
                        Hassan-Montero & Herrero-Solana, InScit'06
• optimiser l'espace vide et la proximité sémantique
                                         Kaser & Lemire, WWW'07
• “topigraphy”: placement 2D d'après la cooccurrence
       Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
Nuages de tags/mots améliorés

Ajouter de l'information extraite du texte :
• pâleur pour exprimer la désuétude dans Amazon
• tags partagés en rouge dans del.icio.us
• regrouper les tags cooccurrents sur la même ligne
                        Hassan-Montero & Herrero-Solana, InScit'06
• optimiser l'espace vide et la proximité sémantique
                                         Kaser & Lemire, WWW'07
• “topigraphy”: placement 2D d'après la cooccurrence
       Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
Extraire l'information sémantique d'un texte
• analyse littéraire :
approche philologique : se concentrer sur le texte
                                                            Brody
• analyse du discours :
analyse arborée, graphe de cooc., projection géodésique
                             Brunet (Hyperbase), Viprey (Astartex)
• fouille de texte :
graphe sémantique
              Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• traitement des langues naturelles :
désambiguïsation
                                                Véronis (Hyperlex)
Extraire l'information sémantique d'un texte
• analyse littéraire :
approche philologique : se concentrer sur le texte
                                                                    Brody
• analyse du discours :
analyse arborée, graphe de cooc., projection géodésique
                             Brunet (Hyperbase), Viprey (Astartex)
• fouille de texte :
graphe sémantique
              Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• traitement des langues naturelles :
désambiguïsation
                                                 Véronis (Hyperlex)


                                              Mayaffre, Quand travail, famille,
                                                et patrie cooccurrent dans le
                                                          discours de Nicolas
                                                            Sarkozy, JADT'08
Extraire l'information sémantique d'un texte
• analyse littéraire :
approche philologique : se concentrer sur le texte
                                                                  Brody
• analyse du discours :
analyse arborée, graphe de cooc., projection géodésique
                             Brunet (Hyperbase), Viprey (Astartex)
• fouille de texte :
graphe sémantique
              Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• traitement des langues naturelles :
désambiguïsation
                                                Véronis (Hyperlex)




                                              Brunet, Les séquences (suite),
                                                                  JADT'08
Extraire l'information sémantique d'un texte
• analyse littéraire :
approche philologique : se concentrer sur le texte
                                                                  Brody
• analyse du discours :
analyse arborée, graphe de cooc., projection géodésique
                             Brunet (Hyperbase), Viprey (Astartex)
• fouille de texte :
graphe sémantique
              Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• traitement des langues naturelles :
désambiguïsation
                                                Véronis (Hyperlex)


                                                              Barry, Viprey,
                                                    Approche comparative
                                                 des résultats d'exploration
                                                     textuelle des discours
                                                  de deux leaders africains
                                                             Keita et Touré,
                                                                   JADT'08
Extraire l'information sémantique d'un texte
• analyse littéraire :
approche philologique : se concentrer sur le texte
                                                                 Brody
• analyse du discours :
analyse arborée, graphe de cooc., projection géodésique
                             Brunet (Hyperbase), Viprey (Astartex)
• fouille de texte :
graphe sémantique
              Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• traitement des langues naturelles :
désambiguïsation
                                                Véronis (Hyperlex)




                                                           Peyrat-Guillard,
                                                     Analyse du discours
                                                  syndical sur l’entreprise,
                                                                   JADT'08
Extraire l'information sémantique d'un texte
• analyse littéraire :
approche philologique : se concentrer sur le texte
                                                                                    Brody
• analyse du discours :
analyse arborée, graphe de cooc., projection géodésique
                                              Brunet (Hyperbase), Viprey (Astartex)
• fouille de texte :
graphe sémantique
                       Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• traitement des langues naturelles :
désambiguïsation
                                                                   Véronis (Hyperlex)


                                                                    Visualisation PhraseNet de
                                                                            paroles des Beatles
                                                                    créé avec Many Eyes (IBM)
                                                                          http://many-eyes.com




http://visualthinkmap.ning.com/photo/phrasenet_beatles-many-eyes
Extraire l'information sémantique d'un texte
• analyse littéraire :
approche philologique : se concentrer sur le texte
                                                                 Brody
• analyse du discours :
analyse arborée, graphe de cooc., projection géodésique
                             Brunet (Hyperbase), Viprey (Astartex)
• fouille de texte :
graphe sémantique
              Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• traitement des langues naturelles :
désambiguïsation
                                                Véronis (Hyperlex)




                                                 Désambiguïsation du mot
                                                               “barrage”.

                                                        Véronis, HyperLex:
                                                    Lexical Cartography for
                                                Information Retrieval, 2004
Nuage de tags + arbre = nuage arboré




                            SplitsTree : Huson 1998,
                               Huson & Bryant 2006
Construit avec
TreeCloud et                 TreeCloud en Python, license GPL
                           disponible sur http://www.treecloud.fr
Nuage arboré des discours d'Obama

couleur : chronologie
ancien
récent




Les 150 mots les plus fréquents dans   Construit avec
les discours de campagne d'Obama,      TreeCloud et
winsize=30, distance=oddsratio,
color=chronology, NJ-tree.
Plan

• Nuages de mots
• Nuages améliorés
• Analyses plus fines
Analyses textuelles fines

Lexico 3
• Laboratoire SYLED-CLA2T de Paris 3 Sorbonne Nouvelle
• Logiciel pour PC sous Windows
• Version d'évaluation gratuite
• Analyses fines, retour au texte




                                    http://www.cavi.univ-paris3.fr/Ilpga/ilpga/tal/lexicoWWW/
Analyses textuelles fines

Lexico 3
• Laboratoire SYLED-CLA2T de Paris 3 Sorbonne Nouvelle
• Logiciel pour PC sous Windows
• Version d'évaluation gratuite
• Analyses fines, retour au texte
• Démo sur les avis cinéma de Monique Pantel




                                                   http://monique.pantel.free.fr
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines




                  glisser-déposer
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines




                            sélection puis
                            clic sur Spécifs
Analyses textuelles fines
Analyses textuelles fines




                            retour au texte

Contenu connexe

En vedette

Les outils de data visualisation
Les outils de data visualisationLes outils de data visualisation
Les outils de data visualisationUNITEC
 
Base de données graphe, Noe4j concepts et mise en oeuvre
Base de données graphe, Noe4j concepts et mise en oeuvreBase de données graphe, Noe4j concepts et mise en oeuvre
Base de données graphe, Noe4j concepts et mise en oeuvreMICHRAFY MUSTAFA
 
Présentation Renaud Ménérat au Petit Club "Simplifier le mobile"
Présentation Renaud Ménérat au Petit Club "Simplifier le mobile"Présentation Renaud Ménérat au Petit Club "Simplifier le mobile"
Présentation Renaud Ménérat au Petit Club "Simplifier le mobile"Petit Web
 
NoSQL Databases: Why, what and when
NoSQL Databases: Why, what and whenNoSQL Databases: Why, what and when
NoSQL Databases: Why, what and whenLorenzo Alberton
 
A TELECHARGER ! Schéma d’une plateforme de veille "modulaire" 100% RSS (MAJ l...
A TELECHARGER ! Schéma d’une plateforme de veille "modulaire" 100% RSS (MAJ l...A TELECHARGER ! Schéma d’une plateforme de veille "modulaire" 100% RSS (MAJ l...
A TELECHARGER ! Schéma d’une plateforme de veille "modulaire" 100% RSS (MAJ l...Serge Courrier
 
Dataviz : quels outils pour quelles visualisations (Serge Courrier) - MAJ (1...
Dataviz  : quels outils pour quelles visualisations (Serge Courrier) - MAJ (1...Dataviz  : quels outils pour quelles visualisations (Serge Courrier) - MAJ (1...
Dataviz : quels outils pour quelles visualisations (Serge Courrier) - MAJ (1...Serge Courrier
 
DeciLogic exemple d'application Web de geolocalisation
DeciLogic exemple d'application Web de geolocalisationDeciLogic exemple d'application Web de geolocalisation
DeciLogic exemple d'application Web de geolocalisationEric Mauvais
 
ConféR3nce "Géolocalisation Sociale et Marketing Mobile"
ConféR3nce "Géolocalisation Sociale et Marketing Mobile"ConféR3nce "Géolocalisation Sociale et Marketing Mobile"
ConféR3nce "Géolocalisation Sociale et Marketing Mobile"Sophie Gironi
 
Outils de veille - catalogue
Outils de veille - catalogueOutils de veille - catalogue
Outils de veille - catalogueRaphaël Rey
 

En vedette (10)

Les outils de data visualisation
Les outils de data visualisationLes outils de data visualisation
Les outils de data visualisation
 
Base de données graphe, Noe4j concepts et mise en oeuvre
Base de données graphe, Noe4j concepts et mise en oeuvreBase de données graphe, Noe4j concepts et mise en oeuvre
Base de données graphe, Noe4j concepts et mise en oeuvre
 
Présentation Renaud Ménérat au Petit Club "Simplifier le mobile"
Présentation Renaud Ménérat au Petit Club "Simplifier le mobile"Présentation Renaud Ménérat au Petit Club "Simplifier le mobile"
Présentation Renaud Ménérat au Petit Club "Simplifier le mobile"
 
NoSQL Databases: Why, what and when
NoSQL Databases: Why, what and whenNoSQL Databases: Why, what and when
NoSQL Databases: Why, what and when
 
La datavisualisation
La datavisualisationLa datavisualisation
La datavisualisation
 
A TELECHARGER ! Schéma d’une plateforme de veille "modulaire" 100% RSS (MAJ l...
A TELECHARGER ! Schéma d’une plateforme de veille "modulaire" 100% RSS (MAJ l...A TELECHARGER ! Schéma d’une plateforme de veille "modulaire" 100% RSS (MAJ l...
A TELECHARGER ! Schéma d’une plateforme de veille "modulaire" 100% RSS (MAJ l...
 
Dataviz : quels outils pour quelles visualisations (Serge Courrier) - MAJ (1...
Dataviz  : quels outils pour quelles visualisations (Serge Courrier) - MAJ (1...Dataviz  : quels outils pour quelles visualisations (Serge Courrier) - MAJ (1...
Dataviz : quels outils pour quelles visualisations (Serge Courrier) - MAJ (1...
 
DeciLogic exemple d'application Web de geolocalisation
DeciLogic exemple d'application Web de geolocalisationDeciLogic exemple d'application Web de geolocalisation
DeciLogic exemple d'application Web de geolocalisation
 
ConféR3nce "Géolocalisation Sociale et Marketing Mobile"
ConféR3nce "Géolocalisation Sociale et Marketing Mobile"ConféR3nce "Géolocalisation Sociale et Marketing Mobile"
ConféR3nce "Géolocalisation Sociale et Marketing Mobile"
 
Outils de veille - catalogue
Outils de veille - catalogueOutils de veille - catalogue
Outils de veille - catalogue
 

Plus de Philippe Gambette

Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloud
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloudNuages arborés et analyse textuelle - Présentation de l’outil TreeCloud
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloudPhilippe Gambette
 
Practical use of combinatorial methods for phylogenetic network reconstruction
Practical use of combinatorial methods for phylogenetic network reconstructionPractical use of combinatorial methods for phylogenetic network reconstruction
Practical use of combinatorial methods for phylogenetic network reconstructionPhilippe Gambette
 
Méthodes combinatoires de reconstruction de réseaux phylogénétiques
Méthodes combinatoires de reconstruction de réseaux phylogénétiquesMéthodes combinatoires de reconstruction de réseaux phylogénétiques
Méthodes combinatoires de reconstruction de réseaux phylogénétiquesPhilippe Gambette
 
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...Philippe Gambette
 
Reconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiquesReconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiquesPhilippe Gambette
 
The Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksThe Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksPhilippe Gambette
 
Estimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues CarambarEstimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues CarambarPhilippe Gambette
 
On restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsOn restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsPhilippe Gambette
 
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Philippe Gambette
 
Visualising a text with a tree cloud
Visualising a text with a tree cloudVisualising a text with a tree cloud
Visualising a text with a tree cloudPhilippe Gambette
 

Plus de Philippe Gambette (10)

Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloud
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloudNuages arborés et analyse textuelle - Présentation de l’outil TreeCloud
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloud
 
Practical use of combinatorial methods for phylogenetic network reconstruction
Practical use of combinatorial methods for phylogenetic network reconstructionPractical use of combinatorial methods for phylogenetic network reconstruction
Practical use of combinatorial methods for phylogenetic network reconstruction
 
Méthodes combinatoires de reconstruction de réseaux phylogénétiques
Méthodes combinatoires de reconstruction de réseaux phylogénétiquesMéthodes combinatoires de reconstruction de réseaux phylogénétiques
Méthodes combinatoires de reconstruction de réseaux phylogénétiques
 
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
 
Reconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiquesReconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiques
 
The Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksThe Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic Networks
 
Estimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues CarambarEstimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues Carambar
 
On restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsOn restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphs
 
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
 
Visualising a text with a tree cloud
Visualising a text with a tree cloudVisualising a text with a tree cloud
Visualising a text with a tree cloud
 

Dernier

Formation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadershipFormation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadershipM2i Formation
 
Présentation_ Didactique 1_SVT (S4) complet.pptx
Présentation_ Didactique 1_SVT (S4) complet.pptxPrésentation_ Didactique 1_SVT (S4) complet.pptx
Présentation_ Didactique 1_SVT (S4) complet.pptxrababouerdighi
 
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdfSciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdfSKennel
 
Cours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSETCours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSETMedBechir
 
le present des verbes reguliers -er.pptx
le present des verbes reguliers -er.pptxle present des verbes reguliers -er.pptx
le present des verbes reguliers -er.pptxmmatar2
 
SciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdfSciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdfSKennel
 
Principe de fonctionnement d'un moteur 4 temps
Principe de fonctionnement d'un moteur 4 tempsPrincipe de fonctionnement d'un moteur 4 temps
Principe de fonctionnement d'un moteur 4 tempsRajiAbdelghani
 
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .
Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .Txaruka
 
Saint Georges, martyr, et la lègend du dragon.pptx
Saint Georges, martyr, et la lègend du dragon.pptxSaint Georges, martyr, et la lègend du dragon.pptx
Saint Georges, martyr, et la lègend du dragon.pptxMartin M Flynn
 
Fondation Louis Vuitton. pptx
Fondation      Louis      Vuitton.   pptxFondation      Louis      Vuitton.   pptx
Fondation Louis Vuitton. pptxTxaruka
 
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdfSKennel
 
Cours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSETCours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSETMedBechir
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...Faga1939
 
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdfSKennel
 
Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024Gilles Le Page
 
Le Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directeLe Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directeXL Groupe
 
Zotero avancé - support de formation doctorants SHS 2024
Zotero avancé - support de formation doctorants SHS 2024Zotero avancé - support de formation doctorants SHS 2024
Zotero avancé - support de formation doctorants SHS 2024Alain Marois
 
presentation sur la maladie de la dengue .pptx
presentation sur la maladie de la dengue .pptxpresentation sur la maladie de la dengue .pptx
presentation sur la maladie de la dengue .pptxNYTombaye
 
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdfSKennel
 

Dernier (20)

Formation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadershipFormation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadership
 
Présentation_ Didactique 1_SVT (S4) complet.pptx
Présentation_ Didactique 1_SVT (S4) complet.pptxPrésentation_ Didactique 1_SVT (S4) complet.pptx
Présentation_ Didactique 1_SVT (S4) complet.pptx
 
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdfSciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
 
Cours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSETCours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSET
 
le present des verbes reguliers -er.pptx
le present des verbes reguliers -er.pptxle present des verbes reguliers -er.pptx
le present des verbes reguliers -er.pptx
 
SciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdfSciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdf
 
Principe de fonctionnement d'un moteur 4 temps
Principe de fonctionnement d'un moteur 4 tempsPrincipe de fonctionnement d'un moteur 4 temps
Principe de fonctionnement d'un moteur 4 temps
 
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .
Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .
 
Saint Georges, martyr, et la lègend du dragon.pptx
Saint Georges, martyr, et la lègend du dragon.pptxSaint Georges, martyr, et la lègend du dragon.pptx
Saint Georges, martyr, et la lègend du dragon.pptx
 
Fondation Louis Vuitton. pptx
Fondation      Louis      Vuitton.   pptxFondation      Louis      Vuitton.   pptx
Fondation Louis Vuitton. pptx
 
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
 
Cours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSETCours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSET
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
 
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
 
Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024
 
Le Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directeLe Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directe
 
Zotero avancé - support de formation doctorants SHS 2024
Zotero avancé - support de formation doctorants SHS 2024Zotero avancé - support de formation doctorants SHS 2024
Zotero avancé - support de formation doctorants SHS 2024
 
presentation sur la maladie de la dengue .pptx
presentation sur la maladie de la dengue .pptxpresentation sur la maladie de la dengue .pptx
presentation sur la maladie de la dengue .pptx
 
DO PALÁCIO À ASSEMBLEIA .
DO PALÁCIO À ASSEMBLEIA                 .DO PALÁCIO À ASSEMBLEIA                 .
DO PALÁCIO À ASSEMBLEIA .
 
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
 

Analyse de textes avec TreeCloud et Lexico3

  • 1. Journée OSIDMESH Montpellier – 23/10/2009 Analyses de textes avec TreeCloud et Lexico3 Philippe Gambette
  • 2. Plan • Nuages de mots • Nuages améliorés • Analyses plus fines
  • 3. Plan • Nuages de mots • Nuages améliorés • Analyses plus fines
  • 4. Nuages de mots • Construits depuis l'ensemble des mots d'un texte • Taille de police liée à la fréquence • Se sont popularisés avec Wordle • Donnent un bon aperçu d'un texte Nuages Wordle des mots les plus utilisés début 2009 dans les blogs des Top 100 politique et high-tech de Wikio http://aixtal.blogspot.com/2009/04/web-de-quoi-parlent-les-blogs.html
  • 5. Nuages de mots • Construits depuis l'ensemble des mots d'un texte • Taille de police liée à la fréquence • Se sont popularisés avec Wordle • Donnent un bon aperçu d'un texte
  • 6. Nuages de mots • Construits depuis l'ensemble des mots d'un texte • Taille de police liée à la fréquence • Se sont popularisés avec Wordle • Donnent un bon aperçu d'un texte GoogleImage(obama inaugural address wordle)
  • 7. Nuages de mots • Construits depuis l'ensemble des mots d'un texte • Taille de police liée à la fréquence • Se sont popularisés avec Wordle GoogleImage(obama inaugural address wordle)
  • 8. Nuages de mots • Construits depuis l'ensemble des mots d'un texte • Taille de police liée à la fréquence • Se sont popularisés avec Wordle GoogleImage(obama inaugural address wordle)
  • 9. Plan • Nuages de mots • Nuages améliorés • Analyses plus fines
  • 10. Nuages de mots améliorés Ajouter de l'information extraite du texte : • pâleur pour exprimer la désuétude dans Amazon • tags partagés en rouge dans del.icio.us • regrouper les tags cooccurrents sur la même ligne Hassan-Montero & Herrero-Solana, InScit'06 • optimiser l'espace vide et la proximité sémantique Kaser & Lemire, WWW'07 • “topigraphy”: placement 2D d'après la cooccurrence Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
  • 11. Nuages de tags/mots améliorés Ajouter de l'information extraite du texte : • pâleur pour exprimer la désuétude dans Amazon • tags partagés en rouge dans del.icio.us • regrouper les tags cooccurrents sur la même ligne Hassan-Montero & Herrero-Solana, InScit'06 • optimiser l'espace vide et la proximité sémantique Kaser & Lemire, WWW'07 • “topigraphy”: placement 2D d'après la cooccurrence Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
  • 12. Nuages de tags/mots améliorés Ajouter de l'information extraite du texte : • pâleur pour exprimer la désuétude dans Amazon • tags partagés en rouge dans del.icio.us • regrouper les tags cooccurrents sur la même ligne Hassan-Montero & Herrero-Solana, InScit'06 • optimiser l'espace vide et la proximité sémantique Kaser & Lemire, WWW'07 • “topigraphy”: placement 2D d'après la cooccurrence Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
  • 13. Nuages de tags/mots améliorés Ajouter de l'information extraite du texte : • pâleur pour exprimer la désuétude dans Amazon • tags partagés en rouge dans del.icio.us • regrouper les tags cooccurrents sur la même ligne Hassan-Montero & Herrero-Solana, InScit'06 • optimiser l'espace vide et la proximité sémantique Kaser & Lemire, WWW'07 • “topigraphy”: placement 2D d'après la cooccurrence Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
  • 14. Nuages de tags/mots améliorés Ajouter de l'information extraite du texte : • pâleur pour exprimer la désuétude dans Amazon • tags partagés en rouge dans del.icio.us • regrouper les tags cooccurrents sur la même ligne Hassan-Montero & Herrero-Solana, InScit'06 • optimiser l'espace vide et la proximité sémantique Kaser & Lemire, WWW'07 • “topigraphy”: placement 2D d'après la cooccurrence Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
  • 15. Extraire l'information sémantique d'un texte • analyse littéraire : approche philologique : se concentrer sur le texte Brody • analyse du discours : analyse arborée, graphe de cooc., projection géodésique Brunet (Hyperbase), Viprey (Astartex) • fouille de texte : graphe sémantique Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes) • traitement des langues naturelles : désambiguïsation Véronis (Hyperlex)
  • 16. Extraire l'information sémantique d'un texte • analyse littéraire : approche philologique : se concentrer sur le texte Brody • analyse du discours : analyse arborée, graphe de cooc., projection géodésique Brunet (Hyperbase), Viprey (Astartex) • fouille de texte : graphe sémantique Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes) • traitement des langues naturelles : désambiguïsation Véronis (Hyperlex) Mayaffre, Quand travail, famille, et patrie cooccurrent dans le discours de Nicolas Sarkozy, JADT'08
  • 17. Extraire l'information sémantique d'un texte • analyse littéraire : approche philologique : se concentrer sur le texte Brody • analyse du discours : analyse arborée, graphe de cooc., projection géodésique Brunet (Hyperbase), Viprey (Astartex) • fouille de texte : graphe sémantique Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes) • traitement des langues naturelles : désambiguïsation Véronis (Hyperlex) Brunet, Les séquences (suite), JADT'08
  • 18. Extraire l'information sémantique d'un texte • analyse littéraire : approche philologique : se concentrer sur le texte Brody • analyse du discours : analyse arborée, graphe de cooc., projection géodésique Brunet (Hyperbase), Viprey (Astartex) • fouille de texte : graphe sémantique Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes) • traitement des langues naturelles : désambiguïsation Véronis (Hyperlex) Barry, Viprey, Approche comparative des résultats d'exploration textuelle des discours de deux leaders africains Keita et Touré, JADT'08
  • 19. Extraire l'information sémantique d'un texte • analyse littéraire : approche philologique : se concentrer sur le texte Brody • analyse du discours : analyse arborée, graphe de cooc., projection géodésique Brunet (Hyperbase), Viprey (Astartex) • fouille de texte : graphe sémantique Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes) • traitement des langues naturelles : désambiguïsation Véronis (Hyperlex) Peyrat-Guillard, Analyse du discours syndical sur l’entreprise, JADT'08
  • 20. Extraire l'information sémantique d'un texte • analyse littéraire : approche philologique : se concentrer sur le texte Brody • analyse du discours : analyse arborée, graphe de cooc., projection géodésique Brunet (Hyperbase), Viprey (Astartex) • fouille de texte : graphe sémantique Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes) • traitement des langues naturelles : désambiguïsation Véronis (Hyperlex) Visualisation PhraseNet de paroles des Beatles créé avec Many Eyes (IBM) http://many-eyes.com http://visualthinkmap.ning.com/photo/phrasenet_beatles-many-eyes
  • 21. Extraire l'information sémantique d'un texte • analyse littéraire : approche philologique : se concentrer sur le texte Brody • analyse du discours : analyse arborée, graphe de cooc., projection géodésique Brunet (Hyperbase), Viprey (Astartex) • fouille de texte : graphe sémantique Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes) • traitement des langues naturelles : désambiguïsation Véronis (Hyperlex) Désambiguïsation du mot “barrage”. Véronis, HyperLex: Lexical Cartography for Information Retrieval, 2004
  • 22. Nuage de tags + arbre = nuage arboré SplitsTree : Huson 1998, Huson & Bryant 2006 Construit avec TreeCloud et TreeCloud en Python, license GPL disponible sur http://www.treecloud.fr
  • 23. Nuage arboré des discours d'Obama couleur : chronologie ancien récent Les 150 mots les plus fréquents dans Construit avec les discours de campagne d'Obama, TreeCloud et winsize=30, distance=oddsratio, color=chronology, NJ-tree.
  • 24. Plan • Nuages de mots • Nuages améliorés • Analyses plus fines
  • 25. Analyses textuelles fines Lexico 3 • Laboratoire SYLED-CLA2T de Paris 3 Sorbonne Nouvelle • Logiciel pour PC sous Windows • Version d'évaluation gratuite • Analyses fines, retour au texte http://www.cavi.univ-paris3.fr/Ilpga/ilpga/tal/lexicoWWW/
  • 26. Analyses textuelles fines Lexico 3 • Laboratoire SYLED-CLA2T de Paris 3 Sorbonne Nouvelle • Logiciel pour PC sous Windows • Version d'évaluation gratuite • Analyses fines, retour au texte • Démo sur les avis cinéma de Monique Pantel http://monique.pantel.free.fr
  • 34. Analyses textuelles fines glisser-déposer
  • 40. Analyses textuelles fines sélection puis clic sur Spécifs
  • 42. Analyses textuelles fines retour au texte