SlideShare ist ein Scribd-Unternehmen logo
1 von 7
Downloaden Sie, um offline zu lesen
Data Tuesday – 18 septembre 2012



Adaptation et enrichissement de la
  donnée géographique brute



                    Data Tuesday – 18 septembre 2012
Fournisseurs et besoins
            Adapter :
            ● Remodéliser

                   Navigation, îlotage
            ●   Îloter
                   Sectorisation
                   Outil ergonomique de sélection des IHM

            Enrichir :
            ● Données à plat

                ➔   Par géocodage, matching d'adresses
            ●   Données spatialisées
ATTRIBUTS       ➔   Par inclusion géométrique
                ➔   Par requête spatiale
RELATIONS

                            Data Tuesday – 18 septembre 2012
Focus : le géocodage
      28    rue de l'Arbousier,     13300 Salon de Provence
      17    rue de l'Armandier,     13300 Salon de Provence
      215   rue de l'Acacia,        13300 Salon de Provence
      33    rue de l'Abri côtier,   13300 Salon de Provence
        En règle générale, les odonymes de graphie
        identique entre 2 bases d'adresses
        représentent 80 % de la volumétrie totale.
      Les différences de graphie se résolvent par :
        ● La comparaison des mots directeurs

        ● La ressemblance phonétique (soundex)

        ● La ressemblance lexicale :

          ● Distance de Levenshtein

          ● Score des trigrammes




                           Data Tuesday – 18 septembre 2012
Focus : le géocodage
Le score des trigrammes :

         ●   Décompose les chaînes de caractères en groupes de 3 lettres
         ●   ABRICOTIER ABR-BRI-RIC-ICO-COT-OTI-TIE-IER
         ●   ABRI COTIER ABR-BRI-RI_-_CO-COT-OTI-TIE-IER
         ●   Calcule un score construit sur les trigrammes communs

Dans le SGBD PostgreSQL :

        select similarity('abricotier', 'abri cotier')
        = 0.642857




                                             Data Tuesday – 18 septembre 2012
Focus : la sectorisation
                           ❶

                           ❸ ❷




                            ❹




Réseau filaire de voirie   Îlotage                  Quantification

                                     Data Tuesday – 18 septembre 2012
Focus : la sectorisation
 Algorithme du recuit simulé




          Optimisation sur :
          ● La forme

          ● Le potentiel

          ● L'homogénéité

          ● L'hétérogénéité




                        Data Tuesday – 18 septembre 2012
Exemple d'application
          Enrichir OpenStreetMap par les données INSEE
 Cartographie           géocodage
 OpenStreetMap                                    Correspondances
                                                  adresses–zones urbaines
îlotage
                            en ces
                      ad jac
                                                  Ilots – IRIS
 Ilots - IRIS
                                                  Données du recensement
 OpenStreetMap



                                     Données externes
                                     Bases clients – prospects
                                     Zonages

                                         Data Tuesday – 18 septembre 2012

Weitere ähnliche Inhalte

Andere mochten auch

2 Kelquartier - Larrain - Smart cities & data - 26 mars 2013
2    Kelquartier - Larrain - Smart cities & data - 26 mars 20132    Kelquartier - Larrain - Smart cities & data - 26 mars 2013
2 Kelquartier - Larrain - Smart cities & data - 26 mars 2013
Data Tuesday
 
Ilhamul wadud cheikh_ahmadou_bamba
Ilhamul wadud cheikh_ahmadou_bambaIlhamul wadud cheikh_ahmadou_bamba
Ilhamul wadud cheikh_ahmadou_bamba
falloug
 
Articles l'Hérault du Jour
Articles l'Hérault du JourArticles l'Hérault du Jour
Articles l'Hérault du Jour
elsaN15
 
Présentation de l’identité visuelle dakcom
Présentation de l’identité visuelle dakcomPrésentation de l’identité visuelle dakcom
Présentation de l’identité visuelle dakcom
Ahmed-Djibril Coly
 
Présentation mémoire
Présentation mémoirePrésentation mémoire
Présentation mémoire
iris LUPIANEZ
 
CPH. L'industrie minière en Haïti. Enjeux et réalités (Final jan 2016)
CPH. L'industrie minière en Haïti. Enjeux et réalités (Final jan 2016)CPH. L'industrie minière en Haïti. Enjeux et réalités (Final jan 2016)
CPH. L'industrie minière en Haïti. Enjeux et réalités (Final jan 2016)
Gerardo Ducos
 
1 quels ages ont-ils en 2012
1 quels ages ont-ils en 20121 quels ages ont-ils en 2012
1 quels ages ont-ils en 2012
Philippe Massé
 
Informaticadispositivosdecomunicacionpersonal (2)
Informaticadispositivosdecomunicacionpersonal (2)Informaticadispositivosdecomunicacionpersonal (2)
Informaticadispositivosdecomunicacionpersonal (2)
Nadia HCh
 
Découvrir et prendre en mains les outils de baladodiffusion ( décembre 2013 )
Découvrir et prendre en mains les outils de baladodiffusion ( décembre 2013 ) Découvrir et prendre en mains les outils de baladodiffusion ( décembre 2013 )
Découvrir et prendre en mains les outils de baladodiffusion ( décembre 2013 )
MissTice
 

Andere mochten auch (20)

Hardware y software
Hardware y softwareHardware y software
Hardware y software
 
2 Kelquartier - Larrain - Smart cities & data - 26 mars 2013
2    Kelquartier - Larrain - Smart cities & data - 26 mars 20132    Kelquartier - Larrain - Smart cities & data - 26 mars 2013
2 Kelquartier - Larrain - Smart cities & data - 26 mars 2013
 
39979311 (2)
39979311 (2)39979311 (2)
39979311 (2)
 
Projet de realisation
Projet de realisationProjet de realisation
Projet de realisation
 
Ilhamul wadud cheikh_ahmadou_bamba
Ilhamul wadud cheikh_ahmadou_bambaIlhamul wadud cheikh_ahmadou_bamba
Ilhamul wadud cheikh_ahmadou_bamba
 
Temps forts exposition
Temps forts expositionTemps forts exposition
Temps forts exposition
 
Articles l'Hérault du Jour
Articles l'Hérault du JourArticles l'Hérault du Jour
Articles l'Hérault du Jour
 
FEDER - Rapport final d'évaluation TIC 2015 (phase 2)
FEDER - Rapport final d'évaluation TIC 2015 (phase 2)FEDER - Rapport final d'évaluation TIC 2015 (phase 2)
FEDER - Rapport final d'évaluation TIC 2015 (phase 2)
 
Présentation de l’identité visuelle dakcom
Présentation de l’identité visuelle dakcomPrésentation de l’identité visuelle dakcom
Présentation de l’identité visuelle dakcom
 
Présentation mémoire
Présentation mémoirePrésentation mémoire
Présentation mémoire
 
Tablettes numeriques et mediation_alix_dumolard
Tablettes numeriques et mediation_alix_dumolardTablettes numeriques et mediation_alix_dumolard
Tablettes numeriques et mediation_alix_dumolard
 
La telefonía ip convierte el computador en un teléfono
La telefonía ip convierte el computador en un teléfonoLa telefonía ip convierte el computador en un teléfono
La telefonía ip convierte el computador en un teléfono
 
Presentation Emgoldex-Goldxteam 2014(Français)
Presentation Emgoldex-Goldxteam 2014(Français)Presentation Emgoldex-Goldxteam 2014(Français)
Presentation Emgoldex-Goldxteam 2014(Français)
 
CPH. L'industrie minière en Haïti. Enjeux et réalités (Final jan 2016)
CPH. L'industrie minière en Haïti. Enjeux et réalités (Final jan 2016)CPH. L'industrie minière en Haïti. Enjeux et réalités (Final jan 2016)
CPH. L'industrie minière en Haïti. Enjeux et réalités (Final jan 2016)
 
1 quels ages ont-ils en 2012
1 quels ages ont-ils en 20121 quels ages ont-ils en 2012
1 quels ages ont-ils en 2012
 
Informaticadispositivosdecomunicacionpersonal (2)
Informaticadispositivosdecomunicacionpersonal (2)Informaticadispositivosdecomunicacionpersonal (2)
Informaticadispositivosdecomunicacionpersonal (2)
 
Découvrir et prendre en mains les outils de baladodiffusion ( décembre 2013 )
Découvrir et prendre en mains les outils de baladodiffusion ( décembre 2013 ) Découvrir et prendre en mains les outils de baladodiffusion ( décembre 2013 )
Découvrir et prendre en mains les outils de baladodiffusion ( décembre 2013 )
 
Bon anniversaire guillaume
Bon anniversaire guillaumeBon anniversaire guillaume
Bon anniversaire guillaume
 
Ppl13 245-140124081336-phpapp01
Ppl13 245-140124081336-phpapp01Ppl13 245-140124081336-phpapp01
Ppl13 245-140124081336-phpapp01
 
Tp rodas, viviana
Tp rodas, vivianaTp rodas, viviana
Tp rodas, viviana
 

Mehr von Data Tuesday

Bruno Van Haetsdaele - Data Tuesday - VRM
Bruno Van Haetsdaele - Data Tuesday - VRMBruno Van Haetsdaele - Data Tuesday - VRM
Bruno Van Haetsdaele - Data Tuesday - VRM
Data Tuesday
 
Bruno van haetsdaele_2013-09-vrm
Bruno van haetsdaele_2013-09-vrmBruno van haetsdaele_2013-09-vrm
Bruno van haetsdaele_2013-09-vrm
Data Tuesday
 
Daniel Kaplan - FING - Data Tuesday - VRM
Daniel Kaplan - FING -  Data Tuesday - VRMDaniel Kaplan - FING -  Data Tuesday - VRM
Daniel Kaplan - FING - Data Tuesday - VRM
Data Tuesday
 
Nicolas Rose - XANGE - VRM - Data Tuesday
Nicolas Rose - XANGE -  VRM - Data Tuesday Nicolas Rose - XANGE -  VRM - Data Tuesday
Nicolas Rose - XANGE - VRM - Data Tuesday
Data Tuesday
 
Cozy Cloud - Data Tuesday - VRM
Cozy Cloud - Data Tuesday - VRMCozy Cloud - Data Tuesday - VRM
Cozy Cloud - Data Tuesday - VRM
Data Tuesday
 
Didier louvet - ADM - Data Tuesday - VRM - 08-10-2013
Didier louvet - ADM  -  Data Tuesday - VRM - 08-10-2013Didier louvet - ADM  -  Data Tuesday - VRM - 08-10-2013
Didier louvet - ADM - Data Tuesday - VRM - 08-10-2013
Data Tuesday
 
Privowny - Data Tuesday VRM
Privowny - Data Tuesday VRMPrivowny - Data Tuesday VRM
Privowny - Data Tuesday VRM
Data Tuesday
 
Renaud Francou- FING - Datatuesday VRM
Renaud Francou- FING - Datatuesday VRMRenaud Francou- FING - Datatuesday VRM
Renaud Francou- FING - Datatuesday VRM
Data Tuesday
 
DATATUESDAY VRM - Onecub
DATATUESDAY VRM -  Onecub DATATUESDAY VRM -  Onecub
DATATUESDAY VRM - Onecub
Data Tuesday
 
Cristal Festival, Timeline (EN)
Cristal Festival, Timeline (EN)Cristal Festival, Timeline (EN)
Cristal Festival, Timeline (EN)
Data Tuesday
 
Cristal Festival, Timeline (FR)
Cristal Festival, Timeline (FR)Cristal Festival, Timeline (FR)
Cristal Festival, Timeline (FR)
Data Tuesday
 
4 présentation mgdis open data - datatuesday v2
4   présentation mgdis open data - datatuesday v24   présentation mgdis open data - datatuesday v2
4 présentation mgdis open data - datatuesday v2
Data Tuesday
 
Cristal Academy / Séminaire 4 juillet 2013
Cristal Academy / Séminaire 4 juillet 2013Cristal Academy / Séminaire 4 juillet 2013
Cristal Academy / Séminaire 4 juillet 2013
Data Tuesday
 
10 jean-louis zimmermann - open streetmap france - lizmobility
10   jean-louis zimmermann - open streetmap france - lizmobility10   jean-louis zimmermann - open streetmap france - lizmobility
10 jean-louis zimmermann - open streetmap france - lizmobility
Data Tuesday
 

Mehr von Data Tuesday (20)

Data Publica
Data PublicaData Publica
Data Publica
 
Bittle
BittleBittle
Bittle
 
Fruition sciences
Fruition sciencesFruition sciences
Fruition sciences
 
Xiko
XikoXiko
Xiko
 
Shift technology
Shift technologyShift technology
Shift technology
 
Data driven company
Data driven companyData driven company
Data driven company
 
Bruno Van Haetsdaele - Data Tuesday - VRM
Bruno Van Haetsdaele - Data Tuesday - VRMBruno Van Haetsdaele - Data Tuesday - VRM
Bruno Van Haetsdaele - Data Tuesday - VRM
 
Bruno van haetsdaele_2013-09-vrm
Bruno van haetsdaele_2013-09-vrmBruno van haetsdaele_2013-09-vrm
Bruno van haetsdaele_2013-09-vrm
 
Daniel Kaplan - FING - Data Tuesday - VRM
Daniel Kaplan - FING -  Data Tuesday - VRMDaniel Kaplan - FING -  Data Tuesday - VRM
Daniel Kaplan - FING - Data Tuesday - VRM
 
Nicolas Rose - XANGE - VRM - Data Tuesday
Nicolas Rose - XANGE -  VRM - Data Tuesday Nicolas Rose - XANGE -  VRM - Data Tuesday
Nicolas Rose - XANGE - VRM - Data Tuesday
 
Cozy Cloud - Data Tuesday - VRM
Cozy Cloud - Data Tuesday - VRMCozy Cloud - Data Tuesday - VRM
Cozy Cloud - Data Tuesday - VRM
 
Didier louvet - ADM - Data Tuesday - VRM - 08-10-2013
Didier louvet - ADM  -  Data Tuesday - VRM - 08-10-2013Didier louvet - ADM  -  Data Tuesday - VRM - 08-10-2013
Didier louvet - ADM - Data Tuesday - VRM - 08-10-2013
 
Privowny - Data Tuesday VRM
Privowny - Data Tuesday VRMPrivowny - Data Tuesday VRM
Privowny - Data Tuesday VRM
 
Renaud Francou- FING - Datatuesday VRM
Renaud Francou- FING - Datatuesday VRMRenaud Francou- FING - Datatuesday VRM
Renaud Francou- FING - Datatuesday VRM
 
DATATUESDAY VRM - Onecub
DATATUESDAY VRM -  Onecub DATATUESDAY VRM -  Onecub
DATATUESDAY VRM - Onecub
 
Cristal Festival, Timeline (EN)
Cristal Festival, Timeline (EN)Cristal Festival, Timeline (EN)
Cristal Festival, Timeline (EN)
 
Cristal Festival, Timeline (FR)
Cristal Festival, Timeline (FR)Cristal Festival, Timeline (FR)
Cristal Festival, Timeline (FR)
 
4 présentation mgdis open data - datatuesday v2
4   présentation mgdis open data - datatuesday v24   présentation mgdis open data - datatuesday v2
4 présentation mgdis open data - datatuesday v2
 
Cristal Academy / Séminaire 4 juillet 2013
Cristal Academy / Séminaire 4 juillet 2013Cristal Academy / Séminaire 4 juillet 2013
Cristal Academy / Séminaire 4 juillet 2013
 
10 jean-louis zimmermann - open streetmap france - lizmobility
10   jean-louis zimmermann - open streetmap france - lizmobility10   jean-louis zimmermann - open streetmap france - lizmobility
10 jean-louis zimmermann - open streetmap france - lizmobility
 

Data Tuesday 18 09 2012 Malte Brun - Goulas

  • 1. Data Tuesday – 18 septembre 2012 Adaptation et enrichissement de la donnée géographique brute Data Tuesday – 18 septembre 2012
  • 2. Fournisseurs et besoins Adapter : ● Remodéliser  Navigation, îlotage ● Îloter  Sectorisation  Outil ergonomique de sélection des IHM Enrichir : ● Données à plat ➔ Par géocodage, matching d'adresses ● Données spatialisées ATTRIBUTS ➔ Par inclusion géométrique ➔ Par requête spatiale RELATIONS Data Tuesday – 18 septembre 2012
  • 3. Focus : le géocodage 28 rue de l'Arbousier, 13300 Salon de Provence 17 rue de l'Armandier, 13300 Salon de Provence 215 rue de l'Acacia, 13300 Salon de Provence 33 rue de l'Abri côtier, 13300 Salon de Provence En règle générale, les odonymes de graphie identique entre 2 bases d'adresses représentent 80 % de la volumétrie totale. Les différences de graphie se résolvent par : ● La comparaison des mots directeurs ● La ressemblance phonétique (soundex) ● La ressemblance lexicale : ● Distance de Levenshtein ● Score des trigrammes Data Tuesday – 18 septembre 2012
  • 4. Focus : le géocodage Le score des trigrammes : ● Décompose les chaînes de caractères en groupes de 3 lettres ● ABRICOTIER ABR-BRI-RIC-ICO-COT-OTI-TIE-IER ● ABRI COTIER ABR-BRI-RI_-_CO-COT-OTI-TIE-IER ● Calcule un score construit sur les trigrammes communs Dans le SGBD PostgreSQL : select similarity('abricotier', 'abri cotier') = 0.642857 Data Tuesday – 18 septembre 2012
  • 5. Focus : la sectorisation ❶ ❸ ❷ ❹ Réseau filaire de voirie Îlotage Quantification Data Tuesday – 18 septembre 2012
  • 6. Focus : la sectorisation Algorithme du recuit simulé Optimisation sur : ● La forme ● Le potentiel ● L'homogénéité ● L'hétérogénéité Data Tuesday – 18 septembre 2012
  • 7. Exemple d'application Enrichir OpenStreetMap par les données INSEE Cartographie géocodage OpenStreetMap Correspondances adresses–zones urbaines îlotage en ces ad jac Ilots – IRIS Ilots - IRIS Données du recensement OpenStreetMap Données externes Bases clients – prospects Zonages Data Tuesday – 18 septembre 2012