SlideShare une entreprise Scribd logo
1  sur  33
Spatial Data Integrator présentation de l'outil  et cas d'utilisation Journées Nationales du Réseau Géomatique - 02/10/09 mathieu.rajerison Chargé de mission SIG
Sommaire ,[object Object]
Place au sein d'une infrastructure de données
Les composantes de l'outil ,[object Object],[object Object]
Mise en place des composants dans l'espace de travail graphique
Paramétrage du composant de jointure tMap
Exécution du job ,[object Object],[object Object]
Fusion de couches
Automatisation de la vérification de la qualité de données géographiques
Migration de données vers PostgreSQL/PostGIS
Autres applications ,[object Object],[object Object]
Liens
1- Présentation de l'outil
Présentation générale  ,[object Object]
Solution libre créée par CampToCamp
Basée sur l'outil Talend Open Studio
Une couche spatiale avec des composants d'accès, de traitement de données spatialisées
Basé sur Java: environnement Eclipse, éléments de UDig, librairies SIG Java GeoTools, Java Topology Suite, sextante
Place au sein d'une  infrastructure de données
Les composantes de l'outil la fenêtre carto Cette fenêtre permet de visualiser des données géographiques. Elle a son utilité lorsqu'il s'agit de contrôler les résultats de traitements. Elle est issue du logiciel Udig.
Les composantes de l'outil Le business modeler Cet espace permet de modéliser les processus métiers en cours au sein de vos jobs. Il permet à des acteurs fonctionnels, de prendre part à la conception des flux de données et de suivre de près l'avancement des développements, et ce, quel que soit leur profil. La modélisation au sein de cette fenêtre n'a aucune liaison avec l'exécution de vos jobs.
Les composantes de l'outil L'onglet metada de repository Le repository contient, entre autres, la partie metadata. La partie metadata du repository est un lieu de stockage de l'accès aux sources de données. On peut d'ailleurs y voir les différents types de sources de données disponibles. A noter que le paramétrage de l'accès aux données géographiques ne se fait pas via la partie metadata (cf démonstration).
Les composantes de l'outil L'espace de travail graphique La fenêtre principale est l'espace de conception de vos jobs. On y dépose et lie les différents composants. Il existe plusieurs types de relations entre composants
Les composantes de l'outil La palette de composants C'est dans la palette que l'on pioche les composants qui nous intéressent. Spatial Data integrator y ajoute la partie  geo La palette est extensible grâce aux contributions des développeurs de Talend. Il est même possible de développer ses composants.
Les composantes de l'outil l'onglet de configuration La fenêtre du bas permet de configurer le comportement de chaque composant. Elle permet également de paramétrer l'exécution du job.
2- Démonstration gestion des rejets lors d'une jointure
Paramétrage des accès et création des schémas La première étape consiste à paramétrer l'accès aux sources de données.
La création des relations On dispose et connecte les composants au sein de l'espace de travail graphique
Mise en place des composants dans l'espace de travail graphique On paramètre la jointure sur le nom de la commune. Deux flux de sortie sont générés: un relatif aux résultats de la jointure (inner join) et un relatif aux rejets (outer join)
L'exécution du job Le job peut maintenant être exécuté. Il peut l'être selon deux modes. -le mode statististics permettant d'afficher les statistiques concernant le nombre d'enregistrements de chaque flux -le mode traces qui affiche le contenu des enregistrements Chacun de ces modes est exécuté en mode streaming, en continu
Aller plus loin:  utilisation des ressemblances entre deux flux Ici, nous utilisons un composant de logique floue appelé tFuzzyMatch qui permet d'établir des correspondances entre les entrées de deux flux en fonction de leur ressemblance.
3- Cas d'utilisation
L'agrégation de données en tâche planifiée Un portail web géographique de base communale demande de joindre automatiquement et périodiquement les données d'une base de données locale Access alimentée par des utilisateurs et les données géographiques de la BDCARTO Base  Access SHP BDCARTO Base  Sybase XML ... Serveur  carto WMS Partie cliente SCP SHP

Contenu connexe

En vedette

3 short big_data_oracle
3 short big_data_oracle3 short big_data_oracle
3 short big_data_oraclepour action !
 
DATA WAREHOUSING
DATA WAREHOUSINGDATA WAREHOUSING
DATA WAREHOUSINGKing Julian
 
Atelier BiB92 / curation Camille Rivory
Atelier BiB92 / curation Camille RivoryAtelier BiB92 / curation Camille Rivory
Atelier BiB92 / curation Camille RivoryBiB92
 
Samoussas (au porc)
Samoussas (au porc)Samoussas (au porc)
Samoussas (au porc)elol3fle
 
Trabajo darwin
Trabajo darwinTrabajo darwin
Trabajo darwinRAYO12
 
105 langevin xavier ia(intelligence artificielle)
105 langevin xavier ia(intelligence artificielle)105 langevin xavier ia(intelligence artificielle)
105 langevin xavier ia(intelligence artificielle)Xavier Langevin
 
Test presentation
Test presentationTest presentation
Test presentationAnna Chen
 
Lignes Et Cables Electriques
Lignes Et Cables ElectriquesLignes Et Cables Electriques
Lignes Et Cables ElectriquesSais Abdelkrim
 
Corinne Guillemot & Xavier Opigez - IAU IDF
Corinne Guillemot & Xavier Opigez - IAU IDFCorinne Guillemot & Xavier Opigez - IAU IDF
Corinne Guillemot & Xavier Opigez - IAU IDFCap'Com
 
T 1 marta garcía-ochoa
T 1 marta garcía-ochoaT 1 marta garcía-ochoa
T 1 marta garcía-ochoaMartagocho
 
Nouveautés cdi rentrée2012
Nouveautés cdi rentrée2012Nouveautés cdi rentrée2012
Nouveautés cdi rentrée2012Claudie Merlet
 
110510 grafitis montevideanos
110510 grafitis montevideanos110510 grafitis montevideanos
110510 grafitis montevideanosGerardo Cánepa
 
Gràfics de l’hort
Gràfics de l’hortGràfics de l’hort
Gràfics de l’hortnessyllamas
 
La TV demain : 10 enjeux de Transformation
La TV demain : 10 enjeux de TransformationLa TV demain : 10 enjeux de Transformation
La TV demain : 10 enjeux de TransformationPhilippe KHATTOU
 
Estanflaqueeeeee estanflacion-mijito-ensayo-libre-de-que-hacer-en-el-mercado-...
Estanflaqueeeeee estanflacion-mijito-ensayo-libre-de-que-hacer-en-el-mercado-...Estanflaqueeeeee estanflacion-mijito-ensayo-libre-de-que-hacer-en-el-mercado-...
Estanflaqueeeeee estanflacion-mijito-ensayo-libre-de-que-hacer-en-el-mercado-...Ruben Cantafio
 
Seminario didacti cs2013-nivel medio.v2
Seminario didacti cs2013-nivel medio.v2Seminario didacti cs2013-nivel medio.v2
Seminario didacti cs2013-nivel medio.v2Eduardo R. Diaz Madero
 

En vedette (20)

3 short big_data_oracle
3 short big_data_oracle3 short big_data_oracle
3 short big_data_oracle
 
DATA WAREHOUSING
DATA WAREHOUSINGDATA WAREHOUSING
DATA WAREHOUSING
 
Atelier BiB92 / curation Camille Rivory
Atelier BiB92 / curation Camille RivoryAtelier BiB92 / curation Camille Rivory
Atelier BiB92 / curation Camille Rivory
 
Samoussas (au porc)
Samoussas (au porc)Samoussas (au porc)
Samoussas (au porc)
 
La guerra fría
La guerra fríaLa guerra fría
La guerra fría
 
Trabajo darwin
Trabajo darwinTrabajo darwin
Trabajo darwin
 
Tema 4 slideshare
Tema 4 slideshareTema 4 slideshare
Tema 4 slideshare
 
105 langevin xavier ia(intelligence artificielle)
105 langevin xavier ia(intelligence artificielle)105 langevin xavier ia(intelligence artificielle)
105 langevin xavier ia(intelligence artificielle)
 
Bibliotheque
BibliothequeBibliotheque
Bibliotheque
 
Test presentation
Test presentationTest presentation
Test presentation
 
Plan fb
Plan fbPlan fb
Plan fb
 
Lignes Et Cables Electriques
Lignes Et Cables ElectriquesLignes Et Cables Electriques
Lignes Et Cables Electriques
 
Corinne Guillemot & Xavier Opigez - IAU IDF
Corinne Guillemot & Xavier Opigez - IAU IDFCorinne Guillemot & Xavier Opigez - IAU IDF
Corinne Guillemot & Xavier Opigez - IAU IDF
 
T 1 marta garcía-ochoa
T 1 marta garcía-ochoaT 1 marta garcía-ochoa
T 1 marta garcía-ochoa
 
Nouveautés cdi rentrée2012
Nouveautés cdi rentrée2012Nouveautés cdi rentrée2012
Nouveautés cdi rentrée2012
 
110510 grafitis montevideanos
110510 grafitis montevideanos110510 grafitis montevideanos
110510 grafitis montevideanos
 
Gràfics de l’hort
Gràfics de l’hortGràfics de l’hort
Gràfics de l’hort
 
La TV demain : 10 enjeux de Transformation
La TV demain : 10 enjeux de TransformationLa TV demain : 10 enjeux de Transformation
La TV demain : 10 enjeux de Transformation
 
Estanflaqueeeeee estanflacion-mijito-ensayo-libre-de-que-hacer-en-el-mercado-...
Estanflaqueeeeee estanflacion-mijito-ensayo-libre-de-que-hacer-en-el-mercado-...Estanflaqueeeeee estanflacion-mijito-ensayo-libre-de-que-hacer-en-el-mercado-...
Estanflaqueeeeee estanflacion-mijito-ensayo-libre-de-que-hacer-en-el-mercado-...
 
Seminario didacti cs2013-nivel medio.v2
Seminario didacti cs2013-nivel medio.v2Seminario didacti cs2013-nivel medio.v2
Seminario didacti cs2013-nivel medio.v2
 

Similaire à [MAP-MEEDM] Présentation Spatial Data Integrator

Nouveautés produits Autodesk 2010
Nouveautés produits Autodesk 2010Nouveautés produits Autodesk 2010
Nouveautés produits Autodesk 2010Geomap GIS America
 
Veille technologique portant sur le mariage judicieux de l’intelligence d’aff...
Veille technologique portant sur le mariage judicieux de l’intelligence d’aff...Veille technologique portant sur le mariage judicieux de l’intelligence d’aff...
Veille technologique portant sur le mariage judicieux de l’intelligence d’aff...Intelli³
 
Amazon Web Services User Group - France - 3 mai 2010 - Optimisation et Automa...
Amazon Web Services User Group - France - 3 mai 2010 - Optimisation et Automa...Amazon Web Services User Group - France - 3 mai 2010 - Optimisation et Automa...
Amazon Web Services User Group - France - 3 mai 2010 - Optimisation et Automa...Frédéric FAURE
 
Ysance conference - cloud computing - aws - 3 mai 2010
Ysance   conference - cloud computing - aws - 3 mai 2010Ysance   conference - cloud computing - aws - 3 mai 2010
Ysance conference - cloud computing - aws - 3 mai 2010Ysance
 
Infrastructure - Monitoring - Cacti
Infrastructure - Monitoring - CactiInfrastructure - Monitoring - Cacti
Infrastructure - Monitoring - CactiFrédéric FAURE
 
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -introNosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -introOlivier Mallassi
 
Stream processing et SQL
Stream processing et SQLStream processing et SQL
Stream processing et SQLBruno Bonnin
 
Stream processing et SQL
Stream processing et SQLStream processing et SQL
Stream processing et SQLBruno Bonnin
 
D3 js-last
D3 js-lastD3 js-last
D3 js-lastTECOS
 
Dea Presentation Pierre Marguerite 24 Juin 2003
Dea Presentation Pierre Marguerite 24 Juin 2003Dea Presentation Pierre Marguerite 24 Juin 2003
Dea Presentation Pierre Marguerite 24 Juin 2003Pierre Marguerite
 
Stratégie et veille : Extraire et trier des données en ligne
Stratégie et veille : Extraire et trier des données en ligneStratégie et veille : Extraire et trier des données en ligne
Stratégie et veille : Extraire et trier des données en ligneErwan Tanguy
 
Stream processing et SQL
Stream processing et SQLStream processing et SQL
Stream processing et SQLBruno Bonnin
 
201303 - Java8
201303 - Java8201303 - Java8
201303 - Java8lyonjug
 
ALT.NET Modéliser Parallèle avec C# 4.0
ALT.NET Modéliser Parallèle avec C# 4.0ALT.NET Modéliser Parallèle avec C# 4.0
ALT.NET Modéliser Parallèle avec C# 4.0Bruno Boucard
 
SQL Server 2012 et ArcGIS d'Esri: Intégrez la dimension géographique dans vos...
SQL Server 2012 et ArcGIS d'Esri: Intégrez la dimension géographique dans vos...SQL Server 2012 et ArcGIS d'Esri: Intégrez la dimension géographique dans vos...
SQL Server 2012 et ArcGIS d'Esri: Intégrez la dimension géographique dans vos...Microsoft Technet France
 
Presentation intis 2017 version27112017
Presentation intis 2017 version27112017Presentation intis 2017 version27112017
Presentation intis 2017 version27112017Dr Hajji Hicham
 
Synchroniser ses applications (plus) simplement
Synchroniser ses applications (plus) simplementSynchroniser ses applications (plus) simplement
Synchroniser ses applications (plus) simplementgplanchat
 
Google Web Toolkit 1.5 Presentation Web Creative Common
Google Web Toolkit 1.5 Presentation Web Creative CommonGoogle Web Toolkit 1.5 Presentation Web Creative Common
Google Web Toolkit 1.5 Presentation Web Creative CommonStéphane Liétard
 

Similaire à [MAP-MEEDM] Présentation Spatial Data Integrator (20)

Nouveautés produits Autodesk 2010
Nouveautés produits Autodesk 2010Nouveautés produits Autodesk 2010
Nouveautés produits Autodesk 2010
 
Veille technologique portant sur le mariage judicieux de l’intelligence d’aff...
Veille technologique portant sur le mariage judicieux de l’intelligence d’aff...Veille technologique portant sur le mariage judicieux de l’intelligence d’aff...
Veille technologique portant sur le mariage judicieux de l’intelligence d’aff...
 
Amazon Web Services User Group - France - 3 mai 2010 - Optimisation et Automa...
Amazon Web Services User Group - France - 3 mai 2010 - Optimisation et Automa...Amazon Web Services User Group - France - 3 mai 2010 - Optimisation et Automa...
Amazon Web Services User Group - France - 3 mai 2010 - Optimisation et Automa...
 
Ysance conference - cloud computing - aws - 3 mai 2010
Ysance   conference - cloud computing - aws - 3 mai 2010Ysance   conference - cloud computing - aws - 3 mai 2010
Ysance conference - cloud computing - aws - 3 mai 2010
 
Infrastructure - Monitoring - Cacti
Infrastructure - Monitoring - CactiInfrastructure - Monitoring - Cacti
Infrastructure - Monitoring - Cacti
 
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -introNosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
 
Stream processing et SQL
Stream processing et SQLStream processing et SQL
Stream processing et SQL
 
Stream processing et SQL
Stream processing et SQLStream processing et SQL
Stream processing et SQL
 
CV_Bilel CHAOUADI
CV_Bilel CHAOUADICV_Bilel CHAOUADI
CV_Bilel CHAOUADI
 
D3 js-last
D3 js-lastD3 js-last
D3 js-last
 
Dea Presentation Pierre Marguerite 24 Juin 2003
Dea Presentation Pierre Marguerite 24 Juin 2003Dea Presentation Pierre Marguerite 24 Juin 2003
Dea Presentation Pierre Marguerite 24 Juin 2003
 
Stratégie et veille : Extraire et trier des données en ligne
Stratégie et veille : Extraire et trier des données en ligneStratégie et veille : Extraire et trier des données en ligne
Stratégie et veille : Extraire et trier des données en ligne
 
Stream processing et SQL
Stream processing et SQLStream processing et SQL
Stream processing et SQL
 
201303 - Java8
201303 - Java8201303 - Java8
201303 - Java8
 
ALT.NET Modéliser Parallèle avec C# 4.0
ALT.NET Modéliser Parallèle avec C# 4.0ALT.NET Modéliser Parallèle avec C# 4.0
ALT.NET Modéliser Parallèle avec C# 4.0
 
SQL Server 2012 et ArcGIS d'Esri: Intégrez la dimension géographique dans vos...
SQL Server 2012 et ArcGIS d'Esri: Intégrez la dimension géographique dans vos...SQL Server 2012 et ArcGIS d'Esri: Intégrez la dimension géographique dans vos...
SQL Server 2012 et ArcGIS d'Esri: Intégrez la dimension géographique dans vos...
 
Presentation intis 2017 version27112017
Presentation intis 2017 version27112017Presentation intis 2017 version27112017
Presentation intis 2017 version27112017
 
Synchroniser ses applications (plus) simplement
Synchroniser ses applications (plus) simplementSynchroniser ses applications (plus) simplement
Synchroniser ses applications (plus) simplement
 
JasperReport
JasperReportJasperReport
JasperReport
 
Google Web Toolkit 1.5 Presentation Web Creative Common
Google Web Toolkit 1.5 Presentation Web Creative CommonGoogle Web Toolkit 1.5 Presentation Web Creative Common
Google Web Toolkit 1.5 Presentation Web Creative Common
 

[MAP-MEEDM] Présentation Spatial Data Integrator

  • 1. Spatial Data Integrator présentation de l'outil et cas d'utilisation Journées Nationales du Réseau Géomatique - 02/10/09 mathieu.rajerison Chargé de mission SIG
  • 2.
  • 3. Place au sein d'une infrastructure de données
  • 4.
  • 5. Mise en place des composants dans l'espace de travail graphique
  • 6. Paramétrage du composant de jointure tMap
  • 7.
  • 9. Automatisation de la vérification de la qualité de données géographiques
  • 10. Migration de données vers PostgreSQL/PostGIS
  • 11.
  • 12. Liens
  • 14.
  • 15. Solution libre créée par CampToCamp
  • 16. Basée sur l'outil Talend Open Studio
  • 17. Une couche spatiale avec des composants d'accès, de traitement de données spatialisées
  • 18. Basé sur Java: environnement Eclipse, éléments de UDig, librairies SIG Java GeoTools, Java Topology Suite, sextante
  • 19. Place au sein d'une infrastructure de données
  • 20. Les composantes de l'outil la fenêtre carto Cette fenêtre permet de visualiser des données géographiques. Elle a son utilité lorsqu'il s'agit de contrôler les résultats de traitements. Elle est issue du logiciel Udig.
  • 21. Les composantes de l'outil Le business modeler Cet espace permet de modéliser les processus métiers en cours au sein de vos jobs. Il permet à des acteurs fonctionnels, de prendre part à la conception des flux de données et de suivre de près l'avancement des développements, et ce, quel que soit leur profil. La modélisation au sein de cette fenêtre n'a aucune liaison avec l'exécution de vos jobs.
  • 22. Les composantes de l'outil L'onglet metada de repository Le repository contient, entre autres, la partie metadata. La partie metadata du repository est un lieu de stockage de l'accès aux sources de données. On peut d'ailleurs y voir les différents types de sources de données disponibles. A noter que le paramétrage de l'accès aux données géographiques ne se fait pas via la partie metadata (cf démonstration).
  • 23. Les composantes de l'outil L'espace de travail graphique La fenêtre principale est l'espace de conception de vos jobs. On y dépose et lie les différents composants. Il existe plusieurs types de relations entre composants
  • 24. Les composantes de l'outil La palette de composants C'est dans la palette que l'on pioche les composants qui nous intéressent. Spatial Data integrator y ajoute la partie geo La palette est extensible grâce aux contributions des développeurs de Talend. Il est même possible de développer ses composants.
  • 25. Les composantes de l'outil l'onglet de configuration La fenêtre du bas permet de configurer le comportement de chaque composant. Elle permet également de paramétrer l'exécution du job.
  • 26. 2- Démonstration gestion des rejets lors d'une jointure
  • 27. Paramétrage des accès et création des schémas La première étape consiste à paramétrer l'accès aux sources de données.
  • 28. La création des relations On dispose et connecte les composants au sein de l'espace de travail graphique
  • 29. Mise en place des composants dans l'espace de travail graphique On paramètre la jointure sur le nom de la commune. Deux flux de sortie sont générés: un relatif aux résultats de la jointure (inner join) et un relatif aux rejets (outer join)
  • 30. L'exécution du job Le job peut maintenant être exécuté. Il peut l'être selon deux modes. -le mode statististics permettant d'afficher les statistiques concernant le nombre d'enregistrements de chaque flux -le mode traces qui affiche le contenu des enregistrements Chacun de ces modes est exécuté en mode streaming, en continu
  • 31. Aller plus loin: utilisation des ressemblances entre deux flux Ici, nous utilisons un composant de logique floue appelé tFuzzyMatch qui permet d'établir des correspondances entre les entrées de deux flux en fonction de leur ressemblance.
  • 33. L'agrégation de données en tâche planifiée Un portail web géographique de base communale demande de joindre automatiquement et périodiquement les données d'une base de données locale Access alimentée par des utilisateurs et les données géographiques de la BDCARTO Base Access SHP BDCARTO Base Sybase XML ... Serveur carto WMS Partie cliente SCP SHP
  • 34.
  • 37. Fusion de couches Des données géographiques sont disséminées en autant de fichiers qu'il y a de communes. L'objectif est de fusionner l'ensemble de ces fichiers en une table unique. SHP5 SHP4 SHP3 SHP2 SHP1 SHP
  • 39. L'automatisation de la vérification de la qualité de données géograhiques Un bureau d'études envoie des documents d'urbanisme numérisés. La validation des données se fait après une série de vérifications liées aux objets géographiques ainsi qu'aux attributs. Cette tâche est répétitive et chronophage. Vérification de la structure des tables Vérification du contenu des tables Vérification de la qualité des objets géographiques Comparaison aux référentiels géogaphiques
  • 40. L'automatisation de la vérification de la qualité de données géograhiques Par un clic, nous souhaitons effectuer cette série de vérifications. Des rapports listent d'éventuelles erreurs: objets, valeurs d'attribut non conformes Vérification de la structure des tables Vérification du contenu des tables Vérification de la qualité des objets géographiques Comparaison aux référentiels géogaphiques
  • 41. L'automatisation de la vérification de la qualité de données géograhiques
  • 42. L'automatisation de la vérification de la qualité de données géograhiques Job de comparaison de la couche des PLU avec le référentiel de la BD Parcellaire
  • 43. L'automatisation de la vérification de la qualité de données géograhiques Composant de jointure tMap Fonction utilisée type row4.the_geom. symDifference (row2.the_geom) géométrique GeometryOperation.GETAREA (row4.the_geom.difference(row2.the_geom)) flottant
  • 44. La migration de données vers PostgreSQL/PostGIS Dans un cadre régional, la mutualisation de données nécessite l'intégration de certaines couches au sein d'un SGBDR postgre/postGIS centralisé Arborescence de fichiers plats SGBDR
  • 45. La migration de données vers PostgreSQL/PostGIS
  • 46.
  • 47. Copier des dalles par commune par intersection de la BDCarto et du tableau d'assemblage et copie des fichiers.
  • 48. Conversion d'ensembles de fichiers dans d'autres formats: utilisation connexe avec exe GDAL-OGR
  • 50. Possibilité d'intégrer des bibliothèques auxiliaires java
  • 51.
  • 52. Migrer , consolider des infrastructures de données géographiques
  • 53. Simplifier l'exécution de tâches habituellement chronophages
  • 54. Éviter les erreurs dûes à la redondance d'opérations manuelles
  • 56. De nouveaux composants en perspective
  • 57.
  • 58. Accès aux données par voies multiples : SCP, FTP, WebServices, POP
  • 59. Création automatique de méta-données : MEF, fiches XML vers GeoNetwork
  • 60. Opérations sur rasters via sextante
  • 61.
  • 62. Le forum de developpez.com consacré à Talend (francophone )