SlideShare ist ein Scribd-Unternehmen logo
1 von 13
Downloaden Sie, um offline zu lesen
INTÉGRATION DE DONNEES
AVEC UN ETL OPEN SOURCE :
OPEN STUDIO TOS
Presenté par LASSEY horacio (horalass@gmail.com)
Agenda
 C’est quoi un ETL
 Présentation de Talend Open Studio
 Avantages des solutions ETL
 Critères de sélection d’un ETL
 Démo : création de quelques jobs talend
 Conclusion
C’est quoi un ETL
 ETL est l’acronyme de Extract Transform Load. Un
 ETL combine en elle seule trois fonctionnalités :
 extraction depuis une source de données , la
 transformation des données issues de l’étape
 précédente et enfin le load (chargement) dans une
 nouvelle source de données.
 On utilise les ETL pour les projets d’intégration de
 données (structure BI), de synchronisation de sources
 de données, migration de données etc…
Presentation de Talend Open Studio

 TOS est un ETL de la société Talend
 C’est un projet open source
 C’est une application Eclipse plateforme
 Première version en 2005
 C’est un ETL générateur de code (Java, Perl )
Avantages des solutions ETL
 Dans un environnement décisionnel une partie des
 besoins ne survient qu’après la mise en production. Il
 faut pouvoir adapter rapidement son code ETL au
 nouveau des utilisateurs tout en gardant une bonne
 qualité du code
 Nécessité de transformer certains données
 opérationnelles
 Il faut pouvoir stocker les metadata des transformations
 La plupart des solutions ETL propose des exécutions en
 parallèle et du multi-threading ce qui les rend plus
 performants qu’un code simple
Avantages des solutions ETL (suite)
 Accès à des sources de données très diversifiées et
 intégration des fonctions de filtre, agrégation etc.
 Gestion centralisée des metadata
 Utilisation d’interface graphique conviviale pour
 exécuter les tâches ETL
Critère de sélection d’un ETL
 Type d’ETL : code generator, database-embedded,
 engine based
 Connecteur natif : SAP, salesforce, XML, etc
 Les temps d’exécution.
 Type de déclencheur ( temps réel , sur évènement ,
 batch)
Démo : création de quelques jobs
talend
 Job step1
   Présentation d’un job talend
   Utilisation des statistiques
   Utilisation des traces
Démo : création de quelques jobs
talend(suite)
 Job step2
   Utilisation de tMap pour se connecter à des sources
   multiples de données
   Utilisation des métadonnées
Démo : création de quelques jobs
talend(suite)
 Job step3
   Orchestration et gestion des flows
Démo : création de quelques jobs
talend(suite)
 Job step4
   Gestion des erreurs et déploiement des jobs
Conclusion
 Le choix d’un etl est très influencé par le projet que l’on
 fait et le contexte
 Mais pour faire son choix il faut tenir compte :
   Connecteurs natifs
   du temps de traitements
    du type d’etl ( générateur de code, moteur de
   transformation, etc)
    du type de déclencheur
 Il existe plusieurs ETL open source : Talend , Pentaho
 data Integration etc pour s’essayer et faire la preuve du
 concept
Références
 www.talend.com
 The Data Warehouse ETL Toolkit, Ralph Kimball &
 Joe Caserta

Weitere ähnliche Inhalte

Was ist angesagt?

PFE BI - INPT
PFE BI - INPTPFE BI - INPT
PFE BI - INPT
riyadadva
 
Tp soa avec talend esb
Tp soa avec talend esbTp soa avec talend esb
Tp soa avec talend esb
Alahyane Ahmed
 

Was ist angesagt? (20)

Cours Big Data Chap2
Cours Big Data Chap2Cours Big Data Chap2
Cours Big Data Chap2
 
BigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceBigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-Reduce
 
Traitement distribue en BIg Data - KAFKA Broker and Kafka Streams
Traitement distribue en BIg Data - KAFKA Broker and Kafka StreamsTraitement distribue en BIg Data - KAFKA Broker and Kafka Streams
Traitement distribue en BIg Data - KAFKA Broker and Kafka Streams
 
Big Data, Hadoop & Spark
Big Data, Hadoop & SparkBig Data, Hadoop & Spark
Big Data, Hadoop & Spark
 
Le processus ETL (Extraction, Transformation, Chargement)
Le processus ETL (Extraction, Transformation, Chargement)Le processus ETL (Extraction, Transformation, Chargement)
Le processus ETL (Extraction, Transformation, Chargement)
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
 
BigData_Chp4: NOSQL
BigData_Chp4: NOSQLBigData_Chp4: NOSQL
BigData_Chp4: NOSQL
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
 
BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian
 
PFE BI - INPT
PFE BI - INPTPFE BI - INPT
PFE BI - INPT
 
Cours Big Data Chap3
Cours Big Data Chap3Cours Big Data Chap3
Cours Big Data Chap3
 
Pfe
PfePfe
Pfe
 
Une introduction à Hive
Une introduction à HiveUne introduction à Hive
Une introduction à Hive
 
Alphorm.com Formation ETL Talend Open Studio (1/2) - Les fondamentaux
Alphorm.com Formation ETL Talend Open Studio (1/2) - Les fondamentauxAlphorm.com Formation ETL Talend Open Studio (1/2) - Les fondamentaux
Alphorm.com Formation ETL Talend Open Studio (1/2) - Les fondamentaux
 
Présentation PFE: Système de gestion des réclamations et interventions clients
Présentation PFE: Système de gestion des réclamations et interventions clientsPrésentation PFE: Système de gestion des réclamations et interventions clients
Présentation PFE: Système de gestion des réclamations et interventions clients
 
Tp soa avec talend esb
Tp soa avec talend esbTp soa avec talend esb
Tp soa avec talend esb
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Guide talend
Guide talendGuide talend
Guide talend
 

Andere mochten auch

Andere mochten auch (13)

Petit Déjeuner Talend/SQLI
Petit Déjeuner Talend/SQLIPetit Déjeuner Talend/SQLI
Petit Déjeuner Talend/SQLI
 
Certificate Talend
Certificate TalendCertificate Talend
Certificate Talend
 
[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend
 
Webinar Smile et Talend : Faites communiquer vos applications en temps réel
Webinar Smile et Talend  : Faites communiquer vos applications en temps réelWebinar Smile et Talend  : Faites communiquer vos applications en temps réel
Webinar Smile et Talend : Faites communiquer vos applications en temps réel
 
alphorm.com - Formation PostgreSQL administration
alphorm.com - Formation PostgreSQL administrationalphorm.com - Formation PostgreSQL administration
alphorm.com - Formation PostgreSQL administration
 
Alphorm.com Formation RDS Windows Server 2008 R2 - Guide du consultant
Alphorm.com Formation  RDS Windows Server 2008 R2 - Guide du consultantAlphorm.com Formation  RDS Windows Server 2008 R2 - Guide du consultant
Alphorm.com Formation RDS Windows Server 2008 R2 - Guide du consultant
 
Alphorm.com formation-GNS3
Alphorm.com formation-GNS3Alphorm.com formation-GNS3
Alphorm.com formation-GNS3
 
Alphorm.com Formation le langage SQL
Alphorm.com  Formation le langage SQLAlphorm.com  Formation le langage SQL
Alphorm.com Formation le langage SQL
 
alphorm.com - Formation SQL Server 2012 (70-462)
alphorm.com - Formation SQL Server 2012 (70-462)alphorm.com - Formation SQL Server 2012 (70-462)
alphorm.com - Formation SQL Server 2012 (70-462)
 
Alphorm.com Formation PL/SQL
Alphorm.com Formation PL/SQLAlphorm.com Formation PL/SQL
Alphorm.com Formation PL/SQL
 
Alphorm.com Formation PostgreSQL, la Haute Disponibilité
Alphorm.com Formation PostgreSQL, la Haute DisponibilitéAlphorm.com Formation PostgreSQL, la Haute Disponibilité
Alphorm.com Formation PostgreSQL, la Haute Disponibilité
 
Alphorm.com Formation Microsoft SQL Server 2016 Business Intelligence (SSIS)
Alphorm.com Formation Microsoft SQL Server 2016 Business Intelligence (SSIS)Alphorm.com Formation Microsoft SQL Server 2016 Business Intelligence (SSIS)
Alphorm.com Formation Microsoft SQL Server 2016 Business Intelligence (SSIS)
 
Alphorm.com Formation MySQL Administration(1Z0-883)
Alphorm.com   Formation MySQL Administration(1Z0-883)Alphorm.com   Formation MySQL Administration(1Z0-883)
Alphorm.com Formation MySQL Administration(1Z0-883)
 

Ähnlich wie Présentation Talend Open Studio

Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...
Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...
Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...
CERTyou Formation
 
Talei formation-talend-open-studio-data-integration-les-bases
Talei formation-talend-open-studio-data-integration-les-basesTalei formation-talend-open-studio-data-integration-les-bases
Talei formation-talend-open-studio-data-integration-les-bases
CERTyou Formation
 
Switch to alfresco with 1 genia fr
Switch to alfresco with 1 genia frSwitch to alfresco with 1 genia fr
Switch to alfresco with 1 genia fr
Alfresco Software
 
Talea formation-talend-open-studio-data-integration-perfectionnement
Talea formation-talend-open-studio-data-integration-perfectionnementTalea formation-talend-open-studio-data-integration-perfectionnement
Talea formation-talend-open-studio-data-integration-perfectionnement
CERTyou Formation
 

Ähnlich wie Présentation Talend Open Studio (20)

Développement de plug in sous eclipse
Développement de plug in sous eclipseDéveloppement de plug in sous eclipse
Développement de plug in sous eclipse
 
Entity_framework_db first
Entity_framework_db firstEntity_framework_db first
Entity_framework_db first
 
Les nouveautés du Framework .NET 4.5
Les nouveautés du Framework .NET 4.5Les nouveautés du Framework .NET 4.5
Les nouveautés du Framework .NET 4.5
 
Alfresco Meetup - ETL Connector & Talend
Alfresco Meetup - ETL Connector & TalendAlfresco Meetup - ETL Connector & Talend
Alfresco Meetup - ETL Connector & Talend
 
Language INtegrated Query LINQ
 Language INtegrated QueryLINQ Language INtegrated QueryLINQ
Language INtegrated Query LINQ
 
introductionaudevcomposantdistribuejavaee.pdf
introductionaudevcomposantdistribuejavaee.pdfintroductionaudevcomposantdistribuejavaee.pdf
introductionaudevcomposantdistribuejavaee.pdf
 
Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...
Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...
Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...
 
Support cours j2_ee
Support cours j2_eeSupport cours j2_ee
Support cours j2_ee
 
Etl -
Etl -Etl -
Etl -
 
Retour d'expérience TAA - 2011/03/29
Retour d'expérience TAA - 2011/03/29Retour d'expérience TAA - 2011/03/29
Retour d'expérience TAA - 2011/03/29
 
Java Entreprise Edition
Java Entreprise EditionJava Entreprise Edition
Java Entreprise Edition
 
Talei formation-talend-open-studio-data-integration-les-bases
Talei formation-talend-open-studio-data-integration-les-basesTalei formation-talend-open-studio-data-integration-les-bases
Talei formation-talend-open-studio-data-integration-les-bases
 
Switch to alfresco with 1 genia fr
Switch to alfresco with 1 genia frSwitch to alfresco with 1 genia fr
Switch to alfresco with 1 genia fr
 
Talend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric CarboneTalend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric Carbone
 
La Tooling API, est-ce pour moi ? Bien sûr, viens voir pourquoi !
La Tooling API, est-ce pour moi ? Bien sûr, viens voir pourquoi !La Tooling API, est-ce pour moi ? Bien sûr, viens voir pourquoi !
La Tooling API, est-ce pour moi ? Bien sûr, viens voir pourquoi !
 
Talea formation-talend-open-studio-data-integration-perfectionnement
Talea formation-talend-open-studio-data-integration-perfectionnementTalea formation-talend-open-studio-data-integration-perfectionnement
Talea formation-talend-open-studio-data-integration-perfectionnement
 
Comparaison de outils mda
Comparaison de outils mdaComparaison de outils mda
Comparaison de outils mda
 
Les micro orm, alternatives à entity framework
Les micro orm, alternatives à entity frameworkLes micro orm, alternatives à entity framework
Les micro orm, alternatives à entity framework
 
Introduction au Domain Driven Design
Introduction au Domain Driven DesignIntroduction au Domain Driven Design
Introduction au Domain Driven Design
 
Petit DéJeuner Industrialisation 13 10 2011 Eurosites
Petit DéJeuner Industrialisation 13 10 2011 EurositesPetit DéJeuner Industrialisation 13 10 2011 Eurosites
Petit DéJeuner Industrialisation 13 10 2011 Eurosites
 

Présentation Talend Open Studio

  • 1. INTÉGRATION DE DONNEES AVEC UN ETL OPEN SOURCE : OPEN STUDIO TOS Presenté par LASSEY horacio (horalass@gmail.com)
  • 2. Agenda C’est quoi un ETL Présentation de Talend Open Studio Avantages des solutions ETL Critères de sélection d’un ETL Démo : création de quelques jobs talend Conclusion
  • 3. C’est quoi un ETL ETL est l’acronyme de Extract Transform Load. Un ETL combine en elle seule trois fonctionnalités : extraction depuis une source de données , la transformation des données issues de l’étape précédente et enfin le load (chargement) dans une nouvelle source de données. On utilise les ETL pour les projets d’intégration de données (structure BI), de synchronisation de sources de données, migration de données etc…
  • 4. Presentation de Talend Open Studio TOS est un ETL de la société Talend C’est un projet open source C’est une application Eclipse plateforme Première version en 2005 C’est un ETL générateur de code (Java, Perl )
  • 5. Avantages des solutions ETL Dans un environnement décisionnel une partie des besoins ne survient qu’après la mise en production. Il faut pouvoir adapter rapidement son code ETL au nouveau des utilisateurs tout en gardant une bonne qualité du code Nécessité de transformer certains données opérationnelles Il faut pouvoir stocker les metadata des transformations La plupart des solutions ETL propose des exécutions en parallèle et du multi-threading ce qui les rend plus performants qu’un code simple
  • 6. Avantages des solutions ETL (suite) Accès à des sources de données très diversifiées et intégration des fonctions de filtre, agrégation etc. Gestion centralisée des metadata Utilisation d’interface graphique conviviale pour exécuter les tâches ETL
  • 7. Critère de sélection d’un ETL Type d’ETL : code generator, database-embedded, engine based Connecteur natif : SAP, salesforce, XML, etc Les temps d’exécution. Type de déclencheur ( temps réel , sur évènement , batch)
  • 8. Démo : création de quelques jobs talend Job step1 Présentation d’un job talend Utilisation des statistiques Utilisation des traces
  • 9. Démo : création de quelques jobs talend(suite) Job step2 Utilisation de tMap pour se connecter à des sources multiples de données Utilisation des métadonnées
  • 10. Démo : création de quelques jobs talend(suite) Job step3 Orchestration et gestion des flows
  • 11. Démo : création de quelques jobs talend(suite) Job step4 Gestion des erreurs et déploiement des jobs
  • 12. Conclusion Le choix d’un etl est très influencé par le projet que l’on fait et le contexte Mais pour faire son choix il faut tenir compte : Connecteurs natifs du temps de traitements du type d’etl ( générateur de code, moteur de transformation, etc) du type de déclencheur Il existe plusieurs ETL open source : Talend , Pentaho data Integration etc pour s’essayer et faire la preuve du concept
  • 13. Références www.talend.com The Data Warehouse ETL Toolkit, Ralph Kimball & Joe Caserta