SlideShare ist ein Scribd-Unternehmen logo
1 von 27
© Talend 2014© Talend 2014
Data centric
Une plate forme centrée sur les données au service de votre organisation
Benjamin Boutros et Jean-Michel
Franco
bboutros@talend.com
jfranco@talend.com (@jmichel_franco)
© Talend 2014© Talend 2014
Agenda
1. Talend en bref
2. MDM et Data Gouvernance : pourquoi ?
3. MDM et Data Gouvernance : comment ?
4. Références et cas d’usage
5. MDM et Big Data : l’association gagnante
© Talend 2014© Talend 2014
EN BREF
• Fondée en 2006
• 400 employés
dans 7 pays
• Deux sièges : Los Altos, en
Californie et Paris, en France
• Modèle Open Core
• Licence (souscription)
• Services et formations
Solutions
 Solutions d’intégration évolutives pour le Big
Data, l’intégration de données et d’applications, la
qualité de données, le MDM et BPM.
 Classé Leader Visionnaire par Gartner et Forrester sur
le marché de l’intégration
Présentation de Talend
Modèle de déploiement-croissance
2007 2008 2009 2010 2011 2012
VISIBILITE
1,6 million de
téléchargements
COMMUNAUTÉ
DYNAMIQUE
100 000
utilisateurs
enregistrés
MONÉTISATION
1 800
souscripteurs
actifs
FIDELITE DES
CLIENTS
Taux de
renouvellement
de 86%
© Talend 2014© Talend 2014
La Plateforme Talend
GESTION DES
DONNEES
USAGE DE
L’INFORMATION
© Talend 2014© Talend 2014
Data centric ? L’exemple d’Amazon
Connaître
son client
Elargir son offre
produits & services
Valoriser tout
l’écosystème
© Talend 2014© Talend 2014
Talend
MDM
Client
Four-
nisseur
Produit
Actif
(Asset)
Agence
Magasins
Organisa
tions et
codifi-
cations
Employé
MDM et data gouvernance ?
Maîtriser le « qui, quoi, comment et où » de vos activités
Quoi ?
(44%)
Comptes
Géolocalisation
Contrat
Nomenclatures
Attributs
Prix
Catalogue
Profil
Comportement
Adresse
Identité
Qui ?
(33%)
Territoires
Comment ?
(21%)
Où ?
(3%)
Standards
Compliance
Sources : Gartner
© Talend 2014© Talend 2014
Fonctionnalités clés d’un MDM
Alimentation
Capture
• Audit des
sources
• Chargement
initial
• Insertions /
mises à jour,
batch et fil de
l’eau
Rapproche-
ments
Consolida-
tions
Enrichisse-
ments
Distribution
Publication
• Trouve et relie
les doublons
potentiels
• Algorithmes et
arbitrages
manuels
• Fusionne les
doublons avec
des règles
automatiques et
des processus
manuels
Nettoyage
• Corrections
(erreurs de
saisies,
formats…)
• Alignement sur
un standard
• Validation
d’adresses
postales
• Ajoute des
informations
transverses
• Sources
externes
• Enrichisse-
ments et
arbitrages
manuels
• Met les Master
Data à
disposition de
tout le système
d’information
Le processus MDM
© Talend 2014© Talend 2014
1) Intégration des sources
Alimentation
Capture
• Audit des
sources
• Chargement
initial
• Insertions /
mises à jour,
batch et fil de
l’eau
Rapproche-
ments
Consolida-
tions
Enrichisse-
ments
Distribution
Publication
• Trouve et relie
les doublons
potentiels
• Algorithmes et
arbitrages
manuels
• Fusionne les
doublons avec
des règles
automatiques et
des processus
manuels
Nettoyage
• Corrections
(erreurs de
saisies,
formats…)
• Alignement sur
un standard
• Validation
d’adresses
postales
• Ajoute des
informations
transverses
• Sources
externes
• Enrichisse-
ments et
arbitrages
manuels
• Met les Master
Data à
disposition de
tout le système
d’information
Le processus MDM
Plateforme Talend
• Data Profiling: > 100 indicateurs, rapports d’audit, suivi dans le temps
• Active Data Model: tous domaines, validation synchrone ou asynchrone
• Data Integration: > 500 connecteurs (dans l’ADN de Talend !)
• Application Integration: services, messages, routing, mediation…
© Talend 2014© Talend 2014
Six dimensions de la qualité de données
© Talend 2014© Talend 2014
Complétude
• Complétude : le type n’est pas renseigné pour DUPONT PIERRE/DIDIER JOSEPHINE et PAYS est
renseignée avec une valeur par défaut
La Complétude
© Talend 2014© Talend 2014
La Conformité
Complétude
Conformité
• Complétude : le type n’est pas renseigné pour DUPONT PIERRE/DIDIER JOSEPHINE et PAYS est
renseignée avec une valeur par défaut
• Conformité : l’adresse n’est pas correcte pour DUPONT PIERRE et LAPEYRE
© Talend 2014© Talend 2014
La Cohérence
Complétude
Conformité
Cohérence
• Complétude : le type n’est pas renseigné pour DUPONT PIERRE/DIDIER JOSEPHINE et PAYS est
renseignée avec une valeur par défaut
• Conformité : l’adresse n’est pas correcte pour DUPONT PIERRE et LAPEYRE
• Cohérence : YAHOO n’est pas une personne et BOUTROS BENJAMIN n’est pas une entreprise
© Talend 2014© Talend 2014
L’exactitude…
Complétude
Conformité
Cohérence
Exactitude
• Complétude : le type n’est pas renseigné pour DUPONT PIERRE/DIDIER JOSEPHINE et PAYS est
renseignée avec une valeur par défaut
• Conformité : l’adresse n’est pas correcte pour DUPONT PIERRE et LAPEYRE
• Cohérence : YAHOO n’est pas une personne et BOUTROS BENJAMIN n’est pas une entreprise
• Exactitude : l’information POIDS n’est pas applicable aux entreprises
© Talend 2014© Talend 2014
La Duplication
Complétude
Conformité
Cohérence
Duplication
Exactitude
• Complétude : le type n’est pas renseigné pour DUPONT PIERRE/DIDIER JOSEPHINE et PAYS est
renseignée avec une valeur par défaut
• Conformité : l’adresse n’est pas correcte pour DUPONT PIERRE et LAPEYRE
• Cohérence : YAHOO n’est pas une personne et BOUTROS BENJAMIN n’est pas une entreprise
• Exactitude : l’information POIDS n’est pas applicable aux entreprises
• Duplication : J BLANC et MR JACQUES BLANC sont la même personne
© Talend 2014© Talend 2014
L’intégrité
Complétude
Conformité
Cohérence
Duplication
Intégrité
Exactitude
• Complétude : le type n’est pas renseigné pour DUPONT PIERRE/DIDIER JOSEPHINE et PAYS est
renseignée avec une valeur par défaut
• Conformité : l’adresse n’est pas correcte pour DUPONT PIERRE et LAPEYRE
• Cohérence : YAHOO n’est pas une personne et BOUTROS BENJAMIN n’est pas une entreprise
• Exactitude : l’information POIDS n’est pas applicable aux entreprises
• Duplication : J BLANC et MR JACQUES BLANC sont la même personne
• Intégrité : le lien qui unit ces deux personnes n’est pas établie dans le fichier
© Talend 2014© Talend 2014
2) Nettoyage & alignement des données
Alimentation
Capture
• Audit des
sources
• Chargement
initial
• Insertions /
mises à jour,
batch et fil de
l’eau
Rapproche-
ments
Consolida-
tions
Enrichisse-
ments
Distribution
Publication
• Trouve et relie
les doublons
potentiels
• Algorithmes et
arbitrages
manuels
• Fusionne les
doublons avec
des règles
automatiques et
des processus
manuels
Nettoyage
• Corrections
(erreurs de
saisies,
formats…)
• Alignement sur
un standard
• Validation
d’adresses
postales
• Ajoute des
informations
transverses
• Sources
externes
• Enrichisse-
ments et
arbitrages
manuels
• Met les Master
Data à
disposition de
tout le système
d’information
Le processus MDM
Plateforme Talend
• Data Quality: parsing, synonymes, correspondances, standardisation
• Composants specialisés: prenoms, nicknames, telephones…
• Composants de validation d’adresses: Google, Uniserv, Loqate…
© Talend 2014© Talend 2014
3) Rapprochement (« Entity Resolution », « Record Linkage »…)
Alimentation
Capture
• Audit des
sources
• Chargement
initial
• Insertions /
mises à jour,
batch et fil de
l’eau
Rapproche-
ments
Consolida-
tions
Enrichisse-
ments
Distribution
Publication
• Trouve et relie
les doublons
potentiels
• Algorithmes et
arbitrages
manuels
• Fusionne les
doublons avec
des règles
automatiques et
des processus
manuels
Nettoyage
• Corrections
(erreurs de
saisies,
formats…)
• Alignement sur
un standard
• Validation
d’adresses
postales
• Ajoute des
informations
transverses
• Sources
externes
• Enrichisse-
ments et
arbitrages
manuels
• Met les Master
Data à
disposition de
tout le système
d’information
Le processus MDM
Plateforme Talend
• Algorithmes de matching: détection des similaires, scoring, seuils d’incertitude…
• Stewardship Console: visualisation graphique des rapprochements
© Talend 2014© Talend 2014
4) Consolidation, « Survivorship »
Alimentation
Capture
• Audit des
sources
• Chargement
initial
• Insertions /
mises à jour,
batch et fil de
l’eau
Rapproche-
ments
Consolida-
tions
Enrichisse-
ments
Distribution
Publication
• Trouve et relie
les doublons
potentiels
• Algorithmes et
arbitrages
manuels
• Fusionne les
doublons avec
des règles
automatiques et
des processus
manuels
Nettoyage
• Corrections
(erreurs de
saisies,
formats…)
• Alignement sur
un standard
• Validation
d’adresses
postales
• Ajoute des
informations
transverses
• Sources
externes
• Enrichisse-
ments et
arbitrages
manuels
• Met les Master
Data à
disposition de
tout le système
d’information
Le processus MDM
Plateforme Talend
• Algorithmes de survivorship: fonctions intégrées et règles personnalisées
• Stewardship Console: arbitrage / correction manuelle de la fusion
© Talend 2014© Talend 2014
5) Améliorations, enrichissement
Alimentation
Capture
• Audit des
sources
• Chargement
initial
• Insertions /
mises à jour,
batch et fil de
l’eau
Rapproche-
ments
Consolida-
tions
Enrichisse-
ments
Distribution
Publication
• Trouve et relie
les doublons
potentiels
• Algorithmes et
arbitrages
manuels
• Fusionne les
doublons avec
des règles
automatiques et
des processus
manuels
Nettoyage
• Corrections
(erreurs de
saisies,
formats…)
• Alignement sur
un standard
• Validation
d’adresses
postales
• Ajoute des
informations
transverses
• Sources
externes
• Enrichisse-
ments et
arbitrages
manuels
• Met les Master
Data à
disposition de
tout le système
d’information
Le processus MDM
Plateforme Talend
• Formulaires Web: auto-générés sur le modèle, vues dépendantes du
rôle, droits d’accès
• Workflow: moteur de BPM complet (designer de formulaires
métier, rôles, assignations, délégations, deadlines, notifications…)
© Talend 2014© Talend 2014
6) Publication, mise à disposition
Alimentation
Capture
• Audit des
sources
• Chargement
initial
• Insertions /
mises à jour,
batch et fil de
l’eau
Rapproche-
ments
Consolida-
tions
Enrichisse-
ments
Distribution
Publication
• Trouve et relie
les doublons
potentiels
• Algorithmes et
arbitrages
manuels
• Fusionne les
doublons avec
des règles
automatiques et
des processus
manuels
Nettoyage
• Corrections
(erreurs de
saisies,
formats…)
• Alignement sur
un standard
• Validation
d’adresses
postales
• Ajoute des
informations
transverses
• Sources
externes
• Enrichisse-
ments et
arbitrages
manuels
• Met les Master
Data à
disposition de
tout le système
d’information
Le processus MDM
Plateforme Talend
• Data Integration: export dans virtuellement n’importe quel format vers
n’importe quelle cible
• ESB: publication dans le bus de service Talend
© Talend 2014© Talend 2014
Client
Quelques clients MDM
Produit
Autres
domaines
Employés, Founisseurs, Site
& Meta-Data Management
Reference Data
Management
Multi-Domaine
© Talend 2014© Talend 2014
Etude de cas : Veolia
➜ L’entreprise :
• Veolia Propreté est la division de Veolia Environnement spécialisée dans la gestion et la valorisation des déchets..
• Plus de 47 millions d'habitants desservis, 64 291 collaborateurs, 686 unités de traitement, 575000 clients, flotte
de 10000 véhicules
➜ L’enjeu:
• Produire, de façon automatisée, des indicateurs clés de performance pour la DG et tous les niveaux de
l’organisation
• Unifier la gestion de l’activité aux travers des organisations et des systèmes d’information
➜ Solution:
• Un référentiel des matériels pour les 1200 catégories de déchets traités
• Un référentiel véhicules pour les 10000 véhicules de la flotte
• Une organisation associée pour le data stewardship
➜ Résultats :
• Des processus rationalisé grâce à une élimination des
incohérences et doublons (exemple : évolution
de 10000 à 1200 codes matériel après la phase
de collecte et dédoublonnage.
• La capacité à déployer rapidement de
nouveaux domaines et l’organisation de
gouvernance associée : déploiement de chaque
nouveau modèle en 6 à 8 semaines
© Talend 2014© Talend 2014
Pourquoi le Big Data a-t-il besoin du MDM et de la
data quality ?
23
Extraction du contenu
Gestion de la qualité
Réconciliation avec les master data
Enrichissement
Id_Client Prénom Nom Produit Fournisseur Date Montant
92584789 Anne B. TXF98 Dell 24/12/2013 650 €
92584789 Anne B. AXC54 Maped 24/12/2013 2,44 €
92584789 Anne B. TRE56 Playmobil 24/12/2013 129,36 €
….
Exemple : la dématérialisation du Père Noël
© Talend 2014© Talend 2014
Pourquoi le Big Data a t’il besoin du MDM et de la DQ ?
Ex: Du MDM client au « client augmenté » et la recommandation temps réel
24
Customer Data Platform
Données de
parcours, sentiments et
interactions
Données
décisionnelles
Données
transactionnelles
Centre de contacts
Face à face
(Boutique, agence…)
SMS/Mail/Chat…
Service après vente
Applications
mobiles et Web
MDM,
Data Quality
© Talend 2014© Talend 2014
RUNTIME PLATFORM (JAVA, Hadoop, SQL, etc.)
La plate-forme Talend pour le Big Data
Talend Platform for Big Data
TALEND UNIFIED PLATFORM
Studio Repository Deployment Execution Monitoring
DATA INTEGRATION
Data
Access ETL / ELT
Version
Control
Business
Rules
Change
Data Capture Scheduler
Parallel
Processing
High
Availability
Big DATA QUALITY
Hive Data
Profiling
Drill-down
to Values
DQ Portal,
Monitoring
Data
Stewardship
Report
Design
Address
Validation
Custom
Analysis
M/R Parsing,
Matching
BIG DATA
Hadoop 2.0
MapReduce
ETL/ELT
Hcatalog/
meta-data
Pig, Sqoop,
Hive
Hadoop Job
Scheduler
Google Big
Query
NoSQL
SupportHDFS
© Talend 2014© Talend 2014
Conclusion – Talend MDM et Data Quality
Rapide à implémenter
Plateforme avec tous les composants pour le MDM
Se prête à l’implémentation incrémentale
Approche simple et intuitive
Modélisation, configuration, design
Pas de programmation, réutilisation des composants Talend
VOTRE domaine, VOS règles
Modélisation ultra flexible basée sur XML
Système évènementiel pour validations & corrections auto
Rejoignez la communauté Open Source
Basé sur les standards et frameworks Open Source
Ouvert et extensible
Prêt à embarquer le Big Data
Gestion des 4V (volume, variété, vitesse et véracité)
Capacité à traiter les données là où elles sont
Rapide
Simple
Flexible
Open
Extensible
© Talend 2014© Talend 2014
Des questions ?

Weitere ähnliche Inhalte

Was ist angesagt?

Rapport data-mining
Rapport data-miningRapport data-mining
Rapport data-miningSawsen Larbi
 
Audit Informatique
Audit InformatiqueAudit Informatique
Audit Informatiqueetienne
 
Prendre la data par le bon sens
Prendre la data par le bon sensPrendre la data par le bon sens
Prendre la data par le bon sensJean-Michel Franco
 
BigData_TP4 : Cassandra
BigData_TP4 : CassandraBigData_TP4 : Cassandra
BigData_TP4 : CassandraLilia Sfaxi
 
Mini projet power bi
Mini projet power bi Mini projet power bi
Mini projet power bi AfnouchAhmed
 
Introduction aux systèmes d’information des entreprises
Introduction aux systèmes d’information des entreprisesIntroduction aux systèmes d’information des entreprises
Introduction aux systèmes d’information des entreprisesMessaoud Hatri
 
BigData_Chp5: Putting it all together
BigData_Chp5: Putting it all togetherBigData_Chp5: Putting it all together
BigData_Chp5: Putting it all togetherLilia Sfaxi
 
Cours guvernance des systèmes d'information partie 3 prof. Khalifa MANSOURI
Cours guvernance des systèmes d'information partie 3 prof. Khalifa MANSOURICours guvernance des systèmes d'information partie 3 prof. Khalifa MANSOURI
Cours guvernance des systèmes d'information partie 3 prof. Khalifa MANSOURIMansouri Khalifa
 
Système Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et OpérationnelSystème Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et OpérationnelFrédéric FAURE
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1Amal Abid
 
Effets du système de management de la sécurité de l'information sur la perfor...
Effets du système de management de la sécurité de l'information sur la perfor...Effets du système de management de la sécurité de l'information sur la perfor...
Effets du système de management de la sécurité de l'information sur la perfor...Harold NGUEGANG
 
Présentation PFE Hachem Selmi et Ahmed Dridi Big data
Présentation PFE Hachem Selmi et Ahmed Dridi Big data Présentation PFE Hachem Selmi et Ahmed Dridi Big data
Présentation PFE Hachem Selmi et Ahmed Dridi Big data HaShem Selmi
 
Data mining - Introduction générale
Data mining - Introduction généraleData mining - Introduction générale
Data mining - Introduction généraleMohamed Heny SELMI
 
Rapport exposé eXtreme Programming XP
Rapport exposé eXtreme Programming XPRapport exposé eXtreme Programming XP
Rapport exposé eXtreme Programming XPSarah
 

Was ist angesagt? (20)

Rapport data-mining
Rapport data-miningRapport data-mining
Rapport data-mining
 
Audit Informatique
Audit InformatiqueAudit Informatique
Audit Informatique
 
Prendre la data par le bon sens
Prendre la data par le bon sensPrendre la data par le bon sens
Prendre la data par le bon sens
 
BigData_TP4 : Cassandra
BigData_TP4 : CassandraBigData_TP4 : Cassandra
BigData_TP4 : Cassandra
 
Mini projet power bi
Mini projet power bi Mini projet power bi
Mini projet power bi
 
Cloud presentation
Cloud  presentationCloud  presentation
Cloud presentation
 
Introduction aux systèmes d’information des entreprises
Introduction aux systèmes d’information des entreprisesIntroduction aux systèmes d’information des entreprises
Introduction aux systèmes d’information des entreprises
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
BigData_Chp5: Putting it all together
BigData_Chp5: Putting it all togetherBigData_Chp5: Putting it all together
BigData_Chp5: Putting it all together
 
Cours guvernance des systèmes d'information partie 3 prof. Khalifa MANSOURI
Cours guvernance des systèmes d'information partie 3 prof. Khalifa MANSOURICours guvernance des systèmes d'information partie 3 prof. Khalifa MANSOURI
Cours guvernance des systèmes d'information partie 3 prof. Khalifa MANSOURI
 
Système Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et OpérationnelSystème Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et Opérationnel
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
 
Effets du système de management de la sécurité de l'information sur la perfor...
Effets du système de management de la sécurité de l'information sur la perfor...Effets du système de management de la sécurité de l'information sur la perfor...
Effets du système de management de la sécurité de l'information sur la perfor...
 
Cours uml
Cours umlCours uml
Cours uml
 
Présentation PFE Hachem Selmi et Ahmed Dridi Big data
Présentation PFE Hachem Selmi et Ahmed Dridi Big data Présentation PFE Hachem Selmi et Ahmed Dridi Big data
Présentation PFE Hachem Selmi et Ahmed Dridi Big data
 
Data mining - Introduction générale
Data mining - Introduction généraleData mining - Introduction générale
Data mining - Introduction générale
 
Rapport exposé eXtreme Programming XP
Rapport exposé eXtreme Programming XPRapport exposé eXtreme Programming XP
Rapport exposé eXtreme Programming XP
 
Cmmi
CmmiCmmi
Cmmi
 
Système d'Information (S.I.) dans l’entreprise
Système d'Information (S.I.) dans l’entrepriseSystème d'Information (S.I.) dans l’entreprise
Système d'Information (S.I.) dans l’entreprise
 
Partie1BI-DW2019
Partie1BI-DW2019Partie1BI-DW2019
Partie1BI-DW2019
 

Andere mochten auch

Data-Ed Slides: Data-Centric Strategy & Roadmap - Supercharging Your Business
Data-Ed Slides: Data-Centric Strategy & Roadmap - Supercharging Your BusinessData-Ed Slides: Data-Centric Strategy & Roadmap - Supercharging Your Business
Data-Ed Slides: Data-Centric Strategy & Roadmap - Supercharging Your BusinessDATAVERSITY
 
Club Urba-EA - Vers un SI "data centric"
Club Urba-EA - Vers un SI "data centric" Club Urba-EA - Vers un SI "data centric"
Club Urba-EA - Vers un SI "data centric" Club Urba-EA
 
Data-Centric and Message-Centric System Architecture
Data-Centric and Message-Centric System ArchitectureData-Centric and Message-Centric System Architecture
Data-Centric and Message-Centric System ArchitectureRick Warren
 
Data-Centric Approach for Project Delivery
Data-Centric Approach for Project DeliveryData-Centric Approach for Project Delivery
Data-Centric Approach for Project DeliveryAVEVA Group plc
 
Du SEO empirique au SEO Data centric - Comment piloter sa stratégie SEO en 20...
Du SEO empirique au SEO Data centric - Comment piloter sa stratégie SEO en 20...Du SEO empirique au SEO Data centric - Comment piloter sa stratégie SEO en 20...
Du SEO empirique au SEO Data centric - Comment piloter sa stratégie SEO en 20...Olivier TASSEL
 
Data-Centric Infrastructure for Agile Development
Data-Centric Infrastructure for Agile DevelopmentData-Centric Infrastructure for Agile Development
Data-Centric Infrastructure for Agile DevelopmentDATAVERSITY
 

Andere mochten auch (6)

Data-Ed Slides: Data-Centric Strategy & Roadmap - Supercharging Your Business
Data-Ed Slides: Data-Centric Strategy & Roadmap - Supercharging Your BusinessData-Ed Slides: Data-Centric Strategy & Roadmap - Supercharging Your Business
Data-Ed Slides: Data-Centric Strategy & Roadmap - Supercharging Your Business
 
Club Urba-EA - Vers un SI "data centric"
Club Urba-EA - Vers un SI "data centric" Club Urba-EA - Vers un SI "data centric"
Club Urba-EA - Vers un SI "data centric"
 
Data-Centric and Message-Centric System Architecture
Data-Centric and Message-Centric System ArchitectureData-Centric and Message-Centric System Architecture
Data-Centric and Message-Centric System Architecture
 
Data-Centric Approach for Project Delivery
Data-Centric Approach for Project DeliveryData-Centric Approach for Project Delivery
Data-Centric Approach for Project Delivery
 
Du SEO empirique au SEO Data centric - Comment piloter sa stratégie SEO en 20...
Du SEO empirique au SEO Data centric - Comment piloter sa stratégie SEO en 20...Du SEO empirique au SEO Data centric - Comment piloter sa stratégie SEO en 20...
Du SEO empirique au SEO Data centric - Comment piloter sa stratégie SEO en 20...
 
Data-Centric Infrastructure for Agile Development
Data-Centric Infrastructure for Agile DevelopmentData-Centric Infrastructure for Agile Development
Data-Centric Infrastructure for Agile Development
 

Ähnlich wie Data centric : une plate-forme orientée donnée au coeur de votre organisation

Le référentiel employé pour tirer toute la valeur de vos données RH
Le référentiel employé pour tirer toute la valeur de vos données RHLe référentiel employé pour tirer toute la valeur de vos données RH
Le référentiel employé pour tirer toute la valeur de vos données RHJean-Michel Franco
 
Atelier Talend - Forum MDM Micropole 2014 - Du MDM client à la customer dat...
Atelier Talend -  Forum MDM Micropole 2014 -  Du MDM client à la customer dat...Atelier Talend -  Forum MDM Micropole 2014 -  Du MDM client à la customer dat...
Atelier Talend - Forum MDM Micropole 2014 - Du MDM client à la customer dat...Micropole Group
 
La qualité des données à l’ère du Big Data
La qualité des données à l’ère du Big DataLa qualité des données à l’ère du Big Data
La qualité des données à l’ère du Big DataPrecisely
 
Collaboration et gestion des données et contenus dans la transformation digit...
Collaboration et gestion des données et contenus dans la transformation digit...Collaboration et gestion des données et contenus dans la transformation digit...
Collaboration et gestion des données et contenus dans la transformation digit...KnowledgeConsult
 
Banques et Assurances : optez pour des données fiables, précises et cohérentes !
Banques et Assurances : optez pour des données fiables, précises et cohérentes !Banques et Assurances : optez pour des données fiables, précises et cohérentes !
Banques et Assurances : optez pour des données fiables, précises et cohérentes !Precisely
 
Webinar Smile et Talend : Faites communiquer vos applications en temps réel
Webinar Smile et Talend  : Faites communiquer vos applications en temps réelWebinar Smile et Talend  : Faites communiquer vos applications en temps réel
Webinar Smile et Talend : Faites communiquer vos applications en temps réelSmile I.T is open
 
[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend[French] Matinale du Big Data Talend
[French] Matinale du Big Data TalendJean-Michel Franco
 
Découvrez comment créer une solution complète de gouvernance des données
Découvrez comment créer une solution complète de gouvernance des donnéesDécouvrez comment créer une solution complète de gouvernance des données
Découvrez comment créer une solution complète de gouvernance des donnéesPrecisely
 
Talend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric CarboneTalend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric CarboneCedric CARBONE
 
Présentation de Talend Data Preparation
Présentation de Talend Data PreparationPrésentation de Talend Data Preparation
Présentation de Talend Data PreparationJean-Michel Franco
 
Réussir le projet MDM depuis son business case jusqu'à son exploitation au q...
Réussir le projet MDM depuis son business case jusqu'à son exploitation au q...Réussir le projet MDM depuis son business case jusqu'à son exploitation au q...
Réussir le projet MDM depuis son business case jusqu'à son exploitation au q...Jean-Michel Franco
 
Données Ouvertes : mode d'emploi ?
Données Ouvertes : mode d'emploi ?Données Ouvertes : mode d'emploi ?
Données Ouvertes : mode d'emploi ?mondeca
 
IBM Information Management - Pas de décision de qualité sans informations de ...
IBM Information Management - Pas de décision de qualité sans informations de ...IBM Information Management - Pas de décision de qualité sans informations de ...
IBM Information Management - Pas de décision de qualité sans informations de ...Nicolas Desachy
 
{French] 5 cas d'usages mdm produit
{French] 5 cas d'usages mdm produit{French] 5 cas d'usages mdm produit
{French] 5 cas d'usages mdm produitJean-Michel Franco
 
Enrichissement et nettoyage de données - Foule Factory
Enrichissement et nettoyage de données - Foule FactoryEnrichissement et nettoyage de données - Foule Factory
Enrichissement et nettoyage de données - Foule FactoryFoule factory
 
[French] Une Vision à 360° de vos clients grâce au Master Data Management et ...
[French] Une Vision à 360° de vos clients grâce au Master Data Management et ...[French] Une Vision à 360° de vos clients grâce au Master Data Management et ...
[French] Une Vision à 360° de vos clients grâce au Master Data Management et ...Jean-Michel Franco
 
Piloter l'entreprise par ses données (présentation Talend pour la matinale ED...
Piloter l'entreprise par ses données (présentation Talend pour la matinale ED...Piloter l'entreprise par ses données (présentation Talend pour la matinale ED...
Piloter l'entreprise par ses données (présentation Talend pour la matinale ED...Jean-Michel Franco
 
Mise en conformité d'un traitement de données de bout-en-bout
Mise en conformité d'un traitement de données de bout-en-boutMise en conformité d'un traitement de données de bout-en-bout
Mise en conformité d'un traitement de données de bout-en-boutAndrea MARTELLETTI
 
Adoption de Hadoop : des Possibilités Illimitées - Hortonworks and Talend
Adoption de Hadoop : des Possibilités Illimitées - Hortonworks and TalendAdoption de Hadoop : des Possibilités Illimitées - Hortonworks and Talend
Adoption de Hadoop : des Possibilités Illimitées - Hortonworks and TalendHortonworks
 

Ähnlich wie Data centric : une plate-forme orientée donnée au coeur de votre organisation (20)

Le référentiel employé pour tirer toute la valeur de vos données RH
Le référentiel employé pour tirer toute la valeur de vos données RHLe référentiel employé pour tirer toute la valeur de vos données RH
Le référentiel employé pour tirer toute la valeur de vos données RH
 
Atelier Talend - Forum MDM Micropole 2014 - Du MDM client à la customer dat...
Atelier Talend -  Forum MDM Micropole 2014 -  Du MDM client à la customer dat...Atelier Talend -  Forum MDM Micropole 2014 -  Du MDM client à la customer dat...
Atelier Talend - Forum MDM Micropole 2014 - Du MDM client à la customer dat...
 
La qualité des données à l’ère du Big Data
La qualité des données à l’ère du Big DataLa qualité des données à l’ère du Big Data
La qualité des données à l’ère du Big Data
 
Collaboration et gestion des données et contenus dans la transformation digit...
Collaboration et gestion des données et contenus dans la transformation digit...Collaboration et gestion des données et contenus dans la transformation digit...
Collaboration et gestion des données et contenus dans la transformation digit...
 
Banques et Assurances : optez pour des données fiables, précises et cohérentes !
Banques et Assurances : optez pour des données fiables, précises et cohérentes !Banques et Assurances : optez pour des données fiables, précises et cohérentes !
Banques et Assurances : optez pour des données fiables, précises et cohérentes !
 
Webinar Smile et Talend : Faites communiquer vos applications en temps réel
Webinar Smile et Talend  : Faites communiquer vos applications en temps réelWebinar Smile et Talend  : Faites communiquer vos applications en temps réel
Webinar Smile et Talend : Faites communiquer vos applications en temps réel
 
[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend
 
Découvrez comment créer une solution complète de gouvernance des données
Découvrez comment créer une solution complète de gouvernance des donnéesDécouvrez comment créer une solution complète de gouvernance des données
Découvrez comment créer une solution complète de gouvernance des données
 
Talend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric CarboneTalend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric Carbone
 
Présentation de Talend Data Preparation
Présentation de Talend Data PreparationPrésentation de Talend Data Preparation
Présentation de Talend Data Preparation
 
Réussir le projet MDM depuis son business case jusqu'à son exploitation au q...
Réussir le projet MDM depuis son business case jusqu'à son exploitation au q...Réussir le projet MDM depuis son business case jusqu'à son exploitation au q...
Réussir le projet MDM depuis son business case jusqu'à son exploitation au q...
 
Données Ouvertes : mode d'emploi ?
Données Ouvertes : mode d'emploi ?Données Ouvertes : mode d'emploi ?
Données Ouvertes : mode d'emploi ?
 
IBM Information Management - Pas de décision de qualité sans informations de ...
IBM Information Management - Pas de décision de qualité sans informations de ...IBM Information Management - Pas de décision de qualité sans informations de ...
IBM Information Management - Pas de décision de qualité sans informations de ...
 
{French] 5 cas d'usages mdm produit
{French] 5 cas d'usages mdm produit{French] 5 cas d'usages mdm produit
{French] 5 cas d'usages mdm produit
 
Enrichissement et nettoyage de données - Foule Factory
Enrichissement et nettoyage de données - Foule FactoryEnrichissement et nettoyage de données - Foule Factory
Enrichissement et nettoyage de données - Foule Factory
 
[French] Une Vision à 360° de vos clients grâce au Master Data Management et ...
[French] Une Vision à 360° de vos clients grâce au Master Data Management et ...[French] Une Vision à 360° de vos clients grâce au Master Data Management et ...
[French] Une Vision à 360° de vos clients grâce au Master Data Management et ...
 
Piloter l'entreprise par ses données (présentation Talend pour la matinale ED...
Piloter l'entreprise par ses données (présentation Talend pour la matinale ED...Piloter l'entreprise par ses données (présentation Talend pour la matinale ED...
Piloter l'entreprise par ses données (présentation Talend pour la matinale ED...
 
Mise en conformité d'un traitement de données de bout-en-bout
Mise en conformité d'un traitement de données de bout-en-boutMise en conformité d'un traitement de données de bout-en-bout
Mise en conformité d'un traitement de données de bout-en-bout
 
Adoption de Hadoop : des Possibilités Illimitées - Hortonworks and Talend
Adoption de Hadoop : des Possibilités Illimitées - Hortonworks and TalendAdoption de Hadoop : des Possibilités Illimitées - Hortonworks and Talend
Adoption de Hadoop : des Possibilités Illimitées - Hortonworks and Talend
 
Informatica 9 pervasive dq
Informatica 9 pervasive dqInformatica 9 pervasive dq
Informatica 9 pervasive dq
 

Mehr von Jean-Michel Franco

A commonsense approach to data
A commonsense approach to dataA commonsense approach to data
A commonsense approach to dataJean-Michel Franco
 
Reveal the Intelligence in your Data with Talend Data Fabric
Reveal the Intelligence in your Data with Talend Data FabricReveal the Intelligence in your Data with Talend Data Fabric
Reveal the Intelligence in your Data with Talend Data FabricJean-Michel Franco
 
Dévoilez l'essentiel de vos données avec Talend
Dévoilez l'essentiel de vos données avec TalendDévoilez l'essentiel de vos données avec Talend
Dévoilez l'essentiel de vos données avec TalendJean-Michel Franco
 
3 Steps to Turning CCPA & Data Privacy into Personalized Customer Experiences
3 Steps to Turning CCPA & Data Privacy into Personalized Customer Experiences3 Steps to Turning CCPA & Data Privacy into Personalized Customer Experiences
3 Steps to Turning CCPA & Data Privacy into Personalized Customer ExperiencesJean-Michel Franco
 
Delivering data governance with a Yes
Delivering data governance with a YesDelivering data governance with a Yes
Delivering data governance with a YesJean-Michel Franco
 
Delivering data you can trust with Talend 2019
Delivering data you can trust with Talend 2019 Delivering data you can trust with Talend 2019
Delivering data you can trust with Talend 2019 Jean-Michel Franco
 
Delivering data you can trust for data privacy
Delivering data you can trust for data privacy Delivering data you can trust for data privacy
Delivering data you can trust for data privacy Jean-Michel Franco
 
Deliver Data Governance with a “Yes”
Deliver Data Governance with a “Yes”Deliver Data Governance with a “Yes”
Deliver Data Governance with a “Yes”Jean-Michel Franco
 
Libérez vos données avec un catalogue de données
Libérez vos données avec un catalogue de donnéesLibérez vos données avec un catalogue de données
Libérez vos données avec un catalogue de donnéesJean-Michel Franco
 
Liberating data with Talend Data Catalog
Liberating data with Talend Data CatalogLiberating data with Talend Data Catalog
Liberating data with Talend Data CatalogJean-Michel Franco
 
Delivering Analytics at Scale with a Governed Data Lake
Delivering Analytics at Scale with a Governed Data LakeDelivering Analytics at Scale with a Governed Data Lake
Delivering Analytics at Scale with a Governed Data LakeJean-Michel Franco
 
GDPR Benhmark: 70% of companies failing on their own GDPR compliance claims
GDPR Benhmark: 70%  of companies failing on their own GDPR compliance claimsGDPR Benhmark: 70%  of companies failing on their own GDPR compliance claims
GDPR Benhmark: 70% of companies failing on their own GDPR compliance claimsJean-Michel Franco
 
Enacting the data subjects access rights for gdpr with data services and data...
Enacting the data subjects access rights for gdpr with data services and data...Enacting the data subjects access rights for gdpr with data services and data...
Enacting the data subjects access rights for gdpr with data services and data...Jean-Michel Franco
 
Operationalising gdpr compliance with data management
Operationalising gdpr compliance with data managementOperationalising gdpr compliance with data management
Operationalising gdpr compliance with data managementJean-Michel Franco
 
Delivering analytics at scale with a governed data lake
Delivering analytics at scale with a governed data lakeDelivering analytics at scale with a governed data lake
Delivering analytics at scale with a governed data lakeJean-Michel Franco
 
Enacting the Data Subjects Access Rights for GDPR with Data Services and Data...
Enacting the Data Subjects Access Rights for GDPR with Data Services and Data...Enacting the Data Subjects Access Rights for GDPR with Data Services and Data...
Enacting the Data Subjects Access Rights for GDPR with Data Services and Data...Jean-Michel Franco
 
Créer la vue 360° des employés
Créer la vue 360° des employés Créer la vue 360° des employés
Créer la vue 360° des employés Jean-Michel Franco
 
Are Your Data Ready for GDPR? (with MAPR and Talend)
Are Your Data Ready for GDPR? (with MAPR and Talend)Are Your Data Ready for GDPR? (with MAPR and Talend)
Are Your Data Ready for GDPR? (with MAPR and Talend)Jean-Michel Franco
 
Etapes Pratiques Pour La Mise En Conformité Au GDPR avec Talend
Etapes Pratiques Pour La Mise En Conformité Au GDPR avec TalendEtapes Pratiques Pour La Mise En Conformité Au GDPR avec Talend
Etapes Pratiques Pour La Mise En Conformité Au GDPR avec TalendJean-Michel Franco
 

Mehr von Jean-Michel Franco (20)

A commonsense approach to data
A commonsense approach to dataA commonsense approach to data
A commonsense approach to data
 
Reveal the Intelligence in your Data with Talend Data Fabric
Reveal the Intelligence in your Data with Talend Data FabricReveal the Intelligence in your Data with Talend Data Fabric
Reveal the Intelligence in your Data with Talend Data Fabric
 
Dévoilez l'essentiel de vos données avec Talend
Dévoilez l'essentiel de vos données avec TalendDévoilez l'essentiel de vos données avec Talend
Dévoilez l'essentiel de vos données avec Talend
 
3 Steps to Turning CCPA & Data Privacy into Personalized Customer Experiences
3 Steps to Turning CCPA & Data Privacy into Personalized Customer Experiences3 Steps to Turning CCPA & Data Privacy into Personalized Customer Experiences
3 Steps to Turning CCPA & Data Privacy into Personalized Customer Experiences
 
Delivering data governance with a Yes
Delivering data governance with a YesDelivering data governance with a Yes
Delivering data governance with a Yes
 
Delivering data you can trust with Talend 2019
Delivering data you can trust with Talend 2019 Delivering data you can trust with Talend 2019
Delivering data you can trust with Talend 2019
 
Delivering data you can trust for data privacy
Delivering data you can trust for data privacy Delivering data you can trust for data privacy
Delivering data you can trust for data privacy
 
Deliver Data Governance with a “Yes”
Deliver Data Governance with a “Yes”Deliver Data Governance with a “Yes”
Deliver Data Governance with a “Yes”
 
Libérez vos données avec un catalogue de données
Libérez vos données avec un catalogue de donnéesLibérez vos données avec un catalogue de données
Libérez vos données avec un catalogue de données
 
Liberating data with Talend Data Catalog
Liberating data with Talend Data CatalogLiberating data with Talend Data Catalog
Liberating data with Talend Data Catalog
 
Delivering Analytics at Scale with a Governed Data Lake
Delivering Analytics at Scale with a Governed Data LakeDelivering Analytics at Scale with a Governed Data Lake
Delivering Analytics at Scale with a Governed Data Lake
 
GDPR Benhmark: 70% of companies failing on their own GDPR compliance claims
GDPR Benhmark: 70%  of companies failing on their own GDPR compliance claimsGDPR Benhmark: 70%  of companies failing on their own GDPR compliance claims
GDPR Benhmark: 70% of companies failing on their own GDPR compliance claims
 
Enacting the data subjects access rights for gdpr with data services and data...
Enacting the data subjects access rights for gdpr with data services and data...Enacting the data subjects access rights for gdpr with data services and data...
Enacting the data subjects access rights for gdpr with data services and data...
 
Operationalising gdpr compliance with data management
Operationalising gdpr compliance with data managementOperationalising gdpr compliance with data management
Operationalising gdpr compliance with data management
 
Make Data Better Together
Make Data Better Together Make Data Better Together
Make Data Better Together
 
Delivering analytics at scale with a governed data lake
Delivering analytics at scale with a governed data lakeDelivering analytics at scale with a governed data lake
Delivering analytics at scale with a governed data lake
 
Enacting the Data Subjects Access Rights for GDPR with Data Services and Data...
Enacting the Data Subjects Access Rights for GDPR with Data Services and Data...Enacting the Data Subjects Access Rights for GDPR with Data Services and Data...
Enacting the Data Subjects Access Rights for GDPR with Data Services and Data...
 
Créer la vue 360° des employés
Créer la vue 360° des employés Créer la vue 360° des employés
Créer la vue 360° des employés
 
Are Your Data Ready for GDPR? (with MAPR and Talend)
Are Your Data Ready for GDPR? (with MAPR and Talend)Are Your Data Ready for GDPR? (with MAPR and Talend)
Are Your Data Ready for GDPR? (with MAPR and Talend)
 
Etapes Pratiques Pour La Mise En Conformité Au GDPR avec Talend
Etapes Pratiques Pour La Mise En Conformité Au GDPR avec TalendEtapes Pratiques Pour La Mise En Conformité Au GDPR avec Talend
Etapes Pratiques Pour La Mise En Conformité Au GDPR avec Talend
 

Data centric : une plate-forme orientée donnée au coeur de votre organisation

  • 1. © Talend 2014© Talend 2014 Data centric Une plate forme centrée sur les données au service de votre organisation Benjamin Boutros et Jean-Michel Franco bboutros@talend.com jfranco@talend.com (@jmichel_franco)
  • 2. © Talend 2014© Talend 2014 Agenda 1. Talend en bref 2. MDM et Data Gouvernance : pourquoi ? 3. MDM et Data Gouvernance : comment ? 4. Références et cas d’usage 5. MDM et Big Data : l’association gagnante
  • 3. © Talend 2014© Talend 2014 EN BREF • Fondée en 2006 • 400 employés dans 7 pays • Deux sièges : Los Altos, en Californie et Paris, en France • Modèle Open Core • Licence (souscription) • Services et formations Solutions  Solutions d’intégration évolutives pour le Big Data, l’intégration de données et d’applications, la qualité de données, le MDM et BPM.  Classé Leader Visionnaire par Gartner et Forrester sur le marché de l’intégration Présentation de Talend Modèle de déploiement-croissance 2007 2008 2009 2010 2011 2012 VISIBILITE 1,6 million de téléchargements COMMUNAUTÉ DYNAMIQUE 100 000 utilisateurs enregistrés MONÉTISATION 1 800 souscripteurs actifs FIDELITE DES CLIENTS Taux de renouvellement de 86%
  • 4. © Talend 2014© Talend 2014 La Plateforme Talend GESTION DES DONNEES USAGE DE L’INFORMATION
  • 5. © Talend 2014© Talend 2014 Data centric ? L’exemple d’Amazon Connaître son client Elargir son offre produits & services Valoriser tout l’écosystème
  • 6. © Talend 2014© Talend 2014 Talend MDM Client Four- nisseur Produit Actif (Asset) Agence Magasins Organisa tions et codifi- cations Employé MDM et data gouvernance ? Maîtriser le « qui, quoi, comment et où » de vos activités Quoi ? (44%) Comptes Géolocalisation Contrat Nomenclatures Attributs Prix Catalogue Profil Comportement Adresse Identité Qui ? (33%) Territoires Comment ? (21%) Où ? (3%) Standards Compliance Sources : Gartner
  • 7. © Talend 2014© Talend 2014 Fonctionnalités clés d’un MDM Alimentation Capture • Audit des sources • Chargement initial • Insertions / mises à jour, batch et fil de l’eau Rapproche- ments Consolida- tions Enrichisse- ments Distribution Publication • Trouve et relie les doublons potentiels • Algorithmes et arbitrages manuels • Fusionne les doublons avec des règles automatiques et des processus manuels Nettoyage • Corrections (erreurs de saisies, formats…) • Alignement sur un standard • Validation d’adresses postales • Ajoute des informations transverses • Sources externes • Enrichisse- ments et arbitrages manuels • Met les Master Data à disposition de tout le système d’information Le processus MDM
  • 8. © Talend 2014© Talend 2014 1) Intégration des sources Alimentation Capture • Audit des sources • Chargement initial • Insertions / mises à jour, batch et fil de l’eau Rapproche- ments Consolida- tions Enrichisse- ments Distribution Publication • Trouve et relie les doublons potentiels • Algorithmes et arbitrages manuels • Fusionne les doublons avec des règles automatiques et des processus manuels Nettoyage • Corrections (erreurs de saisies, formats…) • Alignement sur un standard • Validation d’adresses postales • Ajoute des informations transverses • Sources externes • Enrichisse- ments et arbitrages manuels • Met les Master Data à disposition de tout le système d’information Le processus MDM Plateforme Talend • Data Profiling: > 100 indicateurs, rapports d’audit, suivi dans le temps • Active Data Model: tous domaines, validation synchrone ou asynchrone • Data Integration: > 500 connecteurs (dans l’ADN de Talend !) • Application Integration: services, messages, routing, mediation…
  • 9. © Talend 2014© Talend 2014 Six dimensions de la qualité de données
  • 10. © Talend 2014© Talend 2014 Complétude • Complétude : le type n’est pas renseigné pour DUPONT PIERRE/DIDIER JOSEPHINE et PAYS est renseignée avec une valeur par défaut La Complétude
  • 11. © Talend 2014© Talend 2014 La Conformité Complétude Conformité • Complétude : le type n’est pas renseigné pour DUPONT PIERRE/DIDIER JOSEPHINE et PAYS est renseignée avec une valeur par défaut • Conformité : l’adresse n’est pas correcte pour DUPONT PIERRE et LAPEYRE
  • 12. © Talend 2014© Talend 2014 La Cohérence Complétude Conformité Cohérence • Complétude : le type n’est pas renseigné pour DUPONT PIERRE/DIDIER JOSEPHINE et PAYS est renseignée avec une valeur par défaut • Conformité : l’adresse n’est pas correcte pour DUPONT PIERRE et LAPEYRE • Cohérence : YAHOO n’est pas une personne et BOUTROS BENJAMIN n’est pas une entreprise
  • 13. © Talend 2014© Talend 2014 L’exactitude… Complétude Conformité Cohérence Exactitude • Complétude : le type n’est pas renseigné pour DUPONT PIERRE/DIDIER JOSEPHINE et PAYS est renseignée avec une valeur par défaut • Conformité : l’adresse n’est pas correcte pour DUPONT PIERRE et LAPEYRE • Cohérence : YAHOO n’est pas une personne et BOUTROS BENJAMIN n’est pas une entreprise • Exactitude : l’information POIDS n’est pas applicable aux entreprises
  • 14. © Talend 2014© Talend 2014 La Duplication Complétude Conformité Cohérence Duplication Exactitude • Complétude : le type n’est pas renseigné pour DUPONT PIERRE/DIDIER JOSEPHINE et PAYS est renseignée avec une valeur par défaut • Conformité : l’adresse n’est pas correcte pour DUPONT PIERRE et LAPEYRE • Cohérence : YAHOO n’est pas une personne et BOUTROS BENJAMIN n’est pas une entreprise • Exactitude : l’information POIDS n’est pas applicable aux entreprises • Duplication : J BLANC et MR JACQUES BLANC sont la même personne
  • 15. © Talend 2014© Talend 2014 L’intégrité Complétude Conformité Cohérence Duplication Intégrité Exactitude • Complétude : le type n’est pas renseigné pour DUPONT PIERRE/DIDIER JOSEPHINE et PAYS est renseignée avec une valeur par défaut • Conformité : l’adresse n’est pas correcte pour DUPONT PIERRE et LAPEYRE • Cohérence : YAHOO n’est pas une personne et BOUTROS BENJAMIN n’est pas une entreprise • Exactitude : l’information POIDS n’est pas applicable aux entreprises • Duplication : J BLANC et MR JACQUES BLANC sont la même personne • Intégrité : le lien qui unit ces deux personnes n’est pas établie dans le fichier
  • 16. © Talend 2014© Talend 2014 2) Nettoyage & alignement des données Alimentation Capture • Audit des sources • Chargement initial • Insertions / mises à jour, batch et fil de l’eau Rapproche- ments Consolida- tions Enrichisse- ments Distribution Publication • Trouve et relie les doublons potentiels • Algorithmes et arbitrages manuels • Fusionne les doublons avec des règles automatiques et des processus manuels Nettoyage • Corrections (erreurs de saisies, formats…) • Alignement sur un standard • Validation d’adresses postales • Ajoute des informations transverses • Sources externes • Enrichisse- ments et arbitrages manuels • Met les Master Data à disposition de tout le système d’information Le processus MDM Plateforme Talend • Data Quality: parsing, synonymes, correspondances, standardisation • Composants specialisés: prenoms, nicknames, telephones… • Composants de validation d’adresses: Google, Uniserv, Loqate…
  • 17. © Talend 2014© Talend 2014 3) Rapprochement (« Entity Resolution », « Record Linkage »…) Alimentation Capture • Audit des sources • Chargement initial • Insertions / mises à jour, batch et fil de l’eau Rapproche- ments Consolida- tions Enrichisse- ments Distribution Publication • Trouve et relie les doublons potentiels • Algorithmes et arbitrages manuels • Fusionne les doublons avec des règles automatiques et des processus manuels Nettoyage • Corrections (erreurs de saisies, formats…) • Alignement sur un standard • Validation d’adresses postales • Ajoute des informations transverses • Sources externes • Enrichisse- ments et arbitrages manuels • Met les Master Data à disposition de tout le système d’information Le processus MDM Plateforme Talend • Algorithmes de matching: détection des similaires, scoring, seuils d’incertitude… • Stewardship Console: visualisation graphique des rapprochements
  • 18. © Talend 2014© Talend 2014 4) Consolidation, « Survivorship » Alimentation Capture • Audit des sources • Chargement initial • Insertions / mises à jour, batch et fil de l’eau Rapproche- ments Consolida- tions Enrichisse- ments Distribution Publication • Trouve et relie les doublons potentiels • Algorithmes et arbitrages manuels • Fusionne les doublons avec des règles automatiques et des processus manuels Nettoyage • Corrections (erreurs de saisies, formats…) • Alignement sur un standard • Validation d’adresses postales • Ajoute des informations transverses • Sources externes • Enrichisse- ments et arbitrages manuels • Met les Master Data à disposition de tout le système d’information Le processus MDM Plateforme Talend • Algorithmes de survivorship: fonctions intégrées et règles personnalisées • Stewardship Console: arbitrage / correction manuelle de la fusion
  • 19. © Talend 2014© Talend 2014 5) Améliorations, enrichissement Alimentation Capture • Audit des sources • Chargement initial • Insertions / mises à jour, batch et fil de l’eau Rapproche- ments Consolida- tions Enrichisse- ments Distribution Publication • Trouve et relie les doublons potentiels • Algorithmes et arbitrages manuels • Fusionne les doublons avec des règles automatiques et des processus manuels Nettoyage • Corrections (erreurs de saisies, formats…) • Alignement sur un standard • Validation d’adresses postales • Ajoute des informations transverses • Sources externes • Enrichisse- ments et arbitrages manuels • Met les Master Data à disposition de tout le système d’information Le processus MDM Plateforme Talend • Formulaires Web: auto-générés sur le modèle, vues dépendantes du rôle, droits d’accès • Workflow: moteur de BPM complet (designer de formulaires métier, rôles, assignations, délégations, deadlines, notifications…)
  • 20. © Talend 2014© Talend 2014 6) Publication, mise à disposition Alimentation Capture • Audit des sources • Chargement initial • Insertions / mises à jour, batch et fil de l’eau Rapproche- ments Consolida- tions Enrichisse- ments Distribution Publication • Trouve et relie les doublons potentiels • Algorithmes et arbitrages manuels • Fusionne les doublons avec des règles automatiques et des processus manuels Nettoyage • Corrections (erreurs de saisies, formats…) • Alignement sur un standard • Validation d’adresses postales • Ajoute des informations transverses • Sources externes • Enrichisse- ments et arbitrages manuels • Met les Master Data à disposition de tout le système d’information Le processus MDM Plateforme Talend • Data Integration: export dans virtuellement n’importe quel format vers n’importe quelle cible • ESB: publication dans le bus de service Talend
  • 21. © Talend 2014© Talend 2014 Client Quelques clients MDM Produit Autres domaines Employés, Founisseurs, Site & Meta-Data Management Reference Data Management Multi-Domaine
  • 22. © Talend 2014© Talend 2014 Etude de cas : Veolia ➜ L’entreprise : • Veolia Propreté est la division de Veolia Environnement spécialisée dans la gestion et la valorisation des déchets.. • Plus de 47 millions d'habitants desservis, 64 291 collaborateurs, 686 unités de traitement, 575000 clients, flotte de 10000 véhicules ➜ L’enjeu: • Produire, de façon automatisée, des indicateurs clés de performance pour la DG et tous les niveaux de l’organisation • Unifier la gestion de l’activité aux travers des organisations et des systèmes d’information ➜ Solution: • Un référentiel des matériels pour les 1200 catégories de déchets traités • Un référentiel véhicules pour les 10000 véhicules de la flotte • Une organisation associée pour le data stewardship ➜ Résultats : • Des processus rationalisé grâce à une élimination des incohérences et doublons (exemple : évolution de 10000 à 1200 codes matériel après la phase de collecte et dédoublonnage. • La capacité à déployer rapidement de nouveaux domaines et l’organisation de gouvernance associée : déploiement de chaque nouveau modèle en 6 à 8 semaines
  • 23. © Talend 2014© Talend 2014 Pourquoi le Big Data a-t-il besoin du MDM et de la data quality ? 23 Extraction du contenu Gestion de la qualité Réconciliation avec les master data Enrichissement Id_Client Prénom Nom Produit Fournisseur Date Montant 92584789 Anne B. TXF98 Dell 24/12/2013 650 € 92584789 Anne B. AXC54 Maped 24/12/2013 2,44 € 92584789 Anne B. TRE56 Playmobil 24/12/2013 129,36 € …. Exemple : la dématérialisation du Père Noël
  • 24. © Talend 2014© Talend 2014 Pourquoi le Big Data a t’il besoin du MDM et de la DQ ? Ex: Du MDM client au « client augmenté » et la recommandation temps réel 24 Customer Data Platform Données de parcours, sentiments et interactions Données décisionnelles Données transactionnelles Centre de contacts Face à face (Boutique, agence…) SMS/Mail/Chat… Service après vente Applications mobiles et Web MDM, Data Quality
  • 25. © Talend 2014© Talend 2014 RUNTIME PLATFORM (JAVA, Hadoop, SQL, etc.) La plate-forme Talend pour le Big Data Talend Platform for Big Data TALEND UNIFIED PLATFORM Studio Repository Deployment Execution Monitoring DATA INTEGRATION Data Access ETL / ELT Version Control Business Rules Change Data Capture Scheduler Parallel Processing High Availability Big DATA QUALITY Hive Data Profiling Drill-down to Values DQ Portal, Monitoring Data Stewardship Report Design Address Validation Custom Analysis M/R Parsing, Matching BIG DATA Hadoop 2.0 MapReduce ETL/ELT Hcatalog/ meta-data Pig, Sqoop, Hive Hadoop Job Scheduler Google Big Query NoSQL SupportHDFS
  • 26. © Talend 2014© Talend 2014 Conclusion – Talend MDM et Data Quality Rapide à implémenter Plateforme avec tous les composants pour le MDM Se prête à l’implémentation incrémentale Approche simple et intuitive Modélisation, configuration, design Pas de programmation, réutilisation des composants Talend VOTRE domaine, VOS règles Modélisation ultra flexible basée sur XML Système évènementiel pour validations & corrections auto Rejoignez la communauté Open Source Basé sur les standards et frameworks Open Source Ouvert et extensible Prêt à embarquer le Big Data Gestion des 4V (volume, variété, vitesse et véracité) Capacité à traiter les données là où elles sont Rapide Simple Flexible Open Extensible
  • 27. © Talend 2014© Talend 2014 Des questions ?

Hinweis der Redaktion

  1. Tout d’abord, j’aimerais prendre quelques instants pour vous parler de Talend et vous présenter l’historique de notre entreprise. (Il y a beaucoup d’informations sur cette diapo et tous les points ne nécessitent pas d’être développés, en fonction du temps disponible).Faits importantsL’entreprise a été fondée en 2006. Nous comptons aujourd’hui environ 400 employés. Nous sommes installés dans 7 pays et possédons deux sièges – un à Los Altos, en Californie et l’autre près de Paris (Suresnes), en France, où l’entreprise a été fondée.Notre modèle commercial est appelé “open core”. Il est unique et un peu différent des modèles traditionnels que vous connaissez via les vendeurs propriétaires proposant des licences perpétuelles. Nous fournissons des licences sous souscription et nous proposons des formations et des services d’expertise et de support. Nous en parlerons plus en détail durant cette présentation. Le modèle open core permet à Talend de fournir de l’intégration à tous les niveaux, vous permettant de consommer ce dont vous avez besoin aujourd’hui et d’augmenter votre utilisation des produits au fur et à mesure que vos besoins évoluent.Vous pouvez constater sur le graphique que Talend a connu une forte croissance depuis sa création et continue de croître à un taux impressionnant (Le TCAM représente le taux de croissance annuel moyen, c’est-à-dire la moyenne de la croissance par an). Modèle de déploiement basé sur la croissanceComment cette croissance a-t-elle été conduite ? Notre modèle commercial est unique et se base sur la philosophie open source dans le domaine des logiciels, sur laquelle l’entreprise à été fondée. Ce modèle permet une connaissance répandue de la marque. Vous pouvez constater que notre produit a été téléchargé plus de 1,6 million de fois, ce qui montre que Talend est non seulement connu d’un large public, mais également que de nombreuses entreprises tirent parti de l’utilisation des produits Talend. Nous en avons la preuve au sein de notre communauté dynamique. Plus de 100 000 utilisateurs enregistrés utilisent activement nos produits et partagent leur expérience. Ils partagent leur apprentissage des produits et comment ils peuvent en faire profiter le reste de la communauté – c’est un arrangement mutuel de partage d’informations, d’expériences et de bonnes pratiques.Vous vous demandez peut-être, “Comment une entreprise open source gagne-t-elle de l’argent ?” Nous réussissons à monétiser la popularité des produits en commercialisant certaines fonctionnalités et en facturant ces produits améliorés via le modèle de souscription que j’ai mentionné. Nous fournissons des fonctionnalités de niveau entreprise complétant la technologie open source au cœur de nos produits.Dans cette diapositive, vous pouvez voir que nous avons plus de 1 800 souscripteurs actifs (sociétés). (Si votre public a vu nos diapositives disant que nous avons 4 000 clients, vous pouvez leur dire que, depuis notre création, nous avons eu 4 000 clients payants bénéficiant des produits Talend). Notre modèle de souscription signifie que nous devons prouver notre valeur chaque année à nos clients. Vous pouvez constater que 86% des clients renouvellent leur licence, ce qui est un taux indiquant un fort taux de fidélité de la part des clients de Talend. C’est la preuve que nos produits fournissent bien la valeur promise, d’une manière peu coûteuse et efficace. (Si l’on vous dit que ce chiffre est trop bas, vous pouvez expliquer que certains projets se terminent et que les licences ne sont plus requises, par exemple pour les projets de migration).SolutionsLa suite de la présentation contient plus de détails concernant nos solutions, mais, en quelques mots, nous fournissons des solutions répondant aux défis de tous les projets d’intégration – de données, d’applications ou orientée processus – mais nous faisons également de la qualité et de la gouvernance de données, puisque ces domaines concernent également les défis d’intégration.Nous sommes reconnus en tant qu’entreprise leader et innovante, notamment dans le marché de l’intégration, mais également dans les domaines que je viens de mentionner. Gartner et Forrester nous positionnent en tant que leader visionnaire dans ces catégories de produits.Si on vous interroge à propos de nos investisseurs, voici quelques informations supplémentaires : Nous avons levé 102 millions de dollars depuis notre création, ce qui nous place parmi les 10 premiers éditeurs privés de solutions Big Data et d’intégration.- Silver Lake Sumeru : notre investisseur le plus récent, Silver Lake Sumeru nous a rejoint lors de l’acquisition de Sopera en 2010. Ils sont le plus grand capital-risqueur de la SiliconValley dans le domaine de la technologie.Balderton Capital : basé à Londres, un des premiers investisseurs de MySQL. Le partenaire chez Balderton qui a conduit cet investissement est Bernard Liautaud, l’ancien fondateur de Business Objects. Il fait maintenant partie de notre Conseil d’Administration. Idinvest Partners: anciennement AGF PrivateEquity, notre premier investisseur, qui a cru en nous dès le début. Bpifrance: notre dernier investisseur en date, banque publique d’investissement, ils investissent dans des sociétés françaises et Talend est vue comme l’entreprise la plus prometteuse de l’industrie du logiciel en France, particulièrement grâce à son succès international et sa croissance rapide. Iris Capital investit généralement aux côté de Bpifrance.
  2. POINT OF SLIDE: proved a standard understanding of what MDM is.MDM supports a business case but what exactly does it DO? Functionally Are these products the same across these two catalogs?Has Paul in accounting approved my request for a new account structure?Is this data valid?Why are these two reports so radically different?How can I better serve my customers?How many customers do we have?
  3. POINT OF SLIDE: proved a standard understanding of what MDM is.MDM supports a business case but what exactly does it DO? Functionally Are these products the same across these two catalogs?Has Paul in accounting approved my request for a new account structure?Is this data valid?Why are these two reports so radically different?How can I better serve my customers?How many customers do we have?
  4. POINT OF SLIDE: proved a standard understanding of what MDM is.MDM supports a business case but what exactly does it DO? Functionally Are these products the same across these two catalogs?Has Paul in accounting approved my request for a new account structure?Is this data valid?Why are these two reports so radically different?How can I better serve my customers?How many customers do we have?
  5. POINT OF SLIDE: proved a standard understanding of what MDM is.MDM supports a business case but what exactly does it DO? Functionally Are these products the same across these two catalogs?Has Paul in accounting approved my request for a new account structure?Is this data valid?Why are these two reports so radically different?How can I better serve my customers?How many customers do we have?
  6. POINT OF SLIDE: proved a standard understanding of what MDM is.MDM supports a business case but what exactly does it DO? Functionally Are these products the same across these two catalogs?Has Paul in accounting approved my request for a new account structure?Is this data valid?Why are these two reports so radically different?How can I better serve my customers?How many customers do we have?
  7. POINT OF SLIDE: proved a standard understanding of what MDM is.MDM supports a business case but what exactly does it DO? Functionally Are these products the same across these two catalogs?Has Paul in accounting approved my request for a new account structure?Is this data valid?Why are these two reports so radically different?How can I better serve my customers?How many customers do we have?
  8. We have seen strong customer momentum in last couple of years across all geographies, domains and industries.British Sugar: British Sugar, a leading supplier of sugar to the UK market has signed a 5 year agreement to implement Talend MDM internally across the business and within their retail arm, Silver Spoon.In a highly competitive market, a company goal for British Sugar is to maintain the best price for sugar and deliver on time to its customers. Large fines are levied by supermarkets for products delivered with any form of data inaccuracy, for example – labeling, product content and incorrect ingredients. Customers will also levy large fines for late delivery if bulk sugar to manufacturing line slides. Cost of delivering to an outdated address can be large. The business decided to upgrade their ERP system and alongside this, create a governance process at departmental level for accurate data validation, cleansing and manipulation.Supplier, Item, CustomerKuoni:Kuinois Global Travel Services and Information Broker between Travel Agencies & providers of Holiday & Tourism ServicesFormerly known as GTA TravelMDM for Customer, Supplier, Product, Location, & Calendar DomainsTo enable more intelligent/effective brokerage of services between their Customers & Suppliers,Ensuring more Revenue is routed directly through Kuoni GTS at the point of booking.i.e. Rather than me going to Egypt and Paying for a Scuba Diving trip with a local company after I arrive (Kuoni Loses this revenue). With effective MDM they can offer these services directly to the Traveller at the point of Booking the Holiday and ensure the revenue is routed through them.VeoliaVeolia An international brand operating in France. Veolia has 9 billion in revenue, 85,600 employees in 33 countries, 819,000 industrial and commercial customersThey service nearly 80 million people.Its line of businesses are Utilities: collection and related services, management of waste disposal facilities, urban cleanliness, sanitationBusiness services: collection, logistics, consolidation and transit, maintenance Industrial Sorting, recycling and treatment of hazardous and non-hazardousMaterial recovery, energy and agricultural Current business environment requires the ability to more, faster with fewer resources, Create products faster, Better serve the customer,Improve reporting and metrics,Optimize the supply chain, Identify new opportunities, Increase revenues, Mergers and acquisitions,Align with legal requirements What do they master: Assets, Products, Now – Employees
  9. Key CapabilitiesIntegrates big data with big data platforms and appliances without codingImproves big data quality and information accuracySimplifies big data project governance and administration
  10. Talend has answered all these market considerations with the introduction of Talend MDM.Talend MDM is rapid to implement. We are the first solution to build integration, quality, all the master data management components such as hierarchies and modeling and workflow all ON a single platform. There is one simple install for all the features across all categories. Everything is installed and connected in under ten minutes. Other vendors require development to cobble the features together.This approach also allows the master data to be IN CONTROL of its own destiny. Because we have integration, quality and workflow unified with MDM. The master data has direct access to each of these functions. More about this a little later.Talend MDM is a flexible general MDM solution. We do not ship with a rigid domain model like other products. The Active Data model allows you to master any data and on your terms. We provide intuitive graphical tools to create the data model and a unique set of processes and triggers to help you implement corresponding business processes. We also provide an easy to use method for importing a data model and corresponding business processes into the solution to get you started quickly.Our unique XML based approach also allows us to provide a dynamic web based interface for collaborating, authoring and searching on hub data. As the data model changes so do corresponding services and any web forms.Talend is dedicated to the open source community. We are not a proprietary black box solution. We provide code so that you can modify and extend as necessary.Download software TODAY. get started today. show real business value NOW.Join the community. Gain value from thousands
  11. Thank you again for the opportunity to speak with you about Talend and how we believe that we can help your organization manage all of your integration needs.I’ll take questions at this time.