SlideShare ist ein Scribd-Unternehmen logo
1 von 25
Downloaden Sie, um offline zu lesen
Donnez votre avis !
                   Depuis votre smartphone, sur :
                    http://notes.mstechdays.fr

    De nombreux lots à gagner toutes les heures !!!
               Claviers, souris et jeux Microsoft…

       Merci de nous aider à améliorer les TechDays

http://notes.mstechdays.fr
Qu'est-ce que la qualité des
                  données
       et comment avoir des données
                 de qualité ?
             DQS nous répond

                                       Mounia BOURDACHE
                                         Consultante en BI
                                          Microsoft France

Serveurs / Entreprise / Réseaux / IT
Chapitre 1

         QU’EST CE QUE LA QUALITÉ DES
         DONNÉES?
Data Quality Services
INTRODUCTION
            Entreprise   Exploite   Information   Fournissent   Données




Data Quality Services
COÛT DE LA NON QUALITÉ DES DONNÉES
       Les données causant disfonctionnement et surcout restent toujours trop nombreuses
       (Coût moyen sur le CA des Entreprises: de 3 à 6%).


       Le traitement des données et leur correction a toujours été un soucis important à gérer.

       En 2011 et 2012 la qualité des données a été:

       - 3e obstacle à la bonne gestion de l’information (après l’accès trop lent à des données sûres et la
          mauvaise intégration des données)
       - 1er obstacle à l’adoption de la BI au sein des Entreprises
       - 1er facteur à l’origine de la mise en œuvre du MDM au sein des Entreprises.



Data Quality Services
QU’EST CE QUE DE MAUVAISES DONNÉES ?
          Données erronées ou
                                 Données en doublon
             incohérentes




Data Quality Services
COMMENT EST MESURÉE LA QUALITÉ DES DONNÉES?
       La qualité des données est mesurée en fonction de leur utilisation.




       Mauvaises données et/ou Mauvaise connaissance de leur utilisation  Mauvais Business
Data Quality Services
Chapitre 2

         COMMENT AVOIR DES DONNÉES DE
         QUALITÉ?
Data Quality Services
DATA QUALITY SERVICES : DQS
        Data Quality Services (DQS) est une solution fondée sur les connaissances.
         Elle permet aux professionnels de l'informatique et aux gestionnaires de
                données d’améliorer facilement la qualité de leurs données
      Des données de bonne qualité sont essentielles à une Business Intelligence efficace

      DQS est un outil intégré à SQL Server 2012, dont les bases de connaissance peuvent
       non seulement être générées mais aussi récupérées via des connecteurs à des tiers
       fournisseurs hébergés sur Azure DataMarket.

      Enrichir les bases de connaissances dans le cloud facilitera l’accès à des données de
       haute qualité.


Data Quality Services
CONCEPT DE LA SOLUTION DQS
                                                     Basée sur une base de connaissance DQ
                        Fondée sur la connaissance   Knowledge Base (DQKB) enrichissable et
                                                     réutilisable
                                                     Les Domaines capturent la
                        Sémantique
                                                     sémantique des données

                                                     Enrichit ses connaissances plus elle
                        Acquiert des connaissances   est utilisée

                                                     Ajout de bases de connaissances générées
                        Ouverte et extensible        et données référencées par des tiers
                                                     fournisseurs

                                                     Interface simple d’utilisation
                        Facile à utiliser

Data Quality Services
LE PROCESS DE DQS




Data Quality Services
MODÉLISATION DQS
                                          Nettoyage des données
        Création (ou import)           (Sources: BDD SQL / xls / csv)
           des Bases de                    Via interface utilisateur
           connaissance               « DQS Client » ou composant SSIS.

        Gestion des Domaines   Standardisation et       Détection des doublons
                               correction des données   et statistiques des
       Données de référence                             données
        Administration des
        règles de
        dédoublonnage




Data Quality Services
COMPOSANTS DE LA SOLUTION DQS
               Modifier, supprimer,
              enrichir et normaliser                            Identifier, réunir ou
                  des données                                  fusionner les entrées
                   inexactes ou                                     connexes.
                  incomplètes.         Nettoyage   Dédoublo-
                                                   nnage




                                       Profilage   Contrôle
               Analyser la source de                            Suivre et contrôler
               données afin d’avoir                             l'état de la qualité
                 un aperçu de la                                   des données.
               qualité des données.




Data Quality Services
PROBLÈMES DE QUALITÉ DE DONNES LES
      PLUS FRÉQUENTS
            Standardisation   Dans une source de données le genre est F, H.
                              Dans l’autre c’est Mr, Mme
            Complétude        Quel est le pourcentage des fiches Clients ne
                              contenant pas d’Email?
            Validité          Est-ce que tous mes codes postaux français hors
                              Corse et Outre-Mer contiennent 5 chiffres?
            Cohérence         Mes clients étudiants ont-ils bien moins de 26
                              ans? Donc peuvent bénéficier des réductions?
            Unicité           Ai-je bien une fiche Client par Client?

Data Quality Services
SOLUTIONS APPORTÉES PAR DQS

                        Civilité   Nom             Num Rue    Nom Rue        Code Postal Ville                Date Naissance
                        Mr         BERNIER Laurent         15 RUE DE LA PAIX               Issy les Mx              01/05/1908
 Nettoyage
                        M.         BERINER Laurent            RUE DE LA PAIE         92130 Saint cloud              01/05/1980




                        Civilité   Nom             Num Rue    Nom Rue        Code Postal Ville                 Date Naissance
                        Monsieur   BERNIER Laurent         15 RUE DE LA PAIX         92130 Issy Les Moulineaux
 Dédou-                 Monsieur   BERINER Laurent            RUE DE LA PAIX         92130 Issy Les Moulineaux       01/05/1980
 blonnage
                        Civilité   Nom             Num Rue    Nom Rue        Code Postal   Ville               Date Naissance
                        Monsieur   BERNIER Laurent         15 RUE DE LA PAIX         92130 Issy Les Moulineaux       01/05/1980




Data Quality Services
DQS PAR LE BIAIS DE SSIS
      Utilisation du
       moteur DQS au
       sein même de
       l’environnement
       SSIS

      Gestion de la
       qualité des
       données en
       même temps que
       le processus
       d’intégration.

Data Quality Services
DÉMONSTRATION

Data Quality Services
Data Quality Services
ANNEXES

Data Quality Services
ARCHITECTURE DQS

Data Quality Services
Client DQ            Azure Datamarket
    Clients
      DQS interface         Catégorisation des services       Catégorisation des           MS DQ
                             de données de référence         données de références       Domains Store
       Découverte et
        gestion des
         bases de                     RD Services API           Réference Data API              Tiers
       connaissances    DQ Server        (Parcourir,            (Parcourir, ajouter,            fournisseurs
                                    paramétrer, Valider…)         mettre à jour…)
         Projets DQ
                        DQ Engine
        Exploration                                              Nettoygae
          base de         Découverte DB      Profilage des
                                                                                 Référentiels
          donnée           connaissance        données         Dédoublonnage

       Composant DQ
           SSIS

     MDS Excel Add in      DQ Active
                                                 Domaine      Domaines             BDC
                            Projects               MS          locaux            publiées
     Composants Excel
       & Dynamics

Data Quality Services
LIENS UTILES

Data Quality Services
BlOG:

                        Blogs.msdn.com/b/dqs


                        VIDEOS:

                        http://technet.microsoft.com/fr-fr/sqlserver/dd353197



                        FORUM:
                        http://social.msdn.microsoft.com/Forums/fr-
                        FR/sqldataqualityservices/threads?Thread%3Asqldataqualityser
                        vices=Microsoft.Forums.Data.Models.DiscussionGroup

Data Quality Services
Développeurs                                                         Pros de l’IT
 http://aka.ms/generation-app       Formez-vous en ligne        www.microsoftvirtualacademy.com

    http://aka.ms/evenements-
                 developpeurs     Retrouvez nos évènements      http://aka.ms/itcamps-france


            Les accélérateurs
                                  Faites-vous accompagner
Windows Azure, Windows Phone,
                                  gratuitement
                   Windows 8


                                   Essayer gratuitement nos     http://aka.ms/telechargements
                                                 solutions IT

         La Dev’Team sur MSDN       Retrouver nos experts       L’IT Team sur TechNet
          http://aka.ms/devteam           Microsoft             http://aka.ms/itteam
Qu’est-ce que la qualité des données et comment avoir des données de qualité ? DQS nous répond.

Más contenido relacionado

Was ist angesagt?

Projet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des donnéesProjet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des donnéesJean-Marc Dupont
 
Big Data, Hadoop & Spark
Big Data, Hadoop & SparkBig Data, Hadoop & Spark
Big Data, Hadoop & SparkAlexia Audevart
 
TP1 Big Data - MapReduce
TP1 Big Data - MapReduceTP1 Big Data - MapReduce
TP1 Big Data - MapReduceAmal Abid
 
Présentation data warehouse etl et olap
Présentation data warehouse etl et olapPrésentation data warehouse etl et olap
Présentation data warehouse etl et olapCynapsys It Hotspot
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1Amal Abid
 
BigData_TP3 : Spark
BigData_TP3 : SparkBigData_TP3 : Spark
BigData_TP3 : SparkLilia Sfaxi
 
Introduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniquesIntroduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniquesIsmail CHAIB
 
Master Data Management : quels outils ? quelles bonnes pratiques ?
Master Data Management : quels outils ? quelles bonnes pratiques ?Master Data Management : quels outils ? quelles bonnes pratiques ?
Master Data Management : quels outils ? quelles bonnes pratiques ?Jean-Michel Franco
 
Les Base de Données NOSQL
Les Base de Données NOSQLLes Base de Données NOSQL
Les Base de Données NOSQLkamar MEDDAH
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business IntelligenceLilia Sfaxi
 
Mémoire de fin d'étude - La big data et les réseaux sociaux
Mémoire de fin d'étude - La big data et les réseaux sociauxMémoire de fin d'étude - La big data et les réseaux sociaux
Mémoire de fin d'étude - La big data et les réseaux sociauxChloé Marty
 
Cours Big Data Chap4 - Spark
Cours Big Data Chap4 - SparkCours Big Data Chap4 - Spark
Cours Big Data Chap4 - SparkAmal Abid
 
BigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceBigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceLilia Sfaxi
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessVincent de Stoecklin
 
DataWarehouse
DataWarehouseDataWarehouse
DataWarehousenzuguem
 
Introduction au big data
Introduction au big dataIntroduction au big data
Introduction au big dataAbdelghani Azri
 
Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.arnaudm
 

Was ist angesagt? (20)

Projet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des donnéesProjet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des données
 
Big Data, Hadoop & Spark
Big Data, Hadoop & SparkBig Data, Hadoop & Spark
Big Data, Hadoop & Spark
 
TP1 Big Data - MapReduce
TP1 Big Data - MapReduceTP1 Big Data - MapReduce
TP1 Big Data - MapReduce
 
Présentation data warehouse etl et olap
Présentation data warehouse etl et olapPrésentation data warehouse etl et olap
Présentation data warehouse etl et olap
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
 
Big data
Big dataBig data
Big data
 
Chapitre i-intro
Chapitre i-introChapitre i-intro
Chapitre i-intro
 
BigData_TP3 : Spark
BigData_TP3 : SparkBigData_TP3 : Spark
BigData_TP3 : Spark
 
Introduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniquesIntroduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniques
 
Master Data Management : quels outils ? quelles bonnes pratiques ?
Master Data Management : quels outils ? quelles bonnes pratiques ?Master Data Management : quels outils ? quelles bonnes pratiques ?
Master Data Management : quels outils ? quelles bonnes pratiques ?
 
Les Base de Données NOSQL
Les Base de Données NOSQLLes Base de Données NOSQL
Les Base de Données NOSQL
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Mémoire de fin d'étude - La big data et les réseaux sociaux
Mémoire de fin d'étude - La big data et les réseaux sociauxMémoire de fin d'étude - La big data et les réseaux sociaux
Mémoire de fin d'étude - La big data et les réseaux sociaux
 
Cours Big Data Chap4 - Spark
Cours Big Data Chap4 - SparkCours Big Data Chap4 - Spark
Cours Big Data Chap4 - Spark
 
BigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceBigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-Reduce
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-business
 
Le processus ETL (Extraction, Transformation, Chargement)
Le processus ETL (Extraction, Transformation, Chargement)Le processus ETL (Extraction, Transformation, Chargement)
Le processus ETL (Extraction, Transformation, Chargement)
 
DataWarehouse
DataWarehouseDataWarehouse
DataWarehouse
 
Introduction au big data
Introduction au big dataIntroduction au big data
Introduction au big data
 
Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.
 

Andere mochten auch

Présentation opendata christiangendreau
Présentation opendata christiangendreauPrésentation opendata christiangendreau
Présentation opendata christiangendreaumontrealouvert
 
Presentation2 essai
Presentation2 essaiPresentation2 essai
Presentation2 essaiXsomeone
 
Lead auditor iso 9001 bsi vn training
Lead auditor iso 9001 bsi vn trainingLead auditor iso 9001 bsi vn training
Lead auditor iso 9001 bsi vn trainingHatrung Le
 
Licences pour les données et les métadonnées
Licences pour les données et les métadonnéesLicences pour les données et les métadonnées
Licences pour les données et les métadonnéesOpen Data Support
 
Huong Dan Ap Dung ISO 9001
Huong Dan Ap Dung ISO 9001Huong Dan Ap Dung ISO 9001
Huong Dan Ap Dung ISO 9001Phi Jack
 
Introduction à la gestion des métadonnées
Introduction à la gestion des métadonnéesIntroduction à la gestion des métadonnées
Introduction à la gestion des métadonnéesOpen Data Support
 
Tài liệu iso 9001-2015
Tài liệu iso 9001-2015Tài liệu iso 9001-2015
Tài liệu iso 9001-2015hopchuanhopquy
 
Le cycle de vie des Données et Métadonnées Publiques Liées Ouvertes
Le cycle de vie des Données et Métadonnées Publiques Liées OuvertesLe cycle de vie des Données et Métadonnées Publiques Liées Ouvertes
Le cycle de vie des Données et Métadonnées Publiques Liées OuvertesOpen Data Support
 
ISO 9001:2015 Hệ thống quản lý chất lượng - các yêu cầu
ISO 9001:2015 Hệ thống quản lý chất lượng - các yêu cầu ISO 9001:2015 Hệ thống quản lý chất lượng - các yêu cầu
ISO 9001:2015 Hệ thống quản lý chất lượng - các yêu cầu Luong NguyenThanh
 
Deepening the Dive into ISO 14001:2015
Deepening the Dive into ISO 14001:2015Deepening the Dive into ISO 14001:2015
Deepening the Dive into ISO 14001:2015DQS Inc.
 
ISO 14001:2015 Significant Aspects sheet
ISO 14001:2015 Significant Aspects sheet ISO 14001:2015 Significant Aspects sheet
ISO 14001:2015 Significant Aspects sheet Tim Matthews
 
ISO 13485:2016 Revisions Webinar
ISO 13485:2016 Revisions WebinarISO 13485:2016 Revisions Webinar
ISO 13485:2016 Revisions WebinarDQS Inc.
 
ISO 14001:2015 managment system manual sample
ISO 14001:2015 managment system manual sample  ISO 14001:2015 managment system manual sample
ISO 14001:2015 managment system manual sample Tim Matthews
 
Entorno Natural y Social
Entorno Natural y  SocialEntorno Natural y  Social
Entorno Natural y Socialazuhilda
 
La computadora y sus partes.
La computadora y sus partes.La computadora y sus partes.
La computadora y sus partes.Eidy_Manco
 
Sicherheitswirtschaft in Berlin und Brandenburg
Sicherheitswirtschaft in Berlin und BrandenburgSicherheitswirtschaft in Berlin und Brandenburg
Sicherheitswirtschaft in Berlin und BrandenburgProjekt Zukunft Berlin
 
Présentation alp finale 24/06/2013
Présentation alp finale 24/06/2013Présentation alp finale 24/06/2013
Présentation alp finale 24/06/2013FernanPatty
 

Andere mochten auch (20)

DQS India
DQS IndiaDQS India
DQS India
 
Présentation opendata christiangendreau
Présentation opendata christiangendreauPrésentation opendata christiangendreau
Présentation opendata christiangendreau
 
Presentation2 essai
Presentation2 essaiPresentation2 essai
Presentation2 essai
 
Lead auditor iso 9001 bsi vn training
Lead auditor iso 9001 bsi vn trainingLead auditor iso 9001 bsi vn training
Lead auditor iso 9001 bsi vn training
 
Licences pour les données et les métadonnées
Licences pour les données et les métadonnéesLicences pour les données et les métadonnées
Licences pour les données et les métadonnées
 
Huong Dan Ap Dung ISO 9001
Huong Dan Ap Dung ISO 9001Huong Dan Ap Dung ISO 9001
Huong Dan Ap Dung ISO 9001
 
Introduction à la gestion des métadonnées
Introduction à la gestion des métadonnéesIntroduction à la gestion des métadonnées
Introduction à la gestion des métadonnées
 
Tài liệu iso 9001-2015
Tài liệu iso 9001-2015Tài liệu iso 9001-2015
Tài liệu iso 9001-2015
 
Le cycle de vie des Données et Métadonnées Publiques Liées Ouvertes
Le cycle de vie des Données et Métadonnées Publiques Liées OuvertesLe cycle de vie des Données et Métadonnées Publiques Liées Ouvertes
Le cycle de vie des Données et Métadonnées Publiques Liées Ouvertes
 
ISO 9001:2015 Hệ thống quản lý chất lượng - các yêu cầu
ISO 9001:2015 Hệ thống quản lý chất lượng - các yêu cầu ISO 9001:2015 Hệ thống quản lý chất lượng - các yêu cầu
ISO 9001:2015 Hệ thống quản lý chất lượng - các yêu cầu
 
Deepening the Dive into ISO 14001:2015
Deepening the Dive into ISO 14001:2015Deepening the Dive into ISO 14001:2015
Deepening the Dive into ISO 14001:2015
 
ISO 14001:2015 Significant Aspects sheet
ISO 14001:2015 Significant Aspects sheet ISO 14001:2015 Significant Aspects sheet
ISO 14001:2015 Significant Aspects sheet
 
ISO 13485:2016 Revisions Webinar
ISO 13485:2016 Revisions WebinarISO 13485:2016 Revisions Webinar
ISO 13485:2016 Revisions Webinar
 
ISO 14001:2015 managment system manual sample
ISO 14001:2015 managment system manual sample  ISO 14001:2015 managment system manual sample
ISO 14001:2015 managment system manual sample
 
Entorno Natural y Social
Entorno Natural y  SocialEntorno Natural y  Social
Entorno Natural y Social
 
Twitter
TwitterTwitter
Twitter
 
La computadora y sus partes.
La computadora y sus partes.La computadora y sus partes.
La computadora y sus partes.
 
Sicherheitswirtschaft in Berlin und Brandenburg
Sicherheitswirtschaft in Berlin und BrandenburgSicherheitswirtschaft in Berlin und Brandenburg
Sicherheitswirtschaft in Berlin und Brandenburg
 
Libro 101-razones
Libro 101-razonesLibro 101-razones
Libro 101-razones
 
Présentation alp finale 24/06/2013
Présentation alp finale 24/06/2013Présentation alp finale 24/06/2013
Présentation alp finale 24/06/2013
 

Ähnlich wie Qu’est-ce que la qualité des données et comment avoir des données de qualité ? DQS nous répond.

La qualité des données à l’ère du Big Data
La qualité des données à l’ère du Big DataLa qualité des données à l’ère du Big Data
La qualité des données à l’ère du Big DataPrecisely
 
Mettre en Oeuvre une Plateforme d'Intégration et de Gestion des Informations ...
Mettre en Oeuvre une Plateforme d'Intégration et de Gestion des Informations ...Mettre en Oeuvre une Plateforme d'Intégration et de Gestion des Informations ...
Mettre en Oeuvre une Plateforme d'Intégration et de Gestion des Informations ...Microsoft Décideurs IT
 
Gouvernance des données avec SQL Server et ETL en Self-Service avec Data Expl...
Gouvernance des données avec SQL Server et ETL en Self-Service avec Data Expl...Gouvernance des données avec SQL Server et ETL en Self-Service avec Data Expl...
Gouvernance des données avec SQL Server et ETL en Self-Service avec Data Expl...Microsoft Décideurs IT
 
Découvrez comment créer une solution complète de gouvernance des données
Découvrez comment créer une solution complète de gouvernance des donnéesDécouvrez comment créer une solution complète de gouvernance des données
Découvrez comment créer une solution complète de gouvernance des donnéesPrecisely
 
IBM Information Management - Pas de décision de qualité sans informations de ...
IBM Information Management - Pas de décision de qualité sans informations de ...IBM Information Management - Pas de décision de qualité sans informations de ...
IBM Information Management - Pas de décision de qualité sans informations de ...Nicolas Desachy
 
wskhlfdm,dsl,sfl
wskhlfdm,dsl,sflwskhlfdm,dsl,sfl
wskhlfdm,dsl,sflcoconimal
 
INFORMATION BUILDERS - Comment integrer les big data a votre SI - Data foru...
INFORMATION BUILDERS -  Comment integrer les big data a votre SI -  Data foru...INFORMATION BUILDERS -  Comment integrer les big data a votre SI -  Data foru...
INFORMATION BUILDERS - Comment integrer les big data a votre SI - Data foru...Micropole Group
 
Micropole Data Forum 2017 - Atelier Pitney Bowes
Micropole Data Forum 2017 - Atelier Pitney BowesMicropole Data Forum 2017 - Atelier Pitney Bowes
Micropole Data Forum 2017 - Atelier Pitney BowesMicropole Group
 
Réinventez votre stratégie de données en 2021 avec la Data Virtualization
Réinventez votre stratégie de données en 2021 avec la Data VirtualizationRéinventez votre stratégie de données en 2021 avec la Data Virtualization
Réinventez votre stratégie de données en 2021 avec la Data VirtualizationDenodo
 
#Wud : dataviz & UX par Caroline Goulard (Dataveyes)
#Wud : dataviz & UX par Caroline Goulard (Dataveyes)#Wud : dataviz & UX par Caroline Goulard (Dataveyes)
#Wud : dataviz & UX par Caroline Goulard (Dataveyes)Dataveyes
 
Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDenodo
 
Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDenodo
 
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationSession découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationDenodo
 
Talend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric CarboneTalend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric CarboneCedric CARBONE
 
Prendre la data par le bon sens
Prendre la data par le bon sensPrendre la data par le bon sens
Prendre la data par le bon sensJean-Michel Franco
 
Le référentiel employé pour tirer toute la valeur de vos données RH
Le référentiel employé pour tirer toute la valeur de vos données RHLe référentiel employé pour tirer toute la valeur de vos données RH
Le référentiel employé pour tirer toute la valeur de vos données RHJean-Michel Franco
 
Presentation corporate hitachi data systems 2012
Presentation corporate hitachi data systems 2012Presentation corporate hitachi data systems 2012
Presentation corporate hitachi data systems 2012Hitachi Data Systems France
 

Ähnlich wie Qu’est-ce que la qualité des données et comment avoir des données de qualité ? DQS nous répond. (20)

La qualité des données à l’ère du Big Data
La qualité des données à l’ère du Big DataLa qualité des données à l’ère du Big Data
La qualité des données à l’ère du Big Data
 
Informatica 9 pervasive dq
Informatica 9 pervasive dqInformatica 9 pervasive dq
Informatica 9 pervasive dq
 
Mettre en Oeuvre une Plateforme d'Intégration et de Gestion des Informations ...
Mettre en Oeuvre une Plateforme d'Intégration et de Gestion des Informations ...Mettre en Oeuvre une Plateforme d'Intégration et de Gestion des Informations ...
Mettre en Oeuvre une Plateforme d'Intégration et de Gestion des Informations ...
 
Gouvernance des données avec SQL Server et ETL en Self-Service avec Data Expl...
Gouvernance des données avec SQL Server et ETL en Self-Service avec Data Expl...Gouvernance des données avec SQL Server et ETL en Self-Service avec Data Expl...
Gouvernance des données avec SQL Server et ETL en Self-Service avec Data Expl...
 
Découvrez comment créer une solution complète de gouvernance des données
Découvrez comment créer une solution complète de gouvernance des donnéesDécouvrez comment créer une solution complète de gouvernance des données
Découvrez comment créer une solution complète de gouvernance des données
 
IBM Information Management - Pas de décision de qualité sans informations de ...
IBM Information Management - Pas de décision de qualité sans informations de ...IBM Information Management - Pas de décision de qualité sans informations de ...
IBM Information Management - Pas de décision de qualité sans informations de ...
 
wskhlfdm,dsl,sfl
wskhlfdm,dsl,sflwskhlfdm,dsl,sfl
wskhlfdm,dsl,sfl
 
Veda Solutions Sommaire
Veda Solutions   SommaireVeda Solutions   Sommaire
Veda Solutions Sommaire
 
INFORMATION BUILDERS - Comment integrer les big data a votre SI - Data foru...
INFORMATION BUILDERS -  Comment integrer les big data a votre SI -  Data foru...INFORMATION BUILDERS -  Comment integrer les big data a votre SI -  Data foru...
INFORMATION BUILDERS - Comment integrer les big data a votre SI - Data foru...
 
Micropole Data Forum 2017 - Atelier Pitney Bowes
Micropole Data Forum 2017 - Atelier Pitney BowesMicropole Data Forum 2017 - Atelier Pitney Bowes
Micropole Data Forum 2017 - Atelier Pitney Bowes
 
Réinventez votre stratégie de données en 2021 avec la Data Virtualization
Réinventez votre stratégie de données en 2021 avec la Data VirtualizationRéinventez votre stratégie de données en 2021 avec la Data Virtualization
Réinventez votre stratégie de données en 2021 avec la Data Virtualization
 
#Wud : dataviz & UX par Caroline Goulard (Dataveyes)
#Wud : dataviz & UX par Caroline Goulard (Dataveyes)#Wud : dataviz & UX par Caroline Goulard (Dataveyes)
#Wud : dataviz & UX par Caroline Goulard (Dataveyes)
 
Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data Virtualization
 
Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data Virtualization
 
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationSession découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
 
Talend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric CarboneTalend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric Carbone
 
Prendre la data par le bon sens
Prendre la data par le bon sensPrendre la data par le bon sens
Prendre la data par le bon sens
 
Le référentiel employé pour tirer toute la valeur de vos données RH
Le référentiel employé pour tirer toute la valeur de vos données RHLe référentiel employé pour tirer toute la valeur de vos données RH
Le référentiel employé pour tirer toute la valeur de vos données RH
 
Presentation corporate hitachi data systems 2012
Presentation corporate hitachi data systems 2012Presentation corporate hitachi data systems 2012
Presentation corporate hitachi data systems 2012
 
Informatica 9 soa
Informatica 9 soaInformatica 9 soa
Informatica 9 soa
 

Mehr von Microsoft Décideurs IT

Lync : intégration et interopérabilité à votre existant, quoi de neuf ?
Lync : intégration et interopérabilité à votre existant, quoi de neuf ?Lync : intégration et interopérabilité à votre existant, quoi de neuf ?
Lync : intégration et interopérabilité à votre existant, quoi de neuf ?Microsoft Décideurs IT
 
Lync : intégration et interopérabilité à votre existant, quoi de neuf ?
Lync : intégration et interopérabilité à votre existant, quoi de neuf ?Lync : intégration et interopérabilité à votre existant, quoi de neuf ?
Lync : intégration et interopérabilité à votre existant, quoi de neuf ?Microsoft Décideurs IT
 
Windows Server vNext- virtualisation et stockage
Windows Server vNext- virtualisation et stockageWindows Server vNext- virtualisation et stockage
Windows Server vNext- virtualisation et stockageMicrosoft Décideurs IT
 
Azure IaaS pour les IT - Demo Extravaganza
Azure IaaS pour les IT - Demo ExtravaganzaAzure IaaS pour les IT - Demo Extravaganza
Azure IaaS pour les IT - Demo ExtravaganzaMicrosoft Décideurs IT
 
Windows Server vNext- administration et réseau
Windows Server vNext- administration et réseauWindows Server vNext- administration et réseau
Windows Server vNext- administration et réseauMicrosoft Décideurs IT
 
Retour d’expérience de Sarenza sur la façon de piloter un projet Power BI
Retour d’expérience de Sarenza sur la façon de piloter un projet Power BIRetour d’expérience de Sarenza sur la façon de piloter un projet Power BI
Retour d’expérience de Sarenza sur la façon de piloter un projet Power BIMicrosoft Décideurs IT
 
Big Data et Business Intelligence de A… Azure
Big Data et Business Intelligence de A… AzureBig Data et Business Intelligence de A… Azure
Big Data et Business Intelligence de A… AzureMicrosoft Décideurs IT
 
Windows Server 2003 EOS : l'opportunité de repenser votre IT et mettre en pla...
Windows Server 2003 EOS : l'opportunité de repenser votre IT et mettre en pla...Windows Server 2003 EOS : l'opportunité de repenser votre IT et mettre en pla...
Windows Server 2003 EOS : l'opportunité de repenser votre IT et mettre en pla...Microsoft Décideurs IT
 
Architectures hybrides: Intégrer vos données métiers dans vos applications cl...
Architectures hybrides: Intégrer vos données métiers dans vos applications cl...Architectures hybrides: Intégrer vos données métiers dans vos applications cl...
Architectures hybrides: Intégrer vos données métiers dans vos applications cl...Microsoft Décideurs IT
 
Reprenez la main sur vos applications SharePoint en mesurant et en optimisant...
Reprenez la main sur vos applications SharePoint en mesurant et en optimisant...Reprenez la main sur vos applications SharePoint en mesurant et en optimisant...
Reprenez la main sur vos applications SharePoint en mesurant et en optimisant...Microsoft Décideurs IT
 
Windows Server 2003 EOS : l'opportunité de repenser votre IT et mettre en pla...
Windows Server 2003 EOS : l'opportunité de repenser votre IT et mettre en pla...Windows Server 2003 EOS : l'opportunité de repenser votre IT et mettre en pla...
Windows Server 2003 EOS : l'opportunité de repenser votre IT et mettre en pla...Microsoft Décideurs IT
 
La collaboration dans Exchange : comparaison on premises et online
La collaboration dans Exchange : comparaison on premises et onlineLa collaboration dans Exchange : comparaison on premises et online
La collaboration dans Exchange : comparaison on premises et onlineMicrosoft Décideurs IT
 
Exchange / Office 365 comment faire un déploiement hybride
Exchange / Office 365 comment faire un déploiement hybrideExchange / Office 365 comment faire un déploiement hybride
Exchange / Office 365 comment faire un déploiement hybrideMicrosoft Décideurs IT
 
Sécurité Active Directory: Etablir un référentiel
Sécurité Active Directory: Etablir un référentielSécurité Active Directory: Etablir un référentiel
Sécurité Active Directory: Etablir un référentielMicrosoft Décideurs IT
 
Cas d’étude : Comment simplifier vos backups dans le cloud grâce à VEEAM et M...
Cas d’étude : Comment simplifier vos backups dans le cloud grâce à VEEAM et M...Cas d’étude : Comment simplifier vos backups dans le cloud grâce à VEEAM et M...
Cas d’étude : Comment simplifier vos backups dans le cloud grâce à VEEAM et M...Microsoft Décideurs IT
 
Industrialisez le déploiement de vos infrastructures Cloud depuis votre systè...
Industrialisez le déploiement de vos infrastructures Cloud depuis votre systè...Industrialisez le déploiement de vos infrastructures Cloud depuis votre systè...
Industrialisez le déploiement de vos infrastructures Cloud depuis votre systè...Microsoft Décideurs IT
 
Comment bâtir un cloud hybride en mode IaaS ou SaaS et apporter le meilleur d...
Comment bâtir un cloud hybride en mode IaaS ou SaaS et apporter le meilleur d...Comment bâtir un cloud hybride en mode IaaS ou SaaS et apporter le meilleur d...
Comment bâtir un cloud hybride en mode IaaS ou SaaS et apporter le meilleur d...Microsoft Décideurs IT
 
Migrer de 2003 à 2012 R2, adopter HyperV ou Microsoft Azure : comment réalise...
Migrer de 2003 à 2012 R2, adopter HyperV ou Microsoft Azure : comment réalise...Migrer de 2003 à 2012 R2, adopter HyperV ou Microsoft Azure : comment réalise...
Migrer de 2003 à 2012 R2, adopter HyperV ou Microsoft Azure : comment réalise...Microsoft Décideurs IT
 

Mehr von Microsoft Décideurs IT (20)

Lync : intégration et interopérabilité à votre existant, quoi de neuf ?
Lync : intégration et interopérabilité à votre existant, quoi de neuf ?Lync : intégration et interopérabilité à votre existant, quoi de neuf ?
Lync : intégration et interopérabilité à votre existant, quoi de neuf ?
 
Lync : intégration et interopérabilité à votre existant, quoi de neuf ?
Lync : intégration et interopérabilité à votre existant, quoi de neuf ?Lync : intégration et interopérabilité à votre existant, quoi de neuf ?
Lync : intégration et interopérabilité à votre existant, quoi de neuf ?
 
Windows Server vNext- virtualisation et stockage
Windows Server vNext- virtualisation et stockageWindows Server vNext- virtualisation et stockage
Windows Server vNext- virtualisation et stockage
 
Azure IaaS pour les IT - Demo Extravaganza
Azure IaaS pour les IT - Demo ExtravaganzaAzure IaaS pour les IT - Demo Extravaganza
Azure IaaS pour les IT - Demo Extravaganza
 
Windows Server vNext- administration et réseau
Windows Server vNext- administration et réseauWindows Server vNext- administration et réseau
Windows Server vNext- administration et réseau
 
La gouvernance des données
La gouvernance des donnéesLa gouvernance des données
La gouvernance des données
 
Retour d’expérience de Sarenza sur la façon de piloter un projet Power BI
Retour d’expérience de Sarenza sur la façon de piloter un projet Power BIRetour d’expérience de Sarenza sur la façon de piloter un projet Power BI
Retour d’expérience de Sarenza sur la façon de piloter un projet Power BI
 
Malware Unchained
Malware UnchainedMalware Unchained
Malware Unchained
 
Big Data et Business Intelligence de A… Azure
Big Data et Business Intelligence de A… AzureBig Data et Business Intelligence de A… Azure
Big Data et Business Intelligence de A… Azure
 
Windows Server 2003 EOS : l'opportunité de repenser votre IT et mettre en pla...
Windows Server 2003 EOS : l'opportunité de repenser votre IT et mettre en pla...Windows Server 2003 EOS : l'opportunité de repenser votre IT et mettre en pla...
Windows Server 2003 EOS : l'opportunité de repenser votre IT et mettre en pla...
 
Architectures hybrides: Intégrer vos données métiers dans vos applications cl...
Architectures hybrides: Intégrer vos données métiers dans vos applications cl...Architectures hybrides: Intégrer vos données métiers dans vos applications cl...
Architectures hybrides: Intégrer vos données métiers dans vos applications cl...
 
Reprenez la main sur vos applications SharePoint en mesurant et en optimisant...
Reprenez la main sur vos applications SharePoint en mesurant et en optimisant...Reprenez la main sur vos applications SharePoint en mesurant et en optimisant...
Reprenez la main sur vos applications SharePoint en mesurant et en optimisant...
 
Windows Server 2003 EOS : l'opportunité de repenser votre IT et mettre en pla...
Windows Server 2003 EOS : l'opportunité de repenser votre IT et mettre en pla...Windows Server 2003 EOS : l'opportunité de repenser votre IT et mettre en pla...
Windows Server 2003 EOS : l'opportunité de repenser votre IT et mettre en pla...
 
La collaboration dans Exchange : comparaison on premises et online
La collaboration dans Exchange : comparaison on premises et onlineLa collaboration dans Exchange : comparaison on premises et online
La collaboration dans Exchange : comparaison on premises et online
 
Exchange / Office 365 comment faire un déploiement hybride
Exchange / Office 365 comment faire un déploiement hybrideExchange / Office 365 comment faire un déploiement hybride
Exchange / Office 365 comment faire un déploiement hybride
 
Sécurité Active Directory: Etablir un référentiel
Sécurité Active Directory: Etablir un référentielSécurité Active Directory: Etablir un référentiel
Sécurité Active Directory: Etablir un référentiel
 
Cas d’étude : Comment simplifier vos backups dans le cloud grâce à VEEAM et M...
Cas d’étude : Comment simplifier vos backups dans le cloud grâce à VEEAM et M...Cas d’étude : Comment simplifier vos backups dans le cloud grâce à VEEAM et M...
Cas d’étude : Comment simplifier vos backups dans le cloud grâce à VEEAM et M...
 
Industrialisez le déploiement de vos infrastructures Cloud depuis votre systè...
Industrialisez le déploiement de vos infrastructures Cloud depuis votre systè...Industrialisez le déploiement de vos infrastructures Cloud depuis votre systè...
Industrialisez le déploiement de vos infrastructures Cloud depuis votre systè...
 
Comment bâtir un cloud hybride en mode IaaS ou SaaS et apporter le meilleur d...
Comment bâtir un cloud hybride en mode IaaS ou SaaS et apporter le meilleur d...Comment bâtir un cloud hybride en mode IaaS ou SaaS et apporter le meilleur d...
Comment bâtir un cloud hybride en mode IaaS ou SaaS et apporter le meilleur d...
 
Migrer de 2003 à 2012 R2, adopter HyperV ou Microsoft Azure : comment réalise...
Migrer de 2003 à 2012 R2, adopter HyperV ou Microsoft Azure : comment réalise...Migrer de 2003 à 2012 R2, adopter HyperV ou Microsoft Azure : comment réalise...
Migrer de 2003 à 2012 R2, adopter HyperV ou Microsoft Azure : comment réalise...
 

Último

KIT-COPILOT and more Article du 20240311
KIT-COPILOT and more Article du 20240311KIT-COPILOT and more Article du 20240311
KIT-COPILOT and more Article du 20240311Erol GIRAUDY
 
Les Metiers de l'Intelligence Artificielle
Les Metiers de l'Intelligence ArtificielleLes Metiers de l'Intelligence Artificielle
Les Metiers de l'Intelligence ArtificielleErol GIRAUDY
 
Workshop l'IA au service de l'industrie - Présentation générale - Extra 14...
Workshop l'IA au service de l'industrie - Présentation générale - Extra 14...Workshop l'IA au service de l'industrie - Présentation générale - Extra 14...
Workshop l'IA au service de l'industrie - Présentation générale - Extra 14...Infopole1
 
Mes succès sur Microsoft LEARN et examens
Mes succès sur Microsoft LEARN et examensMes succès sur Microsoft LEARN et examens
Mes succès sur Microsoft LEARN et examensErol GIRAUDY
 
Installation de Sylius 2.0 et découverte du nouveau backoffice en Bootstrap
Installation de Sylius 2.0 et découverte du nouveau backoffice en BootstrapInstallation de Sylius 2.0 et découverte du nouveau backoffice en Bootstrap
Installation de Sylius 2.0 et découverte du nouveau backoffice en BootstrapMaxime Huran 🌈
 
The Importance of Indoor Air Quality (French)
The Importance of Indoor Air Quality (French)The Importance of Indoor Air Quality (French)
The Importance of Indoor Air Quality (French)IES VE
 

Último (6)

KIT-COPILOT and more Article du 20240311
KIT-COPILOT and more Article du 20240311KIT-COPILOT and more Article du 20240311
KIT-COPILOT and more Article du 20240311
 
Les Metiers de l'Intelligence Artificielle
Les Metiers de l'Intelligence ArtificielleLes Metiers de l'Intelligence Artificielle
Les Metiers de l'Intelligence Artificielle
 
Workshop l'IA au service de l'industrie - Présentation générale - Extra 14...
Workshop l'IA au service de l'industrie - Présentation générale - Extra 14...Workshop l'IA au service de l'industrie - Présentation générale - Extra 14...
Workshop l'IA au service de l'industrie - Présentation générale - Extra 14...
 
Mes succès sur Microsoft LEARN et examens
Mes succès sur Microsoft LEARN et examensMes succès sur Microsoft LEARN et examens
Mes succès sur Microsoft LEARN et examens
 
Installation de Sylius 2.0 et découverte du nouveau backoffice en Bootstrap
Installation de Sylius 2.0 et découverte du nouveau backoffice en BootstrapInstallation de Sylius 2.0 et découverte du nouveau backoffice en Bootstrap
Installation de Sylius 2.0 et découverte du nouveau backoffice en Bootstrap
 
The Importance of Indoor Air Quality (French)
The Importance of Indoor Air Quality (French)The Importance of Indoor Air Quality (French)
The Importance of Indoor Air Quality (French)
 

Qu’est-ce que la qualité des données et comment avoir des données de qualité ? DQS nous répond.

  • 1. Donnez votre avis ! Depuis votre smartphone, sur : http://notes.mstechdays.fr De nombreux lots à gagner toutes les heures !!! Claviers, souris et jeux Microsoft… Merci de nous aider à améliorer les TechDays http://notes.mstechdays.fr
  • 2. Qu'est-ce que la qualité des données et comment avoir des données de qualité ? DQS nous répond Mounia BOURDACHE Consultante en BI Microsoft France Serveurs / Entreprise / Réseaux / IT
  • 3. Chapitre 1 QU’EST CE QUE LA QUALITÉ DES DONNÉES? Data Quality Services
  • 4. INTRODUCTION Entreprise Exploite Information Fournissent Données Data Quality Services
  • 5. COÛT DE LA NON QUALITÉ DES DONNÉES Les données causant disfonctionnement et surcout restent toujours trop nombreuses (Coût moyen sur le CA des Entreprises: de 3 à 6%). Le traitement des données et leur correction a toujours été un soucis important à gérer. En 2011 et 2012 la qualité des données a été: - 3e obstacle à la bonne gestion de l’information (après l’accès trop lent à des données sûres et la mauvaise intégration des données) - 1er obstacle à l’adoption de la BI au sein des Entreprises - 1er facteur à l’origine de la mise en œuvre du MDM au sein des Entreprises. Data Quality Services
  • 6. QU’EST CE QUE DE MAUVAISES DONNÉES ? Données erronées ou Données en doublon incohérentes Data Quality Services
  • 7. COMMENT EST MESURÉE LA QUALITÉ DES DONNÉES? La qualité des données est mesurée en fonction de leur utilisation. Mauvaises données et/ou Mauvaise connaissance de leur utilisation  Mauvais Business Data Quality Services
  • 8. Chapitre 2 COMMENT AVOIR DES DONNÉES DE QUALITÉ? Data Quality Services
  • 9. DATA QUALITY SERVICES : DQS Data Quality Services (DQS) est une solution fondée sur les connaissances. Elle permet aux professionnels de l'informatique et aux gestionnaires de données d’améliorer facilement la qualité de leurs données  Des données de bonne qualité sont essentielles à une Business Intelligence efficace  DQS est un outil intégré à SQL Server 2012, dont les bases de connaissance peuvent non seulement être générées mais aussi récupérées via des connecteurs à des tiers fournisseurs hébergés sur Azure DataMarket.  Enrichir les bases de connaissances dans le cloud facilitera l’accès à des données de haute qualité. Data Quality Services
  • 10. CONCEPT DE LA SOLUTION DQS Basée sur une base de connaissance DQ Fondée sur la connaissance Knowledge Base (DQKB) enrichissable et réutilisable Les Domaines capturent la Sémantique sémantique des données Enrichit ses connaissances plus elle Acquiert des connaissances est utilisée Ajout de bases de connaissances générées Ouverte et extensible et données référencées par des tiers fournisseurs Interface simple d’utilisation Facile à utiliser Data Quality Services
  • 11. LE PROCESS DE DQS Data Quality Services
  • 12. MODÉLISATION DQS Nettoyage des données Création (ou import) (Sources: BDD SQL / xls / csv) des Bases de Via interface utilisateur connaissance « DQS Client » ou composant SSIS. Gestion des Domaines Standardisation et Détection des doublons correction des données et statistiques des Données de référence données Administration des règles de dédoublonnage Data Quality Services
  • 13. COMPOSANTS DE LA SOLUTION DQS Modifier, supprimer, enrichir et normaliser Identifier, réunir ou des données fusionner les entrées inexactes ou connexes. incomplètes. Nettoyage Dédoublo- nnage Profilage Contrôle Analyser la source de Suivre et contrôler données afin d’avoir l'état de la qualité un aperçu de la des données. qualité des données. Data Quality Services
  • 14. PROBLÈMES DE QUALITÉ DE DONNES LES PLUS FRÉQUENTS Standardisation Dans une source de données le genre est F, H. Dans l’autre c’est Mr, Mme Complétude Quel est le pourcentage des fiches Clients ne contenant pas d’Email? Validité Est-ce que tous mes codes postaux français hors Corse et Outre-Mer contiennent 5 chiffres? Cohérence Mes clients étudiants ont-ils bien moins de 26 ans? Donc peuvent bénéficier des réductions? Unicité Ai-je bien une fiche Client par Client? Data Quality Services
  • 15. SOLUTIONS APPORTÉES PAR DQS Civilité Nom Num Rue Nom Rue Code Postal Ville Date Naissance Mr BERNIER Laurent 15 RUE DE LA PAIX Issy les Mx 01/05/1908 Nettoyage M. BERINER Laurent RUE DE LA PAIE 92130 Saint cloud 01/05/1980 Civilité Nom Num Rue Nom Rue Code Postal Ville Date Naissance Monsieur BERNIER Laurent 15 RUE DE LA PAIX 92130 Issy Les Moulineaux Dédou- Monsieur BERINER Laurent RUE DE LA PAIX 92130 Issy Les Moulineaux 01/05/1980 blonnage Civilité Nom Num Rue Nom Rue Code Postal Ville Date Naissance Monsieur BERNIER Laurent 15 RUE DE LA PAIX 92130 Issy Les Moulineaux 01/05/1980 Data Quality Services
  • 16. DQS PAR LE BIAIS DE SSIS  Utilisation du moteur DQS au sein même de l’environnement SSIS  Gestion de la qualité des données en même temps que le processus d’intégration. Data Quality Services
  • 21. Client DQ Azure Datamarket Clients DQS interface Catégorisation des services Catégorisation des MS DQ de données de référence données de références Domains Store Découverte et gestion des bases de RD Services API Réference Data API Tiers connaissances DQ Server (Parcourir, (Parcourir, ajouter, fournisseurs paramétrer, Valider…) mettre à jour…) Projets DQ DQ Engine Exploration Nettoygae base de Découverte DB Profilage des Référentiels donnée connaissance données Dédoublonnage Composant DQ SSIS MDS Excel Add in DQ Active Domaine Domaines BDC Projects MS locaux publiées Composants Excel & Dynamics Data Quality Services
  • 23. BlOG: Blogs.msdn.com/b/dqs VIDEOS: http://technet.microsoft.com/fr-fr/sqlserver/dd353197 FORUM: http://social.msdn.microsoft.com/Forums/fr- FR/sqldataqualityservices/threads?Thread%3Asqldataqualityser vices=Microsoft.Forums.Data.Models.DiscussionGroup Data Quality Services
  • 24. Développeurs Pros de l’IT http://aka.ms/generation-app Formez-vous en ligne www.microsoftvirtualacademy.com http://aka.ms/evenements- developpeurs Retrouvez nos évènements http://aka.ms/itcamps-france Les accélérateurs Faites-vous accompagner Windows Azure, Windows Phone, gratuitement Windows 8 Essayer gratuitement nos http://aka.ms/telechargements solutions IT La Dev’Team sur MSDN Retrouver nos experts L’IT Team sur TechNet http://aka.ms/devteam Microsoft http://aka.ms/itteam

Hinweis der Redaktion

  1. Toute Entreprise exploite de l’information pour fonctionner. Cette information se base sur des données. Comment les entreprises pourraient-elles fonctionner correctement si leurs données sont erronées ou incohérentes?
  2. Les données représentent le patrimoine informationnel des entreprises. Pourtant, leur qualité fait rarement l’objet d’un processus industrialisé.Les Responsables Qualité de données évaluent leurs coûts de non qualité en production de 3 à 6% du chiffre d'affaire.
  3. La qualitéd’unedonnéepeutêtredéfinie, mesurée, administrée à travers diverses dimensions et paramètrestels que la précision, la cohérence, l'exhaustivité, les doublons.
  4. Cequ’ilfaut savoir c’estque lestermes “Qualité de données” ne sont pas absolus. Il n’y a pas de mauvaisesou de bonnes données sil’on ne connait pas leurutilisation. Le degrès de correction des données depend de leur usage. Çan’estqu’unefois la connaissance des données et de leurutilisationacquisequ’ilest possible de dire si les données sontbonnesoumauvaises pour l’utisationdésirée.La qualité des données est subjective, cen’est pas une science exacte, elle depend de l’usagequel’onprévoit pour les données.
  5. Les blocs de couleurs sont éditables et peuvent reprendre la couleur du type de session qui est donnée.Idem pour les textes.
  6. Base de connaissance existante sur AzureDataMarketOu créées
  7. DQS effectue un rapprochement de données en comparant chaque ligne de données source aux données existantes dans une base de connaissances, et en produisant une probabilité pour que les lignes soient similaires (des valeurs équivalentes, mais saisies dans un format ou un style différent sont alors unifiées). Cette étape est majeure dans un projet de qualité des données, il est préférable d'effectuer après le nettoyage des données, de sorte que les données rapprochées soient valides et les autres rejetées dans une table d’erreurs.DQS fournit aussi des fonctionnalités pour réduire la duplication des données et améliorer la précision des données provenant d’une source de données. Ces fonctionnalités peuvent être utilisées au travers d’une application riche par son interface utilisateur « DQS Client » ou bien d’un composant SSIS.Un suivi de l’activité de qualité est également possible dans l’outil DQS Client ainsi que la possibilité d’afficher des rapports d’analyse sur les données sources pour connaitre leurs degrés de qualité.
  8. BDC : base de connaissance