Hadoop has become unavoidable. Companies of all sizes are at different stages of their thoughts on Big Data. Whether you're just starting to explore the platform or you already have several existing clusters, everyone faces the same challenge - to develop its internal expertise.
Specialists of Big Data, Talend, and Hortonworks, watch this webinar to discover how to unify all your data in Hadoop, without specific skills Big Data.
13. 13
Les plus grands défis du marché de l’intégration de
données
BIG DATA
Plus de données, moins structurées
PRODUCTIVITE
Ne peut pas suivre la demande
COUT
Solutions onéreuses
COMPETENCES
Difficultés à trouver des compétences
14. 14
La demande de Big Data
4.4 MILLIONS d’EMPLOIS
DANS LE BIG DATA EN 2015
mais seulement un tiers
de ces emplois seront pourvusSource: Gartner
16. 16
Talend apporte une productivité inégalable
CODAGE à la MAIN
• Contre-productif
• Nécessite des
compétences spécifiques
• Difficile à maintenir
• Support limité
TALEND Big Data
• + de 800 composants
• Génère du code optimisé
• Collaboration & management
• Support Gold (SLAs)
30 X PLUS
PRODUCTIF
17. 17
Architecture intemporelle avec génération de code
natif
ETL
Intégration
quotidienne
ELT
Data Warehouse
ESB
Messaging, Routing,
Transformation
HADOOP
Hautement
évolutif
La Grande
Nouveauté
Spark
18. 18Select Icons made by Freepik, Situ Herrera, www.flaticon.com
Talend Big Data
Systèmes
hérités
ERP
Internet
des Objets
DBMS /
EDW
NoSQL
Rapports
standards
Outils de
requêtes ad-hoc
Data
Mining
MDD/OLAP
Applications
analytiques
NoSQL
Web Logs
Développe et teste Equipe opérations
Studio
Talend Big Data
Ingestion
Map Profile Parse Match
Nettoie Standardise
Change Data
Capture
Machine
Learning
Partage Planifie
Natif
Accès
Avantages
Productivité
améliorée
TCO plus bas
Future Proof
Architecture
19. 19
La solution d’intégration de Big Data la plus facile et la plus puissante
Talend Big Data
Créer
Collaborer
DéployerGérer
Adapter
• Interface utilisateur visuelle, glisser-
déposer
• Plus de 800 connecteurs intégrés
• Génère du code MapReduce Java ou SQL
• S’exécute au niveau du
cluster
• Répartition de charge
et haute disponibilité
• Optimisation du code
• Aucune installation de Talend sur
Hadoop
• Nettoie et enrichie
• Supporte nativement Kerberos
• Supporte des consoles de gestion
Big Data
• Sécurité intégrée nativement
• Planification, monitoring et
gestion centralisés
• Référentiel partagé
• Auto-documentation
20. 20
Les plus grands défis du marché de la donnée
EVOLUTIF AGILE
TCO plus basFACILE
23. 23
Les points clés
• Talend Big Data Platform résout le problème des compétences
• Talend vous permet d’augmenter votre productivité Big Data
• Talend et Hortonworks ont la technologie et les compétences pour satisfaire
les besoins de votre entreprise.
BIG DATA
Plus de données, moins
structurées
PRODUCTIVITY
Ne peut pas suivre la demande
COMPETENCES
Difficulté de trouver des talents
24. 24
Démonstration d’un cas d’usage
Objectif : identifier les problèmes de qualité de données avant de charger les données dans
l’entrepôt de données de l’entreprise sans augmenter le nombre de chargements en cours.
• Charger 500 TB de fichiers compressés dans HFDS
- Fichiers de ventes aux tiers/prescriptions délivrés par des fournisseurs
• Calculer les totaux mensuels
- Avant de charger dans la base de données, comparer les totaux des mois précédents aux
totaux du mois actuel dans de nouveaux fichiers de données.
• Afficher les résultats de ces comparaisons dans un outil analytique
- Afficher les comparaisons de ventes pour chaque produit pour montrer les problèmes de qualité de
données avant la mise en place du chargement dans la base de l’entreprise.
25. 25
Chargement de données avec des tiers
Préparation des données
Traitement de la base
de données
Rapports finaux / Vérification
de la qualité
Les problèmes de mauvaise qualité des Big Data entraînent une perte
de temps, de ressources et de revenus
26. 26
Optimisation de l’entrepôt de données
Cluster
Hadoop Vérifications des données au préalable
Identifier plus tôt les Master records
Charger des données non-compressées
directement dans l’entrepôt de données
Chargement optimisé
Préparation des données
Traitement de la base
de données
Rapports finaux / Vérification
de la qualité
28. 28
Les points clés
Récap’ de la démonstration?
• Hortonworks et Talend peuvent vous aider à réduire vos coûts,
• Ils vous déchargent des processus ETL onéreux,
• Ils augmentent la valeur de votre entrepôt de données,
• Ils mettent à disposition un environnement visuel graphique
glissez-déposez.
29. 29
Hortonworks/Talend Sandbox
• Environnement visuel graphique glissez-déposez mettant en avant Hortonworks
- Permet de montrer les résultats d’un travail d’intégration de façon visuelle
• Accélère le chargement de données et la transformation avec Hadoop
- Construire et déployer des jobs MapReduce et Pig dans YARN
• Cas d’utilisation préconstruits : optimisation des entrepôts de données, données de
parcours de clics, analyse sentimentale des données de Twitter, Analyse des weblogs
Apache
• Démonstrations de plusieurs bases de données NoSQL
30. 30
De zero au Big Data en 10 minutes
Téléchargez la sandbox gratuite
fr.talend.com/hortonworks-sandbox
• Commencez en quelques minutes (pas en
semaines), avec une sandbox Big Data et une
démonstration
• Inclut : Une analyse de sentiments,
chargement ETL, analyse de fichiers Log
• Commencez à travailler avec Talend &
Hortonworks dès aujourd’hui !