SlideShare ist ein Scribd-Unternehmen logo
1 von 27
Downloaden Sie, um offline zu lesen
Hortonworks
Architecture-Installation
A.Stitou Data Scientist
Project Manager
Sommaire
• Introduction
• Architecture
• Composants de la distribution
• Composants non Apach Hadoop
• Installation
Introduction
• Hortonworks a été formé en juin 2011 par des
membres de l’équipe Yahoo en charge du projet
Hadoop.
• but est de faciliter l’adoption de la plate-forme
Hadoop d’Apache, c’est pourquoi tous les
composants sont open source et sous licence
Apache.
• Cette distribution est la plus conforme à la plate-
forme Hadoop d’Apache et Hortonworks est le gros
contributeur Apache Hadoop.
Architecture
Architecture
Composants de la distribution
Hortonworks
• HDFS : stockage distribué. - MapReduce : Traitements parallélisés.
• HBase : Base NoSQL orientée colonnes sur HDFS.
• Pig : plate-forme de scripts d’interrogation HDFS.
• Hive : Requêtage et Méta-données HDFS.
• Oozie : Planification de traitements.
• ZooKeeper : Coordination du cluster.
• Ambari : Gestion et supervision.
• WebHDFS : Accès web aux données. - Ingestion de données :
• Talend Open Studio for Big Data.
• Sqoop : Interactions avec les SGBD.
• Flume : Gestion distribuée des logs.
• Mahout : Apprentissage
Composants non Apache Hadoop
• Hortonworks Cloudbreak (licence Apache) : Solution agnostique de
dimensionnement, de gestion et de monitoring d’un cluster HDP,
compatible avec Microsoft Azure, Amazon AWS, Google Cloud Platform,
OpenStack pour les offres cloud ainsi qu’Apache Ambari, Docker, Swarm et
Consul.
• Hortonworks SmartSense (nécessite une licence) : Maintenance
proactive d’un cluster HDP, recommandations, optimisation de l’utilisation
des ressources.
• Solr on YARN (licence Apache) : C’est une version entièrement
compatible avec Hadoop, ce qui permet de déployer Solr au sein du
cluster et évite de déployer des machines dédiées à Solr
Installation
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork

Weitere ähnliche Inhalte

Was ist angesagt?

Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -introNosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
Olivier Mallassi
 
Mathias Herberts fait le retour d'expérience Hadoop au Crédit Mutuel Arkéa
Mathias Herberts fait le retour d'expérience Hadoop au Crédit Mutuel ArkéaMathias Herberts fait le retour d'expérience Hadoop au Crédit Mutuel Arkéa
Mathias Herberts fait le retour d'expérience Hadoop au Crédit Mutuel Arkéa
Modern Data Stack France
 

Was ist angesagt? (20)

Hadoop Hbase - Introduction
Hadoop Hbase - IntroductionHadoop Hbase - Introduction
Hadoop Hbase - Introduction
 
Hadoop et son écosystème
Hadoop et son écosystèmeHadoop et son écosystème
Hadoop et son écosystème
 
TP1 Big Data - MapReduce
TP1 Big Data - MapReduceTP1 Big Data - MapReduce
TP1 Big Data - MapReduce
 
Installation hadoopv2.7.4-amal abid
Installation hadoopv2.7.4-amal abidInstallation hadoopv2.7.4-amal abid
Installation hadoopv2.7.4-amal abid
 
Hadoop Introduction in Paris
Hadoop Introduction in ParisHadoop Introduction in Paris
Hadoop Introduction in Paris
 
Une introduction à HBase
Une introduction à HBaseUne introduction à HBase
Une introduction à HBase
 
Une introduction à Hive
Une introduction à HiveUne introduction à Hive
Une introduction à Hive
 
Cours Big Data Chap2
Cours Big Data Chap2Cours Big Data Chap2
Cours Big Data Chap2
 
Stats web avec Hive chez Scoop.it
Stats web avec Hive chez Scoop.itStats web avec Hive chez Scoop.it
Stats web avec Hive chez Scoop.it
 
Spark une alternative à Hadoop MapReduce pour le Datamining
Spark une alternative à Hadoop MapReduce pour le DataminingSpark une alternative à Hadoop MapReduce pour le Datamining
Spark une alternative à Hadoop MapReduce pour le Datamining
 
Petit-déjeuner MapReduce-La révolution dans l’analyse des BigData
Petit-déjeuner MapReduce-La révolution dans l’analyse des BigDataPetit-déjeuner MapReduce-La révolution dans l’analyse des BigData
Petit-déjeuner MapReduce-La révolution dans l’analyse des BigData
 
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -introNosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
 
Mathias Herberts fait le retour d'expérience Hadoop au Crédit Mutuel Arkéa
Mathias Herberts fait le retour d'expérience Hadoop au Crédit Mutuel ArkéaMathias Herberts fait le retour d'expérience Hadoop au Crédit Mutuel Arkéa
Mathias Herberts fait le retour d'expérience Hadoop au Crédit Mutuel Arkéa
 
Hadoop MapReduce - OSDC FR 2009
Hadoop MapReduce - OSDC FR 2009Hadoop MapReduce - OSDC FR 2009
Hadoop MapReduce - OSDC FR 2009
 
Tech day hadoop, Spark
Tech day hadoop, SparkTech day hadoop, Spark
Tech day hadoop, Spark
 
HADOOP + R
HADOOP + RHADOOP + R
HADOOP + R
 
Introduction à HDFS
Introduction à HDFSIntroduction à HDFS
Introduction à HDFS
 
Introduction à Hadoop
Introduction à HadoopIntroduction à Hadoop
Introduction à Hadoop
 
BigData_TP3 : Spark
BigData_TP3 : SparkBigData_TP3 : Spark
BigData_TP3 : Spark
 
Journées SQL 2014 - Hive ou la convergence entre datawarehouse et Big Data
Journées SQL 2014 - Hive ou la convergence entre datawarehouse et Big DataJournées SQL 2014 - Hive ou la convergence entre datawarehouse et Big Data
Journées SQL 2014 - Hive ou la convergence entre datawarehouse et Big Data
 

Ähnlich wie Hortonwork

Aqui hadoop draft
Aqui hadoop draftAqui hadoop draft
Aqui hadoop draft
Eric Papet
 
Cy3907 formation-cloudera-administrator-training-for-apache-hadoop
Cy3907 formation-cloudera-administrator-training-for-apache-hadoopCy3907 formation-cloudera-administrator-training-for-apache-hadoop
Cy3907 formation-cloudera-administrator-training-for-apache-hadoop
CERTyou Formation
 
Développement d'un moteur de recherche avec Zend Search
Développement d'un moteur de recherche avec Zend SearchDéveloppement d'un moteur de recherche avec Zend Search
Développement d'un moteur de recherche avec Zend Search
Robert Viseur
 
Alphorm.com Support de la Formation PHP MySQL
Alphorm.com Support de la Formation PHP MySQLAlphorm.com Support de la Formation PHP MySQL
Alphorm.com Support de la Formation PHP MySQL
Alphorm
 

Ähnlich wie Hortonwork (20)

Sahara : Hadoop as Service avec OpenStack
Sahara : Hadoop as Service avec OpenStackSahara : Hadoop as Service avec OpenStack
Sahara : Hadoop as Service avec OpenStack
 
Solr + Hadoop - Fouillez facilement dans votre système Big Data
Solr + Hadoop - Fouillez facilement dans votre système Big DataSolr + Hadoop - Fouillez facilement dans votre système Big Data
Solr + Hadoop - Fouillez facilement dans votre système Big Data
 
Hadoop unit
Hadoop unitHadoop unit
Hadoop unit
 
Hadoop unit
Hadoop unitHadoop unit
Hadoop unit
 
Big Data, Hadoop & Spark
Big Data, Hadoop & SparkBig Data, Hadoop & Spark
Big Data, Hadoop & Spark
 
Commencer avec Hadoop
Commencer avec HadoopCommencer avec Hadoop
Commencer avec Hadoop
 
Aqui hadoop draft
Aqui hadoop draftAqui hadoop draft
Aqui hadoop draft
 
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
 
Cy3907 formation-cloudera-administrator-training-for-apache-hadoop
Cy3907 formation-cloudera-administrator-training-for-apache-hadoopCy3907 formation-cloudera-administrator-training-for-apache-hadoop
Cy3907 formation-cloudera-administrator-training-for-apache-hadoop
 
Déployer facilement OpenStack et CEPH avec Bright OpenStack
Déployer facilement OpenStack et CEPH avec Bright OpenStackDéployer facilement OpenStack et CEPH avec Bright OpenStack
Déployer facilement OpenStack et CEPH avec Bright OpenStack
 
Social Network Analysis Utilizing Big Data Technology
Social Network Analysis Utilizing Big Data TechnologySocial Network Analysis Utilizing Big Data Technology
Social Network Analysis Utilizing Big Data Technology
 
Hadoop
HadoopHadoop
Hadoop
 
Apache Zeppelin @DevoxxFR 2016
Apache Zeppelin @DevoxxFR 2016Apache Zeppelin @DevoxxFR 2016
Apache Zeppelin @DevoxxFR 2016
 
TIAD 2016 : Accenture Devops Platform dans Microsoft Azure
TIAD 2016 : Accenture Devops Platform dans Microsoft AzureTIAD 2016 : Accenture Devops Platform dans Microsoft Azure
TIAD 2016 : Accenture Devops Platform dans Microsoft Azure
 
L'avenir du web au prisme de la ressource
L'avenir du web au prisme de la ressourceL'avenir du web au prisme de la ressource
L'avenir du web au prisme de la ressource
 
Développement d'un moteur de recherche avec Zend Search
Développement d'un moteur de recherche avec Zend SearchDéveloppement d'un moteur de recherche avec Zend Search
Développement d'un moteur de recherche avec Zend Search
 
Alphorm.com Support de la Formation PHP MySQL
Alphorm.com Support de la Formation PHP MySQLAlphorm.com Support de la Formation PHP MySQL
Alphorm.com Support de la Formation PHP MySQL
 
Déposer dans hal_2016_03_fr
Déposer dans hal_2016_03_frDéposer dans hal_2016_03_fr
Déposer dans hal_2016_03_fr
 
Hadoop unit
Hadoop unitHadoop unit
Hadoop unit
 
PHP dans le cloud
PHP dans le cloudPHP dans le cloud
PHP dans le cloud
 

Hortonwork

  • 2. Sommaire • Introduction • Architecture • Composants de la distribution • Composants non Apach Hadoop • Installation
  • 3. Introduction • Hortonworks a été formé en juin 2011 par des membres de l’équipe Yahoo en charge du projet Hadoop. • but est de faciliter l’adoption de la plate-forme Hadoop d’Apache, c’est pourquoi tous les composants sont open source et sous licence Apache. • Cette distribution est la plus conforme à la plate- forme Hadoop d’Apache et Hortonworks est le gros contributeur Apache Hadoop.
  • 6. Composants de la distribution Hortonworks • HDFS : stockage distribué. - MapReduce : Traitements parallélisés. • HBase : Base NoSQL orientée colonnes sur HDFS. • Pig : plate-forme de scripts d’interrogation HDFS. • Hive : Requêtage et Méta-données HDFS. • Oozie : Planification de traitements. • ZooKeeper : Coordination du cluster. • Ambari : Gestion et supervision. • WebHDFS : Accès web aux données. - Ingestion de données : • Talend Open Studio for Big Data. • Sqoop : Interactions avec les SGBD. • Flume : Gestion distribuée des logs. • Mahout : Apprentissage
  • 7. Composants non Apache Hadoop • Hortonworks Cloudbreak (licence Apache) : Solution agnostique de dimensionnement, de gestion et de monitoring d’un cluster HDP, compatible avec Microsoft Azure, Amazon AWS, Google Cloud Platform, OpenStack pour les offres cloud ainsi qu’Apache Ambari, Docker, Swarm et Consul. • Hortonworks SmartSense (nécessite une licence) : Maintenance proactive d’un cluster HDP, recommandations, optimisation de l’utilisation des ressources. • Solr on YARN (licence Apache) : C’est une version entièrement compatible avec Hadoop, ce qui permet de déployer Solr au sein du cluster et évite de déployer des machines dédiées à Solr