SlideShare ist ein Scribd-Unternehmen logo
1 von 33
MapReduceRP*
Map
Reduce
RP* Framework pour le traitement
parallèle de très grande
quantité de données
Encadrer par:Mr.ARIDJ Mohamed
Réaliser par:AMEUR Izzeddine
Juillet 2014
MapReduceRP*
Le plan de travail
Partie théorique
Partie pratique
Conclusion
1
MapReduceRP*
Vous la connaissez peut-être…
2
MapReduceRP*
Deux gros problèmes
1. Données à très grande échelle
2. Ressources financières limitées
3
MapReduceRP*
Schéma logique d’exécution
MapReduce
« Map »: générer un ensemble (clé/valeur) intermédiaire.
« Reduce »:combine toutes les valeurs associé à la même clé
intermédiaire
Données
R
E
D
U
C
E
M
A
P
Résultat
Split 0
Split 1
Split 2
Split 3
Split 4
4
MapReduceRP*
Schéma général d’exécution MapReduce
5
MapReduceRP*
Exemple Word Count
Fonction de partitionnement
hash(Key) mod R
Ou R:nombre des tâches reduce
6
MapReduceRP*
Structures de données classiques
 Limite sur les performances d'accès
 Vulnérabilité aux pannes
 Scalabilité et Disponibilité
 Impossible pour un grand nombre de
clients
Serveurs
Clients
Répertoire
d'accès
7
MapReduceRP*
Multi-ordinateurs
 Une collection d'ordinateurs,
Stations de travail, interconnectés
par un réseau informatique (MAN,
LAN, WAN)
Réseau
Besoin de Systèmes de Stockage
Distribués et à Haute Disponibilité
8
MapReduceRP*
SDDS
 Conçues spécifiquement pour les
multi-ordinateurs
 pour des bases de données modernes
données complexes: spatiales, vidéo,
Image, Son, …
9
MapReduceRP*
Classification des SDDS
RP*
10
MapReduceRP*
La distribution des données
 Utiliser algorithme distribition par
intervalle RP* « Range Partitioning »
 Basé sur paradigme B-arbres et intervalles
(fichier ordonnée + accès rapide)
 Admettant les requêtes à intervalles
 Garantie de bonnes performances
11
MapReduceRP*
Algorithme RP*
 Famille des SDDS, appelée RP*
(Range Partitioning) : RP*N, RP*C et
RP*S
 RP*N :utilisation exclusive du Multicast
 RP*C :c’est un fichier RP*N avec une image au
niveau de chaque client. Utilisation de Unicast et
Multicast
 RP*S : c’est un fichier RP*C + un index distribué
au niveau des serveurs indexant toutes les cases.
Élimine le multicast.
12
MapReduceRP*
Algorithme d'éclatement d'une case
1/ Déterminer (Cm) la clé de l'enregistrement
du milieu de la case de débordement
2/ Créer une nouvelle case j
3/ Déterminer l'en-tête de la case j
λj := Cm ; Copier dans la case j les
enregistrements de la case i avec la clé C>Cm
4/ Modifier l'en-tête de la case i
Effacer les enregistrements de la clé C>Cm
13
MapReduceRP*
Exemple
 Évolution d’un fichier RP*N avec des
enregistrements de clé
alphanumérique et pour b =4.
 inséré clé a
to
the
of
and
+ 
- 
of
and
a
of
-
to
the
+ 
of
Règle 1
Règle 2
Règle 3
Règle 4
14
MapReduceRP*
serveur
Visualisation exemple
Client
Réseau
Client
…
Cases de Données
…
Insertions
…
serveur
serveur
serveur
Coordinateur
Transfert Enregistrements
15
MapReduceRP*
Solutions pour la distribution de
données par intervalle
Soumettre un job
MapReduce
Utilisateur
Input
Data
Output
Data
Algorithme
RP*
Map
Map
Map
Reduce
Reduce
Reduce
Sortir Map Sortir RP*
16
MapReduceRP*
Structure RP*
17
MapReduceRP*
Architecteur HDFS
18
MapReduceRP*
HDFS & MapReduce
Couche
Entité
HDFS MapReduce
Maître NameNode JobTracker
Esclave DataNode TaskTracker
19
MapReduceRP*
Interface : Applications - SDDS
send
Request
Socket
Network
ResponseRequest
Receive
Response
file client(n)
,,,,,, ,,,,,, ,,,,, ,,,,,,,,
Server
Address
Receive
Request
Return
Response
Request Response
Server
Architecture Client
20
MapReduceRP*
Bucket
Insertion Search Update Delete
Thread 1 Thread 4
…
Request
Analysis
Listen
Thread
Socket
Client
Network
Request
Response
Architecture Server
21
MapReduceRP*
Requête simple
 Coté client :Envoyée à l’aide d’un message
Multicast. Reçue par tous les serveurs.
 Coté serveur : Chaque serveur S, d’intervalle
[, ], procède comme suit :
 Si clé « c » [, ] alors S exécute la requête,
puis envoie éventuellement une réponse au client
à l’aide d’un message Unicast, sinon ignore la
requête
 Cette réponse contient le résultat de l’exécution
de la requête( par exemple : l’enregistrement de
clé « c » trouvé avec succès )
22
MapReduceRP*
Requête à intervalle
 Il s’agit de la recherche de l’ensemble des
enregistrements de clés « c » appartenant à un
intervalle donné [a, b] (a <b)
 Elle est envoyée à tous les serveurs à l’aide d’un
message Multicast.
 Elle est traitée sur chaque serveur d’intervalle
(, ] tel que (, ]  [a, b]  {}.
 Les enregistrements sélectionnés sont ensuite
envoyés au client .
23
MapReduceRP*
Visualisation Requête
Load Data Load Data
DémarrerRéponse
Serveur
Concerné
Transfert
Réponse
24
MapReduceRP*
Partie pratique
25
MapReduceRP*
Résultats de simulation-1-
0
10000
20000
30000
40000
50000
60000
70000
80000
90000
10000 30000 50000 100000
100000
10000
5000
-Temps de distribution (ms)-
26
MapReduceRP*
Résultats de simulation-2-
0
10000
20000
30000
40000
50000
60000
5000 10000 100000
100000
50000
30000
10000
-Temps de distribution (ms) en fonction de
nombre de clés insérés -
27
MapReduceRP*
Résultats de simulation-3-
0
100
200
300
400
500
600
10000 30000 50000 100000
100000
10000
5000
-Temps de recherche de requête simple (ms)-
28
MapReduceRP*
Résultats de simulation-4-
0
200
400
600
800
1000
1200
1400
1600
10000 30000 50000 100000
100000
10000
5000
-Temps de recherche de requête
à intervalle (ms)-
29
MapReduceRP*
Conclusion
Nos travaux ont porté sur le couplage des
algorithmes SDDS avec paradigme MapReduce,
et afin de profiter au maximum des ressources de
stockage et de traitement de ces réseaux
d’ordinateurs il faut assurer que les données sont
stockées de façon ordonnée.
30
MapReduceRP*
Perspectives
 Implémenter d’autres variantes de RP* tel que : la
variante RP*c, RP*s
 Implémenter notre système avec une base de
données NoSql
 L’adaptation d’un outil en ligne permet ordonné
donnée de façon périodiquement
31
MapReduceRP*
www.izzeddineameur.netne.net
Merci

Weitere ähnliche Inhalte

Ähnlich wie MapReduce au Niveau RP*

notions de routage IP
notions de routage IPnotions de routage IP
notions de routage IPmohamednacim
 
[Présentation PFE] Conception et implémentation d'un estimateur conjoint de l...
[Présentation PFE] Conception et implémentation d'un estimateur conjoint de l...[Présentation PFE] Conception et implémentation d'un estimateur conjoint de l...
[Présentation PFE] Conception et implémentation d'un estimateur conjoint de l...Yassine Selmi
 
#OSSPARIS19 - Stream processing : de la base de données classique au streamin...
#OSSPARIS19 - Stream processing : de la base de données classique au streamin...#OSSPARIS19 - Stream processing : de la base de données classique au streamin...
#OSSPARIS19 - Stream processing : de la base de données classique au streamin...Paris Open Source Summit
 
Le futur d'apache cassandra
Le futur d'apache cassandraLe futur d'apache cassandra
Le futur d'apache cassandraDuyhai Doan
 
Appels de procédures distants (RPC)
Appels de procédures distants (RPC)Appels de procédures distants (RPC)
Appels de procédures distants (RPC)Heithem Abbes
 
La programmation GPU avec C++ AMP pour les performances extrêmes
La programmation GPU avec C++ AMP pour les performances extrêmesLa programmation GPU avec C++ AMP pour les performances extrêmes
La programmation GPU avec C++ AMP pour les performances extrêmesMicrosoft
 
2018-10-04 Meetup PG Nantes - PostgreSQL: Estimer la mémoire nécessaire pour ...
2018-10-04 Meetup PG Nantes - PostgreSQL: Estimer la mémoire nécessaire pour ...2018-10-04 Meetup PG Nantes - PostgreSQL: Estimer la mémoire nécessaire pour ...
2018-10-04 Meetup PG Nantes - PostgreSQL: Estimer la mémoire nécessaire pour ...rjuju
 
Environnement de développement de bases de données
Environnement de développement de bases de donnéesEnvironnement de développement de bases de données
Environnement de développement de bases de donnéesISIG
 
Cours Systemes embarques.pptx
Cours Systemes embarques.pptxCours Systemes embarques.pptx
Cours Systemes embarques.pptxSihemNasri3
 
Chapitre 6 - Protocoles TCP/IP, UDP/IP
Chapitre 6  - Protocoles TCP/IP, UDP/IPChapitre 6  - Protocoles TCP/IP, UDP/IP
Chapitre 6 - Protocoles TCP/IP, UDP/IPTarik Zakaria Benmerar
 
Apache Cassandra - Concepts et fonctionnalités
Apache Cassandra - Concepts et fonctionnalitésApache Cassandra - Concepts et fonctionnalités
Apache Cassandra - Concepts et fonctionnalitésRomain Hardouin
 
BMC Mainview Data Server - Synthese et Mise en oeuvre
BMC Mainview Data Server - Synthese et Mise en oeuvreBMC Mainview Data Server - Synthese et Mise en oeuvre
BMC Mainview Data Server - Synthese et Mise en oeuvreThierry Déléris
 
Présentation extia optimisation_cfd
Présentation extia optimisation_cfdPrésentation extia optimisation_cfd
Présentation extia optimisation_cfdSteven DAIX
 
Spark-adabra, Comment Construire un DATALAKE ! (Devoxx 2017)
Spark-adabra, Comment Construire un DATALAKE ! (Devoxx 2017) Spark-adabra, Comment Construire un DATALAKE ! (Devoxx 2017)
Spark-adabra, Comment Construire un DATALAKE ! (Devoxx 2017) univalence
 

Ähnlich wie MapReduce au Niveau RP* (20)

Hug janvier 2016 -EDF
Hug   janvier 2016 -EDFHug   janvier 2016 -EDF
Hug janvier 2016 -EDF
 
notions de routage IP
notions de routage IPnotions de routage IP
notions de routage IP
 
Dijkstra kshortest
Dijkstra kshortestDijkstra kshortest
Dijkstra kshortest
 
[Présentation PFE] Conception et implémentation d'un estimateur conjoint de l...
[Présentation PFE] Conception et implémentation d'un estimateur conjoint de l...[Présentation PFE] Conception et implémentation d'un estimateur conjoint de l...
[Présentation PFE] Conception et implémentation d'un estimateur conjoint de l...
 
#OSSPARIS19 - Stream processing : de la base de données classique au streamin...
#OSSPARIS19 - Stream processing : de la base de données classique au streamin...#OSSPARIS19 - Stream processing : de la base de données classique au streamin...
#OSSPARIS19 - Stream processing : de la base de données classique au streamin...
 
DSP
DSPDSP
DSP
 
Le futur d'apache cassandra
Le futur d'apache cassandraLe futur d'apache cassandra
Le futur d'apache cassandra
 
Chap1_Entrees_Sorties.pptx
Chap1_Entrees_Sorties.pptxChap1_Entrees_Sorties.pptx
Chap1_Entrees_Sorties.pptx
 
Appels de procédures distants (RPC)
Appels de procédures distants (RPC)Appels de procédures distants (RPC)
Appels de procédures distants (RPC)
 
La programmation GPU avec C++ AMP pour les performances extrêmes
La programmation GPU avec C++ AMP pour les performances extrêmesLa programmation GPU avec C++ AMP pour les performances extrêmes
La programmation GPU avec C++ AMP pour les performances extrêmes
 
2018-10-04 Meetup PG Nantes - PostgreSQL: Estimer la mémoire nécessaire pour ...
2018-10-04 Meetup PG Nantes - PostgreSQL: Estimer la mémoire nécessaire pour ...2018-10-04 Meetup PG Nantes - PostgreSQL: Estimer la mémoire nécessaire pour ...
2018-10-04 Meetup PG Nantes - PostgreSQL: Estimer la mémoire nécessaire pour ...
 
Environnement de développement de bases de données
Environnement de développement de bases de donnéesEnvironnement de développement de bases de données
Environnement de développement de bases de données
 
Résumé vlsm et cidr
Résumé vlsm et cidrRésumé vlsm et cidr
Résumé vlsm et cidr
 
Cours Systemes embarques.pptx
Cours Systemes embarques.pptxCours Systemes embarques.pptx
Cours Systemes embarques.pptx
 
Chapitre 6 - Protocoles TCP/IP, UDP/IP
Chapitre 6  - Protocoles TCP/IP, UDP/IPChapitre 6  - Protocoles TCP/IP, UDP/IP
Chapitre 6 - Protocoles TCP/IP, UDP/IP
 
Apache Cassandra - Concepts et fonctionnalités
Apache Cassandra - Concepts et fonctionnalitésApache Cassandra - Concepts et fonctionnalités
Apache Cassandra - Concepts et fonctionnalités
 
BMC Mainview Data Server - Synthese et Mise en oeuvre
BMC Mainview Data Server - Synthese et Mise en oeuvreBMC Mainview Data Server - Synthese et Mise en oeuvre
BMC Mainview Data Server - Synthese et Mise en oeuvre
 
Présentation extia optimisation_cfd
Présentation extia optimisation_cfdPrésentation extia optimisation_cfd
Présentation extia optimisation_cfd
 
Spark-adabra, Comment Construire un DATALAKE ! (Devoxx 2017)
Spark-adabra, Comment Construire un DATALAKE ! (Devoxx 2017) Spark-adabra, Comment Construire un DATALAKE ! (Devoxx 2017)
Spark-adabra, Comment Construire un DATALAKE ! (Devoxx 2017)
 
Ch9 miasm
Ch9 miasmCh9 miasm
Ch9 miasm
 

Kürzlich hochgeladen

COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfabatanebureau
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film françaisTxaruka
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.Txaruka
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfachrafbrahimi1
 
Computer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxComputer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxRayane619450
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprisesMajdaKtiri2
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film françaisTxaruka
 
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxSUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxssuserbd075f
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne FontaineTxaruka
 

Kürzlich hochgeladen (10)

COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film français
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdf
 
Computer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxComputer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptx
 
Evaluación Alumnos de Ecole Victor Hugo
Evaluación Alumnos de Ecole  Victor HugoEvaluación Alumnos de Ecole  Victor Hugo
Evaluación Alumnos de Ecole Victor Hugo
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprises
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film français
 
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxSUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne Fontaine
 

MapReduce au Niveau RP*

Hinweis der Redaktion

  1. (1) Extension Dynamique du Fichier