SlideShare une entreprise Scribd logo
1  sur  39
Télécharger pour lire hors ligne
Introduction
                                                     ´
                       Management des flux du trafic aerien
                                                    ´
  Agent Intelligent du Management des flux du trafic aerien
                                 ´
                               Resultats des simulations
                                              Conclusion


 ´
Decouverte des parcours SMA


       `                         ´
   Systemes multi-agents distribues pour le management
                     ˆ                     ´
          et le controle des flux du trafic aerien

                                                Mohamed IMLI

                                                     ´
                                            Universite Paris Descartes


                                            13 Decembre 2012

                                            ´
                                      Encadre par Mr : Pavlos Moraitis




                                          Mohamed IMLI                  ´                                 ´
                                                            SMA distribues : Management des flux du trafic aerien
Introduction
                                                         ´
                           Management des flux du trafic aerien
                                                        ´
      Agent Intelligent du Management des flux du trafic aerien
                                     ´
                                   Resultats des simulations
                                                  Conclusion


Plan
  1      Introduction
  2                                   ´
         Management des flux du trafic aerien
           FACET
               `     ´
           Systeme d’evaluation
  3                                                        ´
         Agent Intelligent du Management des flux du trafic aerien
           Choix de l’agent
           Actions de l’agent
           Apprentissage de l’agent
                             ´
           Structure de la recompense de l’agent
                                ´          ´
           Estimation de la difference de recompense
  4       ´
         Resultats des simulations
            Avec congestion unique
            Avec deux congestions
  5      Conclusion
                                              Mohamed IMLI                  ´                                 ´
                                                                SMA distribues : Management des flux du trafic aerien
Introduction
                                                      ´
                        Management des flux du trafic aerien
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien
                                  ´
                                Resultats des simulations
                                               Conclusion


Introduction




                                   ´
         Gestion des flux du trafic aerien:
                           ´                   ´
                  Un des defis de l’industrie aerospaciale
                  40000 vols commercials par jour aux Etats-Unis
                         `                         ´    ´             `       ` ´
                  Le systeme actuel est centralise et herarchique : tres lent a reagir aux
                  changements
                  322272 heures de retard par an !
                  Cout : environ 3 Milliards $ par an !
                     ˆ




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction
                                                      ´
                        Management des flux du trafic aerien
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien
                                  ´
                                Resultats des simulations
                                               Conclusion


Introduction




                                   ´
         Gestion des flux du trafic aerien:
                                                  ´
                  Trouver des solutions fiables et evolutives :
                  ⇒ importance primordiale
                           Objectif de NGATS :
                          ⇒ acceuillir 3 fois plus de trafic actuel
       `                         ´
  Probleme naturellement distribue :
  ⇒ Solution naturelle : utilisation d’une approche Multi-agents
                 ´ ´       ´              ´
  une solution pre-determinee et centralisee est fortement sous-optimale !




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction
                                                      ´
                        Management des flux du trafic aerien
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien
                                  ´
                                Resultats des simulations
                                               Conclusion


Approche Multi-agents




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction
                                                      ´
                        Management des flux du trafic aerien
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien
                                  ´
                                Resultats des simulations
                                               Conclusion


Approche Multi-agents




                                 `
          Attribution de l’agent a une position dans un espace 2D
         ⇒ Un plan de vol est une suite de positions




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction
                                                      ´
                        Management des flux du trafic aerien
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien
                                  ´
                                Resultats des simulations
                                               Conclusion


Approche Multi-agents




                                 `
          Attribution de l’agent a une position dans un espace 2D
         ⇒ Un plan de vol est une suite de positions
  Objectif de chaque agent :
  ⇒ garder la distance de securite entre les avions
                           ´     ´




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction
                                                      ´
                        Management des flux du trafic aerien
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien
                                  ´
                                Resultats des simulations
                                               Conclusion


Approche Multi-agents




                                 `
          Attribution de l’agent a une position dans un espace 2D
         ⇒ Un plan de vol est une suite de positions
  Objectif de chaque agent :
  ⇒ garder la distance de securite entre les avions
                           ´     ´
  Actions :
  ⇒ Accelerer ou ralentir le flux local
         ´
  ⇒ Apprentissage par renforcement




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction
                                                      ´
                        Management des flux du trafic aerien
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien
                                  ´
                                Resultats des simulations
                                               Conclusion


Apprentissage par renforcement




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction
                                                      ´
                        Management des flux du trafic aerien
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien
                                  ´
                                Resultats des simulations
                                               Conclusion


 ´
Methode Monte Carlo

       But ?
       ⇒ Calcul de la moyenne d’une variable aleatoire
                                                 ´
  Principe ?
                          E [f (X )] =   f (Xi )             ∑                                                     (1)
                                                             i




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction
                                                      ´
                        Management des flux du trafic aerien
                                                             FACET
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien
                                                                 `     ´
                                                             Systeme d’evaluation
                                  ´
                                Resultats des simulations
                                               Conclusion


FACET (Future ATM Concepts Evaluation Tool)




                                                   Figure : Facet



                               ´      ´      ´
          Simulateur du trafic aerien developpe par NASA :
          Projection des plans de vols dans le temps
         ⇒ tester des algorithmes multi-agents

                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction
                                                      ´
                        Management des flux du trafic aerien
                                                             FACET
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien
                                                                 `     ´
                                                             Systeme d’evaluation
                                  ´
                                Resultats des simulations
                                               Conclusion


    `     ´
Systeme d’evaluation



                     ´                                  `
          Fonction d’evaluation des performances du systeme :

                                     G(z ) = −((1 − α)B (z ) + α C (z ))                                           (2)


                  B (z ) : penalite du retard de tous les avions du systeme
                            ´     ´                                     `
                  C (z ) : penalite pour la congestion totale du systeme
                            ´     ´                                   `
                        ´                   `
                  z : l’etat actuel du systeme
                                        ` ´ ´
                  α : Une constante a determiner




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction
                                                      ´
                        Management des flux du trafic aerien
                                                             FACET
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien
                                                                 `     ´
                                                             Systeme d’evaluation
                                  ´
                                Resultats des simulations
                                               Conclusion


    `     ´
Systeme d’evaluation



                     ´                                  `
          Fonction d’evaluation des performances du systeme :

                                     G(z ) = −((1 − α)B (z ) + α C (z ))                                           (2)


                  B (z ) : penalite du retard de tous les avions du systeme
                            ´     ´                                     `
                  C (z ) : penalite pour la congestion totale du systeme
                            ´     ´                                   `
                        ´                   `
                  z : l’etat actuel du systeme
                                        ` ´ ´
                  α : Une constante a determiner
                   L’objectif du systeme : Maximiser G(z )
                                     `




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction   Choix de l’agent
                                                      ´
                        Management des flux du trafic aerien   Actions de l’agent
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien   Apprentissage de l’agent
                                  ´
                                Resultats des simulations                     ´
                                                             Structure de la recompense de l’agent
                                               Conclusion                         ´          ´
                                                             Estimation de la difference de recompense


Choix de l’agent




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction   Choix de l’agent
                                                      ´
                        Management des flux du trafic aerien   Actions de l’agent
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien   Apprentissage de l’agent
                                  ´
                                Resultats des simulations                     ´
                                                             Structure de la recompense de l’agent
                                               Conclusion                         ´          ´
                                                             Estimation de la difference de recompense


Choix de l’agent



                 ´
         Le plus evident ?
         ⇒ Considerer chaque avion comme agent
                     ´




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction   Choix de l’agent
                                                      ´
                        Management des flux du trafic aerien   Actions de l’agent
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien   Apprentissage de l’agent
                                  ´
                                Resultats des simulations                     ´
                                                             Structure de la recompense de l’agent
                                               Conclusion                         ´          ´
                                                             Estimation de la difference de recompense


Choix de l’agent



                 ´
         Le plus evident ?
         ⇒ Considerer chaque avion comme agent
                     ´
                               `
  cette approche pose des problemes :
  ⇒ Un grand systeme massivement multi-agents
                    `
  ⇒ L’apprentissage est tres lent
                            `




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction   Choix de l’agent
                                                      ´
                        Management des flux du trafic aerien   Actions de l’agent
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien   Apprentissage de l’agent
                                  ´
                                Resultats des simulations                     ´
                                                             Structure de la recompense de l’agent
                                               Conclusion                         ´          ´
                                                             Estimation de la difference de recompense


Choix de l’agent



                 ´
         Le plus evident ?
         ⇒ Considerer chaque avion comme agent
                     ´
                               `
  cette approche pose des problemes :
  ⇒ Un grand systeme massivement multi-agents
                    `
  ⇒ L’apprentissage est tres lent
                            `
  Solution ?
  ⇒ Assigner des agents a des positions sur un espace a 2D
                         `                            `
  ⇒ Une zone sur le sol de l’espace aerien
                                     ´
  ⇒ Definie par ses coordonnees
        ´                     ´




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction   Choix de l’agent
                                                      ´
                        Management des flux du trafic aerien   Actions de l’agent
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien   Apprentissage de l’agent
                                  ´
                                Resultats des simulations                     ´
                                                             Structure de la recompense de l’agent
                                               Conclusion                         ´          ´
                                                             Estimation de la difference de recompense


                    `
Architecture du systeme multi-agent




                                        ´
                            Figure : Schema de l’architecture des agents

                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction   Choix de l’agent
                                                      ´
                        Management des flux du trafic aerien   Actions de l’agent
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien   Apprentissage de l’agent
                                  ´
                                Resultats des simulations                     ´
                                                             Structure de la recompense de l’agent
                                               Conclusion                         ´          ´
                                                             Estimation de la difference de recompense


Actions de l’agent




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction   Choix de l’agent
                                                      ´
                        Management des flux du trafic aerien   Actions de l’agent
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien   Apprentissage de l’agent
                                  ´
                                Resultats des simulations                     ´
                                                             Structure de la recompense de l’agent
                                               Conclusion                         ´          ´
                                                             Estimation de la difference de recompense


Actions de l’agent



                  ´
         Un choix evident ?
         ⇒ Soumettre les avions aux agents ..




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction   Choix de l’agent
                                                      ´
                        Management des flux du trafic aerien   Actions de l’agent
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien   Apprentissage de l’agent
                                  ´
                                Resultats des simulations                     ´
                                                             Structure de la recompense de l’agent
                                               Conclusion                         ´          ´
                                                             Estimation de la difference de recompense


Actions de l’agent



                  ´
         Un choix evident ?
         ⇒ Soumettre les avions aux agents ..
                      ´                  `
  cette approche pose egalement des problemes :
  ⇒ Les plans de vols seront moins fiables et compliques
                                                     ´
  ⇒ probleme d’ordonnecement
         `




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction   Choix de l’agent
                                                      ´
                        Management des flux du trafic aerien   Actions de l’agent
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien   Apprentissage de l’agent
                                  ´
                                Resultats des simulations                     ´
                                                             Structure de la recompense de l’agent
                                               Conclusion                         ´          ´
                                                             Estimation de la difference de recompense


Actions de l’agent



                  ´
         Un choix evident ?
         ⇒ Soumettre les avions aux agents ..
                      ´                  `
  cette approche pose egalement des problemes :
  ⇒ Les plans de vols seront moins fiables et compliques
                                                     ´
  ⇒ probleme d’ordonnecement
         `
  Solution ?
  ⇒ Action : garder la distance de securite entre les avions
                                    ´     ´
  ⇒ Cette distance s’appelle MIT
  ⇒ L’agent augmente au diminue la distance MIT



                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction   Choix de l’agent
                                                      ´
                        Management des flux du trafic aerien   Actions de l’agent
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien   Apprentissage de l’agent
                                  ´
                                Resultats des simulations                     ´
                                                             Structure de la recompense de l’agent
                                               Conclusion                         ´          ´
                                                             Estimation de la difference de recompense


Apprentissage de l’agent




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction   Choix de l’agent
                                                      ´
                        Management des flux du trafic aerien   Actions de l’agent
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien   Apprentissage de l’agent
                                  ´
                                Resultats des simulations                     ´
                                                             Structure de la recompense de l’agent
                                               Conclusion                         ´          ´
                                                             Estimation de la difference de recompense


Apprentissage de l’agent


                         `               ´
         L’agent cherche a maximiser sa recompense
         ⇒ Objectif : apprendre les meilleurs valeurs de MIT

                                     Q (a) = (1 − ε)Q (a) + ε(R )
                                      ´                                                                            (3)




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction   Choix de l’agent
                                                      ´
                        Management des flux du trafic aerien   Actions de l’agent
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien   Apprentissage de l’agent
                                  ´
                                Resultats des simulations                     ´
                                                             Structure de la recompense de l’agent
                                               Conclusion                         ´          ´
                                                             Estimation de la difference de recompense


Apprentissage de l’agent


                         `               ´
         L’agent cherche a maximiser sa recompense
         ⇒ Objectif : apprendre les meilleurs valeurs de MIT

                                     Q (a) = (1 − ε)Q (a) + ε(R )
                                      ´                                                                            (3)

  `        ´
  a chaque etape l’agent choisi :
  L’action a avec la probabilite : 1 − ε
                               ´
  →
  Exploitation de sa connaissance
               ´                         ´
  Une action aleatoire avec la probabilite : ε
  →
  Exploration des autres actions


                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction   Choix de l’agent
                                                      ´
                        Management des flux du trafic aerien   Actions de l’agent
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien   Apprentissage de l’agent
                                  ´
                                Resultats des simulations                     ´
                                                             Structure de la recompense de l’agent
                                               Conclusion                         ´          ´
                                                             Estimation de la difference de recompense


                 ´
Structure de la recompense de l’agent




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction   Choix de l’agent
                                                      ´
                        Management des flux du trafic aerien   Actions de l’agent
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien   Apprentissage de l’agent
                                  ´
                                Resultats des simulations                     ´
                                                             Structure de la recompense de l’agent
                                               Conclusion                         ´          ´
                                                             Estimation de la difference de recompense


                 ´
Structure de la recompense de l’agent


                  `
         Une premiere approche ?
         ⇒ performance du systeme
                              `




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction   Choix de l’agent
                                                      ´
                        Management des flux du trafic aerien   Actions de l’agent
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien   Apprentissage de l’agent
                                  ´
                                Resultats des simulations                     ´
                                                             Structure de la recompense de l’agent
                                               Conclusion                         ´          ´
                                                             Estimation de la difference de recompense


                 ´
Structure de la recompense de l’agent


                  `
         Une premiere approche ?
         ⇒ performance du systeme
                              `
  cette approche n’est pas la meilleure
  ⇒ Ralentissement de l’apprentissage




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction   Choix de l’agent
                                                      ´
                        Management des flux du trafic aerien   Actions de l’agent
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien   Apprentissage de l’agent
                                  ´
                                Resultats des simulations                     ´
                                                             Structure de la recompense de l’agent
                                               Conclusion                         ´          ´
                                                             Estimation de la difference de recompense


                 ´
Structure de la recompense de l’agent


                  `
         Une premiere approche ?
         ⇒ performance du systeme
                              `
  cette approche n’est pas la meilleure
  ⇒ Ralentissement de l’apprentissage
  Solution ?
  ⇒ Considerer la difference de la recompense :
             ´        ´             ´

                                      Di = G(z ) − G(z − zi + ci )                                                 (4)

  zi est l’action de l’agent i




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction   Choix de l’agent
                                                      ´
                        Management des flux du trafic aerien   Actions de l’agent
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien   Apprentissage de l’agent
                                  ´
                                Resultats des simulations                     ´
                                                             Structure de la recompense de l’agent
                                               Conclusion                         ´          ´
                                                             Estimation de la difference de recompense


                     ´          ´
Estimation de la difference de recompense




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction   Choix de l’agent
                                                      ´
                        Management des flux du trafic aerien   Actions de l’agent
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien   Apprentissage de l’agent
                                  ´
                                Resultats des simulations                     ´
                                                             Structure de la recompense de l’agent
                                               Conclusion                         ´          ´
                                                             Estimation de la difference de recompense


                     ´          ´
Estimation de la difference de recompense



         ⇒ Impossible de calculer directement Di




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction   Choix de l’agent
                                                      ´
                        Management des flux du trafic aerien   Actions de l’agent
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien   Apprentissage de l’agent
                                  ´
                                Resultats des simulations                     ´
                                                             Structure de la recompense de l’agent
                                               Conclusion                         ´          ´
                                                             Estimation de la difference de recompense


                     ´          ´
Estimation de la difference de recompense



         ⇒ Impossible de calculer directement Di
  Solution ?
  ⇒ Faire une estimation

               Diest1 = Gf (f (z )) − Gf (f (z ) − E (f (z )/zi ) + E (f (z )/ci ))                                (5)


                 Diest2 = Gf (f (z )) − Gf (f (z ) − E (f (z )/zi ) + E (f (z )))                                  (6)




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction
                                                      ´
                        Management des flux du trafic aerien
                                                             Avec congestion unique
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien
                                                             Avec deux congestions
                                  ´
                                Resultats des simulations
                                               Conclusion


Simulation avec congestion unique




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction
                                                      ´
                        Management des flux du trafic aerien
                                                             Avec congestion unique
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien
                                                             Avec deux congestions
                                  ´
                                Resultats des simulations
                                               Conclusion


Simulation avec deux congestions




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction
                                                     ´
                       Management des flux du trafic aerien
                                                            Avec congestion unique
                                                    ´
  Agent Intelligent du Management des flux du trafic aerien
                                                            Avec deux congestions
                                 ´
                               Resultats des simulations
                                              Conclusion


Nombre d’agents




                                          Mohamed IMLI                  ´                                 ´
                                                            SMA distribues : Management des flux du trafic aerien
Introduction
                                                     ´
                       Management des flux du trafic aerien
                                                            Avec congestion unique
                                                    ´
  Agent Intelligent du Management des flux du trafic aerien
                                                            Avec deux congestions
                                 ´
                               Resultats des simulations
                                              Conclusion


Influence de α




                                          Mohamed IMLI                  ´                                 ´
                                                            SMA distribues : Management des flux du trafic aerien
Introduction
                                                      ´
                        Management des flux du trafic aerien
                                                             Avec congestion unique
                                                     ´
   Agent Intelligent du Management des flux du trafic aerien
                                                             Avec deux congestions
                                  ´
                                Resultats des simulations
                                               Conclusion


Cout de calcul
  ˆ




                                           Mohamed IMLI                  ´                                 ´
                                                             SMA distribues : Management des flux du trafic aerien
Introduction
                                                     ´
                       Management des flux du trafic aerien
                                                    ´
  Agent Intelligent du Management des flux du trafic aerien
                                 ´
                               Resultats des simulations
                                              Conclusion


Conclusion




                             ´
        Une solution distribuee adaptative
        Pas de changement radical




                                          Mohamed IMLI                  ´                                 ´
                                                            SMA distribues : Management des flux du trafic aerien
Introduction
                                                     ´
                       Management des flux du trafic aerien
                                                    ´
  Agent Intelligent du Management des flux du trafic aerien
                                 ´
                               Resultats des simulations
                                              Conclusion


Conclusion




                             ´
        Une solution distribuee adaptative
        Pas de changement radical
        D’autres pistes ?
        Chercher d’autres algorithmes
        Etendre la notion d’agent aux secteurs




                                          Mohamed IMLI                  ´                                 ´
                                                            SMA distribues : Management des flux du trafic aerien

Contenu connexe

En vedette

Sistema informativo
Sistema informativoSistema informativo
Sistema informativomauro644
 
seguridad informática
 seguridad informática seguridad informática
seguridad informáticaSeba Pinilla
 
Informatica educativa
Informatica educativaInformatica educativa
Informatica educativaoswaldobaez
 
Proyecto de vida corregido
Proyecto de vida corregidoProyecto de vida corregido
Proyecto de vida corregidoMarina Rea
 
Press book Carré Rive Gauche 2014
Press book Carré Rive Gauche 2014Press book Carré Rive Gauche 2014
Press book Carré Rive Gauche 2014Agence Colonnes
 
Trabajo pràctico nº2 tcs urdiro quiroz
Trabajo pràctico nº2 tcs urdiro quirozTrabajo pràctico nº2 tcs urdiro quiroz
Trabajo pràctico nº2 tcs urdiro quirozdeboquiroz
 
Formation d'agent immobilier
Formation d'agent immobilierFormation d'agent immobilier
Formation d'agent immobilierVIDATIIMMO
 
Ensayo n maiz inta 2011
Ensayo n maiz inta 2011Ensayo n maiz inta 2011
Ensayo n maiz inta 2011NUTRIX S.A.
 
Problématiques du Multi-Touch Analytics
Problématiques du Multi-Touch AnalyticsProblématiques du Multi-Touch Analytics
Problématiques du Multi-Touch Analyticsemachy
 
Diapositivas de 102
Diapositivas de 102Diapositivas de 102
Diapositivas de 102gpool-scout
 
Presentación power point
Presentación power pointPresentación power point
Presentación power pointchaves52
 
Trabajo de la planta
Trabajo de la plantaTrabajo de la planta
Trabajo de la plantaslenderrr
 

En vedette (20)

Sistema informativo
Sistema informativoSistema informativo
Sistema informativo
 
seguridad informática
 seguridad informática seguridad informática
seguridad informática
 
Comenzar
ComenzarComenzar
Comenzar
 
Informatica educativa
Informatica educativaInformatica educativa
Informatica educativa
 
Proyecto de vida corregido
Proyecto de vida corregidoProyecto de vida corregido
Proyecto de vida corregido
 
Presentacion slideshare silvia
Presentacion slideshare silviaPresentacion slideshare silvia
Presentacion slideshare silvia
 
Press book Carré Rive Gauche 2014
Press book Carré Rive Gauche 2014Press book Carré Rive Gauche 2014
Press book Carré Rive Gauche 2014
 
Islamismo
IslamismoIslamismo
Islamismo
 
Trabajo pràctico nº2 tcs urdiro quiroz
Trabajo pràctico nº2 tcs urdiro quirozTrabajo pràctico nº2 tcs urdiro quiroz
Trabajo pràctico nº2 tcs urdiro quiroz
 
Respuesta a radicado uc 20142010455092 (2)
Respuesta a  radicado uc 20142010455092 (2)Respuesta a  radicado uc 20142010455092 (2)
Respuesta a radicado uc 20142010455092 (2)
 
Formation d'agent immobilier
Formation d'agent immobilierFormation d'agent immobilier
Formation d'agent immobilier
 
Ensayo n maiz inta 2011
Ensayo n maiz inta 2011Ensayo n maiz inta 2011
Ensayo n maiz inta 2011
 
Pop
PopPop
Pop
 
Problématiques du Multi-Touch Analytics
Problématiques du Multi-Touch AnalyticsProblématiques du Multi-Touch Analytics
Problématiques du Multi-Touch Analytics
 
Diapositivas de 102
Diapositivas de 102Diapositivas de 102
Diapositivas de 102
 
Presentación power point
Presentación power pointPresentación power point
Presentación power point
 
Baile 16 de noviembre
Baile 16 de noviembreBaile 16 de noviembre
Baile 16 de noviembre
 
Trabajo de la planta
Trabajo de la plantaTrabajo de la planta
Trabajo de la planta
 
Analisis sector salud-haiti_fr
Analisis sector salud-haiti_frAnalisis sector salud-haiti_fr
Analisis sector salud-haiti_fr
 
Test
TestTest
Test
 

Systèmes multi-agents & flux du trafic aérien

  • 1. Introduction ´ Management des flux du trafic aerien ´ Agent Intelligent du Management des flux du trafic aerien ´ Resultats des simulations Conclusion ´ Decouverte des parcours SMA ` ´ Systemes multi-agents distribues pour le management ˆ ´ et le controle des flux du trafic aerien Mohamed IMLI ´ Universite Paris Descartes 13 Decembre 2012 ´ Encadre par Mr : Pavlos Moraitis Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 2. Introduction ´ Management des flux du trafic aerien ´ Agent Intelligent du Management des flux du trafic aerien ´ Resultats des simulations Conclusion Plan 1 Introduction 2 ´ Management des flux du trafic aerien FACET ` ´ Systeme d’evaluation 3 ´ Agent Intelligent du Management des flux du trafic aerien Choix de l’agent Actions de l’agent Apprentissage de l’agent ´ Structure de la recompense de l’agent ´ ´ Estimation de la difference de recompense 4 ´ Resultats des simulations Avec congestion unique Avec deux congestions 5 Conclusion Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 3. Introduction ´ Management des flux du trafic aerien ´ Agent Intelligent du Management des flux du trafic aerien ´ Resultats des simulations Conclusion Introduction ´ Gestion des flux du trafic aerien: ´ ´ Un des defis de l’industrie aerospaciale 40000 vols commercials par jour aux Etats-Unis ` ´ ´ ` ` ´ Le systeme actuel est centralise et herarchique : tres lent a reagir aux changements 322272 heures de retard par an ! Cout : environ 3 Milliards $ par an ! ˆ Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 4. Introduction ´ Management des flux du trafic aerien ´ Agent Intelligent du Management des flux du trafic aerien ´ Resultats des simulations Conclusion Introduction ´ Gestion des flux du trafic aerien: ´ Trouver des solutions fiables et evolutives : ⇒ importance primordiale Objectif de NGATS : ⇒ acceuillir 3 fois plus de trafic actuel ` ´ Probleme naturellement distribue : ⇒ Solution naturelle : utilisation d’une approche Multi-agents ´ ´ ´ ´ une solution pre-determinee et centralisee est fortement sous-optimale ! Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 5. Introduction ´ Management des flux du trafic aerien ´ Agent Intelligent du Management des flux du trafic aerien ´ Resultats des simulations Conclusion Approche Multi-agents Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 6. Introduction ´ Management des flux du trafic aerien ´ Agent Intelligent du Management des flux du trafic aerien ´ Resultats des simulations Conclusion Approche Multi-agents ` Attribution de l’agent a une position dans un espace 2D ⇒ Un plan de vol est une suite de positions Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 7. Introduction ´ Management des flux du trafic aerien ´ Agent Intelligent du Management des flux du trafic aerien ´ Resultats des simulations Conclusion Approche Multi-agents ` Attribution de l’agent a une position dans un espace 2D ⇒ Un plan de vol est une suite de positions Objectif de chaque agent : ⇒ garder la distance de securite entre les avions ´ ´ Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 8. Introduction ´ Management des flux du trafic aerien ´ Agent Intelligent du Management des flux du trafic aerien ´ Resultats des simulations Conclusion Approche Multi-agents ` Attribution de l’agent a une position dans un espace 2D ⇒ Un plan de vol est une suite de positions Objectif de chaque agent : ⇒ garder la distance de securite entre les avions ´ ´ Actions : ⇒ Accelerer ou ralentir le flux local ´ ⇒ Apprentissage par renforcement Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 9. Introduction ´ Management des flux du trafic aerien ´ Agent Intelligent du Management des flux du trafic aerien ´ Resultats des simulations Conclusion Apprentissage par renforcement Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 10. Introduction ´ Management des flux du trafic aerien ´ Agent Intelligent du Management des flux du trafic aerien ´ Resultats des simulations Conclusion ´ Methode Monte Carlo But ? ⇒ Calcul de la moyenne d’une variable aleatoire ´ Principe ? E [f (X )] = f (Xi ) ∑ (1) i Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 11. Introduction ´ Management des flux du trafic aerien FACET ´ Agent Intelligent du Management des flux du trafic aerien ` ´ Systeme d’evaluation ´ Resultats des simulations Conclusion FACET (Future ATM Concepts Evaluation Tool) Figure : Facet ´ ´ ´ Simulateur du trafic aerien developpe par NASA : Projection des plans de vols dans le temps ⇒ tester des algorithmes multi-agents Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 12. Introduction ´ Management des flux du trafic aerien FACET ´ Agent Intelligent du Management des flux du trafic aerien ` ´ Systeme d’evaluation ´ Resultats des simulations Conclusion ` ´ Systeme d’evaluation ´ ` Fonction d’evaluation des performances du systeme : G(z ) = −((1 − α)B (z ) + α C (z )) (2) B (z ) : penalite du retard de tous les avions du systeme ´ ´ ` C (z ) : penalite pour la congestion totale du systeme ´ ´ ` ´ ` z : l’etat actuel du systeme ` ´ ´ α : Une constante a determiner Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 13. Introduction ´ Management des flux du trafic aerien FACET ´ Agent Intelligent du Management des flux du trafic aerien ` ´ Systeme d’evaluation ´ Resultats des simulations Conclusion ` ´ Systeme d’evaluation ´ ` Fonction d’evaluation des performances du systeme : G(z ) = −((1 − α)B (z ) + α C (z )) (2) B (z ) : penalite du retard de tous les avions du systeme ´ ´ ` C (z ) : penalite pour la congestion totale du systeme ´ ´ ` ´ ` z : l’etat actuel du systeme ` ´ ´ α : Une constante a determiner L’objectif du systeme : Maximiser G(z ) ` Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 14. Introduction Choix de l’agent ´ Management des flux du trafic aerien Actions de l’agent ´ Agent Intelligent du Management des flux du trafic aerien Apprentissage de l’agent ´ Resultats des simulations ´ Structure de la recompense de l’agent Conclusion ´ ´ Estimation de la difference de recompense Choix de l’agent Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 15. Introduction Choix de l’agent ´ Management des flux du trafic aerien Actions de l’agent ´ Agent Intelligent du Management des flux du trafic aerien Apprentissage de l’agent ´ Resultats des simulations ´ Structure de la recompense de l’agent Conclusion ´ ´ Estimation de la difference de recompense Choix de l’agent ´ Le plus evident ? ⇒ Considerer chaque avion comme agent ´ Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 16. Introduction Choix de l’agent ´ Management des flux du trafic aerien Actions de l’agent ´ Agent Intelligent du Management des flux du trafic aerien Apprentissage de l’agent ´ Resultats des simulations ´ Structure de la recompense de l’agent Conclusion ´ ´ Estimation de la difference de recompense Choix de l’agent ´ Le plus evident ? ⇒ Considerer chaque avion comme agent ´ ` cette approche pose des problemes : ⇒ Un grand systeme massivement multi-agents ` ⇒ L’apprentissage est tres lent ` Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 17. Introduction Choix de l’agent ´ Management des flux du trafic aerien Actions de l’agent ´ Agent Intelligent du Management des flux du trafic aerien Apprentissage de l’agent ´ Resultats des simulations ´ Structure de la recompense de l’agent Conclusion ´ ´ Estimation de la difference de recompense Choix de l’agent ´ Le plus evident ? ⇒ Considerer chaque avion comme agent ´ ` cette approche pose des problemes : ⇒ Un grand systeme massivement multi-agents ` ⇒ L’apprentissage est tres lent ` Solution ? ⇒ Assigner des agents a des positions sur un espace a 2D ` ` ⇒ Une zone sur le sol de l’espace aerien ´ ⇒ Definie par ses coordonnees ´ ´ Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 18. Introduction Choix de l’agent ´ Management des flux du trafic aerien Actions de l’agent ´ Agent Intelligent du Management des flux du trafic aerien Apprentissage de l’agent ´ Resultats des simulations ´ Structure de la recompense de l’agent Conclusion ´ ´ Estimation de la difference de recompense ` Architecture du systeme multi-agent ´ Figure : Schema de l’architecture des agents Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 19. Introduction Choix de l’agent ´ Management des flux du trafic aerien Actions de l’agent ´ Agent Intelligent du Management des flux du trafic aerien Apprentissage de l’agent ´ Resultats des simulations ´ Structure de la recompense de l’agent Conclusion ´ ´ Estimation de la difference de recompense Actions de l’agent Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 20. Introduction Choix de l’agent ´ Management des flux du trafic aerien Actions de l’agent ´ Agent Intelligent du Management des flux du trafic aerien Apprentissage de l’agent ´ Resultats des simulations ´ Structure de la recompense de l’agent Conclusion ´ ´ Estimation de la difference de recompense Actions de l’agent ´ Un choix evident ? ⇒ Soumettre les avions aux agents .. Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 21. Introduction Choix de l’agent ´ Management des flux du trafic aerien Actions de l’agent ´ Agent Intelligent du Management des flux du trafic aerien Apprentissage de l’agent ´ Resultats des simulations ´ Structure de la recompense de l’agent Conclusion ´ ´ Estimation de la difference de recompense Actions de l’agent ´ Un choix evident ? ⇒ Soumettre les avions aux agents .. ´ ` cette approche pose egalement des problemes : ⇒ Les plans de vols seront moins fiables et compliques ´ ⇒ probleme d’ordonnecement ` Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 22. Introduction Choix de l’agent ´ Management des flux du trafic aerien Actions de l’agent ´ Agent Intelligent du Management des flux du trafic aerien Apprentissage de l’agent ´ Resultats des simulations ´ Structure de la recompense de l’agent Conclusion ´ ´ Estimation de la difference de recompense Actions de l’agent ´ Un choix evident ? ⇒ Soumettre les avions aux agents .. ´ ` cette approche pose egalement des problemes : ⇒ Les plans de vols seront moins fiables et compliques ´ ⇒ probleme d’ordonnecement ` Solution ? ⇒ Action : garder la distance de securite entre les avions ´ ´ ⇒ Cette distance s’appelle MIT ⇒ L’agent augmente au diminue la distance MIT Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 23. Introduction Choix de l’agent ´ Management des flux du trafic aerien Actions de l’agent ´ Agent Intelligent du Management des flux du trafic aerien Apprentissage de l’agent ´ Resultats des simulations ´ Structure de la recompense de l’agent Conclusion ´ ´ Estimation de la difference de recompense Apprentissage de l’agent Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 24. Introduction Choix de l’agent ´ Management des flux du trafic aerien Actions de l’agent ´ Agent Intelligent du Management des flux du trafic aerien Apprentissage de l’agent ´ Resultats des simulations ´ Structure de la recompense de l’agent Conclusion ´ ´ Estimation de la difference de recompense Apprentissage de l’agent ` ´ L’agent cherche a maximiser sa recompense ⇒ Objectif : apprendre les meilleurs valeurs de MIT Q (a) = (1 − ε)Q (a) + ε(R ) ´ (3) Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 25. Introduction Choix de l’agent ´ Management des flux du trafic aerien Actions de l’agent ´ Agent Intelligent du Management des flux du trafic aerien Apprentissage de l’agent ´ Resultats des simulations ´ Structure de la recompense de l’agent Conclusion ´ ´ Estimation de la difference de recompense Apprentissage de l’agent ` ´ L’agent cherche a maximiser sa recompense ⇒ Objectif : apprendre les meilleurs valeurs de MIT Q (a) = (1 − ε)Q (a) + ε(R ) ´ (3) ` ´ a chaque etape l’agent choisi : L’action a avec la probabilite : 1 − ε ´ → Exploitation de sa connaissance ´ ´ Une action aleatoire avec la probabilite : ε → Exploration des autres actions Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 26. Introduction Choix de l’agent ´ Management des flux du trafic aerien Actions de l’agent ´ Agent Intelligent du Management des flux du trafic aerien Apprentissage de l’agent ´ Resultats des simulations ´ Structure de la recompense de l’agent Conclusion ´ ´ Estimation de la difference de recompense ´ Structure de la recompense de l’agent Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 27. Introduction Choix de l’agent ´ Management des flux du trafic aerien Actions de l’agent ´ Agent Intelligent du Management des flux du trafic aerien Apprentissage de l’agent ´ Resultats des simulations ´ Structure de la recompense de l’agent Conclusion ´ ´ Estimation de la difference de recompense ´ Structure de la recompense de l’agent ` Une premiere approche ? ⇒ performance du systeme ` Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 28. Introduction Choix de l’agent ´ Management des flux du trafic aerien Actions de l’agent ´ Agent Intelligent du Management des flux du trafic aerien Apprentissage de l’agent ´ Resultats des simulations ´ Structure de la recompense de l’agent Conclusion ´ ´ Estimation de la difference de recompense ´ Structure de la recompense de l’agent ` Une premiere approche ? ⇒ performance du systeme ` cette approche n’est pas la meilleure ⇒ Ralentissement de l’apprentissage Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 29. Introduction Choix de l’agent ´ Management des flux du trafic aerien Actions de l’agent ´ Agent Intelligent du Management des flux du trafic aerien Apprentissage de l’agent ´ Resultats des simulations ´ Structure de la recompense de l’agent Conclusion ´ ´ Estimation de la difference de recompense ´ Structure de la recompense de l’agent ` Une premiere approche ? ⇒ performance du systeme ` cette approche n’est pas la meilleure ⇒ Ralentissement de l’apprentissage Solution ? ⇒ Considerer la difference de la recompense : ´ ´ ´ Di = G(z ) − G(z − zi + ci ) (4) zi est l’action de l’agent i Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 30. Introduction Choix de l’agent ´ Management des flux du trafic aerien Actions de l’agent ´ Agent Intelligent du Management des flux du trafic aerien Apprentissage de l’agent ´ Resultats des simulations ´ Structure de la recompense de l’agent Conclusion ´ ´ Estimation de la difference de recompense ´ ´ Estimation de la difference de recompense Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 31. Introduction Choix de l’agent ´ Management des flux du trafic aerien Actions de l’agent ´ Agent Intelligent du Management des flux du trafic aerien Apprentissage de l’agent ´ Resultats des simulations ´ Structure de la recompense de l’agent Conclusion ´ ´ Estimation de la difference de recompense ´ ´ Estimation de la difference de recompense ⇒ Impossible de calculer directement Di Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 32. Introduction Choix de l’agent ´ Management des flux du trafic aerien Actions de l’agent ´ Agent Intelligent du Management des flux du trafic aerien Apprentissage de l’agent ´ Resultats des simulations ´ Structure de la recompense de l’agent Conclusion ´ ´ Estimation de la difference de recompense ´ ´ Estimation de la difference de recompense ⇒ Impossible de calculer directement Di Solution ? ⇒ Faire une estimation Diest1 = Gf (f (z )) − Gf (f (z ) − E (f (z )/zi ) + E (f (z )/ci )) (5) Diest2 = Gf (f (z )) − Gf (f (z ) − E (f (z )/zi ) + E (f (z ))) (6) Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 33. Introduction ´ Management des flux du trafic aerien Avec congestion unique ´ Agent Intelligent du Management des flux du trafic aerien Avec deux congestions ´ Resultats des simulations Conclusion Simulation avec congestion unique Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 34. Introduction ´ Management des flux du trafic aerien Avec congestion unique ´ Agent Intelligent du Management des flux du trafic aerien Avec deux congestions ´ Resultats des simulations Conclusion Simulation avec deux congestions Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 35. Introduction ´ Management des flux du trafic aerien Avec congestion unique ´ Agent Intelligent du Management des flux du trafic aerien Avec deux congestions ´ Resultats des simulations Conclusion Nombre d’agents Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 36. Introduction ´ Management des flux du trafic aerien Avec congestion unique ´ Agent Intelligent du Management des flux du trafic aerien Avec deux congestions ´ Resultats des simulations Conclusion Influence de α Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 37. Introduction ´ Management des flux du trafic aerien Avec congestion unique ´ Agent Intelligent du Management des flux du trafic aerien Avec deux congestions ´ Resultats des simulations Conclusion Cout de calcul ˆ Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 38. Introduction ´ Management des flux du trafic aerien ´ Agent Intelligent du Management des flux du trafic aerien ´ Resultats des simulations Conclusion Conclusion ´ Une solution distribuee adaptative Pas de changement radical Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien
  • 39. Introduction ´ Management des flux du trafic aerien ´ Agent Intelligent du Management des flux du trafic aerien ´ Resultats des simulations Conclusion Conclusion ´ Une solution distribuee adaptative Pas de changement radical D’autres pistes ? Chercher d’autres algorithmes Etendre la notion d’agent aux secteurs Mohamed IMLI ´ ´ SMA distribues : Management des flux du trafic aerien