SlideShare ist ein Scribd-Unternehmen logo
1 von 17
Downloaden Sie, um offline zu lesen
協調荷押し問題の複雑性に関する考察
  Complexity of Cooperative Package Pushing Problem




                 複合情報学専攻 複雑系工学講座
              調和系工学研究室 修士2年 高橋 春樹
背景
MASの設計技術を向上させるため,適切な難易度の問題設定が必要

 MAS
  設
  計
  技
  術               創発(GAなどによるMAS設計)

                 現状:「評価関数 = 問題の難易度」



                     適用問題の難易度

評価関数による難易度
       評価関数に現れない性質も多く,
       問題の難易度を正しく表しているとはいえない


       問題の難易度を正しく測る指標が必要
目的
既存の問題群の複雑性や難易度の順序関係を求め
    複雑さの新しい指標の知見を得る



    問題の難易度         新しい指標



                       知見
    既存の問題群

                   順序関係を導く



 発現したエージェント群の複雑性
システムの複雑性の指標
情報エントロピーと相互情報量
 自己組織化するシステムにおける情報エントロピー                  散逸構造論、非平衡開放系

   ・エントロピーの低い状態 : 情報を獲得して行動が自己組織化
   ・エントロピーが増える : 情報を獲得していない,異なる安定状態に移行

   ・エージェントと環境のエントロピーのやりとり[Parunak 2001]
   ・非平衡開放系としてのMASにおけるエントロピーのふるまい[Guerin 2004]

エージェントにとっての情報の価値を定量化する相互情報量
  ・相互情報量が大きい : 情報がエージェントにとって意味のあるものとなっている
  ・相互情報量が小さい : 情報がエージェントにとって意味のないものとなっている

  ・エージェントの相互作用の定量化[西川 2004]
  ・セルオートマトンの複雑さと計算能力の指標[Langton 1990]


 こうした指標を用いたシステム間の比較は行われていない
研究概要

   問題の難易度         新しい指標



                      知見
   既存の問題群

                  順序関係を導く



発現したエージェント群の複雑性
協調荷押し問題 概要
 MASの協調行動を促す問題設定         [大倉2008][片田2008][伍賀2007]


均一な自律エージェント              荷の数字は押すために必要なエージェント数


                   5               3            2




                                                ゴール



                                       シミュレータとしてODEを使用



        様々な設定 : エージェント数 , 荷の数 , 配置


   設定により,難易度がどのように変化するかは不明
問題一覧
下図のようなエージェント数,荷の配置でシミュレーション
               エージェント数n体,荷の数m個の設定をnAmPと表記する

                                                          1A1P           2A1P
                                                  1              2


         2A2P               3A1P       3A2P       1       3A3P           4A1P
    1                              2
                    3                             1                  4
    1                              1
                                                      1

         4A2P      1        4A4P       5A1P               5A2P       1 5A3P
2                                                     1
                   1               5                                 3
2                  1                                  4
                       1                                             1
                            6A1P       6A2P       1 6A3P         1       6A6P
1       5A5P                       3                             1
1                                             2                  1
1                       6                                        1
    1                              3
1                                             3                  1
                                                                 1
エージェントの入出力
                              Input0~7   0or1   IRセンサ
                              Input8     -1~1   エージェントとの距離(2m以下)

                              Input9     -1~1   〃(2m~5m)

                              Input10    -1~1   〃(5m~)

                              Input11    -1~1   エージェントとの角度sinα

                              Input12    -1~1   〃cosα
                  GAによって学習    Input13    -1~1   荷との距離(2m以下)
                              Input14    -1~1   〃(2m∼5m)
    最近のエージェント
                              Input15    -1~1   〃(5m∼)

                  最近の荷        Input16    -1~1   最近の荷との角度sinβ
y
                              Input17    -1~1   〃cosβ
                         針路
                              Input18    -1~1   エージェントの針路sinγ
      α       β
                              Input19    -1~1   〃cosγ
                   x
          γ                   Output0    -1~1   左モータの出力(目標角速度)
                              Output1    -1~1   右モータの出力
情報量の計算

              各エージェント毎に観測された入出力の確率分布から
                  情報エントロピーと相互情報量を計算


  IN={input0,input1,     入力                                             OUT={out0,out1}
     ・・・,input }
              19
                                                       出力
        PIN                                                                      POUT


     情報エントロピー                            相互情報量
                                                                                   p(out, input )
H (OUT )           P(out) log P(out)   I (OUT ; IN )              p(out, input ) log
                                                       out   in                   P(out ) P(input )
                                                                          H (OUT ) H (OUT | IN )
出力のエントロピー = 行動の多様性                       入力と出力の相互情報量 =センサの重要性

                                            出力のエントロピーで割ることで入力が
                                            出力に与える割合を算出
各設定毎の情報量
個別の設定毎に適用 (エージェント2体 荷1個の例)

           2A1P


                      相互情報量から,各エージェントの
                      入力の処理の違いを比較




      エージェント1の相互情報量         エージェント2の相互情報量
研究概要

   問題の難易度         新しい指標



                      知見
   既存の問題群

                  順序関係を導く



発現したエージェント群の複雑性
設定毎に発現したエージェント差
      「タスク達成に要求されるエージェントの多様さ」 =設定の複雑性
      とすると
      「一つの設定で発生したエージェントの差」=設定の複雑性

            各エージェントの相互情報量をベクトルとして捉え距離を算出




        エージェント1の各相互情報量                                                  エージェント2の各相互情報量
 A1 = {IR 1, Ar1 , Ad1 , Pr 1, Pd1 , D1}            A2 = {IR2 , Ar2 , Ad2 , Pr2 , Pd2 , D2}

                          ( IR   1       IR     2   )       2
                                                                        ( Ar    1       Ar       2   )   2


エージェント間の距離=               ( Ad       1     Ad           2       )   2
                                                                          (Pr       1   Pr       2   )   2


                          ( Pd       1     Pd       2       )       2
                                                                          ( d   1       d    2   )   2
設定毎に現れるエージェントの違い
    エージェント間の差が大きかった問題設定順に並べたもの


エ
ー
ジ
ェ
ン
ト
間
の
距
離




                                  各設定
      エージェントや荷の数に応じて差が大きくなっていない
組み合わせとの照合
 荷に対してエージェントを割り当てる組み合わせの数で並べ替えたもの




荷にエージェントを割り当てる組み合わせの数≠問題の複雑さ
動作からの考察

               最も相互情報量に差のあったエージェントを比較
                  5Agents 3Packagesのデータ

                  2体のエージェントでは挙動やセンサ
                  の使い方に差が見られる


                  1つのニューラルネットワークに多様な
Goal Line
                  計算を要求される設定




     エージェント2                     エージェント5
出力のエントロピーと相互情報量から見る性質
            全エージェントのエントロピーと相互情報量

                         設定に応じた自己組織化


(センサの重要性)




                         (行動の多様性)


    行動の多様性が求められる問題ほど入力の情報の価値が高い
まとめ

   問題の難易度          新しい指標
                      知見
                       エージェントの数や荷の数で
                       は決まらない

   既存の問題群              エージェントの差が大きいほど
                       多様な計算を要求され,複雑



                  順序関係を導く
発現したエージェント群の複雑性

Weitere ähnliche Inhalte

Mehr von harmonylab

【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究harmonylab
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...harmonylab
 
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究harmonylab
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究harmonylab
 
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...harmonylab
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backboneharmonylab
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Modelsharmonylab
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimationharmonylab
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Modelsharmonylab
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimationharmonylab
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Modelsharmonylab
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究harmonylab
 
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究harmonylab
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究harmonylab
 
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究harmonylab
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究harmonylab
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究harmonylab
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...harmonylab
 
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究harmonylab
 
A Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear GridA Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear Gridharmonylab
 

Mehr von harmonylab (20)

【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
 
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
 
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Models
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Models
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
 
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
 
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
 
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
 
A Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear GridA Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear Grid
 

Ppt takahashi

  • 1. 協調荷押し問題の複雑性に関する考察 Complexity of Cooperative Package Pushing Problem 複合情報学専攻 複雑系工学講座 調和系工学研究室 修士2年 高橋 春樹
  • 2. 背景 MASの設計技術を向上させるため,適切な難易度の問題設定が必要 MAS 設 計 技 術 創発(GAなどによるMAS設計) 現状:「評価関数 = 問題の難易度」 適用問題の難易度 評価関数による難易度 評価関数に現れない性質も多く, 問題の難易度を正しく表しているとはいえない 問題の難易度を正しく測る指標が必要
  • 3. 目的 既存の問題群の複雑性や難易度の順序関係を求め 複雑さの新しい指標の知見を得る 問題の難易度 新しい指標 知見 既存の問題群 順序関係を導く 発現したエージェント群の複雑性
  • 4. システムの複雑性の指標 情報エントロピーと相互情報量 自己組織化するシステムにおける情報エントロピー 散逸構造論、非平衡開放系 ・エントロピーの低い状態 : 情報を獲得して行動が自己組織化 ・エントロピーが増える : 情報を獲得していない,異なる安定状態に移行 ・エージェントと環境のエントロピーのやりとり[Parunak 2001] ・非平衡開放系としてのMASにおけるエントロピーのふるまい[Guerin 2004] エージェントにとっての情報の価値を定量化する相互情報量 ・相互情報量が大きい : 情報がエージェントにとって意味のあるものとなっている ・相互情報量が小さい : 情報がエージェントにとって意味のないものとなっている ・エージェントの相互作用の定量化[西川 2004] ・セルオートマトンの複雑さと計算能力の指標[Langton 1990] こうした指標を用いたシステム間の比較は行われていない
  • 5. 研究概要 問題の難易度 新しい指標 知見 既存の問題群 順序関係を導く 発現したエージェント群の複雑性
  • 6. 協調荷押し問題 概要 MASの協調行動を促す問題設定 [大倉2008][片田2008][伍賀2007] 均一な自律エージェント 荷の数字は押すために必要なエージェント数 5 3 2 ゴール シミュレータとしてODEを使用 様々な設定 : エージェント数 , 荷の数 , 配置 設定により,難易度がどのように変化するかは不明
  • 7. 問題一覧 下図のようなエージェント数,荷の配置でシミュレーション エージェント数n体,荷の数m個の設定をnAmPと表記する 1A1P 2A1P 1 2 2A2P 3A1P 3A2P 1 3A3P 4A1P 1 2 3 1 4 1 1 1 4A2P 1 4A4P 5A1P 5A2P 1 5A3P 2 1 1 5 3 2 1 4 1 1 6A1P 6A2P 1 6A3P 1 6A6P 1 5A5P 3 1 1 2 1 1 6 1 1 3 1 3 1 1
  • 8. エージェントの入出力 Input0~7 0or1 IRセンサ Input8 -1~1 エージェントとの距離(2m以下) Input9 -1~1 〃(2m~5m) Input10 -1~1 〃(5m~) Input11 -1~1 エージェントとの角度sinα Input12 -1~1 〃cosα GAによって学習 Input13 -1~1 荷との距離(2m以下) Input14 -1~1 〃(2m∼5m) 最近のエージェント Input15 -1~1 〃(5m∼) 最近の荷 Input16 -1~1 最近の荷との角度sinβ y Input17 -1~1 〃cosβ 針路 Input18 -1~1 エージェントの針路sinγ α β Input19 -1~1 〃cosγ x γ Output0 -1~1 左モータの出力(目標角速度) Output1 -1~1 右モータの出力
  • 9. 情報量の計算 各エージェント毎に観測された入出力の確率分布から 情報エントロピーと相互情報量を計算 IN={input0,input1, 入力 OUT={out0,out1} ・・・,input } 19 出力 PIN POUT 情報エントロピー 相互情報量 p(out, input ) H (OUT ) P(out) log P(out) I (OUT ; IN ) p(out, input ) log out in P(out ) P(input ) H (OUT ) H (OUT | IN ) 出力のエントロピー = 行動の多様性 入力と出力の相互情報量 =センサの重要性 出力のエントロピーで割ることで入力が 出力に与える割合を算出
  • 10. 各設定毎の情報量 個別の設定毎に適用 (エージェント2体 荷1個の例) 2A1P 相互情報量から,各エージェントの 入力の処理の違いを比較 エージェント1の相互情報量 エージェント2の相互情報量
  • 11. 研究概要 問題の難易度 新しい指標 知見 既存の問題群 順序関係を導く 発現したエージェント群の複雑性
  • 12. 設定毎に発現したエージェント差 「タスク達成に要求されるエージェントの多様さ」 =設定の複雑性 とすると 「一つの設定で発生したエージェントの差」=設定の複雑性 各エージェントの相互情報量をベクトルとして捉え距離を算出 エージェント1の各相互情報量 エージェント2の各相互情報量 A1 = {IR 1, Ar1 , Ad1 , Pr 1, Pd1 , D1} A2 = {IR2 , Ar2 , Ad2 , Pr2 , Pd2 , D2} ( IR 1 IR 2 ) 2 ( Ar 1 Ar 2 ) 2 エージェント間の距離= ( Ad 1 Ad 2 ) 2 (Pr 1 Pr 2 ) 2 ( Pd 1 Pd 2 ) 2 ( d 1 d 2 ) 2
  • 13. 設定毎に現れるエージェントの違い エージェント間の差が大きかった問題設定順に並べたもの エ ー ジ ェ ン ト 間 の 距 離 各設定 エージェントや荷の数に応じて差が大きくなっていない
  • 15. 動作からの考察 最も相互情報量に差のあったエージェントを比較 5Agents 3Packagesのデータ 2体のエージェントでは挙動やセンサ の使い方に差が見られる 1つのニューラルネットワークに多様な Goal Line 計算を要求される設定 エージェント2 エージェント5
  • 16. 出力のエントロピーと相互情報量から見る性質 全エージェントのエントロピーと相互情報量 設定に応じた自己組織化 (センサの重要性) (行動の多様性) 行動の多様性が求められる問題ほど入力の情報の価値が高い
  • 17. まとめ 問題の難易度 新しい指標 知見 エージェントの数や荷の数で は決まらない 既存の問題群 エージェントの差が大きいほど 多様な計算を要求され,複雑 順序関係を導く 発現したエージェント群の複雑性