Ausgangspunkt / Motivation                Blockmodellierung              Gegenüberstellung und Ausblick




                                Reguläre Äquivalenz
                             IP-Formulierung von Blockmodellen


                                       Jens Fielenbach

                                        Arbeitsgruppe ComOpt
                                    von Prof. Dr. Gerhard Reinelt
                                Fakultät für Mathematik und Informatik
                                        Universität Heidelberg


                     Seminar Analyse von Netzwerken im SS 2011
Ausgangspunkt / Motivation      Blockmodellierung     Gegenüberstellung und Ausblick




Gliederung


       1    Ausgangspunkt / Motivation
              Wiederholung der Definitionen
              Exaktes Auffinden der maximalen regulären Äquivalenz
              Was will man mehr?

       2    Blockmodellierung
               Blockmodellierung als Optimierungsproblem
               Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
               IP-Formulierung
Ausgangspunkt / Motivation       Blockmodellierung        Gegenüberstellung und Ausblick


Wiederholung der Definitionen


Reguläre Äquivalenz


       Definition (Reguläre Äquivalenz)
       Eine Äquivalenzrelation der Knotenmenge eines Graphen
       G = (V , E) heißt regulär, wenn für jedes Knotenpaar (u, v ) mit
       u ≡ w stets folgende Implikationen gelten:
            i (uv ∈ E) =⇒ (∃z ≡ v : wz ∈ E)
           ii (vu ∈ E) =⇒ (∃z ≡ v : zw ∈ E)

       Merksatz in Prosa
       Knoten der selben Äquivalenzklasse haben Knoten der
       gleichen Äquivalenzklassen in ihrer jeweiligen Menge von
       Nachbarn.
Ausgangspunkt / Motivation                       Blockmodellierung       Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz




       Ein kleines Beispiel zum Warmwerden. . .
                                           1                         2




                                           4                         3


           Abbildung: Finden Sie ein oder mehrere reguläre Äquivalenzen!
Ausgangspunkt / Motivation                       Blockmodellierung   Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz




   Eine Lösung
                  1                      2




                  4                      3
Ausgangspunkt / Motivation                       Blockmodellierung                          Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz




   Eine Lösung                                                Alle regulären Äquivalenzen
                                                                                         1234
                  1                      2



                                                                     14/23 1/234 124/3 13/24 123/4 134/2 12/34




                                                                       1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34



                  4                      3
                                                                                        1/2/3/4
Ausgangspunkt / Motivation                       Blockmodellierung        Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]


       Sei P die jeweils aktuelle Partition des Graphen.
          1   Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
              Anmerkung: Natürlich sind alternative Vorgaben für P möglich.

          2   Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
          3   Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
                → Übereinstimmung: Knoten bleiben äquivalent.
                → Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
          4   Wiederhole ab (2) solange Veränderungen eingetreten sind.

          5   Gebe Partition P als Lösung zurück.
Ausgangspunkt / Motivation                       Blockmodellierung        Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]


       Sei P die jeweils aktuelle Partition des Graphen.
          1   Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
              Anmerkung: Natürlich sind alternative Vorgaben für P möglich.

          2   Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
          3   Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
                → Übereinstimmung: Knoten bleiben äquivalent.
                → Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
          4   Wiederhole ab (2) solange Veränderungen eingetreten sind.

          5   Gebe Partition P als Lösung zurück.
Ausgangspunkt / Motivation                       Blockmodellierung        Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]


       Sei P die jeweils aktuelle Partition des Graphen.
          1   Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
              Anmerkung: Natürlich sind alternative Vorgaben für P möglich.

          2   Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
          3   Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
                → Übereinstimmung: Knoten bleiben äquivalent.
                → Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
          4   Wiederhole ab (2) solange Veränderungen eingetreten sind.

          5   Gebe Partition P als Lösung zurück.
Ausgangspunkt / Motivation                       Blockmodellierung        Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]


       Sei P die jeweils aktuelle Partition des Graphen.
          1   Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
              Anmerkung: Natürlich sind alternative Vorgaben für P möglich.

          2   Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
          3   Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
                → Übereinstimmung: Knoten bleiben äquivalent.
                → Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
          4   Wiederhole ab (2) solange Veränderungen eingetreten sind.

          5   Gebe Partition P als Lösung zurück.
Ausgangspunkt / Motivation                       Blockmodellierung        Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]


       Sei P die jeweils aktuelle Partition des Graphen.
          1   Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
              Anmerkung: Natürlich sind alternative Vorgaben für P möglich.

          2   Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
          3   Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
                → Übereinstimmung: Knoten bleiben äquivalent.
                → Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
          4   Wiederhole ab (2) solange Veränderungen eingetreten sind.

          5   Gebe Partition P als Lösung zurück.
Ausgangspunkt / Motivation                       Blockmodellierung        Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]


       Sei P die jeweils aktuelle Partition des Graphen.
          1   Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
              Anmerkung: Natürlich sind alternative Vorgaben für P möglich.

          2   Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
          3   Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
                → Übereinstimmung: Knoten bleiben äquivalent.
                → Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
          4   Wiederhole ab (2) solange Veränderungen eingetreten sind.

          5   Gebe Partition P als Lösung zurück.
Ausgangspunkt / Motivation                       Blockmodellierung        Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]


       Sei P die jeweils aktuelle Partition des Graphen.
          1   Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
              Anmerkung: Natürlich sind alternative Vorgaben für P möglich.

          2   Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
          3   Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
                → Übereinstimmung: Knoten bleiben äquivalent.
                → Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
          4   Wiederhole ab (2) solange Veränderungen eingetreten sind.

          5   Gebe Partition P als Lösung zurück.
Ausgangspunkt / Motivation                       Blockmodellierung        Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]


       Sei P die jeweils aktuelle Partition des Graphen.
          1   Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
              Anmerkung: Natürlich sind alternative Vorgaben für P möglich.

          2   Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
          3   Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
                → Übereinstimmung: Knoten bleiben äquivalent.
                → Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
          4   Wiederhole ab (2) solange Veränderungen eingetreten sind.

          5   Gebe Partition P als Lösung zurück.
Ausgangspunkt / Motivation                       Blockmodellierung        Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]


       Sei P die jeweils aktuelle Partition des Graphen.
          1   Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
              Anmerkung: Natürlich sind alternative Vorgaben für P möglich.

          2   Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
          3   Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
                → Übereinstimmung: Knoten bleiben äquivalent.
                → Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
          4   Wiederhole ab (2) solange Veränderungen eingetreten sind.

          5   Gebe Partition P als Lösung zurück.
Ausgangspunkt / Motivation                       Blockmodellierung   Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Eigenschaften

       Terminiert mit dem sog. Regular Interior [Borgatti und Everett]
       d.h. der maximalen regulären Partion P ≤ der Startpartition.

       Laufzeit O(n3 )
              maximal n Iterationen, da Anzahl der Äquivalenzklassen
              streng monoton steigend – bis auf den letzten Schritt.
              Laufzeit eines Schritts beträgt O( n(n−1) ) = O(n2 ).
                                                    2


       Prädestiniert für Umgang mit Multiplen Relationen
       über stets separate Bestimmung der Nachbarschaftsmengen

       Implementierung
       nicht mehr als 300-400 Zeilen Quellcode in C++
Ausgangspunkt / Motivation                       Blockmodellierung   Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Eigenschaften

       Terminiert mit dem sog. Regular Interior [Borgatti und Everett]
       d.h. der maximalen regulären Partion P ≤ der Startpartition.

       Laufzeit O(n3 )
              maximal n Iterationen, da Anzahl der Äquivalenzklassen
              streng monoton steigend – bis auf den letzten Schritt.
              Laufzeit eines Schritts beträgt O( n(n−1) ) = O(n2 ).
                                                    2


       Prädestiniert für Umgang mit Multiplen Relationen
       über stets separate Bestimmung der Nachbarschaftsmengen

       Implementierung
       nicht mehr als 300-400 Zeilen Quellcode in C++
Ausgangspunkt / Motivation                       Blockmodellierung   Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Eigenschaften

       Terminiert mit dem sog. Regular Interior [Borgatti und Everett]
       d.h. der maximalen regulären Partion P ≤ der Startpartition.

       Laufzeit O(n3 )
              maximal n Iterationen, da Anzahl der Äquivalenzklassen
              streng monoton steigend – bis auf den letzten Schritt.
              Laufzeit eines Schritts beträgt O( n(n−1) ) = O(n2 ).
                                                    2


       Prädestiniert für Umgang mit Multiplen Relationen
       über stets separate Bestimmung der Nachbarschaftsmengen

       Implementierung
       nicht mehr als 300-400 Zeilen Quellcode in C++
Ausgangspunkt / Motivation                       Blockmodellierung   Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Eigenschaften

       Terminiert mit dem sog. Regular Interior [Borgatti und Everett]
       d.h. der maximalen regulären Partion P ≤ der Startpartition.

       Laufzeit O(n3 )
              maximal n Iterationen, da Anzahl der Äquivalenzklassen
              streng monoton steigend – bis auf den letzten Schritt.
              Laufzeit eines Schritts beträgt O( n(n−1) ) = O(n2 ).
                                                    2


       Prädestiniert für Umgang mit Multiplen Relationen
       über stets separate Bestimmung der Nachbarschaftsmengen

       Implementierung
       nicht mehr als 300-400 Zeilen Quellcode in C++
Ausgangspunkt / Motivation                                                             Blockmodellierung                                                             Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Beispiel: Geschäftsbeziehungen von 70 Fotografen
       Wer beliefert wen? [weitgehende Planardarstellung mit Social Network Visualizer SocNetV]

                                                                                                                                                                               10
                                                                                                                                                          24
                                 57                                                                       68                               55
                                                                             44
                                 48                                                                                                                                       69
                                                                                                                                                               26
                                                                        8                                                                       63
                                                67                                                       50
                                                                                                                                                                               40
                                      51
                                                                                                                                                                     61
                                                                                                                        2
                                                                        29

                                                                                                                                                13
                                       28                       39                                                                                                   25
                                                     64                                              60                                4                       47                             17
                                                          46            21                                                                                                          53
                                                                                                    37        1                            70
                                           54                                                                                                             31

                                                52                                20     56
                        30                                                                                                                               59          27                       16
                                                          38                                                       58
                                                                                                                                  35
                                                               6         19
                   45                                                                                          43
                                       33                                                            15                                              5
                                                                   22                          32                  18       14
                                                                              34
                                                                                                                                       9
                                                                                                                                                                                         62
                                                                                                              66
                                                           36                                 23                                                                          42
                                                                                                                             49
                                                                                   65

                                                     3                                                                                          11
                             7
                                                                                        12                                                                          41
Ausgangspunkt / Motivation                       Blockmodellierung                   Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Exemplarisch die Iterationsschritte. . .




       Anzahl der Äquivalenzklassen: 1

       0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
       36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69
Ausgangspunkt / Motivation                       Blockmodellierung                   Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Exemplarisch die Iterationsschritte. . .




       Anzahl der Äquivalenzklassen: 1

       0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
       36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69

       Nachbarschaftsmengen neu berechnen und vergleichen.
Ausgangspunkt / Motivation                       Blockmodellierung                   Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Exemplarisch die Iterationsschritte. . .



       Anzahl der Äquivalenzklassen: 1

       0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
       36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69

       Nachbarschaftsmengen neu berechnen und vergleichen.

       Anzahl der Äquivalenzklassen: 8

         0 5 49 53 1 6 7 14 18 20 22 24 29 30 35 36 37 41 43 45 47 57 59 61 62 63 64 65 66 68 2 38 60
       3 4 10 11 12 13 16 23 25 26 27 31 33 40 42 50 55      8 19 56    9 17 28 32 34 39 44 51 54 67
       15 21 46 48 52 58   69
Ausgangspunkt / Motivation                                                             Blockmodellierung                                                             Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Äquivalenz mit 8 Klassen
       Finden Sie einen Fehler (eine Irregularität)!

                                                                                                                                                                               10
                                                                                                                                                          24
                                 57                                                                       68                               55
                                                                             44
                                 48                                                                                                                                       69
                                                                                                                                                               26
                                                                        8                                                                       63
                                                67                                                       50
                                                                                                                                                                               40
                                      51
                                                                                                                                                                     61
                                                                                                                        2
                                                                        29

                                                                                                                                                13
                                       28                       39                                                                                                   25
                                                     64                                              60                                4                       47                             17
                                                          46            21                                                                                                          53
                                                                                                    37        1                            70
                                           54                                                                                                             31

                                                52                                20     56
                        30                                                                                                                               59          27                       16
                                                          38                                                       58
                                                                                                                                  35
                                                               6         19
                   45                                                                                          43
                                       33                                                            15                                              5
                                                                   22                          32                  18       14
                                                                              34
                                                                                                                                       9
                                                                                                                                                                                         62
                                                                                                              66
                                                           36                                 23                                                                          42
                                                                                                                             49
                                                                                   65

                                                     3                                                                                          11
                             7
                                                                                        12                                                                          41
Ausgangspunkt / Motivation                       Blockmodellierung                Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Exemplarisch die Iterationsschritte. . .




       Anzahl der Äquivalenzklassen: 8

         0 5 49 53 1 6 7 14 18 20 22 24 29 30 35 36 37 41 43 45 47 57 59 61 62 63 64 65 66 68 2 38 60
       3 4 10 11 12 13 16 23 25 26 27 31 33 40 42 50 55      8 19 56    9 17 28 32 34 39 44 51 54 67
       15 21 46 48 52 58   69
Ausgangspunkt / Motivation                       Blockmodellierung                Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Exemplarisch die Iterationsschritte. . .




       Anzahl der Äquivalenzklassen: 8

         0 5 49 53 1 6 7 14 18 20 22 24 29 30 35 36 37 41 43 45 47 57 59 61 62 63 64 65 66 68 2 38 60
       3 4 10 11 12 13 16 23 25 26 27 31 33 40 42 50 55      8 19 56    9 17 28 32 34 39 44 51 54 67
       15 21 46 48 52 58   69

       Nachbarschaftsmengen neu berechnen und vergleichen.
Ausgangspunkt / Motivation                       Blockmodellierung                    Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Exemplarisch die Iterationsschritte. . .



       Anzahl der Äquivalenzklassen: 8

         0 5 49 53 1 6 7 14 18 20 22 24 29 30 35 36 37 41 43 45 47 57 59 61 62 63 64 65 66 68 2 38 60
       3 4 10 11 12 13 16 23 25 26 27 31 33 40 42 50 55      8 19 56    9 17 28 32 34 39 44 51 54 67
       15 21 46 48 52 58   69

       Nachbarschaftsmengen neu berechnen und vergleichen.

       Anzahl der Äquivalenzklassen: 29

          0   1   2   3 10 13 23 25 26 33 42 55        4 11 16 27 31    5 53   6 29
       7 24 41 45 47 61 62 63 65 66 68   8  9 17       12 40   14 18 30 35 37 43 57 64   15    19    20 36
       21   22 59    28 67    32 34 39 54  38 60        44   46   48 52    49   50    51    56    58    69
Ausgangspunkt / Motivation                       Blockmodellierung                    Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Exemplarisch die Iterationsschritte. . .




       Anzahl der Äquivalenzklassen: 29

          0   1   2   3 10 13 23 25 26 33 42 55        4 11 16 27 31    5 53   6 29
       7 24 41 45 47 61 62 63 65 66 68   8  9 17       12 40   14 18 30 35 37 43 57 64   15    19    20 36
       21   22 59    28 67    32 34 39 54  38 60        44   46   48 52    49   50    51    56    58    69
Ausgangspunkt / Motivation                       Blockmodellierung                    Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Exemplarisch die Iterationsschritte. . .




       Anzahl der Äquivalenzklassen: 29

          0   1   2   3 10 13 23 25 26 33 42 55        4 11 16 27 31    5 53   6 29
       7 24 41 45 47 61 62 63 65 66 68   8  9 17       12 40   14 18 30 35 37 43 57 64   15    19    20 36
       21   22 59    28 67    32 34 39 54  38 60        44   46   48 52    49   50    51    56    58    69

       Nachbarschaftsmengen neu berechnen und vergleichen.
Ausgangspunkt / Motivation                       Blockmodellierung                    Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Exemplarisch die Iterationsschritte. . .



       Anzahl der Äquivalenzklassen: 29

          0   1   2   3 10 13 23 25 26 33 42 55        4 11 16 27 31    5 53   6 29
       7 24 41 45 47 61 62 63 65 66 68   8  9 17       12 40   14 18 30 35 37 43 57 64   15    19    20 36
       21   22 59    28 67    32 34 39 54  38 60        44   46   48 52    49   50    51    56    58    69

       Nachbarschaftsmengen neu berechnen und vergleichen.

       Anzahl der Äquivalenzklassen: 47

         0   1    2  3 10 13 25 26 55  4      5   6    7 24 41 45 47 62 63 65 66  8   9   11 16 27 31 12
       14 18 35    15 17 19 20 21            22 59 23 28 67 29 30 57 32 34 33 42 36 37 38
       39   40    43   44   46   48   49      50    51   52    53   54   56    58  60   61   64    68 69
Ausgangspunkt / Motivation                       Blockmodellierung                  Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Exemplarisch die Iterationsschritte. . .




       Anzahl der Äquivalenzklassen: 47

         0   1    2  3 10 13 25 26 55  4      5   6    7 24 41 45 47 62 63 65 66  8   9   11 16 27 31 12
       14 18 35    15 17 19 20 21            22 59 23 28 67 29 30 57 32 34 33 42 36 37 38
       39   40    43   44   46   48   49      50    51   52    53   54   56    58  60   61   64    68 69
Ausgangspunkt / Motivation                       Blockmodellierung                  Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Exemplarisch die Iterationsschritte. . .




       Anzahl der Äquivalenzklassen: 47

         0   1    2  3 10 13 25 26 55  4      5   6    7 24 41 45 47 62 63 65 66  8   9   11 16 27 31 12
       14 18 35    15 17 19 20 21            22 59 23 28 67 29 30 57 32 34 33 42 36 37 38
       39   40    43   44   46   48   49      50    51   52    53   54   56    58  60   61   64    68 69

       Nachbarschaftsmengen neu berechnen und vergleichen.
Ausgangspunkt / Motivation                       Blockmodellierung                       Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Exemplarisch die Iterationsschritte. . .



       Anzahl der Äquivalenzklassen: 47

         0   1    2  3 10 13 25 26 55  4      5   6    7 24 41 45 47 62 63 65 66  8   9   11 16 27 31 12
       14 18 35    15 17 19 20 21            22 59 23 28 67 29 30 57 32 34 33 42 36 37 38
       39   40    43   44   46   48   49      50    51   52    53   54   56    58  60   61   64    68 69

       Nachbarschaftsmengen neu berechnen und vergleichen.

       Anzahl der Äquivalenzklassen: 53

         0   1    2   3 10 13 26   4   5   6    7 24 47 63     8     9   11    12   14 18 35    15    16 27 31
       17   19   20    21   22 59   23   25    28 67   29     30     32 34    33 42   36   37    38    39   40
       41 45 62    43    44  46   48   49    50   51    52    53      54   55    56   57   58    60    61   64
       65 66    68    69
Ausgangspunkt / Motivation                       Blockmodellierung                       Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Exemplarisch die Iterationsschritte. . .




       Anzahl der Äquivalenzklassen: 53

         0   1    2   3 10 13 26   4   5   6    7 24 47 63     8     9   11    12   14 18 35    15    16 27 31
       17   19   20    21   22 59   23   25    28 67   29     30     32 34    33 42   36   37    38    39   40
       41 45 62    43    44  46   48   49    50   51    52    53      54   55    56   57   58    60    61   64
       65 66    68    69
Ausgangspunkt / Motivation                       Blockmodellierung                       Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Exemplarisch die Iterationsschritte. . .




       Anzahl der Äquivalenzklassen: 53

         0   1    2   3 10 13 26   4   5   6    7 24 47 63     8     9   11    12   14 18 35    15    16 27 31
       17   19   20    21   22 59   23   25    28 67   29     30     32 34    33 42   36   37    38    39   40
       41 45 62    43    44  46   48   49    50   51    52    53      54   55    56   57   58    60    61   64
       65 66    68    69

       Nachbarschaftsmengen neu berechnen und vergleichen.
Ausgangspunkt / Motivation                       Blockmodellierung                       Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


Exemplarisch die Iterationsschritte. . .



       Anzahl der Äquivalenzklassen: 53

         0   1    2   3 10 13 26   4   5   6    7 24 47 63     8     9   11    12   14 18 35    15    16 27 31
       17   19   20    21   22 59   23   25    28 67   29     30     32 34    33 42   36   37    38    39   40
       41 45 62    43    44  46   48   49    50   51    52    53      54   55    56   57   58    60    61   64
       65 66    68    69

       Nachbarschaftsmengen neu berechnen und vergleichen.

       Anzahl der Äquivalenzklassen: 54

         0   1  2    3 10 13 26    4  5   6   7 24 63  8    9    11  12   14 18 35       15     16 27 31   17
       19   20    21   22 59    23   25    28 67   29    30    32 34   33 42   36        37     38   39    40
       41 45 62   43    44   46   47   48   49   50   51    52    53  54   55   56        57     58   60   61
       64   65 66    68    69
Ausgangspunkt / Motivation                       Blockmodellierung                   Gegenüberstellung und Ausblick


Exaktes Auffinden der maximalen regulären Äquivalenz


70 Fotografen, 54 verschiedene Typen



       Anzahl der Äquivalenzklassen: 54

         0   1  2    3 10 13 26    4  5   6   7 24 63  8    9    11  12   14 18 35   15    16 27 31    17
       19   20    21   22 59    23   25    28 67   29    30    32 34   33 42   36    37    38   39     40
       41 45 62   43    44   46   47   48   49   50   51    52    53  54   55   56    57    58   60    61
       64   65 66    68    69




       Ist eine solche Anzahl von Klassen noch sinnvoll für
       das Treffen qualitativer analytischer Aussagen?
Ausgangspunkt / Motivation       Blockmodellierung                          Gegenüberstellung und Ausblick


Was will man mehr?


Problemfeld 1: Fehlertoleranz gegenüber Realdaten


   Einzelne Perturbation                      Rollen-Primitivität
                                                                         1234
                  1          2



                                                     14/23 1/234 124/3 13/24 123/4 134/2 12/34




                                                       1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34




                  4          3                                          1/2/3/4




          – Kleine Ungenauigkeiten in den zu Grunde gelegten
            Beziehungsdaten führen zu völlig anderer Klassenstruktur
          + Arbeitsweise des Algorithmus dafür leicht nachvollziehbar.
Ausgangspunkt / Motivation       Blockmodellierung                          Gegenüberstellung und Ausblick


Was will man mehr?


Problemfeld 1: Fehlertoleranz gegenüber Realdaten


   Einzelne Perturbation                      Rollen-Primitivität
                                                                         1234
                  1          2



                                                     14/23 1/234 124/3 13/24 123/4 134/2 12/34




                                                       1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34




                  4          3                                          1/2/3/4




          – Kleine Ungenauigkeiten in den zu Grunde gelegten
            Beziehungsdaten führen zu völlig anderer Klassenstruktur
          + Arbeitsweise des Algorithmus dafür leicht nachvollziehbar.
Ausgangspunkt / Motivation       Blockmodellierung                          Gegenüberstellung und Ausblick


Was will man mehr?


Problemfeld 1: Fehlertoleranz gegenüber Realdaten


   Einzelne Perturbation                      Rollen-Primitivität
                                                                         1234
                  1          2



                                                     14/23 1/234 124/3 13/24 123/4 134/2 12/34




                                                       1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34




                  4          3                                          1/2/3/4




          – Kleine Ungenauigkeiten in den zu Grunde gelegten
            Beziehungsdaten führen zu völlig anderer Klassenstruktur
          + Arbeitsweise des Algorithmus dafür leicht nachvollziehbar.
Ausgangspunkt / Motivation            Blockmodellierung                    Gegenüberstellung und Ausblick


Was will man mehr?


Problemfeld 2: Einbringung von Vorwissen


                                                 1234




                             14/23 1/234 124/3 13/24 123/4 134/2 12/34




                               1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34




                                                1/2/3/4



          + Im Prinzip von jeder Partition aus startbar, so lässt sich die
            Trennung bestimmter Knoten erzwingen.
          – Trotz strukturellem Vorwissen ist weder Klassenzahl noch
            Rollengraph vorgebbar.
Ausgangspunkt / Motivation            Blockmodellierung                    Gegenüberstellung und Ausblick


Was will man mehr?


Problemfeld 2: Einbringung von Vorwissen


                                                 1234




                             14/23 1/234 124/3 13/24 123/4 134/2 12/34




                               1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34




                                                1/2/3/4



          + Im Prinzip von jeder Partition aus startbar, so lässt sich die
            Trennung bestimmter Knoten erzwingen.
          – Trotz strukturellem Vorwissen ist weder Klassenzahl noch
            Rollengraph vorgebbar.
Ausgangspunkt / Motivation            Blockmodellierung                    Gegenüberstellung und Ausblick


Was will man mehr?


Problemfeld 2: Einbringung von Vorwissen


                                                 1234




                             14/23 1/234 124/3 13/24 123/4 134/2 12/34




                               1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34




                                                1/2/3/4



          + Im Prinzip von jeder Partition aus startbar, so lässt sich die
            Trennung bestimmter Knoten erzwingen.
          – Trotz strukturellem Vorwissen ist weder Klassenzahl noch
            Rollengraph vorgebbar.
Ausgangspunkt / Motivation                  Blockmodellierung   Gegenüberstellung und Ausblick


Blockmodellierung als Optimierungsproblem


Grundideen der Blockmodellierung




          1   Klassenzahl und Rollengraph als Modell-Annahme
          2   Knoten bestmöglich den Rollen zuordnen
Ausgangspunkt / Motivation                     Blockmodellierung   Gegenüberstellung und Ausblick


Blockmodellierung als Optimierungsproblem


Gütebeurteilung: Was bedeutet bestmöglich?


       Die Zielfunktion ∆ soll folgende Eigenschaften erfüllen:
          1   ∆(P) ≥ 0
          2   ∆(P) = 0 ⇔ P ist exakt regulär.



       Sei Θk die Menge aller Partitionen mit k Klassen. Dann ist zu
       lösen das Optimierungsproblem

                                            ∆(P ∗ ) = min ∆(P)
                                                        P∈Θk
Ausgangspunkt / Motivation                       Blockmodellierung              Gegenüberstellung und Ausblick


Blockmodellierung als Optimierungsproblem


Gütebeurteilung: Was bedeutet bestmöglich?


       Wähle für ∆ die Definition

                       ∆(P) =                             min        d(Cu × Cv , B)
                                                     B∈B(Cu ,Cv )
                                     Cu ,Cv ∈P

       mit
                      Cu Cluster = Äquivalenzklasse mit Repräsentant u
             Cu × Cv Block = kartesisches Produkt der Cluster (Cu , Cv )
          B(Cu , Cv ) Menge aller Idealblöcke für Cu × Cv
                         d noch zu definierende Abstandsfunktion
Ausgangspunkt / Motivation                  Blockmodellierung   Gegenüberstellung und Ausblick


Blockmodellierung als Optimierungsproblem


Wie sehen ideale reguläre Blockmatrizen aus?


       Definition (Regulärer Block)
       Eine Block Cu × Cv heißt regulär, wenn er in jeder Zeile und
       jeder Spalte mindestens eine 1 enthält.

       Definition (Reguläre Matrix)
       Eine Matrix heißt regulär, wenn sie nur aus Nullblöcken und
       regulären Blöcken besteht.

       Lemma (Konsistenz der Definition)
       Eine Blockmatrix R ist genau dann regulär, wenn sie eine
       reguläre Partition darstellt.
Ausgangspunkt / Motivation                  Blockmodellierung   Gegenüberstellung und Ausblick


Blockmodellierung als Optimierungsproblem


Wie sehen ideale reguläre Blockmatrizen aus?


       Definition (Regulärer Block)
       Eine Block Cu × Cv heißt regulär, wenn er in jeder Zeile und
       jeder Spalte mindestens eine 1 enthält.

       Definition (Reguläre Matrix)
       Eine Matrix heißt regulär, wenn sie nur aus Nullblöcken und
       regulären Blöcken besteht.

       Lemma (Konsistenz der Definition)
       Eine Blockmatrix R ist genau dann regulär, wenn sie eine
       reguläre Partition darstellt.
Ausgangspunkt / Motivation                  Blockmodellierung   Gegenüberstellung und Ausblick


Blockmodellierung als Optimierungsproblem


Wie sehen ideale reguläre Blockmatrizen aus?


       Definition (Regulärer Block)
       Eine Block Cu × Cv heißt regulär, wenn er in jeder Zeile und
       jeder Spalte mindestens eine 1 enthält.

       Definition (Reguläre Matrix)
       Eine Matrix heißt regulär, wenn sie nur aus Nullblöcken und
       regulären Blöcken besteht.

       Lemma (Konsistenz der Definition)
       Eine Blockmatrix R ist genau dann regulär, wenn sie eine
       reguläre Partition darstellt.
Ausgangspunkt / Motivation                       Blockmodellierung   Gegenüberstellung und Ausblick


Blockmodellierung als Optimierungsproblem


Wie sehen ideale reguläre Blockmatrizen aus?

       Beweis des Lemmas für Zeilen (Spalten analog).
       „⇒“ Sei R regulär. Im Falle, dass Cu × Cv Nullblock ist nichts
       zu zeigen. Da für jeden Block Cu × Cv gilt

         Cu × Cv regulär =⇒ ∀w ∈ Cu ∃z ∈ Cv : rwz = 1 =⇒ P reg.


       „⇐“ Angenommen die Blockmatrix R stelle die reguläre
       Partition P dar, aber ein Block Cu × Cv sei weder Null- noch
       regulärer Block. Sei o. B. d. A.
                                        P reg.
                        (ruv = 1) =⇒ (∀w ∈ Cu ∃z ∈ Cv : rwz = 1)

       Dann wäre aber Cu × Cv regulär zur Annahme.
Ausgangspunkt / Motivation                  Blockmodellierung   Gegenüberstellung und Ausblick


Blockmodellierung als Optimierungsproblem


Naheliegende Definition


       Definition (Abstandsfunktion d)
       d(Cu × Cv , B) =
         #Nullzeilen + #Nullspalten, falls Cu × Cv regulär
         #Einsen,                    falls Cu × Cv Nullblock

       Bemerkung
       Obige Definition von d gewichtet Abweichungen in Nullblöcken
       im Mittel stärker als in regulären Blöcken. Allerdings wird so die
       IP-Formulierung später wesentlich übersichtlicher.
Ausgangspunkt / Motivation                  Blockmodellierung   Gegenüberstellung und Ausblick


Blockmodellierung als Optimierungsproblem


Lösungsansätze

       Definition (Lokale Transformation)
          1   Vertausche zwei Zeilen bzw. Spalten aus verschiedenen
              Clustern.
          2   Verschiebe eine Zeile bzw. Spalte in einen anderen
              Cluster.

       Gradienten-Verfahren
       Es werden solange lokale Transformationen durchgeführt, wie
       dadurch ∆ (ganzzahlig) reduziert wird. Das erreichte Optimum
       ist lokal. Globale Optimalität ist nur im Falle ∆ = 0 garantiert.

       Daraus ergibt sich grundsätzliche Frage: Wann gibt es ein
       exakt reguläre Partition mit genau k Äquivalenzklassen?
Ausgangspunkt / Motivation                   Blockmodellierung         Gegenüberstellung und Ausblick


Komplexität von 2-ROLE-ASSIGNABILITY (2RA)


Reguläre k -Zuweisbarkeit für ungerichtete Graphen


       Definition (Reguläre k -Zuweisbarkeit)
       Ein ungerichteter Graph G heißt regulär k -zuweisbar, wenn für
       ihn eine exakte reguläre Äquivalenz mit genau k Klassen
       existiert.
       Leicht: k = 1 und k = |V |                Schwer ist dagegen. . .
       Satz (NP-Vollständigkeit von 2RA)
       Das Entscheidungsproblem, ob ein ungerichteter Graph G
       regulär 2-zuweisbar ist, ist NP-vollständig, falls N = NP.
Ausgangspunkt / Motivation                   Blockmodellierung         Gegenüberstellung und Ausblick


Komplexität von 2-ROLE-ASSIGNABILITY (2RA)


Reguläre k -Zuweisbarkeit für ungerichtete Graphen


       Definition (Reguläre k -Zuweisbarkeit)
       Ein ungerichteter Graph G heißt regulär k -zuweisbar, wenn für
       ihn eine exakte reguläre Äquivalenz mit genau k Klassen
       existiert.
       Leicht: k = 1 und k = |V |                Schwer ist dagegen. . .
       Satz (NP-Vollständigkeit von 2RA)
       Das Entscheidungsproblem, ob ein ungerichteter Graph G
       regulär 2-zuweisbar ist, ist NP-vollständig, falls N = NP.
Ausgangspunkt / Motivation                   Blockmodellierung         Gegenüberstellung und Ausblick


Komplexität von 2-ROLE-ASSIGNABILITY (2RA)


Reguläre k -Zuweisbarkeit für ungerichtete Graphen


       Definition (Reguläre k -Zuweisbarkeit)
       Ein ungerichteter Graph G heißt regulär k -zuweisbar, wenn für
       ihn eine exakte reguläre Äquivalenz mit genau k Klassen
       existiert.
       Leicht: k = 1 und k = |V |                Schwer ist dagegen. . .
       Satz (NP-Vollständigkeit von 2RA)
       Das Entscheidungsproblem, ob ein ungerichteter Graph G
       regulär 2-zuweisbar ist, ist NP-vollständig, falls N = NP.
Ausgangspunkt / Motivation                   Blockmodellierung         Gegenüberstellung und Ausblick


Komplexität von 2-ROLE-ASSIGNABILITY (2RA)


Reguläre k -Zuweisbarkeit für ungerichtete Graphen


       Definition (Reguläre k -Zuweisbarkeit)
       Ein ungerichteter Graph G heißt regulär k -zuweisbar, wenn für
       ihn eine exakte reguläre Äquivalenz mit genau k Klassen
       existiert.
       Leicht: k = 1 und k = |V |                Schwer ist dagegen. . .
       Satz (NP-Vollständigkeit von 2RA)
       Das Entscheidungsproblem, ob ein ungerichteter Graph G
       regulär 2-zuweisbar ist, ist NP-vollständig, falls N = NP.
Ausgangspunkt / Motivation                   Blockmodellierung        Gegenüberstellung und Ausblick


Komplexität von 2-ROLE-ASSIGNABILITY (2RA)


2-Rollenverteilungen eines ungerichteten Graphen

       Definition (2RAi )
       Mit 2RAi bezeichnen wir das Teilproblem, zu entscheiden ob G
       regulär 2-zuweisbar ist mit Rollengraph Ri .




                                       Abbildung: Anzeichnen
      R1                                                         R4

      R2                                                         R5

      R3                                                         R6
Ausgangspunkt / Motivation                   Blockmodellierung   Gegenüberstellung und Ausblick


Komplexität von 2-ROLE-ASSIGNABILITY (2RA)


Polynomiell entscheidbare Teilprobleme von 2RA


       Lemma (für 2RAi , i = 1 . . . 4)
       Der Graph G hat genau dann eine Rollenzuweisung mit
                      R1 wenn G aus lauter isolierten Knoten besteht.
                      R2 wenn G sowohl isolierte Knoten als auch einen
                         zusammenhängenden Teil besitzt.
                      R3 wenn G keine isolierten Knoten, dafür aber
                         mindestens zwei Zusammenhangskomponenten
                         besitzt.
                      R4 wenn G keine isolierten Knoten besitzt und bipartit
                         ist.
Ausgangspunkt / Motivation                   Blockmodellierung   Gegenüberstellung und Ausblick


Komplexität von 2-ROLE-ASSIGNABILITY (2RA)


Polynomiell entscheidbare Teilprobleme von 2RA


       Lemma (für 2RAi , i = 1 . . . 4)
       Der Graph G hat genau dann eine Rollenzuweisung mit
                      R1 wenn G aus lauter isolierten Knoten besteht.
                      R2 wenn G sowohl isolierte Knoten als auch einen
                         zusammenhängenden Teil besitzt.
                      R3 wenn G keine isolierten Knoten, dafür aber
                         mindestens zwei Zusammenhangskomponenten
                         besitzt.
                      R4 wenn G keine isolierten Knoten besitzt und bipartit
                         ist.
Ausgangspunkt / Motivation                   Blockmodellierung   Gegenüberstellung und Ausblick


Komplexität von 2-ROLE-ASSIGNABILITY (2RA)


Polynomiell entscheidbare Teilprobleme von 2RA


       Lemma (für 2RAi , i = 1 . . . 4)
       Der Graph G hat genau dann eine Rollenzuweisung mit
                      R1 wenn G aus lauter isolierten Knoten besteht.
                      R2 wenn G sowohl isolierte Knoten als auch einen
                         zusammenhängenden Teil besitzt.
                      R3 wenn G keine isolierten Knoten, dafür aber
                         mindestens zwei Zusammenhangskomponenten
                         besitzt.
                      R4 wenn G keine isolierten Knoten besitzt und bipartit
                         ist.
Ausgangspunkt / Motivation                   Blockmodellierung   Gegenüberstellung und Ausblick


Komplexität von 2-ROLE-ASSIGNABILITY (2RA)


Polynomiell entscheidbare Teilprobleme von 2RA


       Lemma (für 2RAi , i = 1 . . . 4)
       Der Graph G hat genau dann eine Rollenzuweisung mit
                      R1 wenn G aus lauter isolierten Knoten besteht.
                      R2 wenn G sowohl isolierte Knoten als auch einen
                         zusammenhängenden Teil besitzt.
                      R3 wenn G keine isolierten Knoten, dafür aber
                         mindestens zwei Zusammenhangskomponenten
                         besitzt.
                      R4 wenn G keine isolierten Knoten besitzt und bipartit
                         ist.
Ausgangspunkt / Motivation                   Blockmodellierung   Gegenüberstellung und Ausblick


Komplexität von 2-ROLE-ASSIGNABILITY (2RA)


Polynomiell entscheidbare Teilprobleme von 2RA


       Lemma (für 2RAi , i = 1 . . . 4)
       Der Graph G hat genau dann eine Rollenzuweisung mit
                      R1 wenn G aus lauter isolierten Knoten besteht.
                      R2 wenn G sowohl isolierte Knoten als auch einen
                         zusammenhängenden Teil besitzt.
                      R3 wenn G keine isolierten Knoten, dafür aber
                         mindestens zwei Zusammenhangskomponenten
                         besitzt.
                      R4 wenn G keine isolierten Knoten besitzt und bipartit
                         ist.
Ausgangspunkt / Motivation                   Blockmodellierung          Gegenüberstellung und Ausblick


Komplexität von 2-ROLE-ASSIGNABILITY (2RA)


Skizze der Beweisführung


       Beweisidee.
                                                                        klar !
       Zeige 3SAT (NP-vollständig nach Cook)                     p   2RA ∈ NP.

       Vorgehen.
       Für eine beliebige Instanz von 3SAT mit
       Variablenmenge U = {u1 , u2 , . . . , ui , . . . , un }
       Aussagenmenge C = {c1 , c2 , . . . , cj , . . . , cm }
       konstruiere einen Graphen, der genau dann regulär
       2-zuweisbar ist, wenn die 3SAT -Instanz erfüllbar ist.
Ausgangspunkt / Motivation                   Blockmodellierung          Gegenüberstellung und Ausblick


Komplexität von 2-ROLE-ASSIGNABILITY (2RA)


Skizze der Beweisführung


       Beweisidee.
                                                                        klar !
       Zeige 3SAT (NP-vollständig nach Cook)                     p   2RA ∈ NP.

       Vorgehen.
       Für eine beliebige Instanz von 3SAT mit
       Variablenmenge U = {u1 , u2 , . . . , ui , . . . , un }
       Aussagenmenge C = {c1 , c2 , . . . , cj , . . . , cm }
       konstruiere einen Graphen, der genau dann regulär
       2-zuweisbar ist, wenn die 3SAT -Instanz erfüllbar ist.
Ausgangspunkt / Motivation                    Blockmodellierung              Gegenüberstellung und Ausblick


Komplexität von 2-ROLE-ASSIGNABILITY (2RA)


Übertragung von 3SAT auf Graphen
       Truth-Setting Ti und Satisfaction-Testing-Komponenten Sj




         ui                              ui                       cj1                      cj2
                                                                            cj3

                                                                              bj3


                                                                              bj1
                 (a) T i                                                (b) S j
Ausgangspunkt / Motivation                     Blockmodellierung                       Gegenüberstellung und Ausblick


Komplexität von 2-ROLE-ASSIGNABILITY (2RA)


Beispielgraph zum Beweis von 3SAT                                                 p    2RA5

       Konstruktion in PTIME aus der 3SAT -Instanz
                                                    ¯           ¯
       U = {u1 , u2 , u3 , u4 } und C = {{u1 , u2 , u3 }, {u2 , u3 , u4 }}

                     a11                      a21                         a31                      a41

                     a12                      a22                         a32                      a42
                     a13                      a23                         a33                      a43
      u1                       u1 u2                 u2 u3                      u3 u4                      u4

                         c11                  c13                  c 21                 c 23

                                             c12                                      c 22

                                       b13                                      b23

                                       b12                                      b22

                                       b11                                      b21
Ausgangspunkt / Motivation                   Blockmodellierung                    Gegenüberstellung und Ausblick


Komplexität von 2-ROLE-ASSIGNABILITY (2RA)


Beispielgraph zum Beweis von 2RA5                                             p   2RA


       Konstruktion in PTIME




                                                                  u1                           u2
              u1                 u2                                     b1             a2
                                                           a1                                         b2

              C1                 C2
                                                             x1              y1       x2             y2


              (a)       G                                              (b)        G
Ausgangspunkt / Motivation               Blockmodellierung      Gegenüberstellung und Ausblick


IP-Formulierung


Vereinbarungen zur IP-Formulierung


          N ∈ N, N ≥ 3             Anzahl der Knoten
          K ∈ N  {0}              Anzahl der Blöcke
                             N×N
          S ∈ {0, 1}               Adjazenzmatrix des Graphen
          B ∈ {0, 1}K ×K           Matrixdarstellung des Rollengraphen
          P∈      NK ×K
                   0               Abweichungs-Gewichtungsmatrix (optional)

              Lateinische Kleinbuchstaben stellen ggf. Elemente der mit
              Großbuchstaben bezeichneten Matrizen dar.
              Alle Ausdrücke gelten für alle Indizes aus {i, j, k , l},
              über die nicht summiert wird.
              Ausdrücke mit αikl , βjkl gelten nur für Blöcke (k , l)|bkl = 1.
Ausgangspunkt / Motivation                         Blockmodellierung                       Gegenüberstellung und Ausblick


IP-Formulierung


IP-Formulierung [Brusco, Steinley]


                  N      N                                     N                                 N
       min                                pkl yijkl sij +                          pkl αikl +                       pkl β
                i=1 j=1 (k ,l)|bkl =0                        i=1 (k ,l)|bkl =1                  j=1 (k ,l)|bkl =1



                                    K                                              N
                        s.t.             xik = 1                                         xik ≥ 1             (1)
                                  k =1                                             i=1
                  xik + xjl − yijkl ≤ 1                            xik + xjl − 2 yijkl ≥ 0                   (2)
                       
            N                                                 N
                     yijkl   sij  + αikl ≥ xik                       yijkl sij   + βjkl ≥ xjl              (3)
           j=1                                               i=1

                              xik , yijkl ∈ {0, 1}                         αikl , βjkl ∈ {0, 1}              (4)
Ausgangspunkt / Motivation                       Blockmodellierung                           Gegenüberstellung und Ausblick


IP-Formulierung


IP-Formulierung [äquivalent und lesbar]

                                                                                                                
                  K     K                 N   N                                      N                 N
       min                    pkl ¬bkl               yijkl sij + bkl                     αikl +            βjkl 
             k =1 l=1                     i=1 j=1                                    i=1              j=1



                                  K                                                  N
                       s.t.            xik = 1                                             xik ≥ 1             (1)
                                k =1                                             i=1
                      xik + xjl − yijkl ≤ 1                     xik + xjl − 2 yijkl ≥ 0                        (2)
                           
            N                                               N
                     yijkl sij  + αikl ≥ xik                       yijkl sij       + βjkl ≥ xjl              (3)
           j=1                                             i=1

                            xik , yijkl ∈ {0, 1}                         αikl , βjkl ∈ {0, 1}                  (4)
Ausgangspunkt / Motivation       Blockmodellierung         Gegenüberstellung und Ausblick


IP-Formulierung


Nachbemerkung I zur IP-Formulierung




       Die Typ (2)-Nebenbedingung

                              xik + xjl − 2 yijkl ≥ 0

       ist von entscheidender Bedeutung. Würde sie fehlen, könnten
       die yijkl trotz xik xjl = 1 irrtümlich den Wert 1 annehmen, nur um
       die Nebenbedingungen vom Typ (3) zu erfüllen.
Ausgangspunkt / Motivation                   Blockmodellierung               Gegenüberstellung und Ausblick


IP-Formulierung


Benchmark: Das Everett-Netzwerk

                                 a   b   c      d     e     f    g   h   i   j
                             a   0   1   1      1     0     0    0   0   0   0
                             b   1   0   1      0     1     0    0   0   0   0
                             c   1   1   0      1     0     0    0   0   0   0
                             d   1   0   1      0     1     0    0   0   0   0
                             e   0   1   0      1     0     1    0   0   0   0
                             f   0   0   0      0     1     0    1   0   1   0
                             g   0   0   0      0     0     1    0   1   0   1
                             h   0   0   0      0     0     0    1   0   1   1
                             i   0   0   0      0     0     1    0   1   0   1
                             j   0   0   0      0     0     0    1   1   1   0
                                     Tabelle: Eingangsdaten
Ausgangspunkt / Motivation               Blockmodellierung         Gegenüberstellung und Ausblick


IP-Formulierung


Benchmark: Das Everett-Netzwerk




                                            {?}      {?}     {?}
                                   {?}       1        1       0
                                   {?}       1        0       1
                                   {?}       0        1       1
                             Tabelle: Vorgegebener Rollengraph
Ausgangspunkt / Motivation                     Blockmodellierung               Gegenüberstellung und Ausblick


IP-Formulierung


Benchmark: Das Everett-Netzwerk

                                 c     a   j      h     b     d    g   i   e   f
                             a   1     0   0      0     1     1    0   0   0   0
                             c   0     1   0      0     1     1    0   0   0   0
                             h   0     0   1      0     0     0    1   1   0   0
                             j   0     0   0      1     0     0    1   1   0   0
                             b   1     1   0      0     0     0    0   0   1   0
                             d   1     1   0      0     0     0    0   0   1   0
                             g   0     0   1      1     0     0    0   0   0   1
                             i   0     0   1      1     0     0    0   0   0   1
                             e   0     0   0      0     1     1    0   0   0   1
                             f   0     0   0      0     0     0    1   1   1   0
                                     Tabelle: 3-Cluster-Blockmodell
Ausgangspunkt / Motivation                    Blockmodellierung               Gegenüberstellung und Ausblick


IP-Formulierung


Benchmark: Das Everett-Netzwerk

                                  c   a   j      h     b     d    g   i   e   f
                              a   1   0   0      0     1     1    0   0   0   0
                              c   0   1   0      0     1     1    0   0   0   0
                              h   0   0   1      0     0     0    1   1   0   0
                              j   0   0   0      1     0     0    1   1   0   0
                              b   1   1   0      0     0     0    0   0   1   0
                              d   1   1   0      0     0     0    0   0   1   0
                              g   0   0   1      1     0     0    0   0   0   1
                              i   0   0   1      1     0     0    0   0   0   1
                              e   0   0   0      0     1     1    0   0   0   1
                              f   0   0   0      0     0     0    1   1   1   0
                             Tabelle: Reguläre und Nullblöcke (∆ exakt 0)
Ausgangspunkt / Motivation               Blockmodellierung                  Gegenüberstellung und Ausblick


IP-Formulierung


Benchmark: Das Everett-Netzwerk




                                         {a,c,h,j}      {b,d,g,i}   {e,f}
                             {a,c,h,j}      1              1          0
                             {b,d,g,i}      1              0          1
                               {e,f}        0              1          1
                             Tabelle: Berechnung mit CPLEX 1.30s
Ausgangspunkt / Motivation      Blockmodellierung      Gegenüberstellung und Ausblick


IP-Formulierung


Nachbemerkung II zur IP-Formulierung




       In eine ähnliche IP-Form bringen lassen sich
       Strukturelle Äquivalenz Wesentlich einfacher, da bkl = 1 ⇔
                     Block kl vollbesetzt.
       SE und RE auf V × W Noch um einges komplexer, da Partition
                  zweier Mengen erforderlich.
Ausgangspunkt / Motivation                     Blockmodellierung                     Gegenüberstellung und Ausblick




Vorzüge und Nachteile aller drei Ansätze




                                  CATREGE                  Gradienten-Heuristik   IP-Lösung
                          Güte    keine Aussage            lokales Optimum        Optimalitätsgarantie
                     Vorgehen     explorativ               Hypothesentest         Hypothesentest
                     Vorwissen    kaum einbringbar         Rollengraphvorgabe     Rollengraphvorgabe
            Worst-Case-Laufzeit   O(n3 )                   überpolynomial         überpolynomial
             mehrereRelationen    einfach möglich          großer Mehraufwand     großer Mehraufwand
Ausgangspunkt / Motivation         Blockmodellierung   Gegenüberstellung und Ausblick




Forschungsperspektive




       Wünschenswert wären Verfahren, die alle drei Kriterien
       erfüllen:
          1   Rollengraph auswählen
          2   Reguläre Partition finden
          3   Optimalitätsgarantie liefern
Anhang


Weiterführende Literatur


Weiterführende Literatur I

              Jürgen Lerner.
              Role Assignments, S. 216–252.
              in Brandes, Erlebach: Network Analysis, Springer 2005.
              Fred S. Roberts, Li Sheng 2001.
              How Hard Is It to Determine If a Graph Has a 2-Role
              Assignment?
              NETWORKS Journal, Vol. 37, S. 67-73.
              Michael J. Brusco, Douglas Steinley 2009
              Integer programs for one- and two-mode blockmodeling
              based on prespecified image matrices for structural and
              regular equivalence.
              Journal of Mathematical Psychology, Nr. 53, S. 577-585.

Reguläre Äquivalenz - IP-Formulierung von Blockmodellen

  • 1.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Reguläre Äquivalenz IP-Formulierung von Blockmodellen Jens Fielenbach Arbeitsgruppe ComOpt von Prof. Dr. Gerhard Reinelt Fakultät für Mathematik und Informatik Universität Heidelberg Seminar Analyse von Netzwerken im SS 2011
  • 2.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Gliederung 1 Ausgangspunkt / Motivation Wiederholung der Definitionen Exaktes Auffinden der maximalen regulären Äquivalenz Was will man mehr? 2 Blockmodellierung Blockmodellierung als Optimierungsproblem Komplexität von 2-ROLE-ASSIGNABILITY (2RA) IP-Formulierung
  • 3.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Wiederholung der Definitionen Reguläre Äquivalenz Definition (Reguläre Äquivalenz) Eine Äquivalenzrelation der Knotenmenge eines Graphen G = (V , E) heißt regulär, wenn für jedes Knotenpaar (u, v ) mit u ≡ w stets folgende Implikationen gelten: i (uv ∈ E) =⇒ (∃z ≡ v : wz ∈ E) ii (vu ∈ E) =⇒ (∃z ≡ v : zw ∈ E) Merksatz in Prosa Knoten der selben Äquivalenzklasse haben Knoten der gleichen Äquivalenzklassen in ihrer jeweiligen Menge von Nachbarn.
  • 4.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Ein kleines Beispiel zum Warmwerden. . . 1 2 4 3 Abbildung: Finden Sie ein oder mehrere reguläre Äquivalenzen!
  • 5.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Eine Lösung 1 2 4 3
  • 6.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Eine Lösung Alle regulären Äquivalenzen 1234 1 2 14/23 1/234 124/3 13/24 123/4 134/2 12/34 1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34 4 3 1/2/3/4
  • 7.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Der CATREGE-Algorithmus [Borgatti u. Everett, 1993] Sei P die jeweils aktuelle Partition des Graphen. 1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse. Anmerkung: Natürlich sind alternative Vorgaben für P möglich. 2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu. 3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen: → Übereinstimmung: Knoten bleiben äquivalent. → Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten. 4 Wiederhole ab (2) solange Veränderungen eingetreten sind. 5 Gebe Partition P als Lösung zurück.
  • 8.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Der CATREGE-Algorithmus [Borgatti u. Everett, 1993] Sei P die jeweils aktuelle Partition des Graphen. 1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse. Anmerkung: Natürlich sind alternative Vorgaben für P möglich. 2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu. 3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen: → Übereinstimmung: Knoten bleiben äquivalent. → Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten. 4 Wiederhole ab (2) solange Veränderungen eingetreten sind. 5 Gebe Partition P als Lösung zurück.
  • 9.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Der CATREGE-Algorithmus [Borgatti u. Everett, 1993] Sei P die jeweils aktuelle Partition des Graphen. 1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse. Anmerkung: Natürlich sind alternative Vorgaben für P möglich. 2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu. 3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen: → Übereinstimmung: Knoten bleiben äquivalent. → Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten. 4 Wiederhole ab (2) solange Veränderungen eingetreten sind. 5 Gebe Partition P als Lösung zurück.
  • 10.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Der CATREGE-Algorithmus [Borgatti u. Everett, 1993] Sei P die jeweils aktuelle Partition des Graphen. 1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse. Anmerkung: Natürlich sind alternative Vorgaben für P möglich. 2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu. 3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen: → Übereinstimmung: Knoten bleiben äquivalent. → Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten. 4 Wiederhole ab (2) solange Veränderungen eingetreten sind. 5 Gebe Partition P als Lösung zurück.
  • 11.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Der CATREGE-Algorithmus [Borgatti u. Everett, 1993] Sei P die jeweils aktuelle Partition des Graphen. 1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse. Anmerkung: Natürlich sind alternative Vorgaben für P möglich. 2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu. 3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen: → Übereinstimmung: Knoten bleiben äquivalent. → Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten. 4 Wiederhole ab (2) solange Veränderungen eingetreten sind. 5 Gebe Partition P als Lösung zurück.
  • 12.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Der CATREGE-Algorithmus [Borgatti u. Everett, 1993] Sei P die jeweils aktuelle Partition des Graphen. 1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse. Anmerkung: Natürlich sind alternative Vorgaben für P möglich. 2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu. 3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen: → Übereinstimmung: Knoten bleiben äquivalent. → Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten. 4 Wiederhole ab (2) solange Veränderungen eingetreten sind. 5 Gebe Partition P als Lösung zurück.
  • 13.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Der CATREGE-Algorithmus [Borgatti u. Everett, 1993] Sei P die jeweils aktuelle Partition des Graphen. 1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse. Anmerkung: Natürlich sind alternative Vorgaben für P möglich. 2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu. 3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen: → Übereinstimmung: Knoten bleiben äquivalent. → Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten. 4 Wiederhole ab (2) solange Veränderungen eingetreten sind. 5 Gebe Partition P als Lösung zurück.
  • 14.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Der CATREGE-Algorithmus [Borgatti u. Everett, 1993] Sei P die jeweils aktuelle Partition des Graphen. 1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse. Anmerkung: Natürlich sind alternative Vorgaben für P möglich. 2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu. 3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen: → Übereinstimmung: Knoten bleiben äquivalent. → Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten. 4 Wiederhole ab (2) solange Veränderungen eingetreten sind. 5 Gebe Partition P als Lösung zurück.
  • 15.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Der CATREGE-Algorithmus [Borgatti u. Everett, 1993] Sei P die jeweils aktuelle Partition des Graphen. 1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse. Anmerkung: Natürlich sind alternative Vorgaben für P möglich. 2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu. 3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen: → Übereinstimmung: Knoten bleiben äquivalent. → Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten. 4 Wiederhole ab (2) solange Veränderungen eingetreten sind. 5 Gebe Partition P als Lösung zurück.
  • 16.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Eigenschaften Terminiert mit dem sog. Regular Interior [Borgatti und Everett] d.h. der maximalen regulären Partion P ≤ der Startpartition. Laufzeit O(n3 ) maximal n Iterationen, da Anzahl der Äquivalenzklassen streng monoton steigend – bis auf den letzten Schritt. Laufzeit eines Schritts beträgt O( n(n−1) ) = O(n2 ). 2 Prädestiniert für Umgang mit Multiplen Relationen über stets separate Bestimmung der Nachbarschaftsmengen Implementierung nicht mehr als 300-400 Zeilen Quellcode in C++
  • 17.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Eigenschaften Terminiert mit dem sog. Regular Interior [Borgatti und Everett] d.h. der maximalen regulären Partion P ≤ der Startpartition. Laufzeit O(n3 ) maximal n Iterationen, da Anzahl der Äquivalenzklassen streng monoton steigend – bis auf den letzten Schritt. Laufzeit eines Schritts beträgt O( n(n−1) ) = O(n2 ). 2 Prädestiniert für Umgang mit Multiplen Relationen über stets separate Bestimmung der Nachbarschaftsmengen Implementierung nicht mehr als 300-400 Zeilen Quellcode in C++
  • 18.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Eigenschaften Terminiert mit dem sog. Regular Interior [Borgatti und Everett] d.h. der maximalen regulären Partion P ≤ der Startpartition. Laufzeit O(n3 ) maximal n Iterationen, da Anzahl der Äquivalenzklassen streng monoton steigend – bis auf den letzten Schritt. Laufzeit eines Schritts beträgt O( n(n−1) ) = O(n2 ). 2 Prädestiniert für Umgang mit Multiplen Relationen über stets separate Bestimmung der Nachbarschaftsmengen Implementierung nicht mehr als 300-400 Zeilen Quellcode in C++
  • 19.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Eigenschaften Terminiert mit dem sog. Regular Interior [Borgatti und Everett] d.h. der maximalen regulären Partion P ≤ der Startpartition. Laufzeit O(n3 ) maximal n Iterationen, da Anzahl der Äquivalenzklassen streng monoton steigend – bis auf den letzten Schritt. Laufzeit eines Schritts beträgt O( n(n−1) ) = O(n2 ). 2 Prädestiniert für Umgang mit Multiplen Relationen über stets separate Bestimmung der Nachbarschaftsmengen Implementierung nicht mehr als 300-400 Zeilen Quellcode in C++
  • 20.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Beispiel: Geschäftsbeziehungen von 70 Fotografen Wer beliefert wen? [weitgehende Planardarstellung mit Social Network Visualizer SocNetV] 10 24 57 68 55 44 48 69 26 8 63 67 50 40 51 61 2 29 13 28 39 25 64 60 4 47 17 46 21 53 37 1 70 54 31 52 20 56 30 59 27 16 38 58 35 6 19 45 43 33 15 5 22 32 18 14 34 9 62 66 36 23 42 49 65 3 11 7 12 41
  • 21.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Exemplarisch die Iterationsschritte. . . Anzahl der Äquivalenzklassen: 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69
  • 22.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Exemplarisch die Iterationsschritte. . . Anzahl der Äquivalenzklassen: 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 Nachbarschaftsmengen neu berechnen und vergleichen.
  • 23.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Exemplarisch die Iterationsschritte. . . Anzahl der Äquivalenzklassen: 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 Nachbarschaftsmengen neu berechnen und vergleichen. Anzahl der Äquivalenzklassen: 8 0 5 49 53 1 6 7 14 18 20 22 24 29 30 35 36 37 41 43 45 47 57 59 61 62 63 64 65 66 68 2 38 60 3 4 10 11 12 13 16 23 25 26 27 31 33 40 42 50 55 8 19 56 9 17 28 32 34 39 44 51 54 67 15 21 46 48 52 58 69
  • 24.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Äquivalenz mit 8 Klassen Finden Sie einen Fehler (eine Irregularität)! 10 24 57 68 55 44 48 69 26 8 63 67 50 40 51 61 2 29 13 28 39 25 64 60 4 47 17 46 21 53 37 1 70 54 31 52 20 56 30 59 27 16 38 58 35 6 19 45 43 33 15 5 22 32 18 14 34 9 62 66 36 23 42 49 65 3 11 7 12 41
  • 25.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Exemplarisch die Iterationsschritte. . . Anzahl der Äquivalenzklassen: 8 0 5 49 53 1 6 7 14 18 20 22 24 29 30 35 36 37 41 43 45 47 57 59 61 62 63 64 65 66 68 2 38 60 3 4 10 11 12 13 16 23 25 26 27 31 33 40 42 50 55 8 19 56 9 17 28 32 34 39 44 51 54 67 15 21 46 48 52 58 69
  • 26.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Exemplarisch die Iterationsschritte. . . Anzahl der Äquivalenzklassen: 8 0 5 49 53 1 6 7 14 18 20 22 24 29 30 35 36 37 41 43 45 47 57 59 61 62 63 64 65 66 68 2 38 60 3 4 10 11 12 13 16 23 25 26 27 31 33 40 42 50 55 8 19 56 9 17 28 32 34 39 44 51 54 67 15 21 46 48 52 58 69 Nachbarschaftsmengen neu berechnen und vergleichen.
  • 27.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Exemplarisch die Iterationsschritte. . . Anzahl der Äquivalenzklassen: 8 0 5 49 53 1 6 7 14 18 20 22 24 29 30 35 36 37 41 43 45 47 57 59 61 62 63 64 65 66 68 2 38 60 3 4 10 11 12 13 16 23 25 26 27 31 33 40 42 50 55 8 19 56 9 17 28 32 34 39 44 51 54 67 15 21 46 48 52 58 69 Nachbarschaftsmengen neu berechnen und vergleichen. Anzahl der Äquivalenzklassen: 29 0 1 2 3 10 13 23 25 26 33 42 55 4 11 16 27 31 5 53 6 29 7 24 41 45 47 61 62 63 65 66 68 8 9 17 12 40 14 18 30 35 37 43 57 64 15 19 20 36 21 22 59 28 67 32 34 39 54 38 60 44 46 48 52 49 50 51 56 58 69
  • 28.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Exemplarisch die Iterationsschritte. . . Anzahl der Äquivalenzklassen: 29 0 1 2 3 10 13 23 25 26 33 42 55 4 11 16 27 31 5 53 6 29 7 24 41 45 47 61 62 63 65 66 68 8 9 17 12 40 14 18 30 35 37 43 57 64 15 19 20 36 21 22 59 28 67 32 34 39 54 38 60 44 46 48 52 49 50 51 56 58 69
  • 29.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Exemplarisch die Iterationsschritte. . . Anzahl der Äquivalenzklassen: 29 0 1 2 3 10 13 23 25 26 33 42 55 4 11 16 27 31 5 53 6 29 7 24 41 45 47 61 62 63 65 66 68 8 9 17 12 40 14 18 30 35 37 43 57 64 15 19 20 36 21 22 59 28 67 32 34 39 54 38 60 44 46 48 52 49 50 51 56 58 69 Nachbarschaftsmengen neu berechnen und vergleichen.
  • 30.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Exemplarisch die Iterationsschritte. . . Anzahl der Äquivalenzklassen: 29 0 1 2 3 10 13 23 25 26 33 42 55 4 11 16 27 31 5 53 6 29 7 24 41 45 47 61 62 63 65 66 68 8 9 17 12 40 14 18 30 35 37 43 57 64 15 19 20 36 21 22 59 28 67 32 34 39 54 38 60 44 46 48 52 49 50 51 56 58 69 Nachbarschaftsmengen neu berechnen und vergleichen. Anzahl der Äquivalenzklassen: 47 0 1 2 3 10 13 25 26 55 4 5 6 7 24 41 45 47 62 63 65 66 8 9 11 16 27 31 12 14 18 35 15 17 19 20 21 22 59 23 28 67 29 30 57 32 34 33 42 36 37 38 39 40 43 44 46 48 49 50 51 52 53 54 56 58 60 61 64 68 69
  • 31.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Exemplarisch die Iterationsschritte. . . Anzahl der Äquivalenzklassen: 47 0 1 2 3 10 13 25 26 55 4 5 6 7 24 41 45 47 62 63 65 66 8 9 11 16 27 31 12 14 18 35 15 17 19 20 21 22 59 23 28 67 29 30 57 32 34 33 42 36 37 38 39 40 43 44 46 48 49 50 51 52 53 54 56 58 60 61 64 68 69
  • 32.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Exemplarisch die Iterationsschritte. . . Anzahl der Äquivalenzklassen: 47 0 1 2 3 10 13 25 26 55 4 5 6 7 24 41 45 47 62 63 65 66 8 9 11 16 27 31 12 14 18 35 15 17 19 20 21 22 59 23 28 67 29 30 57 32 34 33 42 36 37 38 39 40 43 44 46 48 49 50 51 52 53 54 56 58 60 61 64 68 69 Nachbarschaftsmengen neu berechnen und vergleichen.
  • 33.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Exemplarisch die Iterationsschritte. . . Anzahl der Äquivalenzklassen: 47 0 1 2 3 10 13 25 26 55 4 5 6 7 24 41 45 47 62 63 65 66 8 9 11 16 27 31 12 14 18 35 15 17 19 20 21 22 59 23 28 67 29 30 57 32 34 33 42 36 37 38 39 40 43 44 46 48 49 50 51 52 53 54 56 58 60 61 64 68 69 Nachbarschaftsmengen neu berechnen und vergleichen. Anzahl der Äquivalenzklassen: 53 0 1 2 3 10 13 26 4 5 6 7 24 47 63 8 9 11 12 14 18 35 15 16 27 31 17 19 20 21 22 59 23 25 28 67 29 30 32 34 33 42 36 37 38 39 40 41 45 62 43 44 46 48 49 50 51 52 53 54 55 56 57 58 60 61 64 65 66 68 69
  • 34.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Exemplarisch die Iterationsschritte. . . Anzahl der Äquivalenzklassen: 53 0 1 2 3 10 13 26 4 5 6 7 24 47 63 8 9 11 12 14 18 35 15 16 27 31 17 19 20 21 22 59 23 25 28 67 29 30 32 34 33 42 36 37 38 39 40 41 45 62 43 44 46 48 49 50 51 52 53 54 55 56 57 58 60 61 64 65 66 68 69
  • 35.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Exemplarisch die Iterationsschritte. . . Anzahl der Äquivalenzklassen: 53 0 1 2 3 10 13 26 4 5 6 7 24 47 63 8 9 11 12 14 18 35 15 16 27 31 17 19 20 21 22 59 23 25 28 67 29 30 32 34 33 42 36 37 38 39 40 41 45 62 43 44 46 48 49 50 51 52 53 54 55 56 57 58 60 61 64 65 66 68 69 Nachbarschaftsmengen neu berechnen und vergleichen.
  • 36.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz Exemplarisch die Iterationsschritte. . . Anzahl der Äquivalenzklassen: 53 0 1 2 3 10 13 26 4 5 6 7 24 47 63 8 9 11 12 14 18 35 15 16 27 31 17 19 20 21 22 59 23 25 28 67 29 30 32 34 33 42 36 37 38 39 40 41 45 62 43 44 46 48 49 50 51 52 53 54 55 56 57 58 60 61 64 65 66 68 69 Nachbarschaftsmengen neu berechnen und vergleichen. Anzahl der Äquivalenzklassen: 54 0 1 2 3 10 13 26 4 5 6 7 24 63 8 9 11 12 14 18 35 15 16 27 31 17 19 20 21 22 59 23 25 28 67 29 30 32 34 33 42 36 37 38 39 40 41 45 62 43 44 46 47 48 49 50 51 52 53 54 55 56 57 58 60 61 64 65 66 68 69
  • 37.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Exaktes Auffinden der maximalen regulären Äquivalenz 70 Fotografen, 54 verschiedene Typen Anzahl der Äquivalenzklassen: 54 0 1 2 3 10 13 26 4 5 6 7 24 63 8 9 11 12 14 18 35 15 16 27 31 17 19 20 21 22 59 23 25 28 67 29 30 32 34 33 42 36 37 38 39 40 41 45 62 43 44 46 47 48 49 50 51 52 53 54 55 56 57 58 60 61 64 65 66 68 69 Ist eine solche Anzahl von Klassen noch sinnvoll für das Treffen qualitativer analytischer Aussagen?
  • 38.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Was will man mehr? Problemfeld 1: Fehlertoleranz gegenüber Realdaten Einzelne Perturbation Rollen-Primitivität 1234 1 2 14/23 1/234 124/3 13/24 123/4 134/2 12/34 1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34 4 3 1/2/3/4 – Kleine Ungenauigkeiten in den zu Grunde gelegten Beziehungsdaten führen zu völlig anderer Klassenstruktur + Arbeitsweise des Algorithmus dafür leicht nachvollziehbar.
  • 39.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Was will man mehr? Problemfeld 1: Fehlertoleranz gegenüber Realdaten Einzelne Perturbation Rollen-Primitivität 1234 1 2 14/23 1/234 124/3 13/24 123/4 134/2 12/34 1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34 4 3 1/2/3/4 – Kleine Ungenauigkeiten in den zu Grunde gelegten Beziehungsdaten führen zu völlig anderer Klassenstruktur + Arbeitsweise des Algorithmus dafür leicht nachvollziehbar.
  • 40.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Was will man mehr? Problemfeld 1: Fehlertoleranz gegenüber Realdaten Einzelne Perturbation Rollen-Primitivität 1234 1 2 14/23 1/234 124/3 13/24 123/4 134/2 12/34 1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34 4 3 1/2/3/4 – Kleine Ungenauigkeiten in den zu Grunde gelegten Beziehungsdaten führen zu völlig anderer Klassenstruktur + Arbeitsweise des Algorithmus dafür leicht nachvollziehbar.
  • 41.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Was will man mehr? Problemfeld 2: Einbringung von Vorwissen 1234 14/23 1/234 124/3 13/24 123/4 134/2 12/34 1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34 1/2/3/4 + Im Prinzip von jeder Partition aus startbar, so lässt sich die Trennung bestimmter Knoten erzwingen. – Trotz strukturellem Vorwissen ist weder Klassenzahl noch Rollengraph vorgebbar.
  • 42.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Was will man mehr? Problemfeld 2: Einbringung von Vorwissen 1234 14/23 1/234 124/3 13/24 123/4 134/2 12/34 1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34 1/2/3/4 + Im Prinzip von jeder Partition aus startbar, so lässt sich die Trennung bestimmter Knoten erzwingen. – Trotz strukturellem Vorwissen ist weder Klassenzahl noch Rollengraph vorgebbar.
  • 43.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Was will man mehr? Problemfeld 2: Einbringung von Vorwissen 1234 14/23 1/234 124/3 13/24 123/4 134/2 12/34 1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34 1/2/3/4 + Im Prinzip von jeder Partition aus startbar, so lässt sich die Trennung bestimmter Knoten erzwingen. – Trotz strukturellem Vorwissen ist weder Klassenzahl noch Rollengraph vorgebbar.
  • 44.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Blockmodellierung als Optimierungsproblem Grundideen der Blockmodellierung 1 Klassenzahl und Rollengraph als Modell-Annahme 2 Knoten bestmöglich den Rollen zuordnen
  • 45.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Blockmodellierung als Optimierungsproblem Gütebeurteilung: Was bedeutet bestmöglich? Die Zielfunktion ∆ soll folgende Eigenschaften erfüllen: 1 ∆(P) ≥ 0 2 ∆(P) = 0 ⇔ P ist exakt regulär. Sei Θk die Menge aller Partitionen mit k Klassen. Dann ist zu lösen das Optimierungsproblem ∆(P ∗ ) = min ∆(P) P∈Θk
  • 46.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Blockmodellierung als Optimierungsproblem Gütebeurteilung: Was bedeutet bestmöglich? Wähle für ∆ die Definition ∆(P) = min d(Cu × Cv , B) B∈B(Cu ,Cv ) Cu ,Cv ∈P mit Cu Cluster = Äquivalenzklasse mit Repräsentant u Cu × Cv Block = kartesisches Produkt der Cluster (Cu , Cv ) B(Cu , Cv ) Menge aller Idealblöcke für Cu × Cv d noch zu definierende Abstandsfunktion
  • 47.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Blockmodellierung als Optimierungsproblem Wie sehen ideale reguläre Blockmatrizen aus? Definition (Regulärer Block) Eine Block Cu × Cv heißt regulär, wenn er in jeder Zeile und jeder Spalte mindestens eine 1 enthält. Definition (Reguläre Matrix) Eine Matrix heißt regulär, wenn sie nur aus Nullblöcken und regulären Blöcken besteht. Lemma (Konsistenz der Definition) Eine Blockmatrix R ist genau dann regulär, wenn sie eine reguläre Partition darstellt.
  • 48.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Blockmodellierung als Optimierungsproblem Wie sehen ideale reguläre Blockmatrizen aus? Definition (Regulärer Block) Eine Block Cu × Cv heißt regulär, wenn er in jeder Zeile und jeder Spalte mindestens eine 1 enthält. Definition (Reguläre Matrix) Eine Matrix heißt regulär, wenn sie nur aus Nullblöcken und regulären Blöcken besteht. Lemma (Konsistenz der Definition) Eine Blockmatrix R ist genau dann regulär, wenn sie eine reguläre Partition darstellt.
  • 49.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Blockmodellierung als Optimierungsproblem Wie sehen ideale reguläre Blockmatrizen aus? Definition (Regulärer Block) Eine Block Cu × Cv heißt regulär, wenn er in jeder Zeile und jeder Spalte mindestens eine 1 enthält. Definition (Reguläre Matrix) Eine Matrix heißt regulär, wenn sie nur aus Nullblöcken und regulären Blöcken besteht. Lemma (Konsistenz der Definition) Eine Blockmatrix R ist genau dann regulär, wenn sie eine reguläre Partition darstellt.
  • 50.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Blockmodellierung als Optimierungsproblem Wie sehen ideale reguläre Blockmatrizen aus? Beweis des Lemmas für Zeilen (Spalten analog). „⇒“ Sei R regulär. Im Falle, dass Cu × Cv Nullblock ist nichts zu zeigen. Da für jeden Block Cu × Cv gilt Cu × Cv regulär =⇒ ∀w ∈ Cu ∃z ∈ Cv : rwz = 1 =⇒ P reg. „⇐“ Angenommen die Blockmatrix R stelle die reguläre Partition P dar, aber ein Block Cu × Cv sei weder Null- noch regulärer Block. Sei o. B. d. A. P reg. (ruv = 1) =⇒ (∀w ∈ Cu ∃z ∈ Cv : rwz = 1) Dann wäre aber Cu × Cv regulär zur Annahme.
  • 51.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Blockmodellierung als Optimierungsproblem Naheliegende Definition Definition (Abstandsfunktion d) d(Cu × Cv , B) = #Nullzeilen + #Nullspalten, falls Cu × Cv regulär #Einsen, falls Cu × Cv Nullblock Bemerkung Obige Definition von d gewichtet Abweichungen in Nullblöcken im Mittel stärker als in regulären Blöcken. Allerdings wird so die IP-Formulierung später wesentlich übersichtlicher.
  • 52.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Blockmodellierung als Optimierungsproblem Lösungsansätze Definition (Lokale Transformation) 1 Vertausche zwei Zeilen bzw. Spalten aus verschiedenen Clustern. 2 Verschiebe eine Zeile bzw. Spalte in einen anderen Cluster. Gradienten-Verfahren Es werden solange lokale Transformationen durchgeführt, wie dadurch ∆ (ganzzahlig) reduziert wird. Das erreichte Optimum ist lokal. Globale Optimalität ist nur im Falle ∆ = 0 garantiert. Daraus ergibt sich grundsätzliche Frage: Wann gibt es ein exakt reguläre Partition mit genau k Äquivalenzklassen?
  • 53.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Komplexität von 2-ROLE-ASSIGNABILITY (2RA) Reguläre k -Zuweisbarkeit für ungerichtete Graphen Definition (Reguläre k -Zuweisbarkeit) Ein ungerichteter Graph G heißt regulär k -zuweisbar, wenn für ihn eine exakte reguläre Äquivalenz mit genau k Klassen existiert. Leicht: k = 1 und k = |V | Schwer ist dagegen. . . Satz (NP-Vollständigkeit von 2RA) Das Entscheidungsproblem, ob ein ungerichteter Graph G regulär 2-zuweisbar ist, ist NP-vollständig, falls N = NP.
  • 54.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Komplexität von 2-ROLE-ASSIGNABILITY (2RA) Reguläre k -Zuweisbarkeit für ungerichtete Graphen Definition (Reguläre k -Zuweisbarkeit) Ein ungerichteter Graph G heißt regulär k -zuweisbar, wenn für ihn eine exakte reguläre Äquivalenz mit genau k Klassen existiert. Leicht: k = 1 und k = |V | Schwer ist dagegen. . . Satz (NP-Vollständigkeit von 2RA) Das Entscheidungsproblem, ob ein ungerichteter Graph G regulär 2-zuweisbar ist, ist NP-vollständig, falls N = NP.
  • 55.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Komplexität von 2-ROLE-ASSIGNABILITY (2RA) Reguläre k -Zuweisbarkeit für ungerichtete Graphen Definition (Reguläre k -Zuweisbarkeit) Ein ungerichteter Graph G heißt regulär k -zuweisbar, wenn für ihn eine exakte reguläre Äquivalenz mit genau k Klassen existiert. Leicht: k = 1 und k = |V | Schwer ist dagegen. . . Satz (NP-Vollständigkeit von 2RA) Das Entscheidungsproblem, ob ein ungerichteter Graph G regulär 2-zuweisbar ist, ist NP-vollständig, falls N = NP.
  • 56.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Komplexität von 2-ROLE-ASSIGNABILITY (2RA) Reguläre k -Zuweisbarkeit für ungerichtete Graphen Definition (Reguläre k -Zuweisbarkeit) Ein ungerichteter Graph G heißt regulär k -zuweisbar, wenn für ihn eine exakte reguläre Äquivalenz mit genau k Klassen existiert. Leicht: k = 1 und k = |V | Schwer ist dagegen. . . Satz (NP-Vollständigkeit von 2RA) Das Entscheidungsproblem, ob ein ungerichteter Graph G regulär 2-zuweisbar ist, ist NP-vollständig, falls N = NP.
  • 57.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Komplexität von 2-ROLE-ASSIGNABILITY (2RA) 2-Rollenverteilungen eines ungerichteten Graphen Definition (2RAi ) Mit 2RAi bezeichnen wir das Teilproblem, zu entscheiden ob G regulär 2-zuweisbar ist mit Rollengraph Ri . Abbildung: Anzeichnen R1 R4 R2 R5 R3 R6
  • 58.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Komplexität von 2-ROLE-ASSIGNABILITY (2RA) Polynomiell entscheidbare Teilprobleme von 2RA Lemma (für 2RAi , i = 1 . . . 4) Der Graph G hat genau dann eine Rollenzuweisung mit R1 wenn G aus lauter isolierten Knoten besteht. R2 wenn G sowohl isolierte Knoten als auch einen zusammenhängenden Teil besitzt. R3 wenn G keine isolierten Knoten, dafür aber mindestens zwei Zusammenhangskomponenten besitzt. R4 wenn G keine isolierten Knoten besitzt und bipartit ist.
  • 59.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Komplexität von 2-ROLE-ASSIGNABILITY (2RA) Polynomiell entscheidbare Teilprobleme von 2RA Lemma (für 2RAi , i = 1 . . . 4) Der Graph G hat genau dann eine Rollenzuweisung mit R1 wenn G aus lauter isolierten Knoten besteht. R2 wenn G sowohl isolierte Knoten als auch einen zusammenhängenden Teil besitzt. R3 wenn G keine isolierten Knoten, dafür aber mindestens zwei Zusammenhangskomponenten besitzt. R4 wenn G keine isolierten Knoten besitzt und bipartit ist.
  • 60.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Komplexität von 2-ROLE-ASSIGNABILITY (2RA) Polynomiell entscheidbare Teilprobleme von 2RA Lemma (für 2RAi , i = 1 . . . 4) Der Graph G hat genau dann eine Rollenzuweisung mit R1 wenn G aus lauter isolierten Knoten besteht. R2 wenn G sowohl isolierte Knoten als auch einen zusammenhängenden Teil besitzt. R3 wenn G keine isolierten Knoten, dafür aber mindestens zwei Zusammenhangskomponenten besitzt. R4 wenn G keine isolierten Knoten besitzt und bipartit ist.
  • 61.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Komplexität von 2-ROLE-ASSIGNABILITY (2RA) Polynomiell entscheidbare Teilprobleme von 2RA Lemma (für 2RAi , i = 1 . . . 4) Der Graph G hat genau dann eine Rollenzuweisung mit R1 wenn G aus lauter isolierten Knoten besteht. R2 wenn G sowohl isolierte Knoten als auch einen zusammenhängenden Teil besitzt. R3 wenn G keine isolierten Knoten, dafür aber mindestens zwei Zusammenhangskomponenten besitzt. R4 wenn G keine isolierten Knoten besitzt und bipartit ist.
  • 62.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Komplexität von 2-ROLE-ASSIGNABILITY (2RA) Polynomiell entscheidbare Teilprobleme von 2RA Lemma (für 2RAi , i = 1 . . . 4) Der Graph G hat genau dann eine Rollenzuweisung mit R1 wenn G aus lauter isolierten Knoten besteht. R2 wenn G sowohl isolierte Knoten als auch einen zusammenhängenden Teil besitzt. R3 wenn G keine isolierten Knoten, dafür aber mindestens zwei Zusammenhangskomponenten besitzt. R4 wenn G keine isolierten Knoten besitzt und bipartit ist.
  • 63.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Komplexität von 2-ROLE-ASSIGNABILITY (2RA) Skizze der Beweisführung Beweisidee. klar ! Zeige 3SAT (NP-vollständig nach Cook) p 2RA ∈ NP. Vorgehen. Für eine beliebige Instanz von 3SAT mit Variablenmenge U = {u1 , u2 , . . . , ui , . . . , un } Aussagenmenge C = {c1 , c2 , . . . , cj , . . . , cm } konstruiere einen Graphen, der genau dann regulär 2-zuweisbar ist, wenn die 3SAT -Instanz erfüllbar ist.
  • 64.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Komplexität von 2-ROLE-ASSIGNABILITY (2RA) Skizze der Beweisführung Beweisidee. klar ! Zeige 3SAT (NP-vollständig nach Cook) p 2RA ∈ NP. Vorgehen. Für eine beliebige Instanz von 3SAT mit Variablenmenge U = {u1 , u2 , . . . , ui , . . . , un } Aussagenmenge C = {c1 , c2 , . . . , cj , . . . , cm } konstruiere einen Graphen, der genau dann regulär 2-zuweisbar ist, wenn die 3SAT -Instanz erfüllbar ist.
  • 65.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Komplexität von 2-ROLE-ASSIGNABILITY (2RA) Übertragung von 3SAT auf Graphen Truth-Setting Ti und Satisfaction-Testing-Komponenten Sj ui ui cj1 cj2 cj3 bj3 bj1 (a) T i (b) S j
  • 66.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Komplexität von 2-ROLE-ASSIGNABILITY (2RA) Beispielgraph zum Beweis von 3SAT p 2RA5 Konstruktion in PTIME aus der 3SAT -Instanz ¯ ¯ U = {u1 , u2 , u3 , u4 } und C = {{u1 , u2 , u3 }, {u2 , u3 , u4 }} a11 a21 a31 a41 a12 a22 a32 a42 a13 a23 a33 a43 u1 u1 u2 u2 u3 u3 u4 u4 c11 c13 c 21 c 23 c12 c 22 b13 b23 b12 b22 b11 b21
  • 67.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Komplexität von 2-ROLE-ASSIGNABILITY (2RA) Beispielgraph zum Beweis von 2RA5 p 2RA Konstruktion in PTIME u1 u2 u1 u2 b1 a2 a1 b2 C1 C2 x1 y1 x2 y2 (a) G (b) G
  • 68.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick IP-Formulierung Vereinbarungen zur IP-Formulierung N ∈ N, N ≥ 3 Anzahl der Knoten K ∈ N {0} Anzahl der Blöcke N×N S ∈ {0, 1} Adjazenzmatrix des Graphen B ∈ {0, 1}K ×K Matrixdarstellung des Rollengraphen P∈ NK ×K 0 Abweichungs-Gewichtungsmatrix (optional) Lateinische Kleinbuchstaben stellen ggf. Elemente der mit Großbuchstaben bezeichneten Matrizen dar. Alle Ausdrücke gelten für alle Indizes aus {i, j, k , l}, über die nicht summiert wird. Ausdrücke mit αikl , βjkl gelten nur für Blöcke (k , l)|bkl = 1.
  • 69.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick IP-Formulierung IP-Formulierung [Brusco, Steinley] N N N N min pkl yijkl sij + pkl αikl + pkl β i=1 j=1 (k ,l)|bkl =0 i=1 (k ,l)|bkl =1 j=1 (k ,l)|bkl =1 K N s.t. xik = 1 xik ≥ 1 (1) k =1 i=1 xik + xjl − yijkl ≤ 1 xik + xjl − 2 yijkl ≥ 0 (2)   N N  yijkl sij  + αikl ≥ xik yijkl sij + βjkl ≥ xjl (3) j=1 i=1 xik , yijkl ∈ {0, 1} αikl , βjkl ∈ {0, 1} (4)
  • 70.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick IP-Formulierung IP-Formulierung [äquivalent und lesbar]    K K N N N N min pkl ¬bkl yijkl sij + bkl  αikl + βjkl  k =1 l=1 i=1 j=1 i=1 j=1 K N s.t. xik = 1 xik ≥ 1 (1) k =1 i=1 xik + xjl − yijkl ≤ 1 xik + xjl − 2 yijkl ≥ 0 (2)   N N  yijkl sij  + αikl ≥ xik yijkl sij + βjkl ≥ xjl (3) j=1 i=1 xik , yijkl ∈ {0, 1} αikl , βjkl ∈ {0, 1} (4)
  • 71.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick IP-Formulierung Nachbemerkung I zur IP-Formulierung Die Typ (2)-Nebenbedingung xik + xjl − 2 yijkl ≥ 0 ist von entscheidender Bedeutung. Würde sie fehlen, könnten die yijkl trotz xik xjl = 1 irrtümlich den Wert 1 annehmen, nur um die Nebenbedingungen vom Typ (3) zu erfüllen.
  • 72.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick IP-Formulierung Benchmark: Das Everett-Netzwerk a b c d e f g h i j a 0 1 1 1 0 0 0 0 0 0 b 1 0 1 0 1 0 0 0 0 0 c 1 1 0 1 0 0 0 0 0 0 d 1 0 1 0 1 0 0 0 0 0 e 0 1 0 1 0 1 0 0 0 0 f 0 0 0 0 1 0 1 0 1 0 g 0 0 0 0 0 1 0 1 0 1 h 0 0 0 0 0 0 1 0 1 1 i 0 0 0 0 0 1 0 1 0 1 j 0 0 0 0 0 0 1 1 1 0 Tabelle: Eingangsdaten
  • 73.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick IP-Formulierung Benchmark: Das Everett-Netzwerk {?} {?} {?} {?} 1 1 0 {?} 1 0 1 {?} 0 1 1 Tabelle: Vorgegebener Rollengraph
  • 74.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick IP-Formulierung Benchmark: Das Everett-Netzwerk c a j h b d g i e f a 1 0 0 0 1 1 0 0 0 0 c 0 1 0 0 1 1 0 0 0 0 h 0 0 1 0 0 0 1 1 0 0 j 0 0 0 1 0 0 1 1 0 0 b 1 1 0 0 0 0 0 0 1 0 d 1 1 0 0 0 0 0 0 1 0 g 0 0 1 1 0 0 0 0 0 1 i 0 0 1 1 0 0 0 0 0 1 e 0 0 0 0 1 1 0 0 0 1 f 0 0 0 0 0 0 1 1 1 0 Tabelle: 3-Cluster-Blockmodell
  • 75.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick IP-Formulierung Benchmark: Das Everett-Netzwerk c a j h b d g i e f a 1 0 0 0 1 1 0 0 0 0 c 0 1 0 0 1 1 0 0 0 0 h 0 0 1 0 0 0 1 1 0 0 j 0 0 0 1 0 0 1 1 0 0 b 1 1 0 0 0 0 0 0 1 0 d 1 1 0 0 0 0 0 0 1 0 g 0 0 1 1 0 0 0 0 0 1 i 0 0 1 1 0 0 0 0 0 1 e 0 0 0 0 1 1 0 0 0 1 f 0 0 0 0 0 0 1 1 1 0 Tabelle: Reguläre und Nullblöcke (∆ exakt 0)
  • 76.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick IP-Formulierung Benchmark: Das Everett-Netzwerk {a,c,h,j} {b,d,g,i} {e,f} {a,c,h,j} 1 1 0 {b,d,g,i} 1 0 1 {e,f} 0 1 1 Tabelle: Berechnung mit CPLEX 1.30s
  • 77.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick IP-Formulierung Nachbemerkung II zur IP-Formulierung In eine ähnliche IP-Form bringen lassen sich Strukturelle Äquivalenz Wesentlich einfacher, da bkl = 1 ⇔ Block kl vollbesetzt. SE und RE auf V × W Noch um einges komplexer, da Partition zweier Mengen erforderlich.
  • 78.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Vorzüge und Nachteile aller drei Ansätze CATREGE Gradienten-Heuristik IP-Lösung Güte keine Aussage lokales Optimum Optimalitätsgarantie Vorgehen explorativ Hypothesentest Hypothesentest Vorwissen kaum einbringbar Rollengraphvorgabe Rollengraphvorgabe Worst-Case-Laufzeit O(n3 ) überpolynomial überpolynomial mehrereRelationen einfach möglich großer Mehraufwand großer Mehraufwand
  • 79.
    Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick Forschungsperspektive Wünschenswert wären Verfahren, die alle drei Kriterien erfüllen: 1 Rollengraph auswählen 2 Reguläre Partition finden 3 Optimalitätsgarantie liefern
  • 80.
    Anhang Weiterführende Literatur Weiterführende LiteraturI Jürgen Lerner. Role Assignments, S. 216–252. in Brandes, Erlebach: Network Analysis, Springer 2005. Fred S. Roberts, Li Sheng 2001. How Hard Is It to Determine If a Graph Has a 2-Role Assignment? NETWORKS Journal, Vol. 37, S. 67-73. Michael J. Brusco, Douglas Steinley 2009 Integer programs for one- and two-mode blockmodeling based on prespecified image matrices for structural and regular equivalence. Journal of Mathematical Psychology, Nr. 53, S. 577-585.