"Knoten der selben Äquivalenzklasse haben Knoten der gleichen Äquivalenzklassen in ihrer jeweiligen Menge von Nachbarn." Mit dieser Definition (Prosaversion) lassen sich Netzwerke aller Art auf wiederkehrende Strukturen untersuchen.
Wirtschaftsingenieurwesen an der Universität Duisburg-Essen
Reguläre Äquivalenz - IP-Formulierung von Blockmodellen
1. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Reguläre Äquivalenz
IP-Formulierung von Blockmodellen
Jens Fielenbach
Arbeitsgruppe ComOpt
von Prof. Dr. Gerhard Reinelt
Fakultät für Mathematik und Informatik
Universität Heidelberg
Seminar Analyse von Netzwerken im SS 2011
2. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Gliederung
1 Ausgangspunkt / Motivation
Wiederholung der Definitionen
Exaktes Auffinden der maximalen regulären Äquivalenz
Was will man mehr?
2 Blockmodellierung
Blockmodellierung als Optimierungsproblem
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
IP-Formulierung
3. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Wiederholung der Definitionen
Reguläre Äquivalenz
Definition (Reguläre Äquivalenz)
Eine Äquivalenzrelation der Knotenmenge eines Graphen
G = (V , E) heißt regulär, wenn für jedes Knotenpaar (u, v ) mit
u ≡ w stets folgende Implikationen gelten:
i (uv ∈ E) =⇒ (∃z ≡ v : wz ∈ E)
ii (vu ∈ E) =⇒ (∃z ≡ v : zw ∈ E)
Merksatz in Prosa
Knoten der selben Äquivalenzklasse haben Knoten der
gleichen Äquivalenzklassen in ihrer jeweiligen Menge von
Nachbarn.
4. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Ein kleines Beispiel zum Warmwerden. . .
1 2
4 3
Abbildung: Finden Sie ein oder mehrere reguläre Äquivalenzen!
5. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Eine Lösung
1 2
4 3
6. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Eine Lösung Alle regulären Äquivalenzen
1234
1 2
14/23 1/234 124/3 13/24 123/4 134/2 12/34
1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34
4 3
1/2/3/4
7. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]
Sei P die jeweils aktuelle Partition des Graphen.
1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
Anmerkung: Natürlich sind alternative Vorgaben für P möglich.
2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
→ Übereinstimmung: Knoten bleiben äquivalent.
→ Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
4 Wiederhole ab (2) solange Veränderungen eingetreten sind.
5 Gebe Partition P als Lösung zurück.
8. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]
Sei P die jeweils aktuelle Partition des Graphen.
1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
Anmerkung: Natürlich sind alternative Vorgaben für P möglich.
2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
→ Übereinstimmung: Knoten bleiben äquivalent.
→ Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
4 Wiederhole ab (2) solange Veränderungen eingetreten sind.
5 Gebe Partition P als Lösung zurück.
9. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]
Sei P die jeweils aktuelle Partition des Graphen.
1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
Anmerkung: Natürlich sind alternative Vorgaben für P möglich.
2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
→ Übereinstimmung: Knoten bleiben äquivalent.
→ Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
4 Wiederhole ab (2) solange Veränderungen eingetreten sind.
5 Gebe Partition P als Lösung zurück.
10. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]
Sei P die jeweils aktuelle Partition des Graphen.
1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
Anmerkung: Natürlich sind alternative Vorgaben für P möglich.
2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
→ Übereinstimmung: Knoten bleiben äquivalent.
→ Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
4 Wiederhole ab (2) solange Veränderungen eingetreten sind.
5 Gebe Partition P als Lösung zurück.
11. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]
Sei P die jeweils aktuelle Partition des Graphen.
1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
Anmerkung: Natürlich sind alternative Vorgaben für P möglich.
2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
→ Übereinstimmung: Knoten bleiben äquivalent.
→ Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
4 Wiederhole ab (2) solange Veränderungen eingetreten sind.
5 Gebe Partition P als Lösung zurück.
12. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]
Sei P die jeweils aktuelle Partition des Graphen.
1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
Anmerkung: Natürlich sind alternative Vorgaben für P möglich.
2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
→ Übereinstimmung: Knoten bleiben äquivalent.
→ Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
4 Wiederhole ab (2) solange Veränderungen eingetreten sind.
5 Gebe Partition P als Lösung zurück.
13. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]
Sei P die jeweils aktuelle Partition des Graphen.
1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
Anmerkung: Natürlich sind alternative Vorgaben für P möglich.
2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
→ Übereinstimmung: Knoten bleiben äquivalent.
→ Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
4 Wiederhole ab (2) solange Veränderungen eingetreten sind.
5 Gebe Partition P als Lösung zurück.
14. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]
Sei P die jeweils aktuelle Partition des Graphen.
1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
Anmerkung: Natürlich sind alternative Vorgaben für P möglich.
2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
→ Übereinstimmung: Knoten bleiben äquivalent.
→ Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
4 Wiederhole ab (2) solange Veränderungen eingetreten sind.
5 Gebe Partition P als Lösung zurück.
15. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Der CATREGE-Algorithmus [Borgatti u. Everett, 1993]
Sei P die jeweils aktuelle Partition des Graphen.
1 Starte P mit allen Knoten in ein und derselben Äquivalenzklasse.
Anmerkung: Natürlich sind alternative Vorgaben für P möglich.
2 Für jeden Knoten berechne dessen Nachbarschaftsmenge bezüglich P neu.
3 Für jedes Paar von Knoten vergleiche deren Nachbarschaftsmengen:
→ Übereinstimmung: Knoten bleiben äquivalent.
→ Abweichung: Eröffne neue Äquivalenzklasse für einen der Knoten.
4 Wiederhole ab (2) solange Veränderungen eingetreten sind.
5 Gebe Partition P als Lösung zurück.
16. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Eigenschaften
Terminiert mit dem sog. Regular Interior [Borgatti und Everett]
d.h. der maximalen regulären Partion P ≤ der Startpartition.
Laufzeit O(n3 )
maximal n Iterationen, da Anzahl der Äquivalenzklassen
streng monoton steigend – bis auf den letzten Schritt.
Laufzeit eines Schritts beträgt O( n(n−1) ) = O(n2 ).
2
Prädestiniert für Umgang mit Multiplen Relationen
über stets separate Bestimmung der Nachbarschaftsmengen
Implementierung
nicht mehr als 300-400 Zeilen Quellcode in C++
17. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Eigenschaften
Terminiert mit dem sog. Regular Interior [Borgatti und Everett]
d.h. der maximalen regulären Partion P ≤ der Startpartition.
Laufzeit O(n3 )
maximal n Iterationen, da Anzahl der Äquivalenzklassen
streng monoton steigend – bis auf den letzten Schritt.
Laufzeit eines Schritts beträgt O( n(n−1) ) = O(n2 ).
2
Prädestiniert für Umgang mit Multiplen Relationen
über stets separate Bestimmung der Nachbarschaftsmengen
Implementierung
nicht mehr als 300-400 Zeilen Quellcode in C++
18. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Eigenschaften
Terminiert mit dem sog. Regular Interior [Borgatti und Everett]
d.h. der maximalen regulären Partion P ≤ der Startpartition.
Laufzeit O(n3 )
maximal n Iterationen, da Anzahl der Äquivalenzklassen
streng monoton steigend – bis auf den letzten Schritt.
Laufzeit eines Schritts beträgt O( n(n−1) ) = O(n2 ).
2
Prädestiniert für Umgang mit Multiplen Relationen
über stets separate Bestimmung der Nachbarschaftsmengen
Implementierung
nicht mehr als 300-400 Zeilen Quellcode in C++
19. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Exaktes Auffinden der maximalen regulären Äquivalenz
Eigenschaften
Terminiert mit dem sog. Regular Interior [Borgatti und Everett]
d.h. der maximalen regulären Partion P ≤ der Startpartition.
Laufzeit O(n3 )
maximal n Iterationen, da Anzahl der Äquivalenzklassen
streng monoton steigend – bis auf den letzten Schritt.
Laufzeit eines Schritts beträgt O( n(n−1) ) = O(n2 ).
2
Prädestiniert für Umgang mit Multiplen Relationen
über stets separate Bestimmung der Nachbarschaftsmengen
Implementierung
nicht mehr als 300-400 Zeilen Quellcode in C++
38. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Was will man mehr?
Problemfeld 1: Fehlertoleranz gegenüber Realdaten
Einzelne Perturbation Rollen-Primitivität
1234
1 2
14/23 1/234 124/3 13/24 123/4 134/2 12/34
1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34
4 3 1/2/3/4
– Kleine Ungenauigkeiten in den zu Grunde gelegten
Beziehungsdaten führen zu völlig anderer Klassenstruktur
+ Arbeitsweise des Algorithmus dafür leicht nachvollziehbar.
39. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Was will man mehr?
Problemfeld 1: Fehlertoleranz gegenüber Realdaten
Einzelne Perturbation Rollen-Primitivität
1234
1 2
14/23 1/234 124/3 13/24 123/4 134/2 12/34
1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34
4 3 1/2/3/4
– Kleine Ungenauigkeiten in den zu Grunde gelegten
Beziehungsdaten führen zu völlig anderer Klassenstruktur
+ Arbeitsweise des Algorithmus dafür leicht nachvollziehbar.
40. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Was will man mehr?
Problemfeld 1: Fehlertoleranz gegenüber Realdaten
Einzelne Perturbation Rollen-Primitivität
1234
1 2
14/23 1/234 124/3 13/24 123/4 134/2 12/34
1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34
4 3 1/2/3/4
– Kleine Ungenauigkeiten in den zu Grunde gelegten
Beziehungsdaten führen zu völlig anderer Klassenstruktur
+ Arbeitsweise des Algorithmus dafür leicht nachvollziehbar.
41. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Was will man mehr?
Problemfeld 2: Einbringung von Vorwissen
1234
14/23 1/234 124/3 13/24 123/4 134/2 12/34
1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34
1/2/3/4
+ Im Prinzip von jeder Partition aus startbar, so lässt sich die
Trennung bestimmter Knoten erzwingen.
– Trotz strukturellem Vorwissen ist weder Klassenzahl noch
Rollengraph vorgebbar.
42. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Was will man mehr?
Problemfeld 2: Einbringung von Vorwissen
1234
14/23 1/234 124/3 13/24 123/4 134/2 12/34
1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34
1/2/3/4
+ Im Prinzip von jeder Partition aus startbar, so lässt sich die
Trennung bestimmter Knoten erzwingen.
– Trotz strukturellem Vorwissen ist weder Klassenzahl noch
Rollengraph vorgebbar.
43. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Was will man mehr?
Problemfeld 2: Einbringung von Vorwissen
1234
14/23 1/234 124/3 13/24 123/4 134/2 12/34
1/23/4 14/2/3 1/24/3 13/2/4 12/3/4 1/2/34
1/2/3/4
+ Im Prinzip von jeder Partition aus startbar, so lässt sich die
Trennung bestimmter Knoten erzwingen.
– Trotz strukturellem Vorwissen ist weder Klassenzahl noch
Rollengraph vorgebbar.
44. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Blockmodellierung als Optimierungsproblem
Grundideen der Blockmodellierung
1 Klassenzahl und Rollengraph als Modell-Annahme
2 Knoten bestmöglich den Rollen zuordnen
45. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Blockmodellierung als Optimierungsproblem
Gütebeurteilung: Was bedeutet bestmöglich?
Die Zielfunktion ∆ soll folgende Eigenschaften erfüllen:
1 ∆(P) ≥ 0
2 ∆(P) = 0 ⇔ P ist exakt regulär.
Sei Θk die Menge aller Partitionen mit k Klassen. Dann ist zu
lösen das Optimierungsproblem
∆(P ∗ ) = min ∆(P)
P∈Θk
46. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Blockmodellierung als Optimierungsproblem
Gütebeurteilung: Was bedeutet bestmöglich?
Wähle für ∆ die Definition
∆(P) = min d(Cu × Cv , B)
B∈B(Cu ,Cv )
Cu ,Cv ∈P
mit
Cu Cluster = Äquivalenzklasse mit Repräsentant u
Cu × Cv Block = kartesisches Produkt der Cluster (Cu , Cv )
B(Cu , Cv ) Menge aller Idealblöcke für Cu × Cv
d noch zu definierende Abstandsfunktion
47. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Blockmodellierung als Optimierungsproblem
Wie sehen ideale reguläre Blockmatrizen aus?
Definition (Regulärer Block)
Eine Block Cu × Cv heißt regulär, wenn er in jeder Zeile und
jeder Spalte mindestens eine 1 enthält.
Definition (Reguläre Matrix)
Eine Matrix heißt regulär, wenn sie nur aus Nullblöcken und
regulären Blöcken besteht.
Lemma (Konsistenz der Definition)
Eine Blockmatrix R ist genau dann regulär, wenn sie eine
reguläre Partition darstellt.
48. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Blockmodellierung als Optimierungsproblem
Wie sehen ideale reguläre Blockmatrizen aus?
Definition (Regulärer Block)
Eine Block Cu × Cv heißt regulär, wenn er in jeder Zeile und
jeder Spalte mindestens eine 1 enthält.
Definition (Reguläre Matrix)
Eine Matrix heißt regulär, wenn sie nur aus Nullblöcken und
regulären Blöcken besteht.
Lemma (Konsistenz der Definition)
Eine Blockmatrix R ist genau dann regulär, wenn sie eine
reguläre Partition darstellt.
49. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Blockmodellierung als Optimierungsproblem
Wie sehen ideale reguläre Blockmatrizen aus?
Definition (Regulärer Block)
Eine Block Cu × Cv heißt regulär, wenn er in jeder Zeile und
jeder Spalte mindestens eine 1 enthält.
Definition (Reguläre Matrix)
Eine Matrix heißt regulär, wenn sie nur aus Nullblöcken und
regulären Blöcken besteht.
Lemma (Konsistenz der Definition)
Eine Blockmatrix R ist genau dann regulär, wenn sie eine
reguläre Partition darstellt.
50. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Blockmodellierung als Optimierungsproblem
Wie sehen ideale reguläre Blockmatrizen aus?
Beweis des Lemmas für Zeilen (Spalten analog).
„⇒“ Sei R regulär. Im Falle, dass Cu × Cv Nullblock ist nichts
zu zeigen. Da für jeden Block Cu × Cv gilt
Cu × Cv regulär =⇒ ∀w ∈ Cu ∃z ∈ Cv : rwz = 1 =⇒ P reg.
„⇐“ Angenommen die Blockmatrix R stelle die reguläre
Partition P dar, aber ein Block Cu × Cv sei weder Null- noch
regulärer Block. Sei o. B. d. A.
P reg.
(ruv = 1) =⇒ (∀w ∈ Cu ∃z ∈ Cv : rwz = 1)
Dann wäre aber Cu × Cv regulär zur Annahme.
51. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Blockmodellierung als Optimierungsproblem
Naheliegende Definition
Definition (Abstandsfunktion d)
d(Cu × Cv , B) =
#Nullzeilen + #Nullspalten, falls Cu × Cv regulär
#Einsen, falls Cu × Cv Nullblock
Bemerkung
Obige Definition von d gewichtet Abweichungen in Nullblöcken
im Mittel stärker als in regulären Blöcken. Allerdings wird so die
IP-Formulierung später wesentlich übersichtlicher.
52. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Blockmodellierung als Optimierungsproblem
Lösungsansätze
Definition (Lokale Transformation)
1 Vertausche zwei Zeilen bzw. Spalten aus verschiedenen
Clustern.
2 Verschiebe eine Zeile bzw. Spalte in einen anderen
Cluster.
Gradienten-Verfahren
Es werden solange lokale Transformationen durchgeführt, wie
dadurch ∆ (ganzzahlig) reduziert wird. Das erreichte Optimum
ist lokal. Globale Optimalität ist nur im Falle ∆ = 0 garantiert.
Daraus ergibt sich grundsätzliche Frage: Wann gibt es ein
exakt reguläre Partition mit genau k Äquivalenzklassen?
53. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Reguläre k -Zuweisbarkeit für ungerichtete Graphen
Definition (Reguläre k -Zuweisbarkeit)
Ein ungerichteter Graph G heißt regulär k -zuweisbar, wenn für
ihn eine exakte reguläre Äquivalenz mit genau k Klassen
existiert.
Leicht: k = 1 und k = |V | Schwer ist dagegen. . .
Satz (NP-Vollständigkeit von 2RA)
Das Entscheidungsproblem, ob ein ungerichteter Graph G
regulär 2-zuweisbar ist, ist NP-vollständig, falls N = NP.
54. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Reguläre k -Zuweisbarkeit für ungerichtete Graphen
Definition (Reguläre k -Zuweisbarkeit)
Ein ungerichteter Graph G heißt regulär k -zuweisbar, wenn für
ihn eine exakte reguläre Äquivalenz mit genau k Klassen
existiert.
Leicht: k = 1 und k = |V | Schwer ist dagegen. . .
Satz (NP-Vollständigkeit von 2RA)
Das Entscheidungsproblem, ob ein ungerichteter Graph G
regulär 2-zuweisbar ist, ist NP-vollständig, falls N = NP.
55. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Reguläre k -Zuweisbarkeit für ungerichtete Graphen
Definition (Reguläre k -Zuweisbarkeit)
Ein ungerichteter Graph G heißt regulär k -zuweisbar, wenn für
ihn eine exakte reguläre Äquivalenz mit genau k Klassen
existiert.
Leicht: k = 1 und k = |V | Schwer ist dagegen. . .
Satz (NP-Vollständigkeit von 2RA)
Das Entscheidungsproblem, ob ein ungerichteter Graph G
regulär 2-zuweisbar ist, ist NP-vollständig, falls N = NP.
56. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Reguläre k -Zuweisbarkeit für ungerichtete Graphen
Definition (Reguläre k -Zuweisbarkeit)
Ein ungerichteter Graph G heißt regulär k -zuweisbar, wenn für
ihn eine exakte reguläre Äquivalenz mit genau k Klassen
existiert.
Leicht: k = 1 und k = |V | Schwer ist dagegen. . .
Satz (NP-Vollständigkeit von 2RA)
Das Entscheidungsproblem, ob ein ungerichteter Graph G
regulär 2-zuweisbar ist, ist NP-vollständig, falls N = NP.
57. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
2-Rollenverteilungen eines ungerichteten Graphen
Definition (2RAi )
Mit 2RAi bezeichnen wir das Teilproblem, zu entscheiden ob G
regulär 2-zuweisbar ist mit Rollengraph Ri .
Abbildung: Anzeichnen
R1 R4
R2 R5
R3 R6
58. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Polynomiell entscheidbare Teilprobleme von 2RA
Lemma (für 2RAi , i = 1 . . . 4)
Der Graph G hat genau dann eine Rollenzuweisung mit
R1 wenn G aus lauter isolierten Knoten besteht.
R2 wenn G sowohl isolierte Knoten als auch einen
zusammenhängenden Teil besitzt.
R3 wenn G keine isolierten Knoten, dafür aber
mindestens zwei Zusammenhangskomponenten
besitzt.
R4 wenn G keine isolierten Knoten besitzt und bipartit
ist.
59. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Polynomiell entscheidbare Teilprobleme von 2RA
Lemma (für 2RAi , i = 1 . . . 4)
Der Graph G hat genau dann eine Rollenzuweisung mit
R1 wenn G aus lauter isolierten Knoten besteht.
R2 wenn G sowohl isolierte Knoten als auch einen
zusammenhängenden Teil besitzt.
R3 wenn G keine isolierten Knoten, dafür aber
mindestens zwei Zusammenhangskomponenten
besitzt.
R4 wenn G keine isolierten Knoten besitzt und bipartit
ist.
60. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Polynomiell entscheidbare Teilprobleme von 2RA
Lemma (für 2RAi , i = 1 . . . 4)
Der Graph G hat genau dann eine Rollenzuweisung mit
R1 wenn G aus lauter isolierten Knoten besteht.
R2 wenn G sowohl isolierte Knoten als auch einen
zusammenhängenden Teil besitzt.
R3 wenn G keine isolierten Knoten, dafür aber
mindestens zwei Zusammenhangskomponenten
besitzt.
R4 wenn G keine isolierten Knoten besitzt und bipartit
ist.
61. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Polynomiell entscheidbare Teilprobleme von 2RA
Lemma (für 2RAi , i = 1 . . . 4)
Der Graph G hat genau dann eine Rollenzuweisung mit
R1 wenn G aus lauter isolierten Knoten besteht.
R2 wenn G sowohl isolierte Knoten als auch einen
zusammenhängenden Teil besitzt.
R3 wenn G keine isolierten Knoten, dafür aber
mindestens zwei Zusammenhangskomponenten
besitzt.
R4 wenn G keine isolierten Knoten besitzt und bipartit
ist.
62. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Polynomiell entscheidbare Teilprobleme von 2RA
Lemma (für 2RAi , i = 1 . . . 4)
Der Graph G hat genau dann eine Rollenzuweisung mit
R1 wenn G aus lauter isolierten Knoten besteht.
R2 wenn G sowohl isolierte Knoten als auch einen
zusammenhängenden Teil besitzt.
R3 wenn G keine isolierten Knoten, dafür aber
mindestens zwei Zusammenhangskomponenten
besitzt.
R4 wenn G keine isolierten Knoten besitzt und bipartit
ist.
63. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Skizze der Beweisführung
Beweisidee.
klar !
Zeige 3SAT (NP-vollständig nach Cook) p 2RA ∈ NP.
Vorgehen.
Für eine beliebige Instanz von 3SAT mit
Variablenmenge U = {u1 , u2 , . . . , ui , . . . , un }
Aussagenmenge C = {c1 , c2 , . . . , cj , . . . , cm }
konstruiere einen Graphen, der genau dann regulär
2-zuweisbar ist, wenn die 3SAT -Instanz erfüllbar ist.
64. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Skizze der Beweisführung
Beweisidee.
klar !
Zeige 3SAT (NP-vollständig nach Cook) p 2RA ∈ NP.
Vorgehen.
Für eine beliebige Instanz von 3SAT mit
Variablenmenge U = {u1 , u2 , . . . , ui , . . . , un }
Aussagenmenge C = {c1 , c2 , . . . , cj , . . . , cm }
konstruiere einen Graphen, der genau dann regulär
2-zuweisbar ist, wenn die 3SAT -Instanz erfüllbar ist.
65. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Übertragung von 3SAT auf Graphen
Truth-Setting Ti und Satisfaction-Testing-Komponenten Sj
ui ui cj1 cj2
cj3
bj3
bj1
(a) T i (b) S j
66. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Beispielgraph zum Beweis von 3SAT p 2RA5
Konstruktion in PTIME aus der 3SAT -Instanz
¯ ¯
U = {u1 , u2 , u3 , u4 } und C = {{u1 , u2 , u3 }, {u2 , u3 , u4 }}
a11 a21 a31 a41
a12 a22 a32 a42
a13 a23 a33 a43
u1 u1 u2 u2 u3 u3 u4 u4
c11 c13 c 21 c 23
c12 c 22
b13 b23
b12 b22
b11 b21
67. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Komplexität von 2-ROLE-ASSIGNABILITY (2RA)
Beispielgraph zum Beweis von 2RA5 p 2RA
Konstruktion in PTIME
u1 u2
u1 u2 b1 a2
a1 b2
C1 C2
x1 y1 x2 y2
(a) G (b) G
68. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
IP-Formulierung
Vereinbarungen zur IP-Formulierung
N ∈ N, N ≥ 3 Anzahl der Knoten
K ∈ N {0} Anzahl der Blöcke
N×N
S ∈ {0, 1} Adjazenzmatrix des Graphen
B ∈ {0, 1}K ×K Matrixdarstellung des Rollengraphen
P∈ NK ×K
0 Abweichungs-Gewichtungsmatrix (optional)
Lateinische Kleinbuchstaben stellen ggf. Elemente der mit
Großbuchstaben bezeichneten Matrizen dar.
Alle Ausdrücke gelten für alle Indizes aus {i, j, k , l},
über die nicht summiert wird.
Ausdrücke mit αikl , βjkl gelten nur für Blöcke (k , l)|bkl = 1.
69. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
IP-Formulierung
IP-Formulierung [Brusco, Steinley]
N N N N
min pkl yijkl sij + pkl αikl + pkl β
i=1 j=1 (k ,l)|bkl =0 i=1 (k ,l)|bkl =1 j=1 (k ,l)|bkl =1
K N
s.t. xik = 1 xik ≥ 1 (1)
k =1 i=1
xik + xjl − yijkl ≤ 1 xik + xjl − 2 yijkl ≥ 0 (2)
N N
yijkl sij + αikl ≥ xik yijkl sij + βjkl ≥ xjl (3)
j=1 i=1
xik , yijkl ∈ {0, 1} αikl , βjkl ∈ {0, 1} (4)
70. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
IP-Formulierung
IP-Formulierung [äquivalent und lesbar]
K K N N N N
min pkl ¬bkl yijkl sij + bkl αikl + βjkl
k =1 l=1 i=1 j=1 i=1 j=1
K N
s.t. xik = 1 xik ≥ 1 (1)
k =1 i=1
xik + xjl − yijkl ≤ 1 xik + xjl − 2 yijkl ≥ 0 (2)
N N
yijkl sij + αikl ≥ xik yijkl sij + βjkl ≥ xjl (3)
j=1 i=1
xik , yijkl ∈ {0, 1} αikl , βjkl ∈ {0, 1} (4)
71. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
IP-Formulierung
Nachbemerkung I zur IP-Formulierung
Die Typ (2)-Nebenbedingung
xik + xjl − 2 yijkl ≥ 0
ist von entscheidender Bedeutung. Würde sie fehlen, könnten
die yijkl trotz xik xjl = 1 irrtümlich den Wert 1 annehmen, nur um
die Nebenbedingungen vom Typ (3) zu erfüllen.
72. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
IP-Formulierung
Benchmark: Das Everett-Netzwerk
a b c d e f g h i j
a 0 1 1 1 0 0 0 0 0 0
b 1 0 1 0 1 0 0 0 0 0
c 1 1 0 1 0 0 0 0 0 0
d 1 0 1 0 1 0 0 0 0 0
e 0 1 0 1 0 1 0 0 0 0
f 0 0 0 0 1 0 1 0 1 0
g 0 0 0 0 0 1 0 1 0 1
h 0 0 0 0 0 0 1 0 1 1
i 0 0 0 0 0 1 0 1 0 1
j 0 0 0 0 0 0 1 1 1 0
Tabelle: Eingangsdaten
77. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
IP-Formulierung
Nachbemerkung II zur IP-Formulierung
In eine ähnliche IP-Form bringen lassen sich
Strukturelle Äquivalenz Wesentlich einfacher, da bkl = 1 ⇔
Block kl vollbesetzt.
SE und RE auf V × W Noch um einges komplexer, da Partition
zweier Mengen erforderlich.
78. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Vorzüge und Nachteile aller drei Ansätze
CATREGE Gradienten-Heuristik IP-Lösung
Güte keine Aussage lokales Optimum Optimalitätsgarantie
Vorgehen explorativ Hypothesentest Hypothesentest
Vorwissen kaum einbringbar Rollengraphvorgabe Rollengraphvorgabe
Worst-Case-Laufzeit O(n3 ) überpolynomial überpolynomial
mehrereRelationen einfach möglich großer Mehraufwand großer Mehraufwand
79. Ausgangspunkt / Motivation Blockmodellierung Gegenüberstellung und Ausblick
Forschungsperspektive
Wünschenswert wären Verfahren, die alle drei Kriterien
erfüllen:
1 Rollengraph auswählen
2 Reguläre Partition finden
3 Optimalitätsgarantie liefern
80. Anhang
Weiterführende Literatur
Weiterführende Literatur I
Jürgen Lerner.
Role Assignments, S. 216–252.
in Brandes, Erlebach: Network Analysis, Springer 2005.
Fred S. Roberts, Li Sheng 2001.
How Hard Is It to Determine If a Graph Has a 2-Role
Assignment?
NETWORKS Journal, Vol. 37, S. 67-73.
Michael J. Brusco, Douglas Steinley 2009
Integer programs for one- and two-mode blockmodeling
based on prespecified image matrices for structural and
regular equivalence.
Journal of Mathematical Psychology, Nr. 53, S. 577-585.