Expertenfindung in komplexen Informationssystemen - Ein Metrik-basierter Ansatz
1. Expertenfindung in komplexen
Informationssystemen - Ein Metrik-basierter Ansatz
Wolfgang Reinhardt
Alexander Boschmann
Andreas Kohring
Christian Meier
Universität Paderborn, Institut für Informatik
Fachgruppe Didaktik der Informatik
2. Die MoKEx Projektgruppenserie
• MoKEx Projektgruppenserie
• langjähriges, interdisziplinäres Forschungsprojekt, Auszeichnung durch
IFIP [HMR07]
• Kooperation zwischen deutschen und schweizer Studenten (Informatik,
Wirtschaftsinformatik)
• Beteiligung von Firmenpartnern
• Anforderungen von Firmenpartnern, Kombination mit Forschungsthemen
• Entwicklung von Lösungsansätzen und Softwareprototypen
2
3. Die MoKEx Projektgruppenserie
• generelle Fragestellungen: betrieblicher Softwareeinsatz im Kontext von E-
Learning und Wissensmanagement & mobile Szenarien
• Bereitstellung kontextualisierter und individualisierter Informationen
• automatische Aufwertung verteilt gespeicherter Daten durch automatische
Metadatenanreicherung
• lose Kopplung bestehender Softwaresysteme und Verknüpfung über
KnowledgeBus-Architektur
• Entwicklung des Single Point of Information Konzepts zur Zentrierung von
Such- und Auffindeprozessen
3
4. Spezifische Zielsetzung
• Wiederverwendung früherer Softwarekomponenten zur automatischen
Gewinnung inhalts- und objektbeschreibender Metadaten [RMS08]
• Ableitung von Mitarbeiter-Expertise und Visualisierung von Experten
• Anreicherung von Suchtreffern um grafische Darstellung von zugehörigen
Experten und verwandten Themen
• Entwicklung eines flexiblen Analysesystems, dass Nutzeraktionen bewertet,
speichert und zur Visualisierung bereitstellt
• Integration der Expertenvisualsierung in einer persönlichen Arbeitsumgebung
• Konzentration auf Daten aus E-Mails und Wikis
4
5. Wissen(-smanagement)
• Wissen und dessen (vermeintliches) Management gewinnt Einfluss als
Produktionsfaktor
• Wissensmanagement nach Nonaka und Takeushi [TN04]:
• „process of continuously creating new knowledge, disseminating it widely
through the organization, and embodying it quickly in new products/
services, technologies and systems“
• YOU CANNOT STORE KNOWLEDGE [Non01]
• IT-Heterogenität kostet Organisationen Zeit und Geld durch lange
Suchprozess nach den richtigen Daten [IB07]
5
6. Expertensuche und -findung
• fehlende Transparenz von Mitarbeiterkompetenzen wird oft als Defizit heutiger
IT-Systeme angesehen [FK01]
• Yellow-Pages-Systeme speicherten Expertise pro Mitarbeiter
• Datenbasis veraltet schnell
• Ackerman‘s Answer Garden [Ack94] als eines der ersten Expertenfinder-
systeme mit aktualisierenden Profilen
• bisher kaum Berücksichtigung des Benutzer- oder Artefaktkontexts
6
7. Graph-basierte Expertenvisualiserung
• Visualisierung sog. Knowledge Entities [Tr05] und semantische Verknüpfung
• processes / activities
• documents
• individuals
• topics
• Verwendung von Knoten, Kanten und Graphalgorithmen zur Visualisierung
• Beantwortung der Fragen „Wer kennt wen?“ und „Wer arbeitet woran?“
7
8. Graph-basierte Expertenvisualiserung, Beispiele
• Meyer & Spiekermann: skillMap [MS06]
• Verknüpfung von Graphen aus Mitarbeitern mit Fachwissensgebieten
• Aussagen über spezielles Expertenwissen
• Fujitsu: KnowWho [ITK03]
• Visualisierung gewonnener Daten aus Terminplänen
• statische Graphen mit Person zentriert in der Mitte
• Sugiyama stellt Best Practices zur Erzeugung benutzerfreundlicher Graphen
vor [Su02]
8
9. Datenschutz, Ergebnisse des Tests
• Datenschutz kann zum Problem werden
• BVG 1983
• Unterscheidung in privat, geschäftlich und vertraulich
• Tests beim Anwendungspartner in der Schweiz zeigte keine solchen
Bedenken auf
9
10. Single Point of Information
FLEX?
FLEX
AJAX?
AJAX
WWW
Web 2.0?
- Alle Benutzer suchen und organisieren sehr
Web 2.0 ähnliche Informationen
- Austausch der Informationen zwischen
den Autoren schwierig
10
11. Motivation
em
ationen liegen an ein
- Alle Inform edundanz
rR
Ort, wenige
Zugriff
- Ge meinsamer
FLEX?
AJAX? DMS
SPI
WWW
Web 2.0?
SPI: Single Point of Information
DMS: Document Management System
11
12. MoKEx Architektur
MetaXsA MeduSA
DMS
KNS
WWW SPI Benutzer-
verwaltung
SPI: Single Point of Information
DMS: Document Management System
MetaXsA: Metadatenextraktion und semantische Analyse
MeduSA: Ablage der Metadaten und Semantik
Benutzerverwaltung: Informationen zu Benutzern
KNS: Zentrale Kommunikation und Workflow-Management
12
13. E-Mail und Wiki Anbindung
Meta
data
MetaXsA MeduSA DMS
KNS
WWW SPI Benutzer-
verwaltung
-Mails
- Erfas sen von E iki Artikeln
von W
- Erfassen E-Mail- Wiki-
Server Server
13
15. Unser Ansatz zur Expertenfindung
• RaMBo (Rating Module and Behavior observation) als Komponente in
Gesamtarchitektur des Projekts
• Kommunikation über Webservices
• Metadatenobjekt wird übergeben
• Daraus Aufbau von Bewertungsrelationen in Datenbank
15
16. Metadatengewinnung
• Komponente MetaXsA (Metadaten EXtraktion und semantische Analyse)
• Eingabe: Dokumente, E-Mails, Wiki-Artikel
• Ermittlung von Metadaten und semantischen Informationen, z.B.
• Autor/Sender, Empfänger
• Keywords, Taxonomien (Kategorien), u.v.m.
• Ausgabe: Metadatenobjekt im XML-Format nach dem LOM Standard Meta
data
[LOM02]
16
17. Expertenfindung
Meta
Text
data
MetaXsA MeduSA DMS
Meta
data
KNS
SPI Benutzer-
verwaltung
WWW
Rating
120
+ 14
134
E-Mail- Wiki- RaMBo
Server Server
17
18. Bewertungsrelationen
• Zum Bewerten der Benutzeraktionen werden verschiedene Relationen
eingesetzt
• Relationen sollen in verschiedenen Kombinationen Beziehungen zwischen
Benutzern, Keywords und Unternehmenskontext herstellen
• Bewertungsrelationen teilen sich in zwei Gruppen:
• Erfassen der Häufigkeit des gemeinsamen Auftretens
• Gewichtete Bewertung mit Hilfe einer Punkte-Metrik
18
19. Relationen
• Keyword x Keyword x Zähler
Häufigkeit des
gemeinsamen Auftretens
• Keyword x Taxonomie x Zähler
• Taxonomie x Taxonomie x Zähler
• Benutzer x Keyword x Bewertung
Bewertung mit Hilfe
• Benutzer x Taxonomie x Bewertung einer Punkte-Metrik
• Benutzer x Quelle x Bewertung
• Benutzer A x Benutzer B x Keyword x Quelle x Bewertung
• Benutzer A x Benutzer B x Taxonomie x Quelle x Bewertung
19
20. Punkte-Metrik
• Treffen von Aussagen über Expertise von Benutzern durch punkte- und
faktorenbasierte Metrik
• Benutzeraktionen mit verschiedenen Datenquellen berücksichtigt
• Benutzeraktionen: erstellen, bearbeiten, lesen und suchen
• unterstützte Datenquellen: Dokumente, Wiki-Artikel, Suche, E-Mail
• Bewertung = Punktwert für Aktion x Gewichtung für Quelle und Aktion
{
{
beliebige Zahl Zahl zwischen 0 und 1
20
21. Punkte-Metrik
• Bewertung = Punktwert für Aktion x Gewichtung für Quelle und Aktion
{
{
beliebige Zahl Zahl zwischen 0 und 1
• Konfiguration des Prototyps im Einsatz:
suchen lesen editieren erstellen
suchen 1
Dokument 1 1 1 1
lesen 10 Wiki 0,8 0,8 0,8 0,8
Suche 0,2 0 0 0
editieren 75
E-Mail 0,4 0 0 0,4
erstellen 250 E-Mail TO 0 0,4 0 0,4
21
23. Performance
• Szenario: Eine E-Mail ohne Anhang
• Ein Sender, Zwei Empfänger
• 10 Keywords, 2 Taxonomien
• Keyword x Keyword x Zähler 10 x 10 = 100
• Keyword x Taxonomie x Zähler 10 x 2 = 20
• Taxonomie x Taxonomie x Zähler 2x2 =4
• Benutzer x Keyword x Bewertung 3 x 10 = 30
• Benutzer x Taxonomie x Bewertung 3x2 =6
∑ =271
• Benutzer x Quelle x Bewertung 3x1 =3
• Benutzer A x Benutzer B x Keyword x Quelle x Bewertung (3 x 3) x (10 x 1) = 90
• Benutzer A x Benutzer B x Taxonomie x Quelle x Bewertung (3 x 3) x (2 x 1) = 18
23
24. Performance
• Statistik bei 1001 Dauer ca. 30 Stunden
Mails auf Mailserver: Calls 659978
Zeit pro Call 165ms
Durchschnittsdauer ca. 1:47min
Calls pro Mail 645
• Annahmen: Dauer Nachtsitzung 14 Stunden
durch. Calldauer 165ms
durch. Calls 645
LOMs pro Nacht 474
• Es kann daher Benutzer 20
bedient werden:
E-Mails pro Benutzer 15
durch. Mails pro Tag 300
max. Mails pro Tag u. Benutzer 24
max. Mails pro Stunde 34
24
25. Berechnung der Bewertungspunkte
Keywords: Web 2.0, FLEX
Rating
Meta 120 Absender: Klaus
data + 14
134
Empfänger: Johannes
RaMBo MetaXsA MeduSA DMS
Benutzer Keyword Rating Benutzer Benutzer Keyword Rating Keyword Keyword Zähler
Klaus Web 2.0 100 Klaus Johannes Web 2.0 100 Web 2.0 FLEX 1
Klaus FLEX 100 Klaus Johannes FLEX 100
Johannes Web 2.0 4
Johannes FLEX 4
KNS
SPI Benutzer-
verwaltung
suchen 1 suchen lesen editieren erstellen Relationen:
Rating
Dokument 1 1 1 1 Benutzer - Keyword - Rating Meta 120
lesen 10 Wiki 0,8 0,8 0,8 0,8 data
Benutzer - Benutzer - Keyword - Rating + 14
134
editieren 75 Suche 0,2 0 0 0 Keyword - Keyword - Zähler
E-Mail 0,4 0 0
E-Mail-
0,4 usw.
Wiki- RaMBo
erstellen 250 E-Mail TO 0 0,4 0 0,4
Server Server
25
26. Expertenfindung
MetaXsA MeduSA DMS
Experten und
verwandte Begriffe
zu Web 2.0?
Web 2.0 KNS
SPI Benutzer-
verwaltung
Rating
Meta120
data
+ 14
134
E-Mail- Wiki- RaMBo
Server Server
26
Motivation - Mokex III - Mokex IV - Demo - Technik - Ausblick
27. Erstellen der Experten- und Keywordnetze
Rating
120 Experten für Web 2.0
Web 2.0 + 14
134 Verwandte Keywords für Web 2.0
RaMBo MetaXsA MeduSA DMS
Benutzer Keyword Rating Benutzer Benutzer Keyword Rating Keyword Keyword Zähler
Klaus Web 2.0 100 Klaus Johannes Web 2.0 100 Web 2.0 FLEX 1
Klaus FLEX 100 Klaus Johannes FLEX 100 Web 2.0 AJAX 4
Klaus Robin Web 2.0 50 FLEX AJAX 6
Johannes Web 2.0 4
Johannes FLEX 4 Klaus Robin AJAX 50
Robin Web 2.0 50
Robin AJAX 50 KNS
SPI Benutzer-
verwaltung
Expertennetz Keywordnetz
K
Klaus Web 2.0 Rating
120
+ 14
134
K K RaMBo
Johannes Robin FLEX
E-Mail-
AJAX Wiki-
Server Server
27
28. Expertenfindung
MetaXsA MeduSA DMS
Expertennetz
Experten und
verwandte Begriffe
Klaus zu Web 2.0?
Johannes Robin
KNS
SPI Benutzer-
verwaltung
Keywordnetz
K
Web 2.0 Rating
120
+ 14
134
K K RaMBo
FLEX AJAX E-Mail- Wiki-
Server Server
28
29. Screenshots
MetaXsA MeduSA DMS
Screenshots
KNS
SPI Benutzer-
verwaltung
Rating
120
+ 14
134
E-Mail- Wiki- RaMBo
Server Server
29
Motivation - Mokex III - Mokex IV - Demo - Technik - Ausblick
34. Zusammenfassung und Ausblick
• Prototyp RaMBo im Kontext eines komplexen Informationssystems zur
Unterstützung des betrieblichen Wissensmanagement und E-Learning eingesetzt
• Hauptaufgabe: aus objekt- und inhaltsbeschreibenden Metadaten zu
Informationsobjekten die Expertise von Benutzern extrahieren und visualisieren
• Evaluation zeigte:
• derzeitige Visualisierung entspricht noch nicht den Erwartungen der Benutzer
• Enorme Datenmenge erfordert intelligentes Scheduling
• Datenschutz kritisch
• Entwicklung der Netze zwischen speichern, um Entwicklungen zu visualisieren
34