SlideShare ist ein Scribd-Unternehmen logo
Pr¨sentation:
a

Thema: Kontext-Basierte
Personalisierungsans¨tze
a
Referent: Lucas Mußm¨cher
a
Datum: 6. Dezember 2013

1 / 25
Ablauf der Pr¨senation:
a

Kontext in Empfehlungssystemen
Bestimmung des Kontexts von Benutzern
Unterschiede zu normalen Empfehlungssystemen
Berechnungs-Ans¨tze der relevanten Items
a
Problem der Komplexit¨t
a
Studie: Einwirkung auf den Benutzer

2 / 25
Einf¨hrungs Beispiel
u
Definition:
Unter dem Begriff Kontext versteht man ”die Bedingungen und
Umst¨nde, die sich auf einen Menschen auswirken”.
a
Beispiel Amazon:
Ein Ehemann, der ein Weihnachtsgeschenk z.B ein Parf¨m f¨r
u u
seine Frau kaufen will w¨rde sich im Kontext Geschenkkauf f¨r
u
u
die Freundin befinden. Im normalen Kaufverhalten w¨rde der
u
Ehemann andere Waren bevorzugen.
In diesem Beispiel w¨rde der Kontext uns Konsumenten im Bezug
u
auf Kaufentscheidungen von Waren (Items) beeinflussen.

3 / 25
Kontext in Empfehlungssystemen
Ziele:
Einbeziehung des Kontexts in Empfehlungssysteme, um die
Genauigkeit der Vorhersage relevanter Waren den (Items) zu
verbessern.
Technische Modellierung:
Ein Kontext k besteht aus mehreren Attributen a1 ... an.
a1 = Wochentag, a2 = KaufAbsicht
k = (a1 ... an)
Beispiele:
k1 = (Werktag, GeschenkFreundin), k2 = (Montag, Sohn)

4 / 25
Kontext in der Baumhierarchie
Die Attribute des Kontexts k liegen in baum¨hnlichen
a
hierrachischen Strukturen.
Wochentag

Werktag

Montag

Dienstag

Wochenende

Samstag

Sonntag

Beispiele:
k = (Werktag, Geschenk)
k1 = (Montag, Geschenk f¨r Freundin)
u
k ist eine Generalisierung der Kontexts k1, wegen
(Montag→Werktag) und (GeschenkFreundin→Geschenk)
5 / 25
Bestimmung des Kontext vom Benutzer
Um Kontextinformationen uber einen Benutzer in
¨
Empfehlungssystemen einzubauen, m¨ssen diese vor der
u
Berechnung der relevanten Items m¨glichst genau bestimmt
o
werden.
Der Kontext eines Benutzers muss vorallem beobachtbar sein, das
heißt er muss formal definiert werden k¨nnen.
o
Explizite Bestimmung:
Direktes Nachfragen beim Benutzer,
z.B durch ein Webformular (Absicht des Kaufs, Aktuelle Stimmng)
Implizite Bestimmung:
Indirektes Abgreifen der Informationen eines Benutzers
z.B Standort, Wochentag beim Kauf, Online Shop Seitenaufrufe
6 / 25
Beispiele zur Kontext Bestimmung eines Benutzers

(a) Explizite Bestimmung

(b) Implizite Bestimmung

7 / 25
Unterschiede zu normalen Empfehlungssystemen
Alle konkreten Kontexte, in denen sich der Benutzer eines
Empfehlungssystems befinden kann, wird als Menge K definiert.
Die Menge K wird als zus¨tzliche Dimension f¨r die Berechnung
a
u
der Bewertungs-Funktion Rank eingef¨hrt.
u
Normale Bewertungs Funktion:
Rank: U × I → Bewertung
Kontext-Basierte Bewertungs Funktion:
Rank: U × I × K → Bewertung
U: Menge aller Benutzer u
I: Menge aller Items i
K: Menge aller Kontexte k
8 / 25
Vorhandener Datensatz in Empfehlungssystemen
Benutzer × Items
Julia
Paul
Peter
Torsten
Hans
Olaf

Star Wars
0
5
5
1
5
1

Star Gate
3
4
3.5
0
2
0

Micky Mouse
4
4
0
3
0
0

In normalen Empfehlungssystemen wird zu jedem Benutzer und
jedem Item, eine abgegebene Benutzerbewertung gespeichert.
z.B r ∈ [0-5]
Datensatz der Form: <U, I, R>
R: Menge aller Benutzerbewertungen r
9 / 25
Aufstellen der Bewertungsfunktion: Rank
Annahmen zum Aufstellen:
1) Benutzer, die ¨hnlich sind, haben die gleichen Vorlieben und
a
w¨rden z.B auch Filme, ¨hnlich bewerten.
u
a
2) Items, die ¨hnlich vom Inhalt her sind und eine gute
a
Bewertung aufweisen, w¨rden automatisch besser bewertet
u
werden.
Benutzer × Items
Julia
Paul
Peter
Torsten

Star Wars
(Wert ?)
5
5
1

Star Gate
3
4
3.5
5

Micky Mouse
4
4
(Wert ?)
3

10 / 25
Bewertungsfunktion: Rank
Formal:
Die Bewertungsfunktion Rank ordnet jedem Benutzer u und
jedem Item i einen positiven Wert gr¨ßer 0 zu.
o
Wichtig:
Je gr¨ßer dieser Wert ausf¨llt, desto wichtiger ist ein Item f¨r
o
a
u
einen Benutzer.
Benuzter U

BenutzerBewertung R = U × I
TopN Items

Items I
Funktion: Rank

Bewertung ∈ ]0,...]

Nach der Berechnung der Rank Funktion werden die h¨chst
o
bewerteten Items in die Menge TopN gespeichert.
11 / 25
Einf¨hrung Kontext Dimension: K
u
Benutzer × Items
Julia in k’
Julia in k”
Torsten in k’
Torsten in k”
Torsten in k”’

Forrest Gump
0
0
1
0
0

Star Wars 7
0
4
0
5
0

Cast Away
3
0
2
0
3

In Kontext basierten Empfehlungssystemen wird zu jedem
Benutzer, jedem Item und jedem Kontext ein durch den Benutzer
abgegebene Benutzerbewertung gespeichert.
Datensatz der Form: <U, I, K, R>.
k’ und k”’ sind unterschiedliche Kontexte, in denen sich der
Benutzer Torsten befand und eine Benutzerbewertung
abgegeben hat.
12 / 25
Beispiele zur Dimension: K
Benutzer × Items
Julia in k’
Julia in k”
Torsten in k”’

Forrest Gump
0
0
1

Star Wars 7
0
4
0

Cast Away
3
0
2

Beispiele:
1) k’ w¨rde bedeuten, dass Julia an einem Samstag, zuhause ist
u
(Standortbestimmung). Dort schaut sie sich die Film Cast Away
alleine an bzw. bewertet diesen auch.
2) k” w¨rde bedeuten, dass Julia an einem Sonntag mit ihrem
u
Freund ins Kino geht, und dabei Star Wars 7 anschaut und
diesen mit 4 bewerten w¨rde.
u
Formal:
k’ = (zuhause, Samstag, alleine), k” = (Kino, Sonntag, Freund)
13 / 25
Berechnung relevanter Items: TopN
Die Berechnung der relevanten Items i in der TopN Menge f¨r
u
einen bestimmten Benutzer u kann mithilfe von 3
unterschiedlichen Berechnungs Ans¨tzen bewerkstelligt werden.
a
Dabei liegen die Datens¨tze der Form DATA := <U, I, K, R> vor.
a
Schritt 1: Kontext Bestimmung
Zuerst wird der aktuelle k’ eines Benutzers u’ ermittelt.
Schritt 2: Berechnung relevanter Items: TopN
1) Kontextuelle Vorfilterung,
2) Kontextuelle Nachfilterung oder
3) Kontext-Basierte Modelle.

14 / 25
¨
Berechnungs-Ans¨tze in der Ubersicht
a

(c) Berechnungsans¨tze
a
15 / 25
Ansatz 1: Kontextuelle Vorfilterung

Bei der kontextuellen Vorfilterung wird zun¨chst die Dimension K
a
aus dem Datensatz durch Selektion mit K=k’ eliminiert.
DATA := <U, I, K=k’, R>
Somit entsteht die Datenmenge DATA’:
DATA[k’] = <U, I, k’, R> → DATA’ = <U, I, R>
Auf der neuen Datenmenge DATA[k’] kann wie bei normalen
Empfehlungssystemen die Bewertungsfunktion Rank aufgestellt
und berechnet werden, da die Dimension K des Kontexts wegf¨llt.
a

16 / 25
Ansatz 1: Kontextuelle Vorfilterung
Benutzer × Items
Julia in k’
Julia in k”
Torsten in k’

Forrest Gump
0
0
1

Star Wars 7
0
4
0

Cast Away
3
0
2

Selektion:
Mit K=k’ entsteht der neue Datensatz DATA[k’].
DATA[k’] = <U, I, k’, R>
Benutzer × Items
Julia in k’
Torsten in k’

Forrest Gump
0
1

Star Wars 7
0
0

Cast Away
3
2

Julia befindet sich momentan im Kontext k’. Alle anderen
abgegebenen Bewertungen der Benutzer im Kontext k’ w¨ren
a
f¨r sie relevant.
u
17 / 25
Ansatz 3: Modellbasierte Einbeziehung des Kontexts
Bei Modell basierten Ans¨tzen wird die Dimension des Kontexts
a
K direkt in die Bewertungsfunktion Rank einbezogen um je nach
Kontext k Items i besser oder schlechter zu bewerten.
Vorhandener Datensatz:
DATA = <U, I, K, R>
Kontext basierte Bewertungs Funktion:
Rank: U × I × K → Bewertung
Ans¨tze:
a
Benutzer, die sich z.B im ”gleichen”Kontext (zuhause) befinden,
w¨rden ¨hnliche Items auch gleich bewerten.
u
a
Das Aufstellen und Berechnen der Rank Funktion
modellbasierter Ans¨tze ist sehr Komplex !
a
18 / 25
Komplexit¨t modellbasierter Ans¨tze
a
a
Bei der Berechnung der Bewertungsfunktion Rank muss f¨r
u
jeden Kontext eine Bewertung f¨r ein Item und einen Benutzer
u
berechnet werden.
Folgerung: Die Komplexivit¨t der Berechnung steigt stark an:
a
Normale Berechnung der Rank Funktion:
ANZAHL(U) = 50k (50.000 Benutzer)
ANZAHL(I) = 200 (200 Verschiedene Items bzw. Waren)
DATA = <U, I, R>
Berechnungsschritte der Rank Funktion:
GESAMT = ANZAHL(U) * ANZAHL(I) = 50k * 200 = 10kk
entspricht etwa 10 Millionen Berechnungen !

19 / 25
Komplexit¨t modellbasierter Ans¨tze
a
a
Beispiel: Online-Buchshop:
k = (WochenTag, KaufAbsicht, Niederschlag, Stimmung)
WochenTag = [Mo, Di, Mi, Do, Fr, Sa, So, WE, WT...]
KaufAbsicht = [Arbeit, Pers¨hnlich, Geschenk, Partner, Freund,
o
Eltern, Sammlung, GeburtstagsGeschenk, HeiratsGeschenk]
Niederschlag = [0-2mm, 2-4mm, 4-100mm]
Stimmung = [ruhig, positiv, tatkr¨ftig, tr¨be]
a
u
¨
Uberschlags Rechnung:
GESAMT(K) = ANZAHL(WochenTag) ×
ANZAHL(KaufAbsicht) × ANZAHL(Niederschlag) ×
ANZAHL(Stimmung)
=9×9×3×4
= 972 entspricht etwa 980 verschiedenen Kontexten in K.

20 / 25
Komplexit¨t modellbasierter Ans¨tze
a
a

Modell-Basierte Berechnung der Rank Funktion:
Ein Benutzer u k¨nnte sich, beim Kauf eines Buches in etwa
o
980 verschiedenen Kontexten K befinden.
ANZAHL(K) = 980;
DATA = <U, I, K, R>
Berechnungsschritte der Rank Funktion:
GESAMT = ANZAHL(U) × ANZAHL(I) × GESAMT(K)
= 50k × 200 × 980 = 10kkk
entspricht etwa 10 Milliarden Berechnungen !!

21 / 25
Studie: Einwirkung auf das Kaufverhalten
Kontext basierte Empfehlungssysteme sind meistens
rechenintensiver als normale Empfehlungssysteme, aber daf¨r
u
genauer in der Bestimmung relevanter Items TopN f¨r einen
u
bestimmten Benutzer.
Studie zu Normalen Systemen:
Ausgegebenes Geld pro Monat pro User: +17% (Anstieg)
Menge an gekauften Items pro Monat pro User: +37% (Anstieg)
Preis pro gekaufter Items pro Monat pro User: -15% (Abfall)
Studie zu Kontext-Basierten Systemen:
Ausgegebenes Geld pro Monat pro User: +28% (Anstieg)
Menge an gekauften Items pro Monat pro User: -8% (Abfall)
Preis pro gekaufter Items pro Monat pro User: +39% (Anstieg)
Quelle:
The Effect of Context-Aware Recommendations on Customer Purchasing
Behavior and Trust

22 / 25
Genauigkeit der Vorhersage relevanter Items
Genauigkeit der TopN Items:
Treffergenauigkeit (Ja-Nein) f¨r einen Benutzer liegt bei beiden
u
Empfehlungssysteme bei etwa 60% - 70%.
Zum Vergleich mit der Kontrollgruppe:
zufallsbasierte Item Empfehlungen liegen bei 40% - 50%
Durchschnitt der positiven Feedbacks:
Benutzerbewertungen liegen in Kontext-Basierten
Empfehlungsysteme bei 55% - 70%.
Bei normalen Empfehlungssystemen bei nur 50% - 60%.
Offline Eink¨ufe:
a
Die meisten Benutzer der Empfehlubngssysteme gaben an,
dass sie offline mehr Produkte gekauft haben, als Benutzer mit
zufallsbasierten Empfehlungen.
23 / 25
Interpretation beim Kaufverhalten
Durch den Einsatz von Empfehlungssysteme kann z.b eine Online
Verkaufsplattform bis zu 30% mehr Geld einnehmen !
Fazit:
Bei Normalen Empfehlungssystemen kauften die Benutzer in
der Summe viel mehr Items, zahlten daf¨r aber einen geringeren
u
Items St¨ckpreis.
u
Bei Kontext-Basierten Empfehlungssystemen kauften die
Benutzer in der Summe etwas weniger Items, aber zahlten daf¨r
u
einen sehr hohen Items St¨ckpreis.
u
M¨gliche Gr¨nde:
o
u
Genauere Vorhersage relevanter Items durch zielgerichtete
Einbeziehung des jeweiligen Kontexts.
24 / 25
Ende

...

25 / 25

Weitere ähnliche Inhalte

Andere mochten auch

Hackers chocos
Hackers chocosHackers chocos
Hackers chocos
rafaecheve
 
Rendición de Cuentas
Rendición de CuentasRendición de Cuentas
Rendición de Cuentas
Fernando Cáceres
 
Tarea de tecnologia
Tarea de tecnologiaTarea de tecnologia
Tarea de tecnologia
jennifer1994
 
Derecho tutelar menores+c+4.+7(2)
Derecho tutelar menores+c+4.+7(2)Derecho tutelar menores+c+4.+7(2)
Derecho tutelar menores+c+4.+7(2)
Renzo Alanya
 
L'aparell circulatori cristian i andrea
L'aparell circulatori cristian i andreaL'aparell circulatori cristian i andrea
L'aparell circulatori cristian i andrea
Escola Montseny
 
FAJ - Bilan & Perspectives 2012-2013
FAJ - Bilan & Perspectives 2012-2013FAJ - Bilan & Perspectives 2012-2013
FAJ - Bilan & Perspectives 2012-2013
celinefaj
 
Derivada de una funci+æn
Derivada de una funci+ænDerivada de una funci+æn
Derivada de una funci+æn
Universidad Tecnológica del Perú UTP
 
Presentación2
Presentación2Presentación2
Presentación2
chais1984
 
Guía Tema 3 - Diplomado Habilidades Moodle
Guía Tema 3 - Diplomado Habilidades MoodleGuía Tema 3 - Diplomado Habilidades Moodle
Guía Tema 3 - Diplomado Habilidades Moodle
Edgar Linares
 
Rpc12263 r7 final thème 6 procédures simplifiées do p conf aimcc 12 09 12
Rpc12263 r7 final thème 6 procédures simplifiées do p conf aimcc 12 09 12Rpc12263 r7 final thème 6 procédures simplifiées do p conf aimcc 12 09 12
Rpc12263 r7 final thème 6 procédures simplifiées do p conf aimcc 12 09 12
satanbaal
 
Burbuja net
Burbuja netBurbuja net
Burbuja net
Daniel Verdin
 
Resolución grafica de ecuaciones de 2º grado
Resolución grafica de  ecuaciones de 2º gradoResolución grafica de  ecuaciones de 2º grado
Resolución grafica de ecuaciones de 2º grado
jenniferscarlatti10
 
Présentation du projet des traductions des résumés de PEDro par la SFP
Présentation du projet des traductions des résumés de PEDro par la SFPPrésentation du projet des traductions des résumés de PEDro par la SFP
Présentation du projet des traductions des résumés de PEDro par la SFP
PEDro-SFP
 
Presentación su empresa
Presentación su empresaPresentación su empresa
Presentación su empresa
Matías Iriñiz
 
Management d'équipe : priorité aux liens humains
Management d'équipe : priorité aux liens humainsManagement d'équipe : priorité aux liens humains
Management d'équipe : priorité aux liens humains
NIER Olivier
 
Présentation jpt final autorégulation métiers du marketing au cameroun
Présentation jpt final autorégulation métiers du marketing au camerounPrésentation jpt final autorégulation métiers du marketing au cameroun
Présentation jpt final autorégulation métiers du marketing au cameroun
Cameroon Marketing Association (ACPM)
 

Andere mochten auch (17)

Hackers chocos
Hackers chocosHackers chocos
Hackers chocos
 
Prez gsdi pp 97 copie
Prez gsdi pp 97   copiePrez gsdi pp 97   copie
Prez gsdi pp 97 copie
 
Rendición de Cuentas
Rendición de CuentasRendición de Cuentas
Rendición de Cuentas
 
Tarea de tecnologia
Tarea de tecnologiaTarea de tecnologia
Tarea de tecnologia
 
Derecho tutelar menores+c+4.+7(2)
Derecho tutelar menores+c+4.+7(2)Derecho tutelar menores+c+4.+7(2)
Derecho tutelar menores+c+4.+7(2)
 
L'aparell circulatori cristian i andrea
L'aparell circulatori cristian i andreaL'aparell circulatori cristian i andrea
L'aparell circulatori cristian i andrea
 
FAJ - Bilan & Perspectives 2012-2013
FAJ - Bilan & Perspectives 2012-2013FAJ - Bilan & Perspectives 2012-2013
FAJ - Bilan & Perspectives 2012-2013
 
Derivada de una funci+æn
Derivada de una funci+ænDerivada de una funci+æn
Derivada de una funci+æn
 
Presentación2
Presentación2Presentación2
Presentación2
 
Guía Tema 3 - Diplomado Habilidades Moodle
Guía Tema 3 - Diplomado Habilidades MoodleGuía Tema 3 - Diplomado Habilidades Moodle
Guía Tema 3 - Diplomado Habilidades Moodle
 
Rpc12263 r7 final thème 6 procédures simplifiées do p conf aimcc 12 09 12
Rpc12263 r7 final thème 6 procédures simplifiées do p conf aimcc 12 09 12Rpc12263 r7 final thème 6 procédures simplifiées do p conf aimcc 12 09 12
Rpc12263 r7 final thème 6 procédures simplifiées do p conf aimcc 12 09 12
 
Burbuja net
Burbuja netBurbuja net
Burbuja net
 
Resolución grafica de ecuaciones de 2º grado
Resolución grafica de  ecuaciones de 2º gradoResolución grafica de  ecuaciones de 2º grado
Resolución grafica de ecuaciones de 2º grado
 
Présentation du projet des traductions des résumés de PEDro par la SFP
Présentation du projet des traductions des résumés de PEDro par la SFPPrésentation du projet des traductions des résumés de PEDro par la SFP
Présentation du projet des traductions des résumés de PEDro par la SFP
 
Presentación su empresa
Presentación su empresaPresentación su empresa
Presentación su empresa
 
Management d'équipe : priorité aux liens humains
Management d'équipe : priorité aux liens humainsManagement d'équipe : priorité aux liens humains
Management d'équipe : priorité aux liens humains
 
Présentation jpt final autorégulation métiers du marketing au cameroun
Présentation jpt final autorégulation métiers du marketing au camerounPrésentation jpt final autorégulation métiers du marketing au cameroun
Présentation jpt final autorégulation métiers du marketing au cameroun
 

Mehr von Florian Stegmaier

Ansätze für gemeinschaftliches Filtering
Ansätze für gemeinschaftliches FilteringAnsätze für gemeinschaftliches Filtering
Ansätze für gemeinschaftliches Filtering
Florian Stegmaier
 
Realtime
 Distributed Analysis
 of Datastreams
Realtime
 Distributed Analysis
 of DatastreamsRealtime
 Distributed Analysis
 of Datastreams
Realtime
 Distributed Analysis
 of Datastreams
Florian Stegmaier
 
Effiziente Verarbeitung von großen Datenmengen
Effiziente Verarbeitung von großen DatenmengenEffiziente Verarbeitung von großen Datenmengen
Effiziente Verarbeitung von großen Datenmengen
Florian Stegmaier
 
Trust-based recommender systems
Trust-based recommender systemsTrust-based recommender systems
Trust-based recommender systems
Florian Stegmaier
 
Trust und Interest Similarity und deren Anwendung für Empfehlungssysteme
Trust und Interest Similarity und deren Anwendung für EmpfehlungssystemeTrust und Interest Similarity und deren Anwendung für Empfehlungssysteme
Trust und Interest Similarity und deren Anwendung für Empfehlungssysteme
Florian Stegmaier
 
Musikempfehlungssysteme
MusikempfehlungssystemeMusikempfehlungssysteme
Musikempfehlungssysteme
Florian Stegmaier
 
Robustheit in Empfehlungssystemen
Robustheit in EmpfehlungssystemenRobustheit in Empfehlungssystemen
Robustheit in Empfehlungssystemen
Florian Stegmaier
 
Linked Open Data als Basis für Empfehlungssysteme
Linked Open Data als Basis für EmpfehlungssystemeLinked Open Data als Basis für Empfehlungssysteme
Linked Open Data als Basis für Empfehlungssysteme
Florian Stegmaier
 
Entscheidungshilfe: Recommender System
Entscheidungshilfe: Recommender SystemEntscheidungshilfe: Recommender System
Entscheidungshilfe: Recommender System
Florian Stegmaier
 
Funktionsweise und Ansätze von inhaltsbasiertem Filtern
Funktionsweise und Ansätze von inhaltsbasiertem FilternFunktionsweise und Ansätze von inhaltsbasiertem Filtern
Funktionsweise und Ansätze von inhaltsbasiertem Filtern
Florian Stegmaier
 
Evaluierung von Empfehlungssystemen
Evaluierung von EmpfehlungssystemenEvaluierung von Empfehlungssystemen
Evaluierung von Empfehlungssystemen
Florian Stegmaier
 
Effiziente Verarbeitung von grossen Datenmengen
Effiziente Verarbeitung von grossen DatenmengenEffiziente Verarbeitung von grossen Datenmengen
Effiziente Verarbeitung von grossen Datenmengen
Florian Stegmaier
 
Introduction to the FP7 CODE project @ BDBC
Introduction to the FP7 CODE project @ BDBCIntroduction to the FP7 CODE project @ BDBC
Introduction to the FP7 CODE project @ BDBC
Florian Stegmaier
 
Generische Datenintegration zur semantischen Diagnoseunterstützung im Projekt...
Generische Datenintegration zur semantischen Diagnoseunterstützung im Projekt...Generische Datenintegration zur semantischen Diagnoseunterstützung im Projekt...
Generische Datenintegration zur semantischen Diagnoseunterstützung im Projekt...
Florian Stegmaier
 
AIR: Architecture for Interoperable Retrieval on Distributed and Heterogeneou...
AIR: Architecture for Interoperable Retrieval on Distributed and Heterogeneou...AIR: Architecture for Interoperable Retrieval on Distributed and Heterogeneou...
AIR: Architecture for Interoperable Retrieval on Distributed and Heterogeneou...
Florian Stegmaier
 

Mehr von Florian Stegmaier (15)

Ansätze für gemeinschaftliches Filtering
Ansätze für gemeinschaftliches FilteringAnsätze für gemeinschaftliches Filtering
Ansätze für gemeinschaftliches Filtering
 
Realtime
 Distributed Analysis
 of Datastreams
Realtime
 Distributed Analysis
 of DatastreamsRealtime
 Distributed Analysis
 of Datastreams
Realtime
 Distributed Analysis
 of Datastreams
 
Effiziente Verarbeitung von großen Datenmengen
Effiziente Verarbeitung von großen DatenmengenEffiziente Verarbeitung von großen Datenmengen
Effiziente Verarbeitung von großen Datenmengen
 
Trust-based recommender systems
Trust-based recommender systemsTrust-based recommender systems
Trust-based recommender systems
 
Trust und Interest Similarity und deren Anwendung für Empfehlungssysteme
Trust und Interest Similarity und deren Anwendung für EmpfehlungssystemeTrust und Interest Similarity und deren Anwendung für Empfehlungssysteme
Trust und Interest Similarity und deren Anwendung für Empfehlungssysteme
 
Musikempfehlungssysteme
MusikempfehlungssystemeMusikempfehlungssysteme
Musikempfehlungssysteme
 
Robustheit in Empfehlungssystemen
Robustheit in EmpfehlungssystemenRobustheit in Empfehlungssystemen
Robustheit in Empfehlungssystemen
 
Linked Open Data als Basis für Empfehlungssysteme
Linked Open Data als Basis für EmpfehlungssystemeLinked Open Data als Basis für Empfehlungssysteme
Linked Open Data als Basis für Empfehlungssysteme
 
Entscheidungshilfe: Recommender System
Entscheidungshilfe: Recommender SystemEntscheidungshilfe: Recommender System
Entscheidungshilfe: Recommender System
 
Funktionsweise und Ansätze von inhaltsbasiertem Filtern
Funktionsweise und Ansätze von inhaltsbasiertem FilternFunktionsweise und Ansätze von inhaltsbasiertem Filtern
Funktionsweise und Ansätze von inhaltsbasiertem Filtern
 
Evaluierung von Empfehlungssystemen
Evaluierung von EmpfehlungssystemenEvaluierung von Empfehlungssystemen
Evaluierung von Empfehlungssystemen
 
Effiziente Verarbeitung von grossen Datenmengen
Effiziente Verarbeitung von grossen DatenmengenEffiziente Verarbeitung von grossen Datenmengen
Effiziente Verarbeitung von grossen Datenmengen
 
Introduction to the FP7 CODE project @ BDBC
Introduction to the FP7 CODE project @ BDBCIntroduction to the FP7 CODE project @ BDBC
Introduction to the FP7 CODE project @ BDBC
 
Generische Datenintegration zur semantischen Diagnoseunterstützung im Projekt...
Generische Datenintegration zur semantischen Diagnoseunterstützung im Projekt...Generische Datenintegration zur semantischen Diagnoseunterstützung im Projekt...
Generische Datenintegration zur semantischen Diagnoseunterstützung im Projekt...
 
AIR: Architecture for Interoperable Retrieval on Distributed and Heterogeneou...
AIR: Architecture for Interoperable Retrieval on Distributed and Heterogeneou...AIR: Architecture for Interoperable Retrieval on Distributed and Heterogeneou...
AIR: Architecture for Interoperable Retrieval on Distributed and Heterogeneou...
 

Context Basierte Personalisierungsansätze

  • 2. Ablauf der Pr¨senation: a Kontext in Empfehlungssystemen Bestimmung des Kontexts von Benutzern Unterschiede zu normalen Empfehlungssystemen Berechnungs-Ans¨tze der relevanten Items a Problem der Komplexit¨t a Studie: Einwirkung auf den Benutzer 2 / 25
  • 3. Einf¨hrungs Beispiel u Definition: Unter dem Begriff Kontext versteht man ”die Bedingungen und Umst¨nde, die sich auf einen Menschen auswirken”. a Beispiel Amazon: Ein Ehemann, der ein Weihnachtsgeschenk z.B ein Parf¨m f¨r u u seine Frau kaufen will w¨rde sich im Kontext Geschenkkauf f¨r u u die Freundin befinden. Im normalen Kaufverhalten w¨rde der u Ehemann andere Waren bevorzugen. In diesem Beispiel w¨rde der Kontext uns Konsumenten im Bezug u auf Kaufentscheidungen von Waren (Items) beeinflussen. 3 / 25
  • 4. Kontext in Empfehlungssystemen Ziele: Einbeziehung des Kontexts in Empfehlungssysteme, um die Genauigkeit der Vorhersage relevanter Waren den (Items) zu verbessern. Technische Modellierung: Ein Kontext k besteht aus mehreren Attributen a1 ... an. a1 = Wochentag, a2 = KaufAbsicht k = (a1 ... an) Beispiele: k1 = (Werktag, GeschenkFreundin), k2 = (Montag, Sohn) 4 / 25
  • 5. Kontext in der Baumhierarchie Die Attribute des Kontexts k liegen in baum¨hnlichen a hierrachischen Strukturen. Wochentag Werktag Montag Dienstag Wochenende Samstag Sonntag Beispiele: k = (Werktag, Geschenk) k1 = (Montag, Geschenk f¨r Freundin) u k ist eine Generalisierung der Kontexts k1, wegen (Montag→Werktag) und (GeschenkFreundin→Geschenk) 5 / 25
  • 6. Bestimmung des Kontext vom Benutzer Um Kontextinformationen uber einen Benutzer in ¨ Empfehlungssystemen einzubauen, m¨ssen diese vor der u Berechnung der relevanten Items m¨glichst genau bestimmt o werden. Der Kontext eines Benutzers muss vorallem beobachtbar sein, das heißt er muss formal definiert werden k¨nnen. o Explizite Bestimmung: Direktes Nachfragen beim Benutzer, z.B durch ein Webformular (Absicht des Kaufs, Aktuelle Stimmng) Implizite Bestimmung: Indirektes Abgreifen der Informationen eines Benutzers z.B Standort, Wochentag beim Kauf, Online Shop Seitenaufrufe 6 / 25
  • 7. Beispiele zur Kontext Bestimmung eines Benutzers (a) Explizite Bestimmung (b) Implizite Bestimmung 7 / 25
  • 8. Unterschiede zu normalen Empfehlungssystemen Alle konkreten Kontexte, in denen sich der Benutzer eines Empfehlungssystems befinden kann, wird als Menge K definiert. Die Menge K wird als zus¨tzliche Dimension f¨r die Berechnung a u der Bewertungs-Funktion Rank eingef¨hrt. u Normale Bewertungs Funktion: Rank: U × I → Bewertung Kontext-Basierte Bewertungs Funktion: Rank: U × I × K → Bewertung U: Menge aller Benutzer u I: Menge aller Items i K: Menge aller Kontexte k 8 / 25
  • 9. Vorhandener Datensatz in Empfehlungssystemen Benutzer × Items Julia Paul Peter Torsten Hans Olaf Star Wars 0 5 5 1 5 1 Star Gate 3 4 3.5 0 2 0 Micky Mouse 4 4 0 3 0 0 In normalen Empfehlungssystemen wird zu jedem Benutzer und jedem Item, eine abgegebene Benutzerbewertung gespeichert. z.B r ∈ [0-5] Datensatz der Form: <U, I, R> R: Menge aller Benutzerbewertungen r 9 / 25
  • 10. Aufstellen der Bewertungsfunktion: Rank Annahmen zum Aufstellen: 1) Benutzer, die ¨hnlich sind, haben die gleichen Vorlieben und a w¨rden z.B auch Filme, ¨hnlich bewerten. u a 2) Items, die ¨hnlich vom Inhalt her sind und eine gute a Bewertung aufweisen, w¨rden automatisch besser bewertet u werden. Benutzer × Items Julia Paul Peter Torsten Star Wars (Wert ?) 5 5 1 Star Gate 3 4 3.5 5 Micky Mouse 4 4 (Wert ?) 3 10 / 25
  • 11. Bewertungsfunktion: Rank Formal: Die Bewertungsfunktion Rank ordnet jedem Benutzer u und jedem Item i einen positiven Wert gr¨ßer 0 zu. o Wichtig: Je gr¨ßer dieser Wert ausf¨llt, desto wichtiger ist ein Item f¨r o a u einen Benutzer. Benuzter U BenutzerBewertung R = U × I TopN Items Items I Funktion: Rank Bewertung ∈ ]0,...] Nach der Berechnung der Rank Funktion werden die h¨chst o bewerteten Items in die Menge TopN gespeichert. 11 / 25
  • 12. Einf¨hrung Kontext Dimension: K u Benutzer × Items Julia in k’ Julia in k” Torsten in k’ Torsten in k” Torsten in k”’ Forrest Gump 0 0 1 0 0 Star Wars 7 0 4 0 5 0 Cast Away 3 0 2 0 3 In Kontext basierten Empfehlungssystemen wird zu jedem Benutzer, jedem Item und jedem Kontext ein durch den Benutzer abgegebene Benutzerbewertung gespeichert. Datensatz der Form: <U, I, K, R>. k’ und k”’ sind unterschiedliche Kontexte, in denen sich der Benutzer Torsten befand und eine Benutzerbewertung abgegeben hat. 12 / 25
  • 13. Beispiele zur Dimension: K Benutzer × Items Julia in k’ Julia in k” Torsten in k”’ Forrest Gump 0 0 1 Star Wars 7 0 4 0 Cast Away 3 0 2 Beispiele: 1) k’ w¨rde bedeuten, dass Julia an einem Samstag, zuhause ist u (Standortbestimmung). Dort schaut sie sich die Film Cast Away alleine an bzw. bewertet diesen auch. 2) k” w¨rde bedeuten, dass Julia an einem Sonntag mit ihrem u Freund ins Kino geht, und dabei Star Wars 7 anschaut und diesen mit 4 bewerten w¨rde. u Formal: k’ = (zuhause, Samstag, alleine), k” = (Kino, Sonntag, Freund) 13 / 25
  • 14. Berechnung relevanter Items: TopN Die Berechnung der relevanten Items i in der TopN Menge f¨r u einen bestimmten Benutzer u kann mithilfe von 3 unterschiedlichen Berechnungs Ans¨tzen bewerkstelligt werden. a Dabei liegen die Datens¨tze der Form DATA := <U, I, K, R> vor. a Schritt 1: Kontext Bestimmung Zuerst wird der aktuelle k’ eines Benutzers u’ ermittelt. Schritt 2: Berechnung relevanter Items: TopN 1) Kontextuelle Vorfilterung, 2) Kontextuelle Nachfilterung oder 3) Kontext-Basierte Modelle. 14 / 25
  • 15. ¨ Berechnungs-Ans¨tze in der Ubersicht a (c) Berechnungsans¨tze a 15 / 25
  • 16. Ansatz 1: Kontextuelle Vorfilterung Bei der kontextuellen Vorfilterung wird zun¨chst die Dimension K a aus dem Datensatz durch Selektion mit K=k’ eliminiert. DATA := <U, I, K=k’, R> Somit entsteht die Datenmenge DATA’: DATA[k’] = <U, I, k’, R> → DATA’ = <U, I, R> Auf der neuen Datenmenge DATA[k’] kann wie bei normalen Empfehlungssystemen die Bewertungsfunktion Rank aufgestellt und berechnet werden, da die Dimension K des Kontexts wegf¨llt. a 16 / 25
  • 17. Ansatz 1: Kontextuelle Vorfilterung Benutzer × Items Julia in k’ Julia in k” Torsten in k’ Forrest Gump 0 0 1 Star Wars 7 0 4 0 Cast Away 3 0 2 Selektion: Mit K=k’ entsteht der neue Datensatz DATA[k’]. DATA[k’] = <U, I, k’, R> Benutzer × Items Julia in k’ Torsten in k’ Forrest Gump 0 1 Star Wars 7 0 0 Cast Away 3 2 Julia befindet sich momentan im Kontext k’. Alle anderen abgegebenen Bewertungen der Benutzer im Kontext k’ w¨ren a f¨r sie relevant. u 17 / 25
  • 18. Ansatz 3: Modellbasierte Einbeziehung des Kontexts Bei Modell basierten Ans¨tzen wird die Dimension des Kontexts a K direkt in die Bewertungsfunktion Rank einbezogen um je nach Kontext k Items i besser oder schlechter zu bewerten. Vorhandener Datensatz: DATA = <U, I, K, R> Kontext basierte Bewertungs Funktion: Rank: U × I × K → Bewertung Ans¨tze: a Benutzer, die sich z.B im ”gleichen”Kontext (zuhause) befinden, w¨rden ¨hnliche Items auch gleich bewerten. u a Das Aufstellen und Berechnen der Rank Funktion modellbasierter Ans¨tze ist sehr Komplex ! a 18 / 25
  • 19. Komplexit¨t modellbasierter Ans¨tze a a Bei der Berechnung der Bewertungsfunktion Rank muss f¨r u jeden Kontext eine Bewertung f¨r ein Item und einen Benutzer u berechnet werden. Folgerung: Die Komplexivit¨t der Berechnung steigt stark an: a Normale Berechnung der Rank Funktion: ANZAHL(U) = 50k (50.000 Benutzer) ANZAHL(I) = 200 (200 Verschiedene Items bzw. Waren) DATA = <U, I, R> Berechnungsschritte der Rank Funktion: GESAMT = ANZAHL(U) * ANZAHL(I) = 50k * 200 = 10kk entspricht etwa 10 Millionen Berechnungen ! 19 / 25
  • 20. Komplexit¨t modellbasierter Ans¨tze a a Beispiel: Online-Buchshop: k = (WochenTag, KaufAbsicht, Niederschlag, Stimmung) WochenTag = [Mo, Di, Mi, Do, Fr, Sa, So, WE, WT...] KaufAbsicht = [Arbeit, Pers¨hnlich, Geschenk, Partner, Freund, o Eltern, Sammlung, GeburtstagsGeschenk, HeiratsGeschenk] Niederschlag = [0-2mm, 2-4mm, 4-100mm] Stimmung = [ruhig, positiv, tatkr¨ftig, tr¨be] a u ¨ Uberschlags Rechnung: GESAMT(K) = ANZAHL(WochenTag) × ANZAHL(KaufAbsicht) × ANZAHL(Niederschlag) × ANZAHL(Stimmung) =9×9×3×4 = 972 entspricht etwa 980 verschiedenen Kontexten in K. 20 / 25
  • 21. Komplexit¨t modellbasierter Ans¨tze a a Modell-Basierte Berechnung der Rank Funktion: Ein Benutzer u k¨nnte sich, beim Kauf eines Buches in etwa o 980 verschiedenen Kontexten K befinden. ANZAHL(K) = 980; DATA = <U, I, K, R> Berechnungsschritte der Rank Funktion: GESAMT = ANZAHL(U) × ANZAHL(I) × GESAMT(K) = 50k × 200 × 980 = 10kkk entspricht etwa 10 Milliarden Berechnungen !! 21 / 25
  • 22. Studie: Einwirkung auf das Kaufverhalten Kontext basierte Empfehlungssysteme sind meistens rechenintensiver als normale Empfehlungssysteme, aber daf¨r u genauer in der Bestimmung relevanter Items TopN f¨r einen u bestimmten Benutzer. Studie zu Normalen Systemen: Ausgegebenes Geld pro Monat pro User: +17% (Anstieg) Menge an gekauften Items pro Monat pro User: +37% (Anstieg) Preis pro gekaufter Items pro Monat pro User: -15% (Abfall) Studie zu Kontext-Basierten Systemen: Ausgegebenes Geld pro Monat pro User: +28% (Anstieg) Menge an gekauften Items pro Monat pro User: -8% (Abfall) Preis pro gekaufter Items pro Monat pro User: +39% (Anstieg) Quelle: The Effect of Context-Aware Recommendations on Customer Purchasing Behavior and Trust 22 / 25
  • 23. Genauigkeit der Vorhersage relevanter Items Genauigkeit der TopN Items: Treffergenauigkeit (Ja-Nein) f¨r einen Benutzer liegt bei beiden u Empfehlungssysteme bei etwa 60% - 70%. Zum Vergleich mit der Kontrollgruppe: zufallsbasierte Item Empfehlungen liegen bei 40% - 50% Durchschnitt der positiven Feedbacks: Benutzerbewertungen liegen in Kontext-Basierten Empfehlungsysteme bei 55% - 70%. Bei normalen Empfehlungssystemen bei nur 50% - 60%. Offline Eink¨ufe: a Die meisten Benutzer der Empfehlubngssysteme gaben an, dass sie offline mehr Produkte gekauft haben, als Benutzer mit zufallsbasierten Empfehlungen. 23 / 25
  • 24. Interpretation beim Kaufverhalten Durch den Einsatz von Empfehlungssysteme kann z.b eine Online Verkaufsplattform bis zu 30% mehr Geld einnehmen ! Fazit: Bei Normalen Empfehlungssystemen kauften die Benutzer in der Summe viel mehr Items, zahlten daf¨r aber einen geringeren u Items St¨ckpreis. u Bei Kontext-Basierten Empfehlungssystemen kauften die Benutzer in der Summe etwas weniger Items, aber zahlten daf¨r u einen sehr hohen Items St¨ckpreis. u M¨gliche Gr¨nde: o u Genauere Vorhersage relevanter Items durch zielgerichtete Einbeziehung des jeweiligen Kontexts. 24 / 25