9.
Zwei Varianten: RLRadio P und RLRadio RL
RLRadio P: Radiosenderauswahl nur anhand
des expliziten Feedbacks
RLRadio RL: Radiosenderauswahl anhand des
expliziten und impliziten Feedbacks
16.07.2013
9
11.
Repräsentiert die Radiosender-Vorlieben des
Benutzers
Beschränkung des Zustandsraums durch
Aufzeichnung von zwei Radiosendern
Weitere Einschränkungen durch Präferenzen:
tief(<15%), fair(15-40%), hoch(40%-60%) und
sehr hoch(> 60%)
56133 mögliche Zustände
16.07.2013
11
13.
Belohnung anhand der Hörlänge eines
Musikstücks
Belohnung in drei Stufen eingeteilt:
<15% - null Punkte
15-60% - ein Punkt
>60% - zwei Punkte
16.07.2013
13
15.
Optimal Policy für RLRadio P mit Policy
Iteration berechnet
Berechnete Strategie aus RLRadio P wird
Startstrategie von RLRadio RL
Optimal Policy von RLRadio RL mit Hilfe RLearning for Undiscounted Tasks verbessert
16.07.2013
15
30.
Radiovorschlagssystem anhand explizitem
und implizitem Feedback
R-Learning for Undiscounted Tasks eignet
sich für diese Problemstellung
Transkription des Systems in andere Bereiche
möglich
16.07.2013
30
32.
[Bortz u. Lienert 2008] Bortz, Jürgen ; Lienert, Gustav A.: Kurzgefasste Statistik
für die klinische Forschung -. Berlin : Springer DE, 2008. – ISBN 978–3–540–
75738–2
[Jawaheer u. a. 2010] Jawaheer, Gawesh ; Szomszor, Martin ; Kostkova, Patty:
Comparison of implicit and explicit feedback from an online music
recommendation service. In: Proceedings of the 1st International Workshop on
Information Heterogeneity and Fusion in Recommender Systems - HetRec ’10
(2010), 47–51.
[Lee 2005] Lee, Mark: 6.7 R-Learning for Undiscounted Continuing Tasks.
http://webdocs.cs.ualberta.ca/~sutton/book/ebook/node67.html. Version: 2005
[Moling u. a. 2012] Moling, Omar ; Baltrunas, Linas ; Ricci, Francesco: Optimal
radiochannel recommendations with explicit and implicit feedback. In:
Proceedings of the sixthACMconference on Recommender systems - RecSys ’12
(2012), 75.
[Richard S. Sutton 1998] Richard S. Sutton, Andrew G. B.: Reinforcement
Learning: An Introduction.http://webdocs.cs.ualberta.ca/~sutton/book/ebook/.
Version: 1998
16.07.2013
32
33.
[1] spotify – Abruf:14.07.2013 http://www.smartdroid.de/wpcontent/uploads/2012/03/spotify-logo.png
[2] Last.fm – Abruf:14.07.2013 http://sysout.be/wpcontent/uploads/2013/01/last-fm-logo.png
[3] pandora - Abruf:14.07.2013
http://a1.mzstatic.com/us/r1000/033/Purple4/v4/16/38/4e/16384e693263-9d3f-484b-7c06488658ca/mzl.qpnxgmrs.png
[4] RLRadio & [5] Radio Präferenzen: Optimal radio channel
recommendations with explicit and implicit feedback. In: Proceedings of
the sixth ACMconference on Recommender systems - RecSys ’12 (2012),
75. http://dx.doi.org/10.1145/2365952.2365971. – DOI
10.1145/2365952.2365971. ISBN 9781450312707
[6] how i met your mother – Abruf:15.07.2013
http://images3.wikia.nocookie.net/__cb20110701174449/how-i-metyour-mother/de/images/b/b3/Future-Barney-how-i-met-your-mother2590507-1280-720.jpg
16.07.2013
33