SlideShare ist ein Scribd-Unternehmen logo
1 von 24
Downloaden Sie, um offline zu lesen
Untersuchung und anschließende
Implementierung eines Empfehlungssystems
f¨ur das Frage & Antwort Portal ”42-Data”
Lucas Mußm¨acher
28. Mai 2014
1 / 24
Ablauf der Pr¨asentation
Einleitung
Motivation
Aufbau eines Empfehlungssystems
Beschreibung des Portals 42-Data
Ziele der Implementierung
Techniken
Bewertungsarten (implizit & explizit)
Implizite Faktoren von Webseiten
Arten Objekt Empfehlung
Verschiedene Ans¨atze (kollaborativ & inhaltsbasiert)
Empfehlungsprozess f¨ur 42-Data
Online Benutzerbefragung
Wissenschaftliche Fragen
2 / 24
Definition: Empfehlungssystem
Definition:
Ein Empfehlungssystem ist ein System, das einem Benutzer in
einem gegebenen Kontext aus einer gegebenen Entit¨atsmenge
aktiv eine Teilmenge n¨utzlicher Elemente empfiehlt.
Elemente der Entit¨atsmenge (Objekte):
Waren & Produkte: z.B. DVDs, B¨ucher, Kleidung ...
Digitale Inhalte: z.B. Musik, Video, Webseiten ...
n¨utzliche Elemente:
relevante Objekte f¨ur einen Benutzer
3 / 24
Aufbau eines kollaborativen Empfehlungssystem
Abbildung: Aufbau und Komponenten
Jeden Benutzer werden relevante Objekte empfohlen
Meinung eines Benutzers entspricht der Objektbewertung
4 / 24
Motivation f¨ur Empfehlungssysteme
Abbildung: Informationsflut durch sehr viele Objekte
Motivation:
Benutzer: Suche nach interessanten und neuen Objekten
Unternehmen: Umsatzsteigerung durch hohe Verkaufszahlen
Beispiel: Spotify (18 Millionen Songs)
5 / 24
Beispiel: Musik Streaming Dienst, Spotify
Musik Empfehlung:
Benutzer hat Nero und Pendulum geh¨ort
⇒ Noisia (Interpret) wird vorgeschlagen
Ziele: Neue Musik Entdecken
Abbildung: Empfohlene Interpreten 6 / 24
Beispiel: Warenverkauf im Internet, Amazon
Produkt Empfehlung:
Benutzer hat ein Handy gekauft
⇒ Handyh¨ulle wird vorgeschlagen
Ziele: Produkte Entdecken und Kaufen
Abbildung: Passende Produkte 7 / 24
Beschreibung des Portals 42-Data
Frage & Antwort System: (42-Data)
Benutzer stellen zu bestimmten Themen Fragen
Experten beantworten die Fragen
Benutzer k¨onnen f¨ur gute Antworten Geld spenden
Diskussion ist Daten zentriert
Bekannte Systeme:
stackoverflow.com (Stack Overflow / technische Themen)
gutefrage.net (GuteFrage / Alltagsthemen)
8 / 24
Beispiel: Fragen des Portals 42-Data
Abbildung: Liste der gestellten Fragen
Zielgruppen: Forscher, Studierende und Journalisten
9 / 24
Ziele der Bachelorarbeit
Abbildung: Aufgaben des Empfehlungssystems
Auswahl eines geeigneten Ansatzes
Umsetzung und Implementierung des Systems
10 / 24
Bewertungsarten (implizit & explizit)
Explizite Bewertung:
Direkte Angabe der
Objektbewertung
z.B. Punkte, Like &
Dislike, Sterne ...
Implizite Bewertung:
Indirekte Angabe der
Objektbewertung
explizite Bewertung muss
berechnet werden
z.B. Webseitenaufrufe,
Lesedauer, Mausklicks ...
11 / 24
Beispiel: Explizite und implizite Bewertung
Abbildung: Stern Bewertung bei
Filmen (explizit)
Abbildung: Anzahl der geh¨orten
Songs (implizit)
12 / 24
Implizite Faktoren von Webseiten (Fragen)
Abbildung: Implizite Faktoren im Internet
Javascript Events erzeugen die Daten
13 / 24
Probleme impliziter Faktoren
answersubmit 0 elementclick 2
keypress 27 mousemove 3345
mouseover 98 mouseselect 7
pageprint 0 pagescroll 381
pagevisits 1 timevisited 48.17
Abbildung: Beispielhafte Werte impliziter Faktoren
Probleme:
Lesedauer: Browser Fenster ge¨offnet ⇒ PC verlassen
Mausscrollen: Geringe Bildschirmaufl¨osung ⇒ mehr Scrollen
Textmarkierung: Copy & Paste Mentalit¨at
14 / 24
Speicherungsprozess impliziter Faktoren
Abbildung: Speicherung der Event Daten
15 / 24
Objekt Empfehlung
Kollaborativer Ansatz:
Es existieren Benutzer mit gleichen Interessen
Benutzer mit gleichen Interessen bewerten Objekte ¨ahnlich
Benutzer sind dann ¨ahnlich, wenn sie Objekte gleich bewerten
Zwei ¨ahnliche Benutzer schlagen sich gegenseitig Objekte vor
Inhaltsbasierter Ansatz:
Es exisiteren Objekte, die inhaltlich ¨ahnlich sind
Zwei Objekt sind dann ¨ahnlich, wenn sie die gleichen
Merkmale besitzen
Dem Benutzer werden Objekte vorgeschlagen, bei denen die
Merkmale mit den bekannten Objekte ¨ubereinstimmen
16 / 24
Inhaltsbasiertes Empfehlungssystem
Abbildung: Inhaltsbasiertes Empfehlungssystem
Schl¨usselmerkmale der Objekte m¨ussen extrahiert werden
Objekte mit gleichen Merkmalen werden vorgeschlagen
17 / 24
Beispiel: Benutzerbasierte Ans¨atze (kollaborativ)
Benutzer × Filme Pate 1 Pate 2 Fight Club Taxi Driver
Julia ? 3,3 4 2,3
Lisa 1,3 3,2 3,9 2,5
Paul 5 4 4,5 3,8
Peter 5,1 3,9 ? 3,8
... ... ... ... ...
Benutzer ¨Ahnlichkeit:
Paul ist ¨ahnlich zu Peter
Lisa ist ¨ahnlich zu Julia
18 / 24
Beispiel: Objektbasierte Ans¨atze (kollaborativ)
Benutzer × Filme Star Wars Star Gate Matrix 1 Matrix 2
Julia ? 1,5 3,1 3,2
Paul 5 4,9 4,1 4,2
Peter 3,1 2,9 5 ?
Lisa 1,4 1,5 2,9 3,2
... ... ... ... ...
Objekt ¨Ahnlichkeit:
Matrix 1 ist ¨ahnlich zu Matrix 2
Star Wars ist ¨ahnlich zu Star Gate
19 / 24
Empfehlungsprozess f¨ur das Portal 42-Data
Abbildung: Ablauf der Objekt Empfehlung
20 / 24
Online Benutzerbefragung
Themen der Benutzerbefragung:
Gewichtung der impliziten Faktoren (Priorit¨aten)
Anforderung des Algorithmus (Zusatz Funktionalit¨at)
Visuelle Pr¨asentation relevanter Objekte (Anzahl, Ort)
21 / 24
Gewichtungsprozess impliziter Faktoren
Abbildung: Berechung der impliziten Faktoren in eine Bewertung
Gewichtung:
... Gedruckt < Lesedauer < Aufrufe < Beantwortet
22 / 24
Wissenschaftliche Fragen
Nutzen des Empfehlungssystem (Integration im Portal)
G¨ute der impliziten Faktoren (explizite zu folgern)
Arten der Benutzer Beobachtung (Zeit, Klicks, Maus)
[Kontext] z.B. begrenzte Relevanz von Themen (WM 2014)
23 / 24
Ablaufplan der Bachelorarbeit
Abbildung: Zeitplan der Bachelorarbeit
24 / 24

Weitere ähnliche Inhalte

Empfohlen

How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at WorkGetSmarter
 

Empfohlen (20)

How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 

Untersuchung und anschließende Implementierung eines Empfehlungssystems für das Frage & Antwort Portal 42-Data

  • 1. Untersuchung und anschließende Implementierung eines Empfehlungssystems f¨ur das Frage & Antwort Portal ”42-Data” Lucas Mußm¨acher 28. Mai 2014 1 / 24
  • 2. Ablauf der Pr¨asentation Einleitung Motivation Aufbau eines Empfehlungssystems Beschreibung des Portals 42-Data Ziele der Implementierung Techniken Bewertungsarten (implizit & explizit) Implizite Faktoren von Webseiten Arten Objekt Empfehlung Verschiedene Ans¨atze (kollaborativ & inhaltsbasiert) Empfehlungsprozess f¨ur 42-Data Online Benutzerbefragung Wissenschaftliche Fragen 2 / 24
  • 3. Definition: Empfehlungssystem Definition: Ein Empfehlungssystem ist ein System, das einem Benutzer in einem gegebenen Kontext aus einer gegebenen Entit¨atsmenge aktiv eine Teilmenge n¨utzlicher Elemente empfiehlt. Elemente der Entit¨atsmenge (Objekte): Waren & Produkte: z.B. DVDs, B¨ucher, Kleidung ... Digitale Inhalte: z.B. Musik, Video, Webseiten ... n¨utzliche Elemente: relevante Objekte f¨ur einen Benutzer 3 / 24
  • 4. Aufbau eines kollaborativen Empfehlungssystem Abbildung: Aufbau und Komponenten Jeden Benutzer werden relevante Objekte empfohlen Meinung eines Benutzers entspricht der Objektbewertung 4 / 24
  • 5. Motivation f¨ur Empfehlungssysteme Abbildung: Informationsflut durch sehr viele Objekte Motivation: Benutzer: Suche nach interessanten und neuen Objekten Unternehmen: Umsatzsteigerung durch hohe Verkaufszahlen Beispiel: Spotify (18 Millionen Songs) 5 / 24
  • 6. Beispiel: Musik Streaming Dienst, Spotify Musik Empfehlung: Benutzer hat Nero und Pendulum geh¨ort ⇒ Noisia (Interpret) wird vorgeschlagen Ziele: Neue Musik Entdecken Abbildung: Empfohlene Interpreten 6 / 24
  • 7. Beispiel: Warenverkauf im Internet, Amazon Produkt Empfehlung: Benutzer hat ein Handy gekauft ⇒ Handyh¨ulle wird vorgeschlagen Ziele: Produkte Entdecken und Kaufen Abbildung: Passende Produkte 7 / 24
  • 8. Beschreibung des Portals 42-Data Frage & Antwort System: (42-Data) Benutzer stellen zu bestimmten Themen Fragen Experten beantworten die Fragen Benutzer k¨onnen f¨ur gute Antworten Geld spenden Diskussion ist Daten zentriert Bekannte Systeme: stackoverflow.com (Stack Overflow / technische Themen) gutefrage.net (GuteFrage / Alltagsthemen) 8 / 24
  • 9. Beispiel: Fragen des Portals 42-Data Abbildung: Liste der gestellten Fragen Zielgruppen: Forscher, Studierende und Journalisten 9 / 24
  • 10. Ziele der Bachelorarbeit Abbildung: Aufgaben des Empfehlungssystems Auswahl eines geeigneten Ansatzes Umsetzung und Implementierung des Systems 10 / 24
  • 11. Bewertungsarten (implizit & explizit) Explizite Bewertung: Direkte Angabe der Objektbewertung z.B. Punkte, Like & Dislike, Sterne ... Implizite Bewertung: Indirekte Angabe der Objektbewertung explizite Bewertung muss berechnet werden z.B. Webseitenaufrufe, Lesedauer, Mausklicks ... 11 / 24
  • 12. Beispiel: Explizite und implizite Bewertung Abbildung: Stern Bewertung bei Filmen (explizit) Abbildung: Anzahl der geh¨orten Songs (implizit) 12 / 24
  • 13. Implizite Faktoren von Webseiten (Fragen) Abbildung: Implizite Faktoren im Internet Javascript Events erzeugen die Daten 13 / 24
  • 14. Probleme impliziter Faktoren answersubmit 0 elementclick 2 keypress 27 mousemove 3345 mouseover 98 mouseselect 7 pageprint 0 pagescroll 381 pagevisits 1 timevisited 48.17 Abbildung: Beispielhafte Werte impliziter Faktoren Probleme: Lesedauer: Browser Fenster ge¨offnet ⇒ PC verlassen Mausscrollen: Geringe Bildschirmaufl¨osung ⇒ mehr Scrollen Textmarkierung: Copy & Paste Mentalit¨at 14 / 24
  • 15. Speicherungsprozess impliziter Faktoren Abbildung: Speicherung der Event Daten 15 / 24
  • 16. Objekt Empfehlung Kollaborativer Ansatz: Es existieren Benutzer mit gleichen Interessen Benutzer mit gleichen Interessen bewerten Objekte ¨ahnlich Benutzer sind dann ¨ahnlich, wenn sie Objekte gleich bewerten Zwei ¨ahnliche Benutzer schlagen sich gegenseitig Objekte vor Inhaltsbasierter Ansatz: Es exisiteren Objekte, die inhaltlich ¨ahnlich sind Zwei Objekt sind dann ¨ahnlich, wenn sie die gleichen Merkmale besitzen Dem Benutzer werden Objekte vorgeschlagen, bei denen die Merkmale mit den bekannten Objekte ¨ubereinstimmen 16 / 24
  • 17. Inhaltsbasiertes Empfehlungssystem Abbildung: Inhaltsbasiertes Empfehlungssystem Schl¨usselmerkmale der Objekte m¨ussen extrahiert werden Objekte mit gleichen Merkmalen werden vorgeschlagen 17 / 24
  • 18. Beispiel: Benutzerbasierte Ans¨atze (kollaborativ) Benutzer × Filme Pate 1 Pate 2 Fight Club Taxi Driver Julia ? 3,3 4 2,3 Lisa 1,3 3,2 3,9 2,5 Paul 5 4 4,5 3,8 Peter 5,1 3,9 ? 3,8 ... ... ... ... ... Benutzer ¨Ahnlichkeit: Paul ist ¨ahnlich zu Peter Lisa ist ¨ahnlich zu Julia 18 / 24
  • 19. Beispiel: Objektbasierte Ans¨atze (kollaborativ) Benutzer × Filme Star Wars Star Gate Matrix 1 Matrix 2 Julia ? 1,5 3,1 3,2 Paul 5 4,9 4,1 4,2 Peter 3,1 2,9 5 ? Lisa 1,4 1,5 2,9 3,2 ... ... ... ... ... Objekt ¨Ahnlichkeit: Matrix 1 ist ¨ahnlich zu Matrix 2 Star Wars ist ¨ahnlich zu Star Gate 19 / 24
  • 20. Empfehlungsprozess f¨ur das Portal 42-Data Abbildung: Ablauf der Objekt Empfehlung 20 / 24
  • 21. Online Benutzerbefragung Themen der Benutzerbefragung: Gewichtung der impliziten Faktoren (Priorit¨aten) Anforderung des Algorithmus (Zusatz Funktionalit¨at) Visuelle Pr¨asentation relevanter Objekte (Anzahl, Ort) 21 / 24
  • 22. Gewichtungsprozess impliziter Faktoren Abbildung: Berechung der impliziten Faktoren in eine Bewertung Gewichtung: ... Gedruckt < Lesedauer < Aufrufe < Beantwortet 22 / 24
  • 23. Wissenschaftliche Fragen Nutzen des Empfehlungssystem (Integration im Portal) G¨ute der impliziten Faktoren (explizite zu folgern) Arten der Benutzer Beobachtung (Zeit, Klicks, Maus) [Kontext] z.B. begrenzte Relevanz von Themen (WM 2014) 23 / 24
  • 24. Ablaufplan der Bachelorarbeit Abbildung: Zeitplan der Bachelorarbeit 24 / 24