Personalisierung im Internet Dr. Udo Ornik
Übersicht <ul><li>Begriffsdefinition </li></ul><ul><li>Grundlegende Techniken zur Identifizierung und Wiedererkennung </li...
Definition Personalisierung Anpassung von angebotenen Informationen  an die Interessen des jeweiligen Betrachters.  Aber a...
Einsatzbereiche  <ul><li>Newsgroups </li></ul><ul><li>Email </li></ul><ul><li>Web </li></ul>In folgenden Bereichen des Int...
Problem: Identifizierung <ul><li>Um ein Internetangebot zu personalisieren muss es zunächst Möglichkeiten geben zu identif...
Problem: http:// Das http-Protokoll ist Verbindungslos. Das Web  hat also kein Gedächtnis Get URL1 URL i Get URL2 Get URL3...
Problem: NAT und Proxies Hinter dem Gateway  verliert sich  die Spur
Techniken: Identifizierung <ul><li>Benutzername und Kennwort </li></ul><ul><li>Email-Adresse </li></ul><ul><li>Cookies </l...
Cookie setzen <html> <head> <script language=JavaScript> function  setCookie (name,value) { document.cookie=name+&quot;=&q...
Techniken: Cookies SITESERVERID=167adba237d88dd7847091369810e7d6bahnauskunft.com/064285900831887777323730704029419385*
Cookie lesen <html> <head> <Script language=JavaScript> function  getCookie()  { alert(unescape(document.cookie)) } </Scri...
Cookies <ul><li>Pro Server max. 20  Cookies   </li></ul><ul><li>Die Gesamtzahl der  Cookies  300  </li></ul><ul><li>Die ma...
Techniken: Codierte URLs Nach der Definition der persönlichen  Einstellungen wird eine Eintrittswebsite als  Favorit gespe...
Codierte URLs Bsp: ASP <%  userid =Request.Querystring(´´userid´´) %>
Techniken: Auslesen der Userdaten <% DbConn=Server.CreateObject(ADODB.Connection) DbConn.open (DSN=´´odbc-name´´) RS=Serve...
Techniken: Klassifizierung der Daten <ul><li>Die Personalisiert dargestellten Daten müssen vorher in aufwendiger Form klas...
Techniken: Metadaten <ul><li>Meta Tags des HTML-HEADERS <META name=&quot; DESCRIPTION &quot; content=&quot;Homepage, Polit...
Techniken: Metadaten <ul><li>Proprietäre Tags, die vom Webserver oder von einem Agent interpretiert werden können. </li></...
Techniken: Automatische Erfassung von MetaDaten Abhdsivfnrnvfr poevppopopovgt Fkmkmkgmg < rthhzzjz > Eruh kog W i Vektor a...
Add-on Programme <ul><li>Aktiv-X oder Java Objekte in Webseiten eingebaut </li></ul><ul><li>Proprietäre Anwendungen und Pr...
Techniken: Logdateien <ul><li>remotehost : Rechnername oder die Internetadresse des Klienten. </li></ul><ul><li>rfc931 : D...
Weitere Standarts <ul><li>W 3C  Extended  Log Files   </li></ul><ul><li>Microsoft IIS Log Files   </li></ul><ul><li>NCSA C...
Techniken: Logdateien W3C 132.180.237.26 - - [20/Dec/1999:15:26:39 +0100] &quot;GET /~c99f72/mmi10.shtml HTTP/1.0&quot; 20...
Techniken: W3C Extended #Fields: date time c-ip cs-username s-sitename s-computername s-ip cs-method cs-uri-stem cs-uri-qu...
 
 
 
 
Strategien zur Anpassung <ul><li>Reaktive Methoden </li></ul><ul><li>Fragebögen </li></ul><ul><li>Formulare </li></ul><ul>...
Strategien: Explizite Abfrage
Strategien: Collaborative Filtering Durch gemeinschaftliches Filtern auf der Basis der Vorlieben anderer User werden Empfe...
 
Collaborative Filtering Titel1 Titel4 Titel3 Titel6 Titel1 Titel4 Titel2 Titel5 input Vorschlag Titel2 Titel5 Der Vorschla...
Collaborative Filtering Linearer Korrelations- Koeffizient (Pearson) Vorhersage für die  Bewertung eines  Merkmals i durch...
Strategie: Content Based Filtering <ul><li>Aus dem Verhalten des Users beim Besuch  einer  Website werden Schlüsse gezogen...
Content-Based Filtering:  KI-Trainingsphase Abhdsivfnrnvfr poevppopopovgt Fkmkmkgmg < rthhzzjz > Eruh kog URL j Kodierung ...
Content-Based Filtering:  KI-Trainingsphase Die kategorisierten Seite bilden Punkte in N+1 dim Vektorraum Punkt j aus Webs...
Strategien: Verhaltensbeobachtung <ul><li>Stellen Informationen, die sie über den Kunden gesammelt haben, einem Satz von R...
Strategien: Regelbasierte Systeme <ul><li>Fertige statistische Profile werden aus Marktforschungsdaten gewonnen </li></ul>...
Strategien: Regelbasierte Systeme User Input Tracking  System, Befragung Wissens basis Output lernen Interferenz maschine ...
Beispiele <ul><li>Personalisierte Websites </li></ul><ul><li>www . sapinfo . net </li></ul><ul><li>www . aol . com </li></...
Quellen Übersichtsartikel Agentenbasiertes Suchen, Filtern und Klassifizieren von Informationsangeboten , Dipl. Kaufmann F...
Nächste SlideShare
Wird geladen in …5
×

Personalisierung

1.826 Aufrufe

Veröffentlicht am

Vortrag FH Gießen-Friedberg

0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
1.826
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
2
Aktionen
Geteilt
0
Downloads
0
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Personalisierung

  1. 1. Personalisierung im Internet Dr. Udo Ornik
  2. 2. Übersicht <ul><li>Begriffsdefinition </li></ul><ul><li>Grundlegende Techniken zur Identifizierung und Wiedererkennung </li></ul><ul><li>Strategien zur Personalisierung </li></ul><ul><li>Beispiele </li></ul><ul><li>Quellen </li></ul>
  3. 3. Definition Personalisierung Anpassung von angebotenen Informationen an die Interessen des jeweiligen Betrachters. Aber auch: Sammlung von Informationen über das jeweilige Verhalten des Betrachters
  4. 4. Einsatzbereiche <ul><li>Newsgroups </li></ul><ul><li>Email </li></ul><ul><li>Web </li></ul>In folgenden Bereichen des Internet bietet sich die Personalisierung an
  5. 5. Problem: Identifizierung <ul><li>Um ein Internetangebot zu personalisieren muss es zunächst Möglichkeiten geben zu identifizieren. </li></ul><ul><li>Das Internet bietet hierzu keine eindeutige Lösung </li></ul><ul><li>verschiedene Verfahren müssen in Kombination eingesetzt werden </li></ul>
  6. 6. Problem: http:// Das http-Protokoll ist Verbindungslos. Das Web hat also kein Gedächtnis Get URL1 URL i Get URL2 Get URL3 . . . Im Prinzip ist für jede Webseite eine Verbindung notwendig
  7. 7. Problem: NAT und Proxies Hinter dem Gateway verliert sich die Spur
  8. 8. Techniken: Identifizierung <ul><li>Benutzername und Kennwort </li></ul><ul><li>Email-Adresse </li></ul><ul><li>Cookies </li></ul><ul><li>URLs mit codierter Benutzerkennung </li></ul><ul><li>IP-Auflösung </li></ul><ul><li>Add-On Programme </li></ul><ul><li>SSL-Certifikate </li></ul>
  9. 9. Cookie setzen <html> <head> <script language=JavaScript> function setCookie (name,value) { document.cookie=name+&quot;=&quot;+escape(value) } </script> </head> <body> <A HREF=&quot;javascript: setCookie ('testCookie','Hallo ich bin's') &quot;> ... Setze Cookie ... </A> </body> </html>
  10. 10. Techniken: Cookies SITESERVERID=167adba237d88dd7847091369810e7d6bahnauskunft.com/064285900831887777323730704029419385*
  11. 11. Cookie lesen <html> <head> <Script language=JavaScript> function getCookie() { alert(unescape(document.cookie)) } </Script> </head> <body onload= getCookie() > </body> </html>
  12. 12. Cookies <ul><li>Pro Server max. 20 Cookies </li></ul><ul><li>Die Gesamtzahl der Cookies 300 </li></ul><ul><li>Die maximale Größe 4KB </li></ul><ul><li>Wird die Beschränkungen überschritten, wird das älteste Cookie gelöscht/überschrieben. </li></ul><ul><li>Wird die Größe überschritten, wird zuerst der Wert und dann der Name des Cookies gelöscht. </li></ul>
  13. 13. Techniken: Codierte URLs Nach der Definition der persönlichen Einstellungen wird eine Eintrittswebsite als Favorit gespeichert: http://www.test.com/start.htm ?userid=215859 Über den Übergabestring kann der User beim Anklicken dieses Links wieder identifiziert werden
  14. 14. Codierte URLs Bsp: ASP <% userid =Request.Querystring(´´userid´´) %>
  15. 15. Techniken: Auslesen der Userdaten <% DbConn=Server.CreateObject(ADODB.Connection) DbConn.open (DSN=´´odbc-name´´) RS=Server.CreateObject(ADODB.RecordSet) SQL=´´Select * FROM userdaten where ID = ´´& userid RS.open DBConn, SQL %> Hallo <%=RS(´´Vorname´´)%> schön Sie wieder zusehen
  16. 16. Techniken: Klassifizierung der Daten <ul><li>Die Personalisiert dargestellten Daten müssen vorher in aufwendiger Form klassifiziert werden. </li></ul><ul><li>In der Regel manuell, da heute eine automatische Klassifizierung nur grobe Unterscheidungen liefert (Bsp: Sport, Wirtschaft, Politik.... </li></ul><ul><li>Dokument wird mit Metadaten versehen, die die gewünschte Information enthalten oder extern in einem zugeordneten Datensatz gespeichert werden </li></ul>
  17. 17. Techniken: Metadaten <ul><li>Meta Tags des HTML-HEADERS <META name=&quot; DESCRIPTION &quot; content=&quot;Homepage, Politik, Wirtschaft, Sport, Vermischtes, News, Wetter“> </li></ul><ul><li><META name=&quot; KEYWORDS &quot; content=&quot;Homepage, Politik, Wirtschaft, Sport, Vermischtes, News, Wetter“> </li></ul><ul><li><META name=&quot; REVISIT-AFTER &quot; content=&quot;1 day&quot;> </li></ul><ul><li><META HTTP-EQUIV=&quot; CONTENT-LANGUAGE &quot; </li></ul><ul><li>content=&quot;de&quot;> </li></ul>
  18. 18. Techniken: Metadaten <ul><li>Proprietäre Tags, die vom Webserver oder von einem Agent interpretiert werden können. </li></ul><ul><li>XML zur Speicherung von Meta-Information </li></ul><ul><li>Hidden Felder in Formularen <input type=hidden name=meta-info value=´´Sport, Fussball, x,y,...´´> </li></ul>
  19. 19. Techniken: Automatische Erfassung von MetaDaten Abhdsivfnrnvfr poevppopopovgt Fkmkmkgmg < rthhzzjz > Eruh kog W i Vektor aus N Merkmalen, die jedem Dokument zugeordnet werden i Index für Merkmal j Index für Dokument URL j
  20. 20. Add-on Programme <ul><li>Aktiv-X oder Java Objekte in Webseiten eingebaut </li></ul><ul><li>Proprietäre Anwendungen und Protokolle </li></ul><ul><li>Verzeichnisserver </li></ul><ul><li>Browser-PlugIns </li></ul>Add-ons unterliegen den Beschränkungen des Webs gar nicht oder nur teilweise. Problem : Nur für beschränkten Userkreis zugänglich
  21. 21. Techniken: Logdateien <ul><li>remotehost : Rechnername oder die Internetadresse des Klienten. </li></ul><ul><li>rfc931 : Der Loginname des Nutzers </li></ul><ul><li>authuser : Nutzerkennung </li></ul><ul><li>[date] : Zeitpunkt der Transaktion </li></ul><ul><li>''request'' Die an den Server gestellte Anfrage z.B. ''GET /'' . </li></ul><ul><li>status : Zahlencode für den Abschlusszustand der Verbindung </li></ul><ul><li>bytes : Menge der abgeschickten Daten in Bytes. </li></ul>Das World Wide Web Consortium (W3C) hat folgendes Format als „Common Log Format'' definiert: remotehost rfc931 authuser [date] &quot;request&quot; status bytes
  22. 22. Weitere Standarts <ul><li>W 3C Extended Log Files </li></ul><ul><li>Microsoft IIS Log Files </li></ul><ul><li>NCSA Common Log Files </li></ul>
  23. 23. Techniken: Logdateien W3C 132.180.237.26 - - [20/Dec/1999:15:26:39 +0100] &quot;GET /~c99f72/mmi10.shtml HTTP/1.0&quot; 200 208 132.180.237.25 - - [20/Dec/1999:15:26:47 +0100] &quot;GET /~c99f71/form.html HTTP/1.0&quot; 200 140 132.180.237.25 - - [20/Dec/1999:15:27:20 +0100] &quot;GET /~c99f71/kursleiter.php3?n=blw HTTP/1.0&quot; 200 188 132.180.237.26 - - [20/Dec/1999:15:27:32 +0100] &quot;GET /~c99f72/check.php3?n=fghgfg HTTP/1.0&quot; 200 88 132.180.237.26 - - [20/Dec/1999:15:27:56 +0100] &quot;GET /~c99f72/mmi10.shtml HTTP/1.0&quot; 200 . . . Dies sind längst nicht alle tatsächlich vorliegenden Informationen !
  24. 24. Techniken: W3C Extended #Fields: date time c-ip cs-username s-sitename s-computername s-ip cs-method cs-uri-stem cs-uri-query sc-status sc-win32-status sc-bytes cs-bytes time-taken s-port cs-version cs(User-Agent) cs(Cookie) cs(Referer) 1998-09-17 09:08:11 192.168.100.5 - W3SVC2 EMU 192.168.100.5 GET /private/index.htm,+Mozilla/4.0+(compatible;+MSIE+4.01;+Windows+NT),+- - 401 5 1403 269 16 80 HTTP/1.1 Mozilla/4.0+(compatible;+MSIE+4.01;+Windows+NT) - -
  25. 29. Strategien zur Anpassung <ul><li>Reaktive Methoden </li></ul><ul><li>Fragebögen </li></ul><ul><li>Formulare </li></ul><ul><li>Nicht Reaktive Methoden </li></ul><ul><li>Logfile-Analysen & Click-Streams </li></ul><ul><li>Session-IDs </li></ul><ul><li>Cookies </li></ul><ul><li>Collaborative Filtering </li></ul><ul><li>Content-Based Filtering </li></ul><ul><li>KI </li></ul><ul><li>Regelbasierte Systeme </li></ul>
  26. 30. Strategien: Explizite Abfrage
  27. 31. Strategien: Collaborative Filtering Durch gemeinschaftliches Filtern auf der Basis der Vorlieben anderer User werden Empfehlungen ausgesprochen.
  28. 33. Collaborative Filtering Titel1 Titel4 Titel3 Titel6 Titel1 Titel4 Titel2 Titel5 input Vorschlag Titel2 Titel5 Der Vorschlag lässt sich mit geeigneten statistischen Methoden berechnen
  29. 34. Collaborative Filtering Linearer Korrelations- Koeffizient (Pearson) Vorhersage für die Bewertung eines Merkmals i durch user a.
  30. 35. Strategie: Content Based Filtering <ul><li>Aus dem Verhalten des Users beim Besuch einer Website werden Schlüsse gezogen </li></ul><ul><li>Dies funktioniert nur im Zusammenhang mit effektiven User-Tracking </li></ul>
  31. 36. Content-Based Filtering: KI-Trainingsphase Abhdsivfnrnvfr poevppopopovgt Fkmkmkgmg < rthhzzjz > Eruh kog URL j Kodierung Input 0 uninteressant 1 interessant Wertung Dim N Neuronales Netz Dim N+1 W i . . . W i 1
  32. 37. Content-Based Filtering: KI-Trainingsphase Die kategorisierten Seite bilden Punkte in N+1 dim Vektorraum Punkt j aus Website Punkt k aus Training Metrik ermöglicht Erkennung interessanter Seiten W i 1
  33. 38. Strategien: Verhaltensbeobachtung <ul><li>Stellen Informationen, die sie über den Kunden gesammelt haben, einem Satz von Regeln gegenüber </li></ul><ul><li>Regeln haben „if-then“ Form Bsp. Videokasetten: </li></ul><ul><li>Wenn der Kunde 8 Jahre alt ist und eine Komödie sucht, dann biete ihm Walt Disneys „Schweinchen Babe“ an. </li></ul>
  34. 39. Strategien: Regelbasierte Systeme <ul><li>Fertige statistische Profile werden aus Marktforschungsdaten gewonnen </li></ul><ul><li>Diese werden mit den Informationen aus Tracking oder Userbefragung kombiniert. </li></ul><ul><li>Der User wird in eine Gruppe kategorisiert </li></ul><ul><li>Als Ergebnis bekommt der Nutzer angepasste Webprofile </li></ul>
  35. 40. Strategien: Regelbasierte Systeme User Input Tracking System, Befragung Wissens basis Output lernen Interferenz maschine <ul><li>Wenn ein Kunde Babynahrung </li></ul><ul><li>bestellt, hat er ein Baby </li></ul><ul><li>Wenn er ein Baby hat </li></ul><ul><li>interessierter sich für .......... </li></ul><ul><li>usw. </li></ul>Marktforschung
  36. 41. Beispiele <ul><li>Personalisierte Websites </li></ul><ul><li>www . sapinfo . net </li></ul><ul><li>www . aol . com </li></ul><ul><li>www.yahoo. com </li></ul><ul><li>www.amazon. com </li></ul><ul><li>Dynamo Profile Station </li></ul><ul><li>Story Server </li></ul><ul><li>WebSell </li></ul><ul><li>Wisewire </li></ul><ul><li>AgentWare </li></ul><ul><li>Wichtige Unternehmen </li></ul><ul><li>Net Perceptions </li></ul><ul><li>Siebel Systems </li></ul><ul><li>Produkte </li></ul><ul><li>LearnSesame </li></ul><ul><li>Guestrack </li></ul><ul><li>Intelliweb </li></ul><ul><li>Firefly </li></ul><ul><li>MS-Siteserver </li></ul><ul><li>Objectstore </li></ul><ul><li>One-To-One </li></ul><ul><li>GroupLens </li></ul>
  37. 42. Quellen Übersichtsartikel Agentenbasiertes Suchen, Filtern und Klassifizieren von Informationsangeboten , Dipl. Kaufmann Frank Teuteberg, Preprint Europa Universität Viadrina Frankfurt Untersuchungen zur Personalisierung, Dipl.-Ing. Michael Sonntag, http://www.fim.uni-linz.ac.at/Publications/Aussendung10.98/Personalisierung.htm SWAMI, a framework for collaborative filetring algorithm development and evaluation , Danyel Fisher et al., University of Berkeley, http://epoch.cs.berkeley.edu:8000/~mct/f99/paper.html Seminar zur Personalisierung im Internet WS 00/01 , Universität Frankfurt, Lehrstuhl BWL , http://www.ecommerce.wiwi.uni-frankfurt.de:8080/lehre/00ws/seminar/seminararbeiten. html Viele Gesichter , c`t 2000, Heft 18, S88, Dietmar Janetzko, Dirk Zugemaier Wichtige Quelle für Forschungsarbeiten auf dem Gebiet des Collaborative Filtering: http://www.cs.umn.edu/Research/GroupLens/

×