Usage and impact of controlled vocabularies in a subject repository for index...
Datenschutz für Bibliotheksanwendungen
1. Bibliotheken im Spannungsfeld zwischen
Nutzungsmessung und Datenschutz
an Lüth, Dr. Timo Borst
T-Entwicklung
BW - Deutsche Zentralbibliothek für Wirtschaftswissenschaften
eibniz-Informationszentrum Wirtschaft
00. DEUTSCHER BIBLIOTHEKARTAG
erlin, 08.06.2011
2. chwerpunkte des Vortrages
Technischer Überblick über die automatische Erhebung von
Nutzungs daten
Basics der Nutzungsmessung / Webanalytics
Datenschutzaspekte
3. Angebote von Bibliotheken im WWW
Website
Online Public Access Catalog (OPAC)
Fachportal
Repository
E.Journal
E-Books
Apps
Social Media
Linked Open Data (LOD)
4. Datenerhebung Nutzerdaten
ienst erbringen
Versand eines Newsletter
Alerting per Email
brechnung / Bezahlung
Dokumentenlieferung
E-Books
ersonalisierung
Login, Präferenzen
Nutzungsverhalten
5. Datenerhebung Nutzungsdaten (automatisch)
echnischer Betrieb
Dokumentation von Angriffen
Technische Optimierung
haltliche Optimierung des Angebots
Seitenstruktur, Layout
Suchmaschinen Optimierung (SEO)
arketing / Controlling
Wirkung von Marketing-Aktivitäten (z.B. Roadshow)
Auswertung von Kampagnen
Zielerreichung (z.B. Download nach Rechercheprozess)
atenbasis für eigene Dienste
Suchmaschinen: Empfehlungs-Dienste, Ranking
6. Nutzungsmessung Webseiten
Abrufe aller Objekte (Hits)
Anzahl der Besuche (Visits)
Anzahl der Besucher (Unique Visitors)
Wiederkehrende Besucher
Dauer der Besuche (Session) Traffic Metriken
Seitenabrufe (Pageviews)
pro Seite
insgesamt
pro Besuch
Metriken bezogen auf Zeitraum z.B. pro Tag / Woche / Monat
7. Nutzungsmessung Webseiten
Nutzer-Interaktion während eines Besuchs
Einstiegsseite, Ausstiegsseite
Landingpages
Klickpfade
Aufruf definierter Objekte (z.B. Bannerwerbung)
Heatmaps
Klickmaps
8. Nutzungsmessung Webseiten
Referer (Verweise auf das aufgerufene Objekt)
Internetsuchmaschinen Keywords
Herkunft der Besucher (Land / Region / Stadt)
Hardware
Betriebssysteme
Software
Plugins
Bildschirmauflösung
9. Nutzungsmessung
ibliothekssuchmaschine, OPAC, Repositorien
Suchterme
Verwendete Parameter
Verwendung verschiedener Sucheinstiege
Verwendung von Facetten/Drill-Downs
Trefferansichten
Ansichten von Volltexten
Ansichten von Abstracts Erfolgs Metriken
Heruntergeladene Dokumente (Downloads)
Granulare Details Dimension (z.B. Seite Titel)
11. Webserver-Logfiles
Protokollierung aller Anfragen an den Webserver
Webseiten, Grafiken, PDF-Dateien, Seiten-Stylesheets etc.
Anfragen auf nicht vorhandene Objekte
Dokumentieren zeilenweise jede Anfrage eines Objektes
Server nimmt die Protokollierung vor
Basis für eine Auswertung mit entsprechenden Analyse-Tools
16. ogfile-Analyse: Bsp. Geolokalisation
134.245.94.1
Ort der IP Adresse: Kiel
ISP: Universitaet Kiel
188.108.121.1-255
Ort der IP Adresse: Eschborn / Germany
ISP: Arcor AG
188.108.255.1-255
Ort der IP Adresse: Hannover / Germany
ISP: Arcor AG
nicht immer identisch mit dem tatsächlichen Standort z.B. UMTS
DSL (dynamische IP-Vergabe)
17. ogfile-Analyse: Software
ostenlose Lizenz
Webalizer (http://webalizer.com/)
AW-Stats (http://awstats.sourceforge.net/)
Demo:
http://www.nltechno.com/awstats/awstats.pl?config=destailleur.fr
…
selbst entwickelte Software-Scripte
18. Webserver-Logfiles: Vorteile
Automatisch auf dem eigenen Webserver verfügbar
Kostenlose Tools für Auswertung
http-Statuscodes insbes. Fehlercodes
Protokollierung von Robots
19. Webserver-Logfiles: technische Grenzen
IP-Adresse/Hostname nicht immer aussagekräftig bzw. eindeutig
Router (Network Address Translation NAT)
Proxy-Server (Zwischenspeicher)
während einer Session wechselnde IP-Adressen (Bsp. AOL)
Robots müssen gefiltert werden
Webbrowser / Software
Referer und User-Agent manipulierbar (SPAM)
Verwendung paralleler Tabs
Eingeschränkte Detail-Analyse
Keine Ergebnisse in “Echtzeit“
20. Nutzer-Tracking
Einbindung einer 1x1 Pixel großen Grafik (Zählpixel)
im <body> jeder Webseite
vor dem Content / hinter dem Content
Einbindung als <img …> mit JavaScript
alternativ <noscript>…
Client-PC liefert Informationen an Tracking-Server
33. Trichteranalyse / Erreichen von Zielen
Wieviele Nutzerinnen erreichen den jeweiligen und nachfolgenden
Schritt
Ziel (Konversion): Ausleihe / Dokumentlieferung / Download
34. Nutzer-Tracking: Vorteile
Suchmaschinen-Robots laden i.d.R kein JavaScript und keine
Grafiken
Höhere Genauigkeit
Browser-Cache, Proxies
Identifikation der Nutzer über Cookies
Je nach Nutzerkreis 90%-99%
Erfassung der Referer
Informationen über die Technik der Nutzer-PC
Tools vereinen Erfassung und Analyse
35. Nutzer-Tracking: technische Grenzen
Code muss in Webseiten integriert werden
Erfassung erst dann möglich
Hoher Aufwand / Schulung erforderlich
(abhängig von den vorzunehmenden Auswertungen)
Nachladen von Teilen der Webseiten (AJAX)
keine Protokollierung von HTTP-Fehlern
Webbrowser / Software
User-Agent manipulierbar
Verwendung paralleler Tabs
Ungenauigkeiten bleiben
Offline-Browser
36. Nutzer-Tracking: Software
Google Analytics
Yahoo Web Analytics
Piwik
etracker
VW*
…
W = Informationsgemeinschaft zur Feststellung der Verbreitung von Werbeträgern
afik: http://www.idealobserver.com/tools/web-analyse/wer-nutzt-welches-tool/web-analytics-systeme-der-top-domains-april2011
37. Vergleich Logfile-Analyse vs. Tracking
Logfile Analyse Tracking
ogfiles automatisch vorhanden Erfassung nach Integration des Codes
rotokollierung von Robots (Nahezu) keine Zugriffe von Robots
rowser-Cache und Proxy-Server Kein Zwischenspeichern des Tracking-
erhindern Zählung aller Zugriffe Pixels
dentifikation des Nutzers über die Identifikation des Nutzers via Tracking-
P-Adresse ungenau ID / Cookies relativ genauer
infache Generierung von Zahlen Komplexe Auswertung möglich
primär Traffic-Metriken) (Traffic- und Erfolgs-Metriken)
38. Webanalytics
Was wollen Sie messen?
Hypothese Überprüfung an Hand von Reports
Trends / Charts Beobachtung von Kennzahlen
Ziele / Erfolgskriterien
Wie wollen Sie messen?
Reicht ein Tracking-Tool?
Ggf. Kombination z.B. mit Application-Logfiles
Welche Konsequenzen wollen Sie ziehen?
Layout, Design, Seitenstruktur, Inhalte
Strategie, Produkte, Marketing
Nutzung Bestandsentwicklung, Dienstleistungen
39. Webanalytics - Vergleichbarkeit
ein Tool liefert 100% genaue Zahlen sondern lediglich Trends!
Mangelnde Vergleichbarkeit Bsp: Fachportal
Inhalte (Volumen / Fachlich)
Seitenstruktur
Zielgruppe
Zahlen abhängig vom verwendeten Tool
Z.B. Konfiguration, Sessiondauer, Robot Listen / Erkennung
Tracking-Lösungen relativ dicht beieinander (z.B. IVW / etracker)
Vergleichbarkeit Repositorien
COUNTER (http://www.projectcounter.org/)
Open-Access-Statistik (http://www.dini.de/projekte/oa-statistik/)
40. Webanalytics
Verwenden Sie Besuche (Visits) als globalen Maßstab
Pageviews sind kaum aussagekräftig
AJAX
Seitenstruktur
Verwenden Sie ein Tool mit pixelbasiertem Tracking für die
Erfolgsmessung
Werten Sie ohne persönliche oder personenbezogene Daten aus
Problematisches Datum ist die IP-Adresse
41. Webanalytics
Technisch
Application Service Providing (ASP) oder Eigeninstallation
Integration in die Webseiten
Organisatorisch
Planen Sie Personal ein
Technisches Verständnis
Produkt-Affinität
Analytisch
Kommunikativ
Webanalytics ist ein laufender Prozess – Generierung
automatischer Reports löst keine Probleme
42. Rechtliche Rahmenbedingungen
Beschränkung der Betrachtung auf Deutschland
Server / Sitz der Institution in Deutschland
Nutzer in Deutschland
Deutsches Recht findet Anwendung
Informationelle Selbstbestimmung (Rechtsprechung BVerfG)
Selbstbestimmte Verwendung personenbezogener Daten
Bundesdatenschutzgesetz BSDG
Telemediengesetz TMG
43. undesdatenschutzgesetz BDSG
§ 1 Zweck und Anwendungsbereich des Gesetzes
Persönlichkeitsrechte des Einzelnen beim Umgang mit seinen
personenbezogenen Daten schützen
§ 3 Abs. 1 Personenbezogene Daten
Angaben über bestimmte oder bestimmbare natürliche Person
§3a Datenvermeidung und Datensparsamkeit
So wenig personenbezogene Daten wie möglich erheben,
verarbeiten, nutzen
Wenn möglich, personenbezogene Daten anonymisieren oder
pseudonymisieren Erstellung anonymer Profile zulässig
§ 3 Abs. 6 Daten Anonymisierung
Keine Zuordnung der Daten zur Person mehr möglich
44. undesdatenschutzgesetz BDSG
§ 3 Abs. 6 Anonymisierung
Verändern personenbezogener Daten derart, dass die
Einzelangaben über persönliche oder sachliche Verhältnisse nich
mehr oder nur mit einem unverhältnismäßig großen Aufwand an
Zeit, Kosten und Arbeitskraft einer bestimmten oder bestimmbare
natürlichen Person zugeordnet werden können
§ 3 Abs. 6a Pseudonymisierung
Ersetzen des Namens und anderer Identifikationsmerkmale durch
ein Kennzeichen zu dem Zweck, die Bestimmung des Betroffenen
auszuschließen oder wesentlich zu erschweren
45. undesdatenschutzgesetz BDSG
§ 11 Auftragsdatenverarbeitung
10 individuelle vertragliche Regelung bei Datenerfassung durch
Dienstleister oder Erfüllung durch AGB des Dienstleisters
46. Datenschutzaufsicht in Deutschland
Öffentliche Stellen Bund
Bundesdatenschutzbeauftragter
Öffentliche Stellen Länder
Landesbeauftragte für den Datenschutz
Betrieblicher Datenschutzbeauftragter
Hinwirken auf die Einhaltung des BDSG etc.
diesbezüglich Vorschlagsrechte
Kontrolle der Einhaltung des BDSG
ndesbeauftragte für den Datenschutz und die Informationsfreiheit - http://www.bfdi.bund.de
Datenschutzbeauftragten der Länder -
p://www.bfdi.bund.de/DE/AnschriftenUndLinks/Landesdatenschutzbeauftragte/AnschriftenLandesdatenschutzbeauftragte.html?nn=408930
47. Telemediengesetz TMG
Daten zur Durchführung eines Telemediendienstes
§ 15 Nutzungsdaten Abs. 1
Erheben und Verwenden personenbezogene Daten eines Nutzers
nur soweit dies erforderlich ist, um die Inanspruchnahme von
Telemedien zu ermöglichen und abzurechnen
Nutzungsdaten sind insbesondere
1. Merkmale zur Identifikation des Nutzers,
2. Angaben über Beginn und Ende sowie des Umfangs der
jeweiligen Nutzung und
3. Angaben über die vom Nutzer in Anspruch genommenen
Telemedien
48. Telemediengesetz TMG
§ 15 Nutzungsdaten Abs. 3
Pseudonymisierte Verarbeitung zulässig für Marktforschung,
bedarfsgerechte Gestaltung
Nutzer hat Widerspruchsrecht
Pseudonymisierte Daten dürfen nicht mit anderen Daten
„personifiziert“ werden
§ 12 Abs. 1
Erhebung und Verwendung personenbezogender Daten zulässig
wenn Nutzer zustimmt
49. P-Adresse ein personenbezogenes Datum?
atenschützer sehen die IP-Adresse als personenbezogenes Datum
Pro-Argumente Contra-Argumente
Internet Service Provider kann - Nur der ISP kann die IP-
die verwendete IP-Adresse Adresse einer Person zuordne
einer Person zuordnen
Von einer Erfassung muss - ISP erfasst u.U. die Identität ga
ausgegangen werden nicht
Betreiber kann dies u.U. in
Verbindung mit Sign-In- Deutschland: Düsseldorfer Kreis
http://de.wikipedia.org/wiki/D%C3%BCsseldorfer_Kreis
Diensten EU: Artikel-29-Datenschutzgruppe
http://de.wikipedia.org/wiki/Artikel-29-Datenschutzgruppe
50. azit für die Nutzungsmessung
Den Betroffenen ist eine Möglichkeit zum Widerspruch gegen die
Erstellung von Nutzungsprofilen einzuräumen. Derartige
Widersprüche sind wirksam umzusetzen.
Die pseudonymisierten Nutzungsdaten dürfen nicht mit Daten über
den Träger des Pseudonyms zusammengeführt werden. Sie müsse
gelöscht werden, wenn ihre Speicherung für die Erstellung der
Nutzungsanalyse nicht mehr erforderlich ist oder der Nutzer dies
verlangt.
elle: Datenschutzkonforme Ausgestaltung von Analyseverfahren zur Reichweitenmessung bei Internet-Angeboten
p://www.bfdi.bund.de/SharedDocs/Publikationen/Entschliessungssammlung/DuesseldorferKreis/Nov09Reichweitenmessung.pdf
51. azit für die Nutzungsmessung
Auf die Erstellung von pseudonymen Nutzungsprofilen und die
Möglichkeit zum Widerspruch müssen die Anbieter in deutlicher
Form im Rahmen der Datenschutzerklärung auf ihrer Internetseite
hinweisen.
Personenbezogene Daten eines Nutzers dürfen ohne Einwilligung
nur erhoben und verwendet werden, soweit dies erforderlich ist, um
die Inanspruchnahme von Telemedien zu ermöglichen und
abzurechnen. Jede darüber hinausgehende Nutzung bedarf der
Einwilligung der Betroffenen.
elle: Datenschutzkonforme Ausgestaltung von Analyseverfahren zur Reichweitenmessung bei Internet-Angeboten
p://www.bfdi.bund.de/SharedDocs/Publikationen/Entschliessungssammlung/DuesseldorferKreis/Nov09Reichweitenmessung.pdf
52. azit für die Nutzungsmessung
Die Analyse des Nutzungsverhaltens unter Verwendung
vollständiger IP-Adressen (einschließlich einer Geolokalisierung) ist
aufgrund der Personenbeziehbarkeit dieser Daten daher nur mit
bewusster, eindeutiger Einwilligung zulässig. Liegt eine solche
Einwilligung nicht vor, ist die IP-Adresse vor jeglicher Auswertung so
zu kürzen, dass eine Personenbeziehbarkeit ausgeschlossen ist.
elle: Datenschutzkonforme Ausgestaltung von Analyseverfahren zur Reichweitenmessung bei Internet-Angeboten
p://www.bfdi.bund.de/SharedDocs/Publikationen/Entschliessungssammlung/DuesseldorferKreis/Nov09Reichweitenmessung.pdf
53. azit für die Nutzungsmessung
Persönliche / personenbezogene Daten nur nach Einwilligung
erheben
Möglichkeiten zum Widerspruch anbieten
Bsp. Opt-Out
Anonymisierung der IP-Adresse innerhalb von 7 Tagen
IP Adresse 192.168.1.17
2 bytes löschen 192.168.x.x
md5 hash (ip) 82fd59f7976a70014fd7fbe773fe72c1
Unzureichend weil der Adressraum begrenzt ist
md5 hash (ip+salt) 393f84a8499cadfcfef054e349beedcd
abhängige Landeszentrum für Datenschutz Schleswig-Holstein (ULD): FAQ IP-Adressen und andere Nutzungsdaten
ps://www.datenschutzzentrum.de/ip-adressen/
54. azit für die Nutzungsmessung
Datenschutzerklärung, Policy verfassen
Datensparsamkeit
Vertragliche Regelung mit Dienstleister treffen, wenn AGB nicht
ausreichend
55. Google Analytics legal nutzbar?
erzeit ist Google Analytics in Deutschland nicht legal nutzbar.
Pro-Argumente Contra-Argumente
Eigenes Opt-Out könnte - Widerspruch/Opt-Out nur durch
programmiert werden Browserspezifisches Plug-In
Die IP-Adresse kann gekürzt - Die IP-Adresse wird zuvor in di
werden _anonymizeIp() USA übermittelt
- Unklar ob gesammelte Daten
gelöscht werden können
- (Vertraglich zu regelnde)
ellungnahme des ULD:
tenschutzrechtliche Bewertung des Einsatzes von Google Analytics Unklarheiten
ps://www.datenschutzzentrum.de/tracking/20090123_GA_stellungnahme.pdf
56. eispiel Service Policy / Datenschutzerklärung
Anonyme Datenerhebung
Anonyme Nutzung ist möglich
Erhebung und Verarbeitung personenbezogener Daten
Freiwillig, z.B. für Newsletter
Nutzung und Weitergabe personenbezogener Daten
Mit Einwilligung, Widerruf möglich
Bearbeitung der Anfragen ,Werbung, Optimierung des
Angebotes
keine Weitergabe an Dritte
Export und Verarbeitung von Daten in Staaten außerhalb des
Europäischen Wirtschaftsraumes
Questionpoint (USA, 90 Tage)
57. eispiel Service Policy / Datenschutzerklärung
Cookies
Zweck, Möglichkeit der Deaktivierung
Webanalytics
Marketing- und Optimierung
Pseudonyme Nutzungsprofile
Keine persönliche Identifikation / Personifizierung
Widerspruchsmöglichkeit
http://www.etracker.de/privacy?et=b9xWmg
Externe Links
Kein Einfluss auf den Inhalt
onBiz – Datenschutz http://econbiz.de/index.php?id=privacy
60. Quellen
ruppe für den Schutz natürlicher Personen bei der Verarbeitung
ersonenbezogender Daten: Privatsphäre im Internet - Ein integrierter
U-Ansatz zum Online-Datenschutz . Brüssel 2000
ttp://ec.europa.eu/justice/policies/privacy/docs/wpdocs/2000/wp37de
df
rtikel-29-Datenschutzgruppe: Stellungnahme 4/2007 zum Begriff
personenbezogene Daten“. Brüssel 2007
ttp://ec.europa.eu/justice/policies/privacy/docs/wpdocs/2007/wp136_
pdf
61. Quellen
üsseldorfer Kreis: Datenschutzkonforme Ausgestaltung von
nalyseverfahren zur Reichweitenmessung bei Internet-Angeboten.
tralsund 2009
ttp://www.bfdi.bund.de/SharedDocs/Publikationen/Entschliessungssa
mlung/DuesseldorferKreis/Nov09Reichweitenmessung.pdf
tellungnahme des ULD: Datenschutzrechtliche Bewertung des
insatzes von Google Analytics
ttps://www.datenschutzzentrum.de/tracking/20090123_GA_stellungn
me.pdf
62. Quellen
amit: Xamit-Studie: Webstatistiken im Test – Welcher Dienst ist in
eutschland legal? Düsseldorf 2010
ttp://www.xamit-
istungen.de/downloads/XamitStudieWebstatistikenimTest.pdf
nabhängige Landeszentrum für Datenschutz Schleswig-Holstein
ULD): https://www.datenschutzzentrum.de/
63. Quellen
Amthor, Brommund:
Mehr Erfolg durch Webanalytics.
München, 2010
http://www.hanser.de/buch.asp?isbn=978-3-446-42139-4