SlideShare ist ein Scribd-Unternehmen logo
1 von 11
Downloaden Sie, um offline zu lesen
Technische Universität München
F. Prasser: Datenanonymisierung und Risikomanagement mit ARX
Dr. Fabian Prasser
Lehrstuhl für Medizinische Informatik
Institut für Medizinische Statistik und Epidemiologie
Klinikum rechts der Isar der TU München
Datenanonymisierung und
Risikomanagement mit ARX
fabian.prasser@tum.de
+49 89 4140 - 4328
Technische Universität München
F. Prasser: Datenanonymisierung und Risikomanagement mit ARX
15.03.2017 2
Motivation und Hintergrund
Wesentliche Anwendungsfälle
●
Sekundärdatennutzung: Insbesondere Routinedaten für die Forschung
●
Kollaborative Forschung: Data Sharing
Rolle des Datenschutzes
●
Einhaltung rechtlicher Vorgaben
●
Stärkung von Vertrauen, gesellschaftliche Akzeptanz
Dichotomie zwischen anonymen und personenbezogenen Daten
●
Personenbezogene Daten
●
Anonyme Daten
„Gesundheitsdaten“ gelten als besonders schützenswert
Wobei alle Mittel "die [...] wahrscheinlich genutzt werden" unter Bezug auf objektive
Faktoren, wie "Kosten [...] Zeitaufwand, [...] verfügbare Technologie und
technologische Entwicklungen" berücksichtigt werden müssen
[1] Verordnung (EU) 2016/679 des Europäischen Parlaments und des Rates vom 27. April 2016 zum Schutz natürlicher Personen bei der Verarbeitung
personenbezogener Daten, zum freien Datenverkehr und zur Aufhebung der Richtlinie 95/46/EG (Datenschutz-Grundverordnung)
[1]
[1]
Technische Universität München
F. Prasser: Datenanonymisierung und Risikomanagement mit ARX
15.03.2017
Herausforderungen
Grenze zwischen personenbezogenen und anonymen Daten ist fließend
●
Datenschutz ist ein Abwägungsprozess
●
Zentrale Herausforderung: Datenschutzrisiken vs. Nützlichkeit
●
Ziel: starke Reduktion des Risikos bei geringer Auswirkung auf die Nützlichkeit
●
Risikomanagement für Mikrodaten ist ein Baustein in einem Bündel von Maßnahmen
Sinnvolle
Maßnahmen
Risiko
Nützlichkeit
3
Originaldaten
Größtes Risiko
Keine Daten
Kein Risiko
Vergröberung
der Daten
Anonymisierung
Alle Daten in MDAT
Größtes Risiko
Keine Daten in MDAT
Kein Risiko
Verschieben
von Attributen
MDAT → IDAT
Pseudonymisierung
Technische Universität München
F. Prasser: Datenanonymisierung und Risikomanagement mit ARX
15.03.2017
ARX
4
Hintergrund
●
Software zur Analyse und Reduktion des Reidentifikationsrisikos strukturierter,
tabellarischer Daten
●
Methoden zur Messung und Reduktion von Risiken orientieren sich an
Empfehlungen für die medizinische Domäne
●
Für Datenanonymisierungslösungen besitzt die Software eine sehr intuitive
graphische Benutzeroberfläche und einen hohen Grad an Automatisierung
●
Schnittstellen zu gängigen Datenbanksystemen (MS SQL, DB2, SQLite, MySQL)
und Tabellenkalkulationen (MS Excel, CSV)
Literaturempfehlungen (Auszug)
●
George T. Duncan, Mark Elliot, Gonzalez Juan Jose Salazar. Statistical
Confidentiality - Principles and Practice. Springer. 2011.
●
Khaled El Emam. Guide to the De-Identification of Personal Health Information.
CRC Press, 2013.
Technische Universität München
F. Prasser: Datenanonymisierung und Risikomanagement mit ARX
15.03.2017
ARX: Perspektiven
5
Konfiguration
Q
ualitäts-
analyse
Exploration
R
isiko-
analyse
Technische Universität München
F. Prasser: Datenanonymisierung und Risikomanagement mit ARX
15.03.2017
ARX: Konfiguration
6
Beispielsweise
●
Risikogrenzwerte für verschiedene Arten von Angriffen
●
Wichtigkeit einzelner Variablen
●
Hintergrundwissen potentieller Angreifer
●
Informationen zur Gesamtpopulation
●
Transformationsmethoden und -regeln
Technische Universität München
F. Prasser: Datenanonymisierung und Risikomanagement mit ARX
ARX: Datentransformation
15.03.2017 7
Generalisierung
Unterdrückung
Mikroaggregation
Reduktion der Granularität potentiell identifizierender Variablen
Stichprobe
Top-/Bottom Coding
Technische Universität München
F. Prasser: Datenanonymisierung und Risikomanagement mit ARX
ARX: Risikoanalyse
15.03.2017 8
Verschiedene Modelle
●
Besonderer Fokus auf Re-Identifikation
●
Vorher/nachher Vergleiche
Technische Universität München
F. Prasser: Datenanonymisierung und Risikomanagement mit ARX
ARX: Qualitätsanalyse
15.03.2017 9
Mehrere Verfahren
●
Modelle für den Informationsgehalt
●
Deskriptive Statistik
●
Statistische Klassifikation
●
Vorher/nachher Vergleiche
Technische Universität München
F. Prasser: Datenanonymisierung und Risikomanagement mit ARX
ARX: Besonderheiten
15.03.2017 10
Umfangreiche Methodenunterstützung
●
Beispiel: 15 verschiedene Risiko-/Datenschutzmodelle
●
Verfügbar für alle wesentlichen Betriebssysteme (Windows, MacOS, Linux)
●
Graphisches Werkzeug und Programmierbibliothek
Hochskalierbar
●
Verarbeitung mehrerer Millionen Datensätze mit bis zu 50 potentiell identifzierbaren
Variablen auf Consumer Hardware
International erfolgreich
●
>20.000 Downloads seit 2012
●
EMA: External Guidance on the Implementation of the European Medicines Agency
Policy 0070 on the Publication of Clinical Data for Medicinal Products for Human Use
●
EU Agency for Network and Information Security (ENISA): Privacy and Data
Protection by Design
●
NIST Special Publication 800-188 (Draft): De-Identifying Government Datasets
Open Source Software
●
Lizenz: Apache 2
Technische Universität München
F. Prasser: Datenanonymisierung und Risikomanagement mit ARX
15.03.2017 11
Tel +49 89 4140-4328
Fax +49 89 4140-4850
fabian.prasser@tum.de
www.imse.med.tum.de
arx.deidentifier.org
Dr. rer. nat. Fabian Prasser
Klinikum rechts der Isar
Technische Universität München
Institut für Medizinische
Statistik und Epidemiologie
Ismaninger Str. 22
81675 Munich
Germany
Danke für Ihre Aufmerksamkeit!

Weitere ähnliche Inhalte

Andere mochten auch

Andere mochten auch (12)

Reciclajehospitalario 160829221040
Reciclajehospitalario 160829221040Reciclajehospitalario 160829221040
Reciclajehospitalario 160829221040
 
Matrix
MatrixMatrix
Matrix
 
Reciclajehospitalario 160829221040
Reciclajehospitalario 160829221040Reciclajehospitalario 160829221040
Reciclajehospitalario 160829221040
 
Anonymisierung und Risikomanagement mit ARX
Anonymisierung und Risikomanagement mit ARXAnonymisierung und Risikomanagement mit ARX
Anonymisierung und Risikomanagement mit ARX
 
Razonamiento verbal
Razonamiento verbalRazonamiento verbal
Razonamiento verbal
 
Mapa mental desarrollo humano
Mapa mental desarrollo humanoMapa mental desarrollo humano
Mapa mental desarrollo humano
 
Proyecto bloque 4
Proyecto bloque 4Proyecto bloque 4
Proyecto bloque 4
 
L’artista va a l’escola presentació març 2017
L’artista va a l’escola presentació març 2017L’artista va a l’escola presentació març 2017
L’artista va a l’escola presentació març 2017
 
El rol de las grandes represas en el Fondo Verde del Clima
El rol de las grandes represas en el Fondo Verde del ClimaEl rol de las grandes represas en el Fondo Verde del Clima
El rol de las grandes represas en el Fondo Verde del Clima
 
492 prontuario nr10
492 prontuario nr10492 prontuario nr10
492 prontuario nr10
 
Recuperacion desechos solidos_mspas
Recuperacion desechos solidos_mspasRecuperacion desechos solidos_mspas
Recuperacion desechos solidos_mspas
 
Slideshare
SlideshareSlideshare
Slideshare
 

Datenanonymisierung und Risikomanagement mit ARX

  • 1. Technische Universität München F. Prasser: Datenanonymisierung und Risikomanagement mit ARX Dr. Fabian Prasser Lehrstuhl für Medizinische Informatik Institut für Medizinische Statistik und Epidemiologie Klinikum rechts der Isar der TU München Datenanonymisierung und Risikomanagement mit ARX fabian.prasser@tum.de +49 89 4140 - 4328
  • 2. Technische Universität München F. Prasser: Datenanonymisierung und Risikomanagement mit ARX 15.03.2017 2 Motivation und Hintergrund Wesentliche Anwendungsfälle ● Sekundärdatennutzung: Insbesondere Routinedaten für die Forschung ● Kollaborative Forschung: Data Sharing Rolle des Datenschutzes ● Einhaltung rechtlicher Vorgaben ● Stärkung von Vertrauen, gesellschaftliche Akzeptanz Dichotomie zwischen anonymen und personenbezogenen Daten ● Personenbezogene Daten ● Anonyme Daten „Gesundheitsdaten“ gelten als besonders schützenswert Wobei alle Mittel "die [...] wahrscheinlich genutzt werden" unter Bezug auf objektive Faktoren, wie "Kosten [...] Zeitaufwand, [...] verfügbare Technologie und technologische Entwicklungen" berücksichtigt werden müssen [1] Verordnung (EU) 2016/679 des Europäischen Parlaments und des Rates vom 27. April 2016 zum Schutz natürlicher Personen bei der Verarbeitung personenbezogener Daten, zum freien Datenverkehr und zur Aufhebung der Richtlinie 95/46/EG (Datenschutz-Grundverordnung) [1] [1]
  • 3. Technische Universität München F. Prasser: Datenanonymisierung und Risikomanagement mit ARX 15.03.2017 Herausforderungen Grenze zwischen personenbezogenen und anonymen Daten ist fließend ● Datenschutz ist ein Abwägungsprozess ● Zentrale Herausforderung: Datenschutzrisiken vs. Nützlichkeit ● Ziel: starke Reduktion des Risikos bei geringer Auswirkung auf die Nützlichkeit ● Risikomanagement für Mikrodaten ist ein Baustein in einem Bündel von Maßnahmen Sinnvolle Maßnahmen Risiko Nützlichkeit 3 Originaldaten Größtes Risiko Keine Daten Kein Risiko Vergröberung der Daten Anonymisierung Alle Daten in MDAT Größtes Risiko Keine Daten in MDAT Kein Risiko Verschieben von Attributen MDAT → IDAT Pseudonymisierung
  • 4. Technische Universität München F. Prasser: Datenanonymisierung und Risikomanagement mit ARX 15.03.2017 ARX 4 Hintergrund ● Software zur Analyse und Reduktion des Reidentifikationsrisikos strukturierter, tabellarischer Daten ● Methoden zur Messung und Reduktion von Risiken orientieren sich an Empfehlungen für die medizinische Domäne ● Für Datenanonymisierungslösungen besitzt die Software eine sehr intuitive graphische Benutzeroberfläche und einen hohen Grad an Automatisierung ● Schnittstellen zu gängigen Datenbanksystemen (MS SQL, DB2, SQLite, MySQL) und Tabellenkalkulationen (MS Excel, CSV) Literaturempfehlungen (Auszug) ● George T. Duncan, Mark Elliot, Gonzalez Juan Jose Salazar. Statistical Confidentiality - Principles and Practice. Springer. 2011. ● Khaled El Emam. Guide to the De-Identification of Personal Health Information. CRC Press, 2013.
  • 5. Technische Universität München F. Prasser: Datenanonymisierung und Risikomanagement mit ARX 15.03.2017 ARX: Perspektiven 5 Konfiguration Q ualitäts- analyse Exploration R isiko- analyse
  • 6. Technische Universität München F. Prasser: Datenanonymisierung und Risikomanagement mit ARX 15.03.2017 ARX: Konfiguration 6 Beispielsweise ● Risikogrenzwerte für verschiedene Arten von Angriffen ● Wichtigkeit einzelner Variablen ● Hintergrundwissen potentieller Angreifer ● Informationen zur Gesamtpopulation ● Transformationsmethoden und -regeln
  • 7. Technische Universität München F. Prasser: Datenanonymisierung und Risikomanagement mit ARX ARX: Datentransformation 15.03.2017 7 Generalisierung Unterdrückung Mikroaggregation Reduktion der Granularität potentiell identifizierender Variablen Stichprobe Top-/Bottom Coding
  • 8. Technische Universität München F. Prasser: Datenanonymisierung und Risikomanagement mit ARX ARX: Risikoanalyse 15.03.2017 8 Verschiedene Modelle ● Besonderer Fokus auf Re-Identifikation ● Vorher/nachher Vergleiche
  • 9. Technische Universität München F. Prasser: Datenanonymisierung und Risikomanagement mit ARX ARX: Qualitätsanalyse 15.03.2017 9 Mehrere Verfahren ● Modelle für den Informationsgehalt ● Deskriptive Statistik ● Statistische Klassifikation ● Vorher/nachher Vergleiche
  • 10. Technische Universität München F. Prasser: Datenanonymisierung und Risikomanagement mit ARX ARX: Besonderheiten 15.03.2017 10 Umfangreiche Methodenunterstützung ● Beispiel: 15 verschiedene Risiko-/Datenschutzmodelle ● Verfügbar für alle wesentlichen Betriebssysteme (Windows, MacOS, Linux) ● Graphisches Werkzeug und Programmierbibliothek Hochskalierbar ● Verarbeitung mehrerer Millionen Datensätze mit bis zu 50 potentiell identifzierbaren Variablen auf Consumer Hardware International erfolgreich ● >20.000 Downloads seit 2012 ● EMA: External Guidance on the Implementation of the European Medicines Agency Policy 0070 on the Publication of Clinical Data for Medicinal Products for Human Use ● EU Agency for Network and Information Security (ENISA): Privacy and Data Protection by Design ● NIST Special Publication 800-188 (Draft): De-Identifying Government Datasets Open Source Software ● Lizenz: Apache 2
  • 11. Technische Universität München F. Prasser: Datenanonymisierung und Risikomanagement mit ARX 15.03.2017 11 Tel +49 89 4140-4328 Fax +49 89 4140-4850 fabian.prasser@tum.de www.imse.med.tum.de arx.deidentifier.org Dr. rer. nat. Fabian Prasser Klinikum rechts der Isar Technische Universität München Institut für Medizinische Statistik und Epidemiologie Ismaninger Str. 22 81675 Munich Germany Danke für Ihre Aufmerksamkeit!