21. Novartis‐GesundheitsforumBasel, 14. November 2018
Datenschutz für personalisierte Medizin
Prof. Jean‐Pierre HubauxAkademischer Direktor des Zentrums für digitales Vertrauen (C4DT)
PI des “Data Protection in Personalized Health“ Projektes Fakultät für Informatik und Kommunikation
EPFL
1
Bedeutung der personalisierten Medizin
1Bundesamt für Statistik2
In der Schweiz
Krebs • 317 000 diagnostizierte Fälle1• 16 000 Todesfälle pro Jahr1
Diabetes(KomplexeKrankheit)
• 500 000 Personen leiden an Diabetes.1• 50% davon wissen es nicht.• Verschiedene Diabetesformen
• Rund 500 000 Personen sind davon betroffen2
• Es gibt 7000 seltene Krankheiten (1/2000 Personen/Jahr).
Seltene Krank‐heiten
2https://www.rts.ch/info/sciences‐tech/2960210‐500‐000‐suisses‐souffrent‐d‐une‐maladie‐rare.html
Bessere Diagnose und Behandlung dank klinischen und genomischen Daten.
Es gibt über 150 genetische Marker für Diabetes.
80% dieser Krankheiten können dank der personalisierten Medizin erkannt werden.
Personalisierte Medizin: immer mehr erhobene und analysierte Daten, insbesondere mit künstlicher Intelligenz
Credits: Diana Coman Schmid, ETHZ3
Der Patient wird untersucht.
Seine Daten werden erhoben und gespeichert.
Es können Daten von Tausenden von Patientinnen und Patienten
gespeichert werden ...
... mit dem Ziel, die beste personalisierte Therapie zu finden
Wachsende Besorgnis: Verletzungenmedizinischer Daten
Etwa 5 erklärte Verstöße pro Woche, von denen jede mehr als 500 Personen betrifft.
https://ocrportal.hhs.gov/ocr/breach/breach_report.jsf
4
5
The Guardian,14. Mai 2017
WannaCry Ransomware
6
Angriffe bei unseren Nachbarn
Schutz medizinischer Daten
7https://m.lematin.ch/articles/5523fb7fab5c371dea000001
8. April 2015
Genomische Daten stellen besondereDatenschutzprobleme dar:• Sie sind von Natur aus identifizierend.• Sie können nicht geändert werden (imGegensatz zu Passwörtern).
• Sie enthalten sensible und persönlicheInformationen (genetische Krankheitenoder Neigung zur Entwicklungbestimmter Pathologien).
• Ihre Veröffentlichung kannEinzelpersonen einer genetischenDiskriminierung aussetzen.
• Auch Angehörige können betroffensein.
Was geschieht, wenn genomische Datenentwendet werden?
8
[Naveed et al.’15]
Unsere Strategie: Data Protection For PersonalizedHealth (DPPH) Project
• 5 Forschungsgruppen im ETH‐Bereich in Zusammenarbeit mit dem SDSC (Swiss Data Science Center)
• Finanzierung: 3 Millionen CHF• Dauer: 3 Jahre (4/2018 – 3/2021)• Finanzierungsprogramm: ETH PHRT (Personalized Health and RelatedTechnologies)
LCA1: Systeme für privatsphäre‐bewusstes Data
Sharing
DEDIS: Verteiltes und dezentrales
Vertrauen
GR‐JET: Grundlegende Kryptografie
Fellay Group: Medizinische Anwendung
SDSC: Datenwissenschaft,
‐infrastrukturund ‐bereitstellung
Health Ethics and Policy: Rechtliche und ethische
Analyse
Mission:• Effiziente personalisierte Medizin gewährleisten, durch Optimierung von Datenschutz, Nutzen und Ethik
• Angemessene Lösungen umsetzen, insbesondere für dieUnterstützung von KI / Machine Learning 9
Prof. Effy Vayena
Dr. Olivier Verscheure
Prof. Jacques Fellay Prof. DimitarJetchev
Prof. Bryan Ford
Data Protection for Personalized Health
10
BGI's DNA‐Sequenzierer in Shenzhen
In einigen Ländern sind Rechtsvorschriftenfür den Datenschutz viel zulässiger Sie können für die Auswertung medizinischer Daten viel schneller sein.
Wir werden eine Schlüsselrolle bei der Definition der Sicherheitsstandards von GA4GH spielen.
Swiss Personalized Health Network
Sicherheitsanforderungen für denDatenschutz der personalisierten Medizin
• Einen pragmatischen Ansatz verfolgen und schrittweise neue Schutzinstrumente einführen.
• Den unterschiedlichen Sensibilität der Daten Rechnung tragen.• Die Zugangsrechte sorgfältig verwalten. • Die Patientinnen und Patienten informieren und ihre Zustimmungeinholen.
11
Data Protection For Personalized Health
RDN: Regionaler Datenknotenpunkt (Regional Data Node)DCC: Datenkoordinationszentrum (Data Coordination Center)
BioMedIT RDN
BioMedIT RDN
BioMedIT RDN
BioMedIT RDN
BioMedIT RDN
SPHNDCC
Pflichtenheft‐ Interoperabilität ‐ Reproduzierbarkeit der Forschungsergebnisse
‐ Dezentralisierung‐ Gesicherter Datenzugang
Gesicherter und dezentralisierter Zugang zur kollaborativen Datenforschung
… …DPPH Blockchain
12
13
Clinical Site (CS)
Clinical Site (CS)Clinical Site
Was zeigt die Demo?
1. & 2.
1.
2.
3.
4.
Jeder CS verschlüsselt und speichert seine Daten lokal.
0.
3.
5.
4.
5.
0.
Clinical Site (CS)
Clinical Site
0.
0.
0.
0.
Querier/Researcher
Node
Node
Der Fragesteller holt die genomischen IDs(numerische Darstellung für eine genomischeVariante), die seiner Anfrage entsprechen.Sowohl die genomischen IDs als auch die klinischen Attribute (z.B. Kutanes Melanom = TRUE) werden verschlüsselt.Die Abfrage wird an einen Knoten gesendet(z.B. der zu einem CS oder einer anderen Entitätgehören kann). Die Abfrage wird an die anderen Knoten verteilt. Die verschlüsselten Werte werden mit den Werten in den Datenbanken der einzelnen CSs abgeglichenDie Ergebnisse, die noch verschlüsselt sind, werden an den Fragesteller gesendet, der sie entschlüsseln kann.
MedCo Demo
https://drive.switch.ch/index.php/s/PAc5ZSnlmlguz83
14
DCC: Data Coordination Center
ITNode
ITNode
ITNode
ITNode
ITNode
DCC
DPPH ‐ Die Rolle der Blockchain
15
… …
DPPH Blockchain
Inference resistance
Provenance and Reproducibility
Immutable Log
Big Data Platform
Distributed Access Control
Distributed Privacy‐conscious Processing
Veranstaltungen zum ThemaSicherheit Genomdaten
• Dagstuhl seminars on genome privacy and security 2013, 2015 • Conference on Genome and Patient Privacy (GaPP)
• March 2016, Stanford School of Medicine• GenoPri: International Workshop on Genome Privacy and Security
• July 2014: Amsterdam (co‐located with PETS)• May 2015: San Jose (co‐located with IEEE S&P)• November 12, 2016: Chicago (co‐located with AMIA)• October 15, 2017: Orlando (co‐located with Am. Society
for Human Genetics (ASHG) and GA4GH) • October 3, 2018, Basel (co‐located with GA4GH)
• iDash: integrating Data for Analysis, Anonymization and sHaring(already in previous years)• October 14, 2017: Orlando
• Inst. For Pure and Applied Mathematics (IPAM, UCLA)Algorithmic Challenges in Protecting Privacy for Biomed Data10‐12 January, 2018
• DPPH Workshop, 15 February 2018
Viel Material online 16DPPH18.epfl.ch
“genomeprivacy.org”
Community‐Website• Durchsuchbare Liste von Publikationen zum Thema Sicherheit Genomdaten• Nachrichten aus den wichtigsten Medien (Wissenschaft, Natur, GenomeWeb, etc.)• Forschungsgruppen und beteiligte Unternehmen• Tutorial und Tools• Veranstaltungen 17
c4dt.org
Schlussfolgerungen
• Vertraulichkeitmedizinischer Daten ist weltweit gefährdet.• Personalisierte Medizin stützt sich auf immense Datenmengen (darunter Genomdaten).• KI benötigt ein vernünftiges Data Management.•Wir fördern eine dezentralisierte Architektur für Skalierbarkeit und Vermeidung von single points of failure.• Das Projekt Data Protection for Personalized Health stellt im Hinblick auf den Austausch der medizinischen Daten im Rahmen des SPHN‐Projekts ein Schlüsselelement dar.
Projekt: https://dpph.chTool: https://medco.epfl.ch 19