Crowdsourcing Genome
Wide Association Studies
Bastian Greshake / @gedankenstuecke
Ein kurzer Reminder
zum menschlichen
Genom
Genomics 101
•Geschrieben in einemVierbuchstaben
Alphabet (A,T,G,C)
•ca. 3,5 Milliarden Buchstaben lang
•Liegt in doppelter Kopie vor (Mom & Dad)
•~ 1 Buchstabe in 1000 ist variabel zwischen
Menschen
SNPs?
Single Nucleotide
Polymorphisms
Alice: …ATGTAGACGATAGC…
Bob: …ATGTAGAGGATAGC…
Carol: …ATGTAGACGATAGC…
SNPs
•Grundlage für Gentests
wie von 23andMe etc.
durchgeführt.
•Kommerzielle Gentests
schauen sich zwischen
600.000 und 1 Mio
solcher Positionen an
Und Jetzt?
Genome Wide
Association Studies
GWAS
GWAS
GWAS
GWAS
Masters of The Sample
Universe
‘By the statistical power
of Grayskull…’
Open Data und Personal
Genomics bislang
UnserVorschlag:
•Eine Anlaufstelle
•die durchsuchbar ist
•auch Phenotypen
sammelt
•bei der User erreichbar
sind
•die Zugriff auf die Daten
per APIs bietet
Und für User die ihre
Daten teilen?
•Durchsuchen von Annotationsdatenbanken
zu aktuellen Informationen zu dem eigenen
Genom
•Visualisierung des Genoms
•Kontaktmöglichkeiten zu anderen Benutzern,
gerade bei Rare Diseases spannend
Weitere Phänotypen-
Arten
•Fitbit-API
•Foto-Uploads
•In Zukunft ggf.
weitere APIS (Nike+,
Jawbone UP, …)
Zugriff auf die Daten
•JSON-API
•Distributed Annotation System (e.g. Genome
Browser)
•Kompletter Dump als ZIP
•Daten lizensiert unter CC0
Datenbestand
•Aktuell:
•> 800 Gen-Datensätze
•> 200 Phänotypen/
Eigenschaften abgefragt
•> 1500 User
UnserTeam
Samantha Clark
Julia Reda
@senficon
Johannes Gutenberg University,
Mayence
@eltonjohn
University ofToronto, Canada
Helge Rausch
@helgerausch
University of Applied Science for
Technology and Economy,
Berlin
Philipp Bayer
@PhilippBayer
University of Queensland, Brisbane
Vielen Dank!
• Code: https://github.com/gedankenstuecke/snpr (MIT
License, Hilfe gern gesehen)
• Paper: http://dx.doi.org/10.1371/journal.pone.0089204
• Kontakt:
• info@ .org
• @openSNPorg / @gedankenstuecke
• +49 176 213 044 66

openSNP - QS Cologne Meetup