Diese Präsentation wurde erfolgreich gemeldet.
Wir verwenden Ihre LinkedIn Profilangaben und Informationen zu Ihren Aktivitäten, um Anzeigen zu personalisieren und Ihnen relevantere Inhalte anzuzeigen. Sie können Ihre Anzeigeneinstellungen jederzeit ändern.
Kunstig intelligens
Perspektiver for sundhedssektoren
Dagens program
• 14:00 Velkommen og et par ord om kunstig intelligens
• 14:20 Introduktion til maskinlæring
• 15:00 LEGO-d...
3
Velkommen
4
Det er ønsket om at gøre danskerne til
det sundeste folk i verden, der er
drivkraften bag Enversion.
Læs mere på enversi...
5
FOKUS
6
7
Data mining
Prædiktiv modellering
Maskinlæring
Data science
Big data
Kunstig intelligens
Maskinintelligens
Ekspertsystem
8
9
http://www.knightscope.com/
10
https://www.youtube.com/watch?v=WFR3lOm_xhE
11
Enorme datamængder Begrænset baggrundsviden
Genial til specialopgaver Multikunstner
Intet ”hvorfor” Holdninger, fantasi...
12
http://content.time.com/time/magazine/article/0,9171,2048299,00.html
2015
13
14
http://aiimpacts.org/trends-in-the-cost-of-computing/
15
Introduktion til maskinlæring
16
17
18
RESULTAT
Kendte data
Blodprøvesvar
Køn, alder, herkomst
…
Kendte svar
Haft tarmkræft?
Træning
Anvendelse
Kendte data
Bl...
19
Attributter:
Eksisterende data,
der beskriver
objektets
forskellige
egenskaber.
(features)
Objektet:
Et eller andet,
ma...
20
Attributter:
Blodprøvesvar
Symptomer
Journalnotater
Mobiltelefonbrug
Google-søgninger
Rejsevaner
Netflix-præferencer
Kr...
21
Attributter:
Vægt
Dimensioner
Massefylde
Antal bøjelige led
Farve(r)
Antal enkeltdele
Produktionsår
Serienavn
Antal fik...
22
23
Attributter:
Blodprøvesvar
Symptomer
Journalnotater
Mobiltelefonbrug
Google-søgninger
Rejsevaner
Netflix-præferencer
Hv...
Find den ”funktion”, der bedst muligt…
24
1. Beskriver sammenhængen
mellem attributter og kendte
resultater for en række o...
Artsbestemmelse af iris
25
Iris setosa
Iris versicolor
+ Iris virginica
Attribut 1: Bredde af bægerblad
Attribut2:Breddeaf...
Regelstyring et hyppigt alternativ
26
IF ( (Blodprøvesvar1>0,5) AND
(Blodprøvesvar2<1,0 OR Blodprøvesvar3<0,5) )
{Diagnose...
27
To do-liste
1. Problemformulering
2. Løsningsmuligheder
3. Indsamling af relevante data
4. Klargøring af data
5. Teknisk m...
1. Problemformulering
29
Der er problemer med et stigende antal
reklamationer på vores LEGO-klodser.
Dette har betydelige ...
2. Løsningsmuligheder
30
Løsning: Byg algoritme, der kan ”teste”
en ny LEGO-klods, før den går i
produktion.
3. Indsamling af relevante data
31
4. Klargøring af data
32
+
4. Klargøring af data
33
5. Teknisk metodevalg
• Ønsket resultat: Klassifikation [JA/NEJ]
• Endeligt attributvalg:
• Modeltype:
• Optimeringskriter...
6. Evaluering af modeller
35
1
2
3
4
5
Model 1 Model 2 Model 3 Model 4 Model 5
1 2 3 4 5
Performance
model 1
Performance
m...
36
7. Implementering / aktiv læring
HUND!
KAT!
?
Will it
break?
38
Forfriskning og pause
39
Maskinlæring i sundhedssektoren
• Alle kontaktpunkter:
– Privatpraktiserende læge og vagtlæger
– Speciallæger
– Private og offentlige sygehuse
– Apoteker
...
Maskinlæringsnirvana…
41
Radiologisvar
Årligt: 700.000
Siden 2000: 11 millioner
Sundhedsfaglige registreringer (SFI)
Årlig...
• Alle kontaktpunkter:
– Badevægt
– Apple Watch
– Endomondo
– Blodtryksapparat
– Toilet
– Min DNA-profil
42
Egen viden om ...
Eller hvad med…
43
http://www.nature.com/nature/journal/v529/n7587/full/nature16521.html
44
Attributter:
Symptomer
Kliniske fund
Prøvesvar
Medicinprofil
Diagnoser
Genetikdata
Sygdom i familien
Vægt, højde, BMI
K...
Ustruktureret tekst
45
Tekstanalyse
46
Emnemærkning, konstruktion af attributter
Stemningsklassifikation
Watson for Oncology
47
Watson for Oncology
48
Google
49
http://googleresearch.blogspot.dk/2015/03/large-scale-machine-learning-for-drug.html
TeleSkin (skinScan)
50
Modernizing Medicine
51
https://www.modmed.com/ophthalmology/improve-outcomes/
Your.md
52
23andMe
53
23andMe
54
55
56
57
Krav:
Signifikant ”bedre”
resultat end ingen
screening.
”Bedre” målt som
livskvalitet,
økonomi, leveår,
…
Evidensbaseret beslutningsstøtte
• Skal vi operere eller medicinere?
• Er der en bedre medicinprofil?
• Hvilken type pacem...
59
Case: Prædiktion af genindlæggelser
Lidt om mig selv
• 24 år, lige flyttet til Aarhus
• Kandidatstuderende i Sundhedsteknologi på AAU,
mangler lige mit specia...
Baggrund for projektet
Genindlæggelsesrater er en kvalitetsparameter
• USA: Offentligt økonomisk tilskud til hospitaler på...
Hvorfor maskinlæring?
• Maskinlæring giver store fordele
• Viser de vigtigste attributter i forhold til genindlæggelser
• ...
Resultater
63
• Endeligt datasæt:
5,8 millioner forløb
• Opdeling af data til
træning og test af
model
• Præcision: Model
...
Diskussion og læring
• ”For grov” præprocessering
– Fjerner bestemte patientgrupper – ej den ”rigtige verden”
– Viden om d...
65
66
Afrunding og opsummering
Gode data
67
https://data.digitaliser.dk/alle
Gode værktøjer
68
Tilgængeligt i skyen, ingen installation
Brugervenligt / Amazon-kvalitet
Billigt (4 kr./time)
Uendeligt ...
God læsning
69
”…it is close to being the perfect guide
for the intelligent reader who, regardless
of whether s/he has a t...
God lytning
70
http://www.thetalkingmachines.com/
”… your window into the world of ML
… conversations with experts in the
...
God læring
71
Krav til gode samarbejdspartnere
72
VS
Krav til gode samarbejdspartnere
73
VS
Gode idéer?
74
Jacob Høy Berthelsen
jhb@enversion.dk
Thomas Schultz
tms@enversion.dk
Bo Thiesson
thiesson@enversion.dk
VI SES
Opfølgning
• Gense dagen på YouTube (Enversion-kanalen)
• Gense slides på SlideShare
• Hent LEGO-datasættet og WEKA...
Inge Lehmanns Gade 10
8000 Aarhus C
E-mail: info@enversion.dk
Telefon: +45 70 23 26 20
Tak (næsten) for i dag
77
Spørgsmål og svar
Nächste SlideShare
Wird geladen in …5
×

Machine learning og perspektiver for sundhedssektoren - Enversion A/S

1.651 Aufrufe

Veröffentlicht am

Teknologiens udvikling gør det i dag muligt at bygge systemer, der kan assistere f.eks. læger i at træffe den bedst mulige beslutning i en given situation. Systemer baseret på machine learning (et skridt på vejen mod kunstig intelligens) - kan overskue, bearbejde og finde mønstre i langt flere data end mennesket er i stand til. Se hele foredraget på YouTube: https://www.youtube.com/watch?v=hWdzCHOxJbM

Veröffentlicht in: Gesundheitswesen
  • Als Erste(r) kommentieren

Machine learning og perspektiver for sundhedssektoren - Enversion A/S

  1. 1. Kunstig intelligens Perspektiver for sundhedssektoren
  2. 2. Dagens program • 14:00 Velkommen og et par ord om kunstig intelligens • 14:20 Introduktion til maskinlæring • 15:00 LEGO-demonstration – ”Will it break”? • 15:30 Forfriskning og pause • 16:00 Maskinlæring i sundhedssektoren • 16:45 Afrunding og opsummering • 17:00 Spørgsmål og svar 2
  3. 3. 3 Velkommen
  4. 4. 4 Det er ønsket om at gøre danskerne til det sundeste folk i verden, der er drivkraften bag Enversion. Læs mere på enversion.dk eller følg os på Facebook, LinkedIn, Twitter
  5. 5. 5 FOKUS
  6. 6. 6
  7. 7. 7 Data mining Prædiktiv modellering Maskinlæring Data science Big data Kunstig intelligens Maskinintelligens Ekspertsystem
  8. 8. 8
  9. 9. 9 http://www.knightscope.com/
  10. 10. 10 https://www.youtube.com/watch?v=WFR3lOm_xhE
  11. 11. 11 Enorme datamængder Begrænset baggrundsviden Genial til specialopgaver Multikunstner Intet ”hvorfor” Holdninger, fantasi, etik, moral Sandsynligheder Intuition Ingen dårlige dage Performance afhænger af dagsform
  12. 12. 12 http://content.time.com/time/magazine/article/0,9171,2048299,00.html 2015
  13. 13. 13
  14. 14. 14 http://aiimpacts.org/trends-in-the-cost-of-computing/
  15. 15. 15 Introduktion til maskinlæring
  16. 16. 16
  17. 17. 17
  18. 18. 18 RESULTAT Kendte data Blodprøvesvar Køn, alder, herkomst … Kendte svar Haft tarmkræft? Træning Anvendelse Kendte data Blodprøvesvar Køn, alder, herkomst … Ønsket svar Tarmkræft?
  19. 19. 19 Attributter: Eksisterende data, der beskriver objektets forskellige egenskaber. (features) Objektet: Et eller andet, man gerne vil kunne udtale sig om, f.eks.: En borger Et modermærke Nogle symptomer En spillefilm En LEGO-klods En kunde Et journalopslag En fakturalinje … RESULTAT Gruppering: Tilhørsforhold til andre objekter. Anormalitetsdetektion: Afvigere (fra andre normale objekter). Klassifikation: Ønsket viden Kan ”puttes i kasser”. Regression: Ønsket viden Kan tælles.
  20. 20. 20 Attributter: Blodprøvesvar Symptomer Journalnotater Mobiltelefonbrug Google-søgninger Rejsevaner Netflix-præferencer Kreditkortbrug Hvilepuls og BMI Diagnoser Køn, alder, civilstand Lønindkomst KOMPLEKSEATTRIBUTTER RESULTAT Gruppering: Hvem minder han om? Anormalitetsdetektion: Er han et menneske? Klassifikation: Social bedrager? Kræftsyg? Dårlig betaler? Vinelsker? Regression: Forventet levealder? Livsløn? Risiko% for diabetes?
  21. 21. 21 Attributter: Vægt Dimensioner Massefylde Antal bøjelige led Farve(r) Antal enkeltdele Produktionsår Serienavn Antal fikspunkter Pigment(er) Hårdhed #solgte enheder SIMPLEATTRIBUTTER RESULTAT Gruppering: Klodstype? Anormalitetsdetektion: Er det en LEGO-klods? Klassifikation: Er den populær? Er den skrøbelig? Vil den flyde på vand? Er den farlig for børn? Regression: Brugtpris? Reklamationsrate? Maksimal stablingshøjde?
  22. 22. 22
  23. 23. 23 Attributter: Blodprøvesvar Symptomer Journalnotater Mobiltelefonbrug Google-søgninger Rejsevaner Netflix-præferencer Hvilepuls og BMI Diagnoser Køn, alder, civilstand Kreditkortbrug Lønindkomst RESULTAT Gruppering: Hvem minder han om? Anormalitetsdetektion: Er han et menneske? Klassifikation: Social bedrager? Kræftsyg? Dårlig betaler? Vinelsker? Regression: Forventet levealder? Livsløn? Body Mass Index? Risiko% for diabetes?
  24. 24. Find den ”funktion”, der bedst muligt… 24 1. Beskriver sammenhængen mellem attributter og kendte resultater for en række objekter. 2. Forudsiger (prædikterer) svaret for et ukendt objekt baseret på objektets attributter. Bedst muligt? • Hurtigst, billigst • Flest “sandt positive” og “sandt negative” • Færrest “falsk negative” og “falsk positive” Diagnose 1Diagnose 2 Diagnose 3
  25. 25. Artsbestemmelse af iris 25 Iris setosa Iris versicolor + Iris virginica Attribut 1: Bredde af bægerblad Attribut2:Breddeafkronblad Iris setosa 0 5 2 0 Iris versicolor
  26. 26. Regelstyring et hyppigt alternativ 26 IF ( (Blodprøvesvar1>0,5) AND (Blodprøvesvar2<1,0 OR Blodprøvesvar3<0,5) ) {Diagnose1} ELSE {Diagnose2} ;
  27. 27. 27
  28. 28. To do-liste 1. Problemformulering 2. Løsningsmuligheder 3. Indsamling af relevante data 4. Klargøring af data 5. Teknisk metodevalg 6. Træning af model 7. Implementering  Aktiv læring 28
  29. 29. 1. Problemformulering 29 Der er problemer med et stigende antal reklamationer på vores LEGO-klodser. Dette har betydelige konsekvenser for serviceomkostninger og kundeloyalitet.
  30. 30. 2. Løsningsmuligheder 30 Løsning: Byg algoritme, der kan ”teste” en ny LEGO-klods, før den går i produktion.
  31. 31. 3. Indsamling af relevante data 31
  32. 32. 4. Klargøring af data 32 +
  33. 33. 4. Klargøring af data 33
  34. 34. 5. Teknisk metodevalg • Ønsket resultat: Klassifikation [JA/NEJ] • Endeligt attributvalg: • Modeltype: • Optimeringskriterier: • Straf for modelkompleksitet: • Matematisk optimeringsmetode:
  35. 35. 6. Evaluering af modeller 35 1 2 3 4 5 Model 1 Model 2 Model 3 Model 4 Model 5 1 2 3 4 5 Performance model 1 Performance model 2 Performance model 3 Performance model 4 Performance model 5
  36. 36. 36 7. Implementering / aktiv læring HUND! KAT! ?
  37. 37. Will it break?
  38. 38. 38 Forfriskning og pause
  39. 39. 39 Maskinlæring i sundhedssektoren
  40. 40. • Alle kontaktpunkter: – Privatpraktiserende læge og vagtlæger – Speciallæger – Private og offentlige sygehuse – Apoteker – Kommunal hjemmepleje – Kommunale sagsbehandlere 40 Den offentlige sektors viden om Thomas
  41. 41. Maskinlæringsnirvana… 41 Radiologisvar Årligt: 700.000 Siden 2000: 11 millioner Sundhedsfaglige registreringer (SFI) Årligt: 100 millioner Siden 2011: 400 millioner Laboratoriesvar Årligt: 40 millioner Siden 2008: 225 millioner Medicinadministrationer Årligt: 13 millioner Siden 2004: 100 millioner Vævsprøveanalyser, mikrobiologi, registreringer af utilsigtede hændelser, logistikdata, indkøbsdata, økonomidata, personaledata, borger-stamdata, gendata, … §
  42. 42. • Alle kontaktpunkter: – Badevægt – Apple Watch – Endomondo – Blodtryksapparat – Toilet – Min DNA-profil 42 Egen viden om Thomas
  43. 43. Eller hvad med… 43 http://www.nature.com/nature/journal/v529/n7587/full/nature16521.html
  44. 44. 44 Attributter: Symptomer Kliniske fund Prøvesvar Medicinprofil Diagnoser Genetikdata Sygdom i familien Vægt, højde, BMI Køn, alder Civilstand KRAM-faktorer RESULTAT Gruppering: Borgersegment? Anormalitetsdetektion: Akutindsats påkrævet? Klassifikation: Medicinprofil OK? Bud på diagnose? Overlever indgreb? Bedste behandling? Regression: Livskvalitetsscore? Antal leveår? Omkostning/gevinst?
  45. 45. Ustruktureret tekst 45
  46. 46. Tekstanalyse 46 Emnemærkning, konstruktion af attributter Stemningsklassifikation
  47. 47. Watson for Oncology 47
  48. 48. Watson for Oncology 48
  49. 49. Google 49 http://googleresearch.blogspot.dk/2015/03/large-scale-machine-learning-for-drug.html
  50. 50. TeleSkin (skinScan) 50
  51. 51. Modernizing Medicine 51 https://www.modmed.com/ophthalmology/improve-outcomes/
  52. 52. Your.md 52
  53. 53. 23andMe 53
  54. 54. 23andMe 54
  55. 55. 55
  56. 56. 56
  57. 57. 57 Krav: Signifikant ”bedre” resultat end ingen screening. ”Bedre” målt som livskvalitet, økonomi, leveår, …
  58. 58. Evidensbaseret beslutningsstøtte • Skal vi operere eller medicinere? • Er der en bedre medicinprofil? • Hvilken type pacemaker er bedst? • Møder John til behandlingen? • Hvilke målinger bør jeg foretage? • Hvornår bør vi indkalde John? 58MASKINLÆRING PÅ KORT SIGT
  59. 59. 59 Case: Prædiktion af genindlæggelser
  60. 60. Lidt om mig selv • 24 år, lige flyttet til Aarhus • Kandidatstuderende i Sundhedsteknologi på AAU, mangler lige mit speciale • Forrige semester: Udlandsophold i Australien • Arbejde med genindlæggelsesmodeller 60
  61. 61. Baggrund for projektet Genindlæggelsesrater er en kvalitetsparameter • USA: Offentligt økonomisk tilskud til hospitaler på baggrund af genindlæggelsesrater [1] • DK: Kvalitetsparametre testes som supplement til afregningsgrundlaget [2] 61 Genindlæggelser er skidt for sundheden og samfundsøkonomien • Definition: Akut hospitalsindlæggelse 4 timer – 30 dage efter udskrivning • Reducér genindlæggelser?  Identificér højrisikopatienter • Intensiveret overgangspleje kan reducere risikoen for genindlæggelse [1] • DK: Bedre overgang fra regional til kommunal behandling i Danmark [1]: D. Kansagara et al: “Risk prediction models for hospital readmission: a systematic review,” Jama, vol. 306, no. 15, pp. 1688–1698, 2011. [2]: K.M. Pedersen: ”Økonomistyring i den offentlige sektor: Kvantitet, kvalitet og sammenhæng i opgaveløsningen”, no.2:2015
  62. 62. Hvorfor maskinlæring? • Maskinlæring giver store fordele • Viser de vigtigste attributter i forhold til genindlæggelser • Sandsynlighedsvurderer hver patient i forhold til risiko for genindlæggelse 62 • Nødvendighed: Uoverskueligt stort datasæt • 6,6 millioner unikke patienter • 25 millioner forløb • Administrative informationer om hvert forløb fra en 10-årig periode • Alder, køn, indlæggelse- og udskrivningstidspunkt, diagnosekoder m.m.
  63. 63. Resultater 63 • Endeligt datasæt: 5,8 millioner forløb • Opdeling af data til træning og test af model • Præcision: Model gætter rigtigt i 92,5% af tilfældene Vigtighed (1 = vigtigst) Attribut Uddybning 1. Overordnet diagnosekategori F.eks. ”kredsløbsforstyrrelse”, eller ”forstyrrelse i fordøjelsessystem” 2. Komorbiditets-indeks Score, som beskriver patientens sundhedstilstand på tværs af alle patientens nuværende sygdomme 3. Hospitalskode Unik kode for hvert hospital, f.eks. ”Hospital 1”, ”Hospital 2”.. 4. Alder i år 5. Henvist fra ”Praktiserende læge”, ”Akut”… 6. Henvist til ”Praktiserende læge”, ”Plejehjem”... 7. Køn ”Mand”, ”Kvinde”, ”Uvis”… 8. Indlæggelsestid i timer Under patientens nuværende forløb 9. Totalt antal af forløb Fra hele patientens sygehistorik 10. Afdelingstype F.eks. Onkologi, Dialyse eller Akutafsnit … … … 18 Udskrivningsmåde ”Udskrevet af hospital”, ”Død”..
  64. 64. Diskussion og læring • ”For grov” præprocessering – Fjerner bestemte patientgrupper – ej den ”rigtige verden” – Viden om dine data (populationen) er alfa og omega! • Model er ikke endeligt valideret på patienter i realtid • Sandsynlighed for genindlæggelse er ingen redning – Vi kan identificere patienter med høj risiko for genindlæggelse – Hvordan kan/skal denne information bedst udnyttes? 64
  65. 65. 65
  66. 66. 66 Afrunding og opsummering
  67. 67. Gode data 67 https://data.digitaliser.dk/alle
  68. 68. Gode værktøjer 68 Tilgængeligt i skyen, ingen installation Brugervenligt / Amazon-kvalitet Billigt (4 kr./time) Uendeligt skalérbart Gratis Open source Vi stiller LEGO-WEKA-filerne til rådighed Moderate datamængder Gratis Open source Omfattende men veldokumenteret Skalerer fornuftigt http://www.infoworld.com/article/2853707/machine-learning/11-open-source-tools-machine-learning.html
  69. 69. God læsning 69 ”…it is close to being the perfect guide for the intelligent reader who, regardless of whether s/he has a tech background, has a sincere desire to learn how the tools and principles of data science can be used to extract meaningful information from huge datasets.”
  70. 70. God lytning 70 http://www.thetalkingmachines.com/ ”… your window into the world of ML … conversations with experts in the field … discussions of industry news, and useful answers to your questions. ML is changing the questions we can ask of the world around us, here we explore how to ask the best questions and what to do with the answers.”
  71. 71. God læring 71
  72. 72. Krav til gode samarbejdspartnere 72 VS
  73. 73. Krav til gode samarbejdspartnere 73 VS
  74. 74. Gode idéer? 74 Jacob Høy Berthelsen jhb@enversion.dk Thomas Schultz tms@enversion.dk Bo Thiesson thiesson@enversion.dk
  75. 75. VI SES Opfølgning • Gense dagen på YouTube (Enversion-kanalen) • Gense slides på SlideShare • Hent LEGO-datasættet og WEKA-filer på enversion.dk • Se billeder fra dagen på Facebook • Følg os på LinkedIn, Twitter og Facebook • Connect med os på LinkedIn • Giv os feedback på tms@enversion.dk 75
  76. 76. Inge Lehmanns Gade 10 8000 Aarhus C E-mail: info@enversion.dk Telefon: +45 70 23 26 20 Tak (næsten) for i dag
  77. 77. 77 Spørgsmål og svar

×