SlideShare ist ein Scribd-Unternehmen logo
1 von 10
Downloaden Sie, um offline zu lesen
La validazione esterna dei
modelli prognostici
Cosa è?
Che tipi di
validazione
esterna ci sono?
Perché è cruciale per
l’implementazione
clinica di modelli
predittivi accurati?
Come si conduce
correttamente uno
studio di validazione
esterna?
Quando è appropriato
validare esternamente
un modello?
Quali fattori
dovrebbero essere
considerati nel
selezionare una
popolazione di
validazione adatta?
La validazione interna usa i soggetti della popolazione usata per lo sviluppo
del modello.
Le forme di validazione interna più usate sono:
🔹Split-sample
🔹Cross-validation
🔹Bootstrapping
La validazione temporale consiste nella divisione temporale di una singola
coorte.
La validazione esterna è l’atto di testare il modello predittivo su un set di
nuovi soggetti per determinare se il modello funziona ad un livello
soddisfacente. I soggetti devono differire strutturalmente da quelli della
coorte iniziale (regione o paese diverso, setting di cura diverso ecc.).
🔴
🔴
🟦
🔴
La formula della predizione è
cucita sui dati per lo sviluppo del
modello
Un modello può essere
scarsamente predittivo
in una coorte esterna
I modelli predittivi possono
accidentalmente essere adattati
ad idiosincrasie del dataset o
corrispondervi troppo da vicino
(overfitting).
È importante testare la
riproducibilità e la
generalizzabilità dei
modelli predittivi
Riproducibilità: La formula della
predizione è valida per nuovi
individui che sono simili alla
popolazione iniziale?
Generalizzabilità: Lo strumento di
predizione è trasportabile a una
popolazione separata con caratteristiche
degli individui diverse?
🔴 Riproducibilità
🔹 Validazione interna, validazione temporale e
validazione geografica
🔹 In un dataset grande abbastanza, la
validazione interna può dare un’indicazione della
performance esterna del modello.
🔴 Generalizzabilità
🔹 Validazione esterna
🔹 Devono essere effettuate validazioni esterne
indipendenti per ogni popolazione se esse differiscono
molto nel setting, nelle misure alla baseline o
nell’incidenza degli outcome.
🔴 Due elementi chiave per valutare la performance
predittiva dei modelli sono la calibrazione e la
discriminazione.
🔴 I modelli predittivi, per poter essere esternamente
validati, dovrebbero:
🔹Esplicitare l’intera formula di predizione, per
permettere di calcolare il rischio assoluto
🔹Avere un basso rischio di bias, per evitare stime del
rischio sistematicamente distorte
🔴 Differenze nelle distribuzioni dei predittori tra la coorte
usata in fase di sviluppo del modello e la coorte di
validazione possono influenzare la performance del
modello.
Calibrazione
🔴 La calibrazione determina se i rischi assoluti predetti sono simili ai
rischi osservati.
🟦Tipi di calibrazione
🔹 Calibrazione in-the-large: il rischio predetto medio nell’intera
popolazione di validazione comparato al rischio osservato
medio.
🔹 Plot di calibrazione: il rischio predetto comparato al rischio
osservato all’interno di sottogruppi di pazienti, sulla base di
probabilità predette.
🔹 Pendenza di calibrazione: essa è calcolata stimando un
nuovo modello con il PI come unico predittore nel dataset di
validazione.
🔴 La ricalibrazione consiste nel cambiare parte della formula
affinché si adatti meglio alla popolazione esterna.
🟦Elementi che possono portare ad un’errata calibrazione:
🔹 Eterogeneità degli effetti dei predittori al variare della
popolazione
🔹 Differenze nell’incidenza degli outcome
Discriminazione
🔴 La discriminazione è una misura relativa di quanto bene un modello sa
distinguere tra pazienti con e senza l’evento di interesse.
🔺 Il C-index (Concordance Index) misura se i pazienti che sperimentano
l’outcome hanno un rischio predetto più alto rispetto ai pazienti che non lo
sperimentano.
🔺 La discriminazione può essere anche valutata attraverso il PI o il punteggio
di rischio.
🔴 Un’ampia variazione nei valori dei predittori renderà più semplice al modello
discriminare tra i pazienti che sperimentano l’outcome e quelli che non lo
sperimentano.
Campioni
🔴 Alcuni studi di simulazione hanno mostrato che nella
validazione un minimo di 100 eventi (e 100 non-eventi)
sono necessari e >200 eventi sono preferiti.
🔴 Le popolazioni sperimentali di controllo randomizzate
non sono adatte perché sono spesso più in salute della
maggior parte dei pazienti incontrati nella pratica clinica e i
predittori potrebbero essere misurati differentemente
rispetto alla pratica standard.
🔴 I modelli dovrebbero essere validati ogni pochi anni, dato che la pratica standard cambia nel
tempo.
🔴 La validazione esterna dovrebbe essere seguita da una ricerca che valuti l’impatto clinico del
modello. Ciò può essere fatto randomizzando l’uso di un modello di predizione tra i medici e
valutando se l’uso migliora gli outcome dei pazienti.

Weitere ähnliche Inhalte

Ähnlich wie externalvalidation.pdf

Medicina difensiva
Medicina difensivaMedicina difensiva
Medicina difensivacassagaleno
 
MACHINE LEARNING, SUPERVISED LEARNING: UN SEMPLICE METODO PER DIAGNOSTICARE I...
MACHINE LEARNING, SUPERVISED LEARNING: UN SEMPLICE METODO PER DIAGNOSTICARE I...MACHINE LEARNING, SUPERVISED LEARNING: UN SEMPLICE METODO PER DIAGNOSTICARE I...
MACHINE LEARNING, SUPERVISED LEARNING: UN SEMPLICE METODO PER DIAGNOSTICARE I...convegnonazionaleaiic
 
Disegno degli studi clinici e analisi dei dati
Disegno degli studi clinici e analisi dei dati  Disegno degli studi clinici e analisi dei dati
Disegno degli studi clinici e analisi dei dati ASMaD
 
il case manager lesioni cutanee a Piacenza: un percorso
il case manager lesioni cutanee a Piacenza: un percorsoil case manager lesioni cutanee a Piacenza: un percorso
il case manager lesioni cutanee a Piacenza: un percorsoAISLeC
 
Santoro - Principi di statistica medica
Santoro - Principi di statistica medicaSantoro - Principi di statistica medica
Santoro - Principi di statistica medicaEugenio Santoro
 
Coinvolgere i cittadini nel processo di messa a punto di linee guida
Coinvolgere i cittadini nel processo di messa a punto di linee guidaCoinvolgere i cittadini nel processo di messa a punto di linee guida
Coinvolgere i cittadini nel processo di messa a punto di linee guidaredazione Partecipasalute
 
QUALICOPC (Giorgio Visentin)
QUALICOPC (Giorgio Visentin)QUALICOPC (Giorgio Visentin)
QUALICOPC (Giorgio Visentin)csermeg
 
Valutazioni criteriali e normative
Valutazioni criteriali e normativeValutazioni criteriali e normative
Valutazioni criteriali e normativeiva martini
 
Valutazioni criteriali e normative
Valutazioni criteriali e normativeValutazioni criteriali e normative
Valutazioni criteriali e normativeiva martini
 
Valutazioni criteriali e normative
Valutazioni criteriali e normativeValutazioni criteriali e normative
Valutazioni criteriali e normativeiva martini
 
Valutazioni criteriali e normative
Valutazioni criteriali e normativeValutazioni criteriali e normative
Valutazioni criteriali e normativeiva martini
 
Utili Consigli Per Migliorare La Comunicazione Di Prodotto Attraverso Il Visu...
Utili Consigli Per Migliorare La Comunicazione Di Prodotto Attraverso Il Visu...Utili Consigli Per Migliorare La Comunicazione Di Prodotto Attraverso Il Visu...
Utili Consigli Per Migliorare La Comunicazione Di Prodotto Attraverso Il Visu...Medi-Pragma
 
Revan franco novelletto
Revan franco novellettoRevan franco novelletto
Revan franco novellettomaxcarraro
 

Ähnlich wie externalvalidation.pdf (20)

Medicina difensiva
Medicina difensivaMedicina difensiva
Medicina difensiva
 
MACHINE LEARNING, SUPERVISED LEARNING: UN SEMPLICE METODO PER DIAGNOSTICARE I...
MACHINE LEARNING, SUPERVISED LEARNING: UN SEMPLICE METODO PER DIAGNOSTICARE I...MACHINE LEARNING, SUPERVISED LEARNING: UN SEMPLICE METODO PER DIAGNOSTICARE I...
MACHINE LEARNING, SUPERVISED LEARNING: UN SEMPLICE METODO PER DIAGNOSTICARE I...
 
Indicatori sanita
Indicatori sanitaIndicatori sanita
Indicatori sanita
 
5 1 giordano
5 1 giordano5 1 giordano
5 1 giordano
 
Disegno degli studi clinici e analisi dei dati
Disegno degli studi clinici e analisi dei dati  Disegno degli studi clinici e analisi dei dati
Disegno degli studi clinici e analisi dei dati
 
il case manager lesioni cutanee a Piacenza: un percorso
il case manager lesioni cutanee a Piacenza: un percorsoil case manager lesioni cutanee a Piacenza: un percorso
il case manager lesioni cutanee a Piacenza: un percorso
 
1.a- 03-02 - DVR.pdf
1.a- 03-02 - DVR.pdf1.a- 03-02 - DVR.pdf
1.a- 03-02 - DVR.pdf
 
Santoro - Principi di statistica medica
Santoro - Principi di statistica medicaSantoro - Principi di statistica medica
Santoro - Principi di statistica medica
 
Coinvolgere i cittadini nel processo di messa a punto di linee guida
Coinvolgere i cittadini nel processo di messa a punto di linee guidaCoinvolgere i cittadini nel processo di messa a punto di linee guida
Coinvolgere i cittadini nel processo di messa a punto di linee guida
 
QUALICOPC (Giorgio Visentin)
QUALICOPC (Giorgio Visentin)QUALICOPC (Giorgio Visentin)
QUALICOPC (Giorgio Visentin)
 
Portage
PortagePortage
Portage
 
Valutazioni criteriali e normative
Valutazioni criteriali e normativeValutazioni criteriali e normative
Valutazioni criteriali e normative
 
Valutazioni criteriali e normative
Valutazioni criteriali e normativeValutazioni criteriali e normative
Valutazioni criteriali e normative
 
Valutazioni criteriali e normative
Valutazioni criteriali e normativeValutazioni criteriali e normative
Valutazioni criteriali e normative
 
Valutazioni criteriali e normative
Valutazioni criteriali e normativeValutazioni criteriali e normative
Valutazioni criteriali e normative
 
350 cochrane review-enforcement
350   cochrane review-enforcement350   cochrane review-enforcement
350 cochrane review-enforcement
 
Utili Consigli Per Migliorare La Comunicazione Di Prodotto Attraverso Il Visu...
Utili Consigli Per Migliorare La Comunicazione Di Prodotto Attraverso Il Visu...Utili Consigli Per Migliorare La Comunicazione Di Prodotto Attraverso Il Visu...
Utili Consigli Per Migliorare La Comunicazione Di Prodotto Attraverso Il Visu...
 
Tassonomia della valutazione
Tassonomia della valutazioneTassonomia della valutazione
Tassonomia della valutazione
 
prova risk
prova riskprova risk
prova risk
 
Revan franco novelletto
Revan franco novellettoRevan franco novelletto
Revan franco novelletto
 

Kürzlich hochgeladen

Imodelli_atomici_stefano_afferrante.pptx
Imodelli_atomici_stefano_afferrante.pptxImodelli_atomici_stefano_afferrante.pptx
Imodelli_atomici_stefano_afferrante.pptxlorenzodemidio01
 
matematicaesempio--power point provaaaaa
matematicaesempio--power point provaaaaamatematicaesempio--power point provaaaaa
matematicaesempio--power point provaaaaanuriaiuzzolino1
 
Iuzzolino Nuria-lavoro scienzeeeeee.pptx
Iuzzolino Nuria-lavoro scienzeeeeee.pptxIuzzolino Nuria-lavoro scienzeeeeee.pptx
Iuzzolino Nuria-lavoro scienzeeeeee.pptxnuriaiuzzolino1
 
CamploneAlessandro_ArcheoBatteri (1).pptx
CamploneAlessandro_ArcheoBatteri (1).pptxCamploneAlessandro_ArcheoBatteri (1).pptx
CamploneAlessandro_ArcheoBatteri (1).pptxcamplonealex26
 
Oman_Raffaele_Progetto_scienze_Eubatteri - Copia (1).pptx
Oman_Raffaele_Progetto_scienze_Eubatteri - Copia (1).pptxOman_Raffaele_Progetto_scienze_Eubatteri - Copia (1).pptx
Oman_Raffaele_Progetto_scienze_Eubatteri - Copia (1).pptxraffaeleoman
 
relazione laboratorio_Stefano Afferrante.docx
relazione laboratorio_Stefano Afferrante.docxrelazione laboratorio_Stefano Afferrante.docx
relazione laboratorio_Stefano Afferrante.docxlorenzodemidio01
 
I Modelli Atmoci_FilippoLuciani bohr.pptx
I Modelli Atmoci_FilippoLuciani bohr.pptxI Modelli Atmoci_FilippoLuciani bohr.pptx
I Modelli Atmoci_FilippoLuciani bohr.pptxfilippoluciani9
 

Kürzlich hochgeladen (7)

Imodelli_atomici_stefano_afferrante.pptx
Imodelli_atomici_stefano_afferrante.pptxImodelli_atomici_stefano_afferrante.pptx
Imodelli_atomici_stefano_afferrante.pptx
 
matematicaesempio--power point provaaaaa
matematicaesempio--power point provaaaaamatematicaesempio--power point provaaaaa
matematicaesempio--power point provaaaaa
 
Iuzzolino Nuria-lavoro scienzeeeeee.pptx
Iuzzolino Nuria-lavoro scienzeeeeee.pptxIuzzolino Nuria-lavoro scienzeeeeee.pptx
Iuzzolino Nuria-lavoro scienzeeeeee.pptx
 
CamploneAlessandro_ArcheoBatteri (1).pptx
CamploneAlessandro_ArcheoBatteri (1).pptxCamploneAlessandro_ArcheoBatteri (1).pptx
CamploneAlessandro_ArcheoBatteri (1).pptx
 
Oman_Raffaele_Progetto_scienze_Eubatteri - Copia (1).pptx
Oman_Raffaele_Progetto_scienze_Eubatteri - Copia (1).pptxOman_Raffaele_Progetto_scienze_Eubatteri - Copia (1).pptx
Oman_Raffaele_Progetto_scienze_Eubatteri - Copia (1).pptx
 
relazione laboratorio_Stefano Afferrante.docx
relazione laboratorio_Stefano Afferrante.docxrelazione laboratorio_Stefano Afferrante.docx
relazione laboratorio_Stefano Afferrante.docx
 
I Modelli Atmoci_FilippoLuciani bohr.pptx
I Modelli Atmoci_FilippoLuciani bohr.pptxI Modelli Atmoci_FilippoLuciani bohr.pptx
I Modelli Atmoci_FilippoLuciani bohr.pptx
 

externalvalidation.pdf

  • 1. La validazione esterna dei modelli prognostici Cosa è? Che tipi di validazione esterna ci sono? Perché è cruciale per l’implementazione clinica di modelli predittivi accurati? Come si conduce correttamente uno studio di validazione esterna? Quando è appropriato validare esternamente un modello? Quali fattori dovrebbero essere considerati nel selezionare una popolazione di validazione adatta?
  • 2. La validazione interna usa i soggetti della popolazione usata per lo sviluppo del modello. Le forme di validazione interna più usate sono: 🔹Split-sample 🔹Cross-validation 🔹Bootstrapping La validazione temporale consiste nella divisione temporale di una singola coorte. La validazione esterna è l’atto di testare il modello predittivo su un set di nuovi soggetti per determinare se il modello funziona ad un livello soddisfacente. I soggetti devono differire strutturalmente da quelli della coorte iniziale (regione o paese diverso, setting di cura diverso ecc.). 🔴 🔴 🟦 🔴
  • 3.
  • 4. La formula della predizione è cucita sui dati per lo sviluppo del modello Un modello può essere scarsamente predittivo in una coorte esterna I modelli predittivi possono accidentalmente essere adattati ad idiosincrasie del dataset o corrispondervi troppo da vicino (overfitting). È importante testare la riproducibilità e la generalizzabilità dei modelli predittivi Riproducibilità: La formula della predizione è valida per nuovi individui che sono simili alla popolazione iniziale? Generalizzabilità: Lo strumento di predizione è trasportabile a una popolazione separata con caratteristiche degli individui diverse?
  • 5. 🔴 Riproducibilità 🔹 Validazione interna, validazione temporale e validazione geografica 🔹 In un dataset grande abbastanza, la validazione interna può dare un’indicazione della performance esterna del modello. 🔴 Generalizzabilità 🔹 Validazione esterna 🔹 Devono essere effettuate validazioni esterne indipendenti per ogni popolazione se esse differiscono molto nel setting, nelle misure alla baseline o nell’incidenza degli outcome.
  • 6. 🔴 Due elementi chiave per valutare la performance predittiva dei modelli sono la calibrazione e la discriminazione. 🔴 I modelli predittivi, per poter essere esternamente validati, dovrebbero: 🔹Esplicitare l’intera formula di predizione, per permettere di calcolare il rischio assoluto 🔹Avere un basso rischio di bias, per evitare stime del rischio sistematicamente distorte 🔴 Differenze nelle distribuzioni dei predittori tra la coorte usata in fase di sviluppo del modello e la coorte di validazione possono influenzare la performance del modello.
  • 7. Calibrazione 🔴 La calibrazione determina se i rischi assoluti predetti sono simili ai rischi osservati. 🟦Tipi di calibrazione 🔹 Calibrazione in-the-large: il rischio predetto medio nell’intera popolazione di validazione comparato al rischio osservato medio. 🔹 Plot di calibrazione: il rischio predetto comparato al rischio osservato all’interno di sottogruppi di pazienti, sulla base di probabilità predette. 🔹 Pendenza di calibrazione: essa è calcolata stimando un nuovo modello con il PI come unico predittore nel dataset di validazione. 🔴 La ricalibrazione consiste nel cambiare parte della formula affinché si adatti meglio alla popolazione esterna. 🟦Elementi che possono portare ad un’errata calibrazione: 🔹 Eterogeneità degli effetti dei predittori al variare della popolazione 🔹 Differenze nell’incidenza degli outcome
  • 8. Discriminazione 🔴 La discriminazione è una misura relativa di quanto bene un modello sa distinguere tra pazienti con e senza l’evento di interesse. 🔺 Il C-index (Concordance Index) misura se i pazienti che sperimentano l’outcome hanno un rischio predetto più alto rispetto ai pazienti che non lo sperimentano. 🔺 La discriminazione può essere anche valutata attraverso il PI o il punteggio di rischio. 🔴 Un’ampia variazione nei valori dei predittori renderà più semplice al modello discriminare tra i pazienti che sperimentano l’outcome e quelli che non lo sperimentano.
  • 9. Campioni 🔴 Alcuni studi di simulazione hanno mostrato che nella validazione un minimo di 100 eventi (e 100 non-eventi) sono necessari e >200 eventi sono preferiti. 🔴 Le popolazioni sperimentali di controllo randomizzate non sono adatte perché sono spesso più in salute della maggior parte dei pazienti incontrati nella pratica clinica e i predittori potrebbero essere misurati differentemente rispetto alla pratica standard.
  • 10. 🔴 I modelli dovrebbero essere validati ogni pochi anni, dato che la pratica standard cambia nel tempo. 🔴 La validazione esterna dovrebbe essere seguita da una ricerca che valuti l’impatto clinico del modello. Ciò può essere fatto randomizzando l’uso di un modello di predizione tra i medici e valutando se l’uso migliora gli outcome dei pazienti.