Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Statistica medica, Appunti di Statistica Medica

L'importanza della statistica medica nella traduzione dell'informazione in conoscenza e nella presa di decisioni basate su osservazioni. Vengono descritte le capacità della statistica di far fronte all'incertezza, di trattare e capire i dati, e di valutare la significatività statistica e clinica. Vengono inoltre presentati strumenti statistici come la curva ROC e le curve di Kaplan Meier, e descritte le misure di tendenza centrale e di dispersione utilizzate nella statistica descrittiva.

Tipologia: Appunti

2020/2021

In vendita dal 15/01/2022

Met1097
Met1097 🇮🇹

4.9

(10)

43 documenti

1 / 22

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Statistica medica
La statistica riguarda come tradurre l’informazione in conoscenza. La statistica suggerisce come valutare ciò
che si osserva e come prendere decisioni sulla base delle osservazioni. La statistica tratta la casualità,
l’aleatorietà e l’incertezza. I dati sono sempre più pervasivi nella società, quindi, la capacità di trattarli e capirli
diventa sempre più rilevante. I dati possono essere numeri ma anche no, può essere una diagnosi, delle scale
di valutazione di un paziente, un gruppo sanguigno. La statistica permette di:
Tradurre l’informazione in conoscenza.
Prendere decisioni: a partire dalla conoscenza. L'obiettivo è, con lo strumento statistico, comprendere
informazioni e prendere decisioni in base a indici, numeri, parametri.
Far fronte all'incertezza: in statistica c’è incertezza in raccolta del dato, scelta del campione, operatore
e paziente che evolve nel tempo. Bisogna prendere una decisione, nonostante l'incertezza. Per cui la
statistica deve raccontare i dati ma deve dire l'incertezza. Un altro esempio potrebbe essere la scelta di
non intervenire se c’è tanta incertezza perché si rischia peggiorare la situazione. Nella stesura di un
articolo si deve sottolineare l’incertezza. Se non c’è, si tratta di uno sbaglio, un’omissione o è stato
svolto in modo da contenerla, ad esempio lavorando su una sottopopolazione particolare. La statistica
è uno strumento non teorico che risolve i problemi con incertezza.
Capacità di trattare i dati e capirli: i dati sono sempre più pervasivi e l’intelligenza artificiale aiuterà a
trattare i dati e dare loro significato.
La statistica descrittiva è l’analisi e la descrizione dei dati. La statistica inferenziale prevede il passaggio da
un campione ad una popolazione. Una casistica non è detto sia un campione. Se la casistica in studio è stata
pensata come un campione rappresentativo di una popolazione più generale, si può dedurre. È importante non
confondere case report e studi su campione.
Significatività statistica e clinica
Al medico interessa la significatività clinica, diversa dalla significatività statistica, il cui significato dipende
dal contesto. L’obbiettivo di una sperimentazione è ottenere dati di significatività clinica.
In un grafico i punti sono i dati puntiformi, la statistica descrittiva; la retta è la retta di regressione, il modello
di tendenza ideale. Se la nuvola dei dati descrittivi si raccoglie attorno a questa retta, è considerabile veritiera.
I dati non sono sempre veritieri, non tutti i pazienti diranno la verità; è necessario fidarsi. Se la retta di
regressione non rappresenta bene i dati perché la nuvola dei puntini della statistica descrittiva è ampia: il
coefficiente R2 (coefficiente di determinazione) è vicino allo 0 (se è verosimile tende a 1). R2 è una
proporzione tra variabilità dei dati e correttezza del modello statistico. Una retta modello non è sempre
applicabile: se i puntini si dispongono con andamento a parabola non ha senso descriverli sottoforma di una
retta di tendenza.
Curva ROC
La curva ROC misura l’accuratezza di un test diagnostico lungo il range dei valori possibili, poiché misura
l’accordo tra test e presenza di malattia (così come identificata da un golden standard). È il metodo d’elezione
per validare un test diagnostico. Identifica il valore soglia ottimale (best cut-off), il valore del test che
massimizza la differenza tra veri positivi (proporzione di individui con un valore alterato del test tra quelli
realmente affetti dalla malattia) e falsi positivi (proporzione di individui che pur avendo un valore alterato del
test non sono affetti dalla malattia).
La curva ROC descrive il numero di test positivi o negativi a seconda di dove venga posto il cut off per definire
un test come positivo. Può essere utile per trovare cut off ottimale e paragonare differenti test. Il migliore test
è quello che si avvicina maggiormente alla curva del test ideale.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16

Anteprima parziale del testo

Scarica Statistica medica e più Appunti in PDF di Statistica Medica solo su Docsity!

Statistica medica

La statistica riguarda come tradurre l’informazione in conoscenza. La statistica suggerisce come valutare ciò che si osserva e come prendere decisioni sulla base delle osservazioni. La statistica tratta la casualità, l’aleatorietà e l’incertezza. I dati sono sempre più pervasivi nella società, quindi, la capacità di trattarli e capirli diventa sempre più rilevante. I dati possono essere numeri ma anche no, può essere una diagnosi, delle scale di valutazione di un paziente, un gruppo sanguigno. La statistica permette di:

  • Tradurre l’informazione in conoscenza.
  • Prendere decisioni: a partire dalla conoscenza. L'obiettivo è, con lo strumento statistico, comprendere informazioni e prendere decisioni in base a indici, numeri, parametri.
  • Far fronte all'incertezza: in statistica c’è incertezza in raccolta del dato, scelta del campione, operatore e paziente che evolve nel tempo. Bisogna prendere una decisione, nonostante l'incertezza. Per cui la statistica deve raccontare i dati ma deve dire l'incertezza. Un altro esempio potrebbe essere la scelta di non intervenire se c’è tanta incertezza perché si rischia peggiorare la situazione. Nella stesura di un articolo si deve sottolineare l’incertezza. Se non c’è, si tratta di uno sbaglio, un’omissione o è stato svolto in modo da contenerla, ad esempio lavorando su una sottopopolazione particolare. La statistica è uno strumento non teorico che risolve i problemi con incertezza.
  • Capacità di trattare i dati e capirli: i dati sono sempre più pervasivi e l’intelligenza artificiale aiuterà a trattare i dati e dare loro significato. La statistica descrittiva è l’analisi e la descrizione dei dati. La statistica inferenziale prevede il passaggio da un campione ad una popolazione. Una casistica non è detto sia un campione. Se la casistica in studio è stata pensata come un campione rappresentativo di una popolazione più generale, si può dedurre. È importante non confondere case report e studi su campione. Significatività statistica e clinica Al medico interessa la significatività clinica , diversa dalla significatività statistica , il cui significato dipende dal contesto. L’obbiettivo di una sperimentazione è ottenere dati di significatività clinica. In un grafico i punti sono i dati puntiformi, la statistica descrittiva ; la retta è la retta di regressione, il modello di tendenza ideale. Se la nuvola dei dati descrittivi si raccoglie attorno a questa retta, è considerabile veritiera. I dati non sono sempre veritieri, non tutti i pazienti diranno la verità; è necessario fidarsi. Se la retta di regressione non rappresenta bene i dati perché la nuvola dei puntini della statistica descrittiva è ampia: il coefficiente R^2 ( coefficiente di determinazione ) è vicino allo 0 (se è verosimile tende a 1). R^2 è una proporzione tra variabilità dei dati e correttezza del modello statistico. Una retta modello non è sempre applicabile: se i puntini si dispongono con andamento a parabola non ha senso descriverli sottoforma di una retta di tendenza. Curva ROC La curva ROC misura l’accuratezza di un test diagnostico lungo il range dei valori possibili, poiché misura l’accordo tra test e presenza di malattia (così come identificata da un golden standard). È il metodo d’elezione per validare un test diagnostico. Identifica il valore soglia ottimale ( best cut-off ), il valore del test che massimizza la differenza tra veri positivi (proporzione di individui con un valore alterato del test tra quelli realmente affetti dalla malattia) e falsi positivi (proporzione di individui che pur avendo un valore alterato del test non sono affetti dalla malattia). La curva ROC descrive il numero di test positivi o negativi a seconda di dove venga posto il cut off per definire un test come positivo. Può essere utile per trovare cut off ottimale e paragonare differenti test. Il migliore test è quello che si avvicina maggiormente alla curva del test ideale.

Curve di Kaplan Meier Curve usate per valutare se i pazienti raggiungono un certo evento (decesso, recidive, guarigioni, ecc…), usate in statistica descrittiva. Le barrette verticali sono valori censurati , sono valori persi quando un paziente si ritira dallo studio o prima dell’esito finale o muore prima, per cause diverse da quelle in esame dallo studio. Queste curve possono essere rappresentate anche circondate da fasce, che indicano i confidence interval , espressione dell’incertezza. La fascia dell’incertezza aumenta con il passare del tempo, perché il numero di pazienti diventa più esiguo e l’incertezza aumenta.

Statistica descrittiva

Prende in considerazione i dati appresi durante studi su popolazioni o campioni. È importante conoscere come sono presi i dati e se sono sufficienti per gli obbiettivi dello studio. I dati non sono solo numeri, ma anche parole, gruppi sanguigni, scale di valutazione, ecc… Possono essere descritti con tabelle, grafici, percentuali o riassunti, tramite misure di tendenza centrale e di dispersione. Misure di tendenza centrale Mettono assieme i dati. I dati analizzati con queste misure devono essere studiabili.

  • Media (somma dei dati/numerosità dei dati): non sempre fornisce informazioni, è inutile se vi sono valori estremi che sporcano il risultato. Può essere informativa se il range di valori è piccolo, senza outliers. Non può essere usata per dati che non siano numeri cardinali. Se la media è molto più alta della mediana, significa che è sporcata da dati outliers.
  • Mediana : valore a metà della distribuzione ordinata dei dati, che lascia alla sua sinistra il 50% dei dati. È una misura più robusta, non influenzata dai valori estremi. Gli outliers sono spesso i più importanti, perché sono dati patologici. Si può calcolare la mediana per tutti i dati ordinabili: non è necessario avere dei numeri cardinali. Se nel campione analizzato ci sono dei valori estremi, possono sballare la media senza modificare la mediana, soprattutto quando la casistica è bassa, quando ci sono pochi casi analizzati. Se la casistica è alta, i valori outlier pesano meno, questo non vuol dire che non siano importanti, anzi, vanno analizzati e capito perché presenti.
  • Moda : indica un dato che prevale sugli altri, scelto in modo soggettivo. Può essere unimodale, bimodale, trimodale, ecc… Misure di dispersione
  • Range dei valori : differenza tra minimo e massimo. Se il range è grande vuol dire che potenzialmente il valore massimo può essere di un valore outlier.
  • Varianza e deviazione standard : valutano quanto i dati sono dispersi rispetto alla media. Non sempre sono informativi: se vi sono valori estremi che sballano la media, anche la deviazione standard non sarà più attendibile. Scrivere media ± deviazione standard indica simmetria, ma i dati patologici spesso sono asimmetrici e non valutabili simmetricamente con gaussiana e punti di flesso.
  • Coefficiente di variazione (deviazione standard/media): permette di correggere la deviazione standard con la media. È utile, come misura relativa, per confrontare 2 popolazioni di dati diversi.
  • Quartili e percentili : valori che dividono la popolazione in 4 parti uguali_._ Il 1° quartile corrisponde al 25° percentile, il 2° alla mediana. Il 25° è il dato che lascia alla sua sinistra il 25% dei dati. Box-plot Rappresentazioni grafiche di misure di centralità e dispersione dei dati per quartili, usati in statistica descrittiva. La regola del box-plot è la “ regola del baffo ”: la lunghezza del baffo può essere al massimo una volta e mezza

informatici e ricorrendo ad opportune approssimazioni si possono trasformare dati non parametrici in dati esprimibili con gaussiana.

  • μ – σ e μ + σ sono punti di flesso , ossia i punti in cui la funzione da convessa diventa concava.
  • Tra μ – σ e μ + σ è compreso il 68,3% dei dati.
  • Tra μ – 2 σ e μ + 2σ è compreso il 95,5% dei dati.
  • Tra μ – 3 σ e μ + 3σ è compreso il 99,7% dei dati.
  • N(0;1) è la normale standard. È una normale con media 0 e deviazione standard 1.

Statistica inferenziale

Con inferenza si intende il passaggio dal campione alla popolazione con stime, test, ecc… Quando si compie uno studio è importante stabilire:

  • Obiettivi dello studio (primari e secondari).
  • Disegno dello studio: retrospettivo, prospettico, randomizzato, caso-controllo.
  • Materiali e metodi: formalità per allestire lo studio, essenziali per la riproducibilità dei risultati.
  • Criteri di inclusione-esclusione, che definiscono la popolazione dello studio.
  • Campione: va scelto quando è chiara la popolazione. Spesso se si ha un campione relativamente piccolo, a monte conviene scegliere una popolazione omogenea (studiando una sotto-casistica).
  • Valutazione descrittiva del campione: ad esempio dal punto di vista clinico, qui è in gioco il medico.
  • Inferenza sulla popolazione: se i dati che provengono dalla statistica descrittiva suggeriscono risultati, per capire cosa dedurre nella popolazione generale. L’inferenza si può fare solo se sono stati compiuti i passi precedenti. Bisogna prestare attenzione a non confondere la casistica con il campione, che è inferenziale.
  • Discussione risultati: per capire se c’è significatività statistica (p value piccolo). Tratte conclusioni in base alle scelte compiute, i risultati, i limiti dello studio condotto. Si cerca di capire se i risultati sono significativi anche da un punto di vista medico-clinico. Questo flusso consente di stabilire l’inferenza, e fornisce gli strumenti per leggere con spirito critico un articolo scientifico. Nelle tesi è meglio trovare risultati in un campione piccolo e omogeneo, su piccole casistiche, piuttosto che partire da grandi gruppi per trovare risultati discutibili. L’inferenza statistica viene vista come passaggio successivo a una serie di premesse. Confidence interval Fare una stima significa dedurre qualcosa dai dati. Ci sono stime puntuali e stime intervallari , preferite dal medico perché considerano l’incertezza. Il confidence interval indica la fiducia che si ha in una stima. In caso di molta incertezza si avranno grandi confidence intervals. Quindi il confidence interval è una stima intervallare con fiducia. Quando si ha a che fare con stime, bisogna fornire il confidence interval. In statistica medica, quando si leggono dati statistici, hanno confidence interval al 95%, cioè si permette un errore al 5%. Tante volte anche con campioni piccoli si riescono fare buoni confidence interval perché si fa una stima a priori della numerosità campionaria. Queste cose sarebbe bene vederle prima, a monte. Non per niente, quando si fa una sperimentazione e si arriva al comitato etico, viene richiesto che si faccia il progetto, che si fornisca il disegno dello studio e che si faccia il calcolo della numerosità a priori, in base agli obiettivi. Per avere buona stima con confidence interval con campioni piccoli una soluzione è avere popolazione più omogenea, ragionando a monte pensando a casistica e criteri di esclusione/inclusione. L’ odds d’esposizione è il rapporto tra probabilità di essere esposti al fattore di rischio e di non essere esposti. È il primo elemento che si valuta in studi caso-controllo, verificando se c’è distribuzione dell’esposizione diversa tra i 2 campioni. Se è diversa, probabilmente c’è associazione tra esposizione e malattia. L’ odds ratio è la risultante del rapporto tra l’odds di esposizione nei casi e nei controlli. L’ odds ratio è leggibile sia come

odds ratio di esposizione, che come odds ratio di malattia. Lo stesso numero riflette doppia interpretazione, perché sono rapporti tra probabilità condizionate. Il valore nullo, che nega l’associazione tra esposizione e malattia, è 1. Quanto più l’odds ratio è >1, tanto più l’esposizione è legata alla malattia, quanto più l’odds ratio è <1, tanto più l’esposizione protegge rispetto al rischio di malattia. L’ odds ratio è come il rischio relativo , ma in uno studio retrospettivo; il RR si usa in uno studio prospettivo. Un confidence interval che non dice niente è un fallimento, almeno che se si è in una direzione sconosciuta; allora in questo caso si continua, sapendo che il confidence interval può essere utile per far procedere lo studio, selezionando meglio la popolazione e gestendo meglio le molte variabili.

Test di ipotesi

È importante capire la domanda di questo test e, quindi, capire che dati inserire nel campione per dedurre la risposta/e. “To test” significa “provare” ma provare nella situazione, contestualizzare, perché non sempre si possono fare tutte le prove volute: ad esempio non si può provare un farmaco ad un gruppo di pazienti che sta male e ad un altro no, perché non sarebbe etico. Ad entrambi si fornisce il massimo del trattamento ma al primo gruppo si aggiunge anche la cura sperimentale. Tutte le prove sono fatte tenendo a mente l’ipotesi: si può voler dimostrare la superiorità di un farmaco rispetto ad un altro, la non inferiorità o la non inferiorità ma con meno effetti collaterali. Fare un test d’ipotesi significa fare delle prove, raccogliere casistica campionaria da cui si cerca di dedurre un risultato generale. Il test del chi quadro ( χ ²) è un test di indipendenza. Significa raccogliere statistica, campionarla e domandarsi se i dati respingono o meno l’ipotesi di indipendenza. È importante fare un test di indipendenza perché, ad esempio, un farmaco può essere indipendente da un altro. Tramite software si ottengono le risposte, capite in base alla domanda. Si possono commettere 2 tipi di errori in un test d’ipotesi:

  • Errore di 1° tipo : rifiuto di ipotesi vera. Il livello di significatività ( α ) è la probabilità di commettere un errore di 1° tipo. Viene dichiarato in tutti gli articoli.
  • Errore di 2° tipo : accettazione di ipotesi falsa. La potenza del test ( 1 - β ) è la probabilità di rifiutare l’ipotesi di lavoro quando è falsa; β è la probabilità di commettere errore di 2° tipo. Si desidera abbassare il livello α il più possibile verso 0; questo aumenta la probabilità β, e questo diminuirà la potenza del test. Si dice che α sia 5% e 1 - β sia 80%; sono definiti margini di errore. Il test T di Student per campioni indipendenti è un test statistico di tipo parametrico allo scopo di verificare se il valore medio di una distribuzione si discosta significativamente da un valore di riferimento. Questo test determina se vi è una differenza significativa tra media di 2 gruppi, dove il livello di significatività è definito di solito da p-value <5%. Si confrontano 2 gruppi per capire se sono sovrapponibili. Ad esempio nel caso di test sull’efficacia di un farmaco, un t-test inizia con 2 ipotesi:
  • Ipotesi nulla ( H 0 ): no differenza significativa prima e dopo l’assunzione del farmaco (senza effetti).
  • Ipotesi alternativa : o Unilaterale : differenza tra 2 medie è numero positivo o negativo. o Bilaterale : differenza tra medie diversa da 0 (non specifica se il valore è positivo o negativo). Di solito si usa il test bilaterale, perché non conoscono l’effetto del farmaco. Per verificare queste 2 ipotesi, si calcola il t - score , il rapporto media delle differenze delle medie/errore standard della differenza delle medie. Il test T per dati appaiati confronta 2 gruppi (gruppo prima e dopo), con dati parametrici. Ad esempio, si prende lo stesso paziente prima e dopo la terapia. La domanda è se gruppo prima è sovrapponibile a gruppo dopo. La risposta sarà un p-value, contestualizzata essendo semplificata.

selezionata (informazioni limitate); i modelli di regressione vanno usati per capire, sulla base di caratteristiche dei pazienti che possono interferire con l’effetto del trattamento (confondenti), l’effetto del trattamento su vari pazienti, anche su quelli non sufficientemente rappresentati nel trial. La differenza tra modello diagnostico e prognostico è la relazione temporale, ovvero la distanza tra il momento in cui si valutano le caratteristiche dei pazienti ed il momento in cui si osserva l’outcome. Un modello diagnostico fornisce la probabilità che una diagnosi sia presente, considerando caratteristiche e sintomi dei pazienti (calcola rischio individuale che sia presente la malattia); se la probabilità è alta si potranno eseguire test invasivi, se è bassa si potrà attendere qualche mese prima di rivalutare il paziente. Il modello prognostico valuta caratteristiche attuali dei pazienti al momento T 0 , ma a differenza del diagnostico si proietta nel futuro; può essere applicato a 2 tipi di soggetti: pazienti con diagnosi attiva, per vedere a quali eventi vanno incontro nel tempo, o a soggetti sani, per valutare nel tempo come evolverà la condizione. Nel modello diagnostico si fa riferimento a disegno trasversale , in cui si valutano i pazienti al tempo T 0 ; alcuni pazienti hanno l’outcome (presenza o assenza di malattia), altri non lo hanno, e si vuole predire chi presenta l’outcome. Nel modello prognostico si fa riferimento a disegno longitudinale , similmente ad uno studio di coorte, in cui si arruolano i pazienti e li si valuta nel tempo. Dai modelli statistici di regressione, grazie a metodi come regressione logistica e di Cox , derivano gli score di rischio per stratificare il rischio dei pazienti. Mentre i clinical trial sono eseguiti seguendo metodo rigido, gli score di rischio spesso sono sviluppati su dati provenienti da studi osservazionali; per questo, a fronte di una grande varietà di proposte di nuovi score di rischio, solo pochi score sono usati in clinica. La predizione è un problema di stima statistica di una probabilità: serve un modello di predizione che stimi la probabilità di un certo outcome. I modelli statistici di predizione, oltre che per stimare la probabilità di un certo outcome, sono utili per effettuare test di ipotesi , ovvero per capire quali siano i fattori che impattano di più sulla stima della probabilità dell’outcome; il medico vuole identificare i fattori che influiscono maggiormente sulla stima, per cercare di modificare questi fattori migliorando la prognosi. Le 2 domande più comuni sono:

  • Quali sono i predittori più importanti in una certa patologia.
  • Quali sono i rapporti tra i vari predittori. Vi è stato un aumento dei metodi machine learning , che rappresentano algoritmi che considerano come input un enorme numero di caratteristiche dei pazienti, per fornire come output la probabilità che il paziente abbia un evento. Sono definiti machine learning in quanto devono imparare a fornire l’outcome analizzando dati di eventi che si sono già verificati. Questi algoritmi gestiscono grandi moli di dati, per questo sono utili in branche come genomica e la proteomica; il limite è che sono basati solo sulla predizione, non danno informazioni sugli effetti delle variabili sulla probabilità. I metodi machine learning non trovano grande applicazione nella pratica clinica, in cui si usano principalmente gli approcci statistici classici, che consentono sia di ottenere una stima della probabilità, sia di valutare l’effetto dei predittori. Una differenza tra i 2 metodi è rappresentata dal fatto che nel machine learning non si fanno assunzioni o ipotesi a priori, ma si parla di “ approccio guidato dai dati ” (approccio più libero, si valutano solo i dati); i modelli classici si basano su assunzioni sul come i dati siano generati, e se queste sono verificate il modello funziona. Mentre il machine learning consente solo di classificare una probabilità, i metodi classici consentono di predire una probabilità (con un intervallo di confidenza) e di capire il peso specifico dei vari fattori sulla probabilità. I modelli statistici devono avere 2 caratteristiche fondamentali:
  • Affidabilità : deve essere affidabile, quindi ben calibrato, ovvero dare stima corretta. Il modello statistico è allenato su un data set di cui si ha l’outcome osservato, quindi si ha già la risposta. Parte del campione si usa per stimare il modello (ottenere i coefficienti delle variabili che stimano il rischio). Parte si usa per valutare se la combinazione trovata stima il rischio giusto. Queste 2 parti si chiamano training e test ; si può affermare che lo strumento è calibrato se identifica correttamente il rischio di eventi. La statistica non dà certezze ma probabilità stimate, attorno a cui esiste un errore aleatorio.
  • Discriminazione : simile alla calibrazione ma più legata al singolo soggetto, consente il ranking dei pazienti in base al rischio. La discriminazione può essere mostrata con curve ROC, per capire specificità e sensibilità test diagnostico; usate anche negli score di rischio. Queste 2 caratteristiche dovrebbero essere sempre verificate e validate, sul proprio data set ma possibilmente anche su altri data set. Oltre all’ incertezza aleatoria (dovuta al fatto che si sta trattando dati campionari,), esiste l’ incertezza sistematica ( epistemica ), legata a compilazione del modello, scelta delle variabili e a come sono inserite nel modello. La scelta delle variabili è un compito del clinico, mentre la scelta di come combinarle nel modello è un compromesso tra clinica e statistica. Il modello statistico vorrebbe che le variabili non siano correlate tra loro, in quanto 2 variabili fortemente correlate danno la stessa informazione ( multicollinearità ).
  • Qualità dei dati : sono costruiti su dati osservazionali. Bisogna capire la qualità della misurazione dei dati, l’intento con cui sono stati misurati, se sono stati misurati una volta sola o se si sta seguendo la popolazione nel tempo. Bisogna considerare carie informazioni per capire il modello da applicare. Se la raccolta dati è prospettica, è preferibile che il clinico discuta con lo statistico prima di iniziare la raccolta, per capire come raccogliere i dati. Spesso ci si basa su dati già raccolti, di cui è necessario solo valutarne la qualità. I 7 step dello sviluppo dei modelli di predizione con analisi regressiva:
  1. Predizione del problema: definire il problema (diagnostico o prognostico, compito del clinico). Ci si chiede qual è la domanda di ricerca, cosa si sa già dei predittori nella comunità scientifica, come si intendono misurare i predittori, qual è l’outcome di interesse.
  2. Codifica dei predittori: definire come si misurano le variabili (scale di misura, ecc…).
  3. Formula del modello: definire le equazioni da usare e quali variabili inserire. Quindi ci si chiede quali sono i predittori da inserire nei modelli e in che modo verranno inseriti. Sono d’aiuto le tecniche step- wise ( graduali ): dalla matrice dei dati (insieme di caratteristiche dei pazienti e outcome) si valutano le caratteristiche gradualmente, per capire quanto queste influiscano singolarmente sull’outcome. Si tratta di un’ analisi univariata. Una volta selezionate le variabili rilevanti, sono inserite in un modello multivariato , che tramite algoritmi iterativi che aggiungono e sottraggono alcune variabili consente di ottenere un modello finale che trattiene il sottogruppo di variabili statisticamente più significative. Si possono avere più modelli equivalenti, con performance equivalenti (con bontà prognostica simile); in questi casi si tende a scegliere il modello che usa le variabili più semplici da misurare.
  4. Stima dei parametri: se ne occupano i software. Per i modelli di regressione si stimano i coefficienti per ogni predittore nel modello.
  5. Bontà di adattamento: il modello è completo e tutti i predittori hanno un peso, la combinazione dà in output una probabilità predetta. La valutazione della bontà di adattamento viene effettuata sui propri dati, poi eventualmente su dati esterni.
  6. Validità: valutazione di affidabilità, calibrazione, discriminazione. L’ideale sarebbe valutare la validità del modello su dati esterni.
  7. Presentazione: se gli step precedenti sono andati a buon fine, si può avere la pubblicazione del modello su un articolo scientifico. Nella pubblicazione non si mostrano le formule usate, ma si cerca di rendere la presentazione più comprensibile con varie tipologie di presentazione, ad esempio nomogrammi , in cui ad ogni variabile viene assegnato un punteggio che verrà sommato agli altri. Ad eccezione degli step della stima dei parametri, della valutazione della bontà di adattamento e della validità, gli altri vengono affrontati insieme al team di ricerca (quindi anche ai clinici). Un esempio di modello è quello in ambito di rischio cardiovascolare, il Framingham Score ; che prende il nome dalla cittadina americana in cui fu reclutata la popolazione studiata e mira a prevedere il rischio di malattia coronarica sulla base di alcune caratteristiche. Lo score usato è il risultato di uno studio di coorte in cui vennero reclutati alcuni cittadini, vennero misurate le caratteristiche alla prima visita aggiornandole nel

Quando si esegue un trial si randomizza per non avere confondimento; se sono randomizzati i pazienti che riceveranno, ad esempio, un trattamento e i rispettivi controlli con meccanismo probabilistico di assegnazione, indipendente dalle caratteristiche dei pazienti, le caratteristiche stesse dovrebbero essere bilanciate tra i gruppi per attribuire differenze dell’outcome solo al trattamento. Con la randomizzazione non solo viene bilanciato quello che si può misurare ma anche quello che non può essere misurato; il trial da questo punto di vista è dunque ideale. Con gli studi osservazionali questo non può essere fatto perché se si considera la somministrazione di un certo trattamento, questa è conseguente a una decisione del medico presa sulla base di caratteristiche del paziente; in questi studi ci possono essere tra le popolazioni caratteristiche che differiscono in modo sistematico. Se questa criticità non viene risolta si rischia di avere una stima distorta; nell’ambito di uno studio osservazionale se si desidera quantificare la relazione trattamento-outcome bisogna ricorrere a un modello di regressione perché ci saranno confondenti. In questo caso si può aggiustare solo per quello che è misurato infatti negli articoli basati su studi osservazionali si trova la dicitura “non sappiamo se ci sono confondenti non misurati”. Per i confondenti misurati, i modelli di regressione stimano l’effetto di una variabile aggiustando per le altre; questo metodo è dettato da esigenze reali in quanto i trials, ottimali dal punto di vista della randomizzazione, presentano limitazioni, come popolazioni selezionate e durata limitata. Il modello di regressione multivariato è molto usato per stimare l’effetto di un trattamento a parità di confondenti ma non è l’unico metodo; esistono metodiche basate su una quantità definita propensity score , stimato tramite modello di regressione. Anche queste sono usate in ambito di studi osservazionali in cui si ha popolazione di trattati e una di non trattati; essendo la decisione sul trattamento presa su base clinica e non randomizzata, i 2 gruppi avranno differenze sistematiche tra loro. Per valutare l’effetto del trattamento sull’outcome si può applicare il propensity score , una stima della probabilità che ciascun paziente ha di ricevere il trattamento in funzione delle caratteristiche. In questo modo si possono creare gruppi in modo artificiale, un data set matchato ; partendo dalla popolazione reale vera, si stimano i vari propensity score e si cerca di matchare ogni trattato a un non trattato con score simile rendendo i dati simili a quelli che sarebbero derivati da un trial. Si creano 2 gruppi artificiali che probabilmente non considereranno tutta la popolazione originale ma un sottogruppo tale da avere un gruppo di trattati e uno di non trattati, il più possibile simili per caratteristiche. I 2 estremi nei modelli di regressione sono:

  • Modello esplicativo : interessa un fattore in particolare e gli altri sono solo confondenti.
  • Modello predittivo : interessa il valore combinato di tutti i predittori e la stima della probabilità. Uno statistico a contatto con i clinici sarà più interessato alle relazioni causali. Diverso sarà l’approccio di uno statistico che lavora nelle agenzie di assicurazioni che hanno l’obiettivo di vendere le assicurazioni sulla vita e quindi di avere delle stime accurate delle probabilità di sopravvivenza. In questo caso sarà interessato a valutare la probabilità di avere eventi entro un lasso di tempo; quindi sarà interessato all’aspetto predittivo.

Modelli di regressione

La regressione lineare standard viene usata quando si ha un risultato d’interesse misurato su scala continua. Nel momento in cui si applica un modello di regressione, si immagina che ci sia un modello generatore dei dati osservati. A questo punto si osserva un campione, risultato di questo meccanismo probabilistico. Ci sarà una componente di variabilità casuale legata al fatto che si ha a disposizione un campione di dati e non si osserva la popolazione. Ci sarà una variabilità sistematica, che è quella che si tenta di spiegare attraverso covariate. Il modello viene scelto su scala di misura dell’outcome.

  • Scala binaria.
  • Scala di conteggio.
  • Scala continua numerica.
  • Scala categorica ordinata.
  • Tempi di sopravvivenza.
  • Scala multinomiale (ha tante classi ma non ordinate tra loro). In base alla scala di misura si ha il modello di regressione adeguato.
  • Modello di regressione logistica : lavora su outcome binari.
  • Modello di regressione lineare : lavora su outcome di tipo continuo.
  • Modello ad azzardi proporzionali : lavora sui tempi di sopravvivenza.
  • Modello di regressione di Poisson : lavora su outcome di tipo conteggio. Il modello generatore di dati immaginato a livello probabilistico, dipende dalla scala di misura del fenomeno. Il modello generatore di dati, cioè la variabile aleatoria che produce ciò che viene osservato nei dati, ha una certa distribuzione di probabilità in funzione della scala di misura. Il tipo di notazione prevede:
  • Variabile dipendente che corrisponde all’outcome (Y, X).
  • Predittori, cioè le caratteristiche dei pazienti.
  • Coefficienti di regressione. Si effettua combinazione lineare delle variabili con pesi determinati dai coefficienti di regressione. L’obiettivo è stimare una relazione tra Y e X, in funzione delle caratteristiche stimate. Il tipo di relazione stimata dipende dalla scala di misura della variabile Y. Il modello di regressione lineare stima il valore atteso in media (c’è sempre l’errore aleatorio) dal momento che si hanno queste caratteristiche. Nonostante ci sia componente di errore, se il modello funziona, la componente di errore in media sulla popolazione è 0. In caso di modello di regressione lineare, si ha un’unica covariata X, quindi un unico predittore, e Y entrambe in una scala numerica. Per ogni valore X si ha una distribuzione di valori per la Y osservati. La retta su cui sono posti i pallini (pazienti) è la retta di regressione lineare , un’equazione che informa che qualsiasi dato valore di X il punto dove interseca la retta è il valore atteso di Y, il valore più probabile. Se il modello funziona la retta interseca la nuvola dei punti e quindi l’errore commesso singolarmente sulla popolazione si bilancia. Per stimare un modello di regressione lineare, si assume che la Y osservata nel campione derivi da una variabile aleatoria che ha distribuzione di tipo gaussiano simmetrica intorno ad una media ignota e che si allontana da essa con una certa variabilità. Ciò che viene osservato è una realizzazione di questa variabile aleatoria e, una volta che i valori sono condizionati alle X osservate, si ottiene un’altra variabile aleatoria che ha un certo errore residuale che sulla popolazione si annulla. Quindi la stima sarà la migliore, se i dati confermano le ipotesi. Nell’equazione estrapolabile si avrà il coefficiente α che è l’intercetta (valore di Y quando X è 0 ), è un valore inutile ma serve per il modello per porre la retta da qualche parte nel piano; β è l’elemento d’interesse, ovvero il coefficiente angolare che indica quanto varia la stima di Y al variare di un anno di X. Si inseriscono i dati in un software di statistica, da cui si ottengono in output i coefficienti, ovvero i numeri α e β; tutto ciò è possibile grazie ad un metodo statistico di stima, noto come metodo dei minimi quadrati. L’output del modello di regressione non viene mai riportato negli articoli, ma è importante, in quanto dice qual è la stima dei coefficienti di regressione, nonché la significatività di tali coefficienti. Si sta lavorando su dati campionari, quindi grazie al software si ottiene in primis la stima dei coefficienti, per la quale ci sarà un errore variabile, e successivamente il test statistico dirà se queste stime ottenute sono diverse da 0, ovvero se sono significative da un punto di vista statistico. Se le stime sono significative, quando si ripete tale analisi su un altro campione, ci si attende il ripresentarsi di un valore simile. Assunzioni Nel momento in cui si è stimato il valore di Y per ogni paziente, sarà possibile calcolare i residui di regressione, ossia la differenza tra valore stimato e reale. La curva che rappresenta la distribuzione dei residui dovrebbe essere una gaussiana a media 0. Ci si aspetta che i residui di regressione sommati costituiscano una curva circa centrata a campana sullo 0; è una situazione ideale, indice del fatto che l’errore commesso nel calcolo è più o meno nullo. Se il campione è piccolo, è sufficiente un singolo valore anomalo per far sì che la curva a campana non sia a campana. Se vi sono outliers nel modello lo statistico parla con il medico, per verificare che il dato osservato sia reale. Nel caso in cui il medico confermi la veridicità del valore, ci si porrà dei dubbi relativi alla possibile problematica di salute. Si ispezionano quindi outliers.

malattia già diagnosticata, si decide la numerosità dei 2 campioni, dunque non è possibile calcolare l’incidenza della malattia, ma è uno studio usato nelle malattie rare. I dati non sono sempre binari, ma potrebbero essere anche su scala numerica. La regressione logistica è importante perché permette di calcolare l’ odds ratio anche in questi casi. La formula dell’ odds ratio (considerandolo binario come in tabella; disease sono i casi, not desease sono i controlli) è il rapporto tra diagonale principale (a * d) e diagonale opposta (c * b). L’ odds ratio è un rapporto di probabilità condizionate : il rapporto tra la probabilità di avere la malattia se esposto, sulla probabilità di non avere la malattia se esposto; diviso la probabilità di avere la malattia se non esposto, sulla probabilità di non avere la malattia se non esposto (lettera normale è positività, lettera barrata è negatività, dunque D è malattia, D con barra è non avere la malattia, E è esposizione, E con barra è non esposizione). Si calcola anche il confidence interval attorno al numero ottenuto: se è >1, conferma che il fattore di rischio è statisticamente significativo ed è associato alla malattia, se è <1, conferma che il fattore di rischio è statisticamente significativo ed è protettivo. Attraverso il modello di regressione logistica in cui si inserisce:

  • Variabile dipendente: probabilità di avere la malattia.
  • Variabile indipendente: fattore di interesse. Si ottiene l’ odds ratio per ciascuna delle variabili inserite, e ciascun odds ratio sarà aggiustato rispetto alle altre caratteristiche. Per capire se vi è stato un confondimento, si confronta il valore dell’ odds ratio crudo con quello aggiustato: se vi è differenza sostanziale, il confondimento è presente; se non vi è differenza e i valori sono simili, non vi è confondimento. Queste analisi si possono applicare in modo univariabile o multivariabile su tutte le variabili misurate nello studio, ma rimane un residuo confondente non misurato. Modificazione dell’effetto/interazione Oltre al fattore di rischio d’interesse e l’outcome, vi è una 3 ª variabile che cambia il risultato. Per alcune classi di età, il farmaco può avere un effetto protettivo, nullo o diventa un fattore di rischio. Questo è un modificatore dell’effetto. Se questo accade, nel modello di regressione logistica va inserita questa variabile, ma in modalità che permetta di inserire un termine che sia il prodotto del fattore di rischio per questa variabile. Se il termine di interazione è statisticamente significativo, l’interazione viene confermata. Successivamente si può trasformare l’analisi in analisi stratificata : dividere la popolazione in classi in cui vi è omogeneità del fattore che modifica l’effetto. Ci potrebbero essere differenze più sfumate, ad esempio basate sulla forza risultante dell’effetto. Ad esempio, l’associazione tra la presenza di diabete (fattore di rischio) e malattia cardiovascolare (outcome). Calcolando l’ odds ratio su un campione di popolazione generale senza divisione tra sessi, l’ odds ratio è 4 ,3 (pazienti diabetici possiedono 4,3 volte il rischio della popolazione controllo); quando si stratificava rispetto al sesso, nei maschi l’ odds ratio era 6,3 e nelle donne 2,2. Quindi, la direzione dell’effetto resta che il diabete è un fattore di rischio associato a malattia cardiovascolare, ma l’associazione cambia in base al sesso. Un modello che in un’unica formula gestisce interazione e confondimento, è il modello di regressione logistica, che stima contemporaneamente più odds ratio. Si tratta di un rapporto di probabilità (pi= probabilità di sviluppare la malattia se presente il fattore i). OR è la probabilità di essere esposto, diviso per 1 meno la probabilità di essere esposto; fratto la probabilità di non essere esposto fratto 1 meno la probabilità di non essere esposto. Il modello di regressione logistica consente di valutare la probabilità ( p ) di avere la malattia sotto alcune condizioni ( i ). Usa la combinazione lineare di fattori di esposizione e confondenti ( c ). L’esponente di “e” è una formula simile alla regressione lineare. I coefficienti, per come è scritta la formula, una volta estimati dalla formula e fattane l’esponenziale, portano all’ odds ratio di tutte le variabili del modello. Dunque, per tutti i fattori di confondimento ed esposizione, il modello restituisce la stima dei b e ciò che

rimane è calcolare l’esponenziale elevato a b, ottenendo l’odds ratio dell’esposizione aggiustato per le altre variabili di confondimento. Essendo la variabile dipendente una probabilità, la matematica crea passaggi per trasformarla in dati lineari, quindi l’equazione per ottenere l’ odds ratio aggiustato è la logit function. Vi sono 2 modelli di regressione logistica che si possono usare in clinica ed epidemiologia, a seconda di come sono raccolti i dati.

  • Modalità binaria : il più comune in ricerca clinica, presuppone che la raccolta di dati sia una matrice in cui ogni riga è un paziente che risulta essere 1 se è un caso, 0 se è un controllo; 1 se c’è stata esposizione, 0 se c’è assenza, e poi parametri aggiuntivi C1 e C2, come età e sesso. Prende come variabile dipendente (quella che vuole predire), ovvero il caso/controllo, e restituisce per ciascun fattore nel modello l’ odds ratio aggiustato.
  • Modalità binomiale : più comune negli studi epidemiologici di fattori di inquinamento ambientale, vede gli effetti raggruppati. Ad esempio, si suppone che si stia studiando un ospedale, le caratteristiche di un reparto e il numero di casi che vi incidono: le caratteristiche degli ospedali diventano le variabili, il numero di persone malate di una specifica malattia (casi) sui pazienti ricoverati nel reparto. Ci sono anche variabili fisse che rappresentano la linea reparto. Si può applicare una regressione logistica: stimare la probabilità di avere un caso in funzione delle caratteristiche del reparto. Se nel modello di regressione logistica si mette un unico predittore, si ottiene l’ odds ratio crudo, tramite le esponenziali del b di quella variabile. Non è un processo inutile: prima di fare un calcolo multivariato si guarda caso per caso quale potrebbe essere l’effetto tra i vari fattori di interesse. Interpretazione del coefficiente Esistono variabili su scala numerica: ci sarà un’unità di misura della variabile. Se il fattore di esposizione è binario, interpretandolo come il rischio aumentato se il fattore è presente o assente. Nella regressione lineare classica, l’interpretazione dei coefficienti di regressione erano interpretati con un’equazione (y=a + bx), in cui se x cambia, b rappresenta come cambia in media y. Nella regressione logistica il processo è simile, nonostante sia calcolata da un’esponenziale: se x cambia di un’unità nella sua scala di misura, y cambia su funzione logaritmica, in accordanza con la scala dell’ odds ratio. Se x resta l’età ed essa varia di 1 anno, l’odds ratio calcola la variazione del rischio per ogni aumentare di un anno di età; il rischio può aumentare ( odds ratio >1) o diminuire, verificando il fattore di esposizione come rischioso o protettivo a seconda che esso sia >1 o <1. Se si vuole valutare l’ odds ratio per un cambiamento di k unità nella scala di misura di x, si eleva alla “k” il numero che ritorna dalla regressione logistica. Il modello di regressione logistica ha un’intercetta, che non è di interesse e non viene interpretata poiché interessa il b della variabile analizzata. È il rischio di malattia quando tutte le variabili sono 0. Variabili categoriche Se si ha un modello di regressione binaria, l’ odds ratio è il fattore presente contro il fattore assente. Se vi è una scala numerica si analizza allo stesso modo ma per unità. Esiste una variabile categorica , una variabile con più di 2 livelli, non numerica. Ad esempio in uno studio in cui si punta a capire l’effetto del peso corporeo sul rischio di malattia coronarica, il peso è una variabile numerica continua, ma i clinici avevano deciso di raggrupparla in classi, rendendola una variabile categorica. Nei modelli di regressione va decisa la classe di riferimento: il modello stima i coefficienti delle altre classi scontrate con quello di riferimento, l’ odds ratio è un rapporto di rischio, quindi deve avere un riferimento. Ciò si vede come presenza o assenza; oppure incremento di uno o nessun incremento.

Se si osservano tutti per la stessa durata di tempo, si può calcolare un’incidenza cumulativa di eventi come numero di casi sul totale della popolazione a rischio all’inizio dell’osservazione. Si fa il rapporto tra questa quantità in esposti e non esposti, ottenendo il rischio relativo. Di solito l’espressione rischio relativo indica il rapporto tra incidenza cumulative, invece l’ incidence rate ratio è il rapporto tra tassi d’incidenza calcolati col metodo delle persone/anno. Se alla fine vi fosse fattore di esposizione binario collegato alla presenza di malattia si può calcolare il rischio relativo facendo il rapporto tra gli esposti che sviluppano la malattia sul totale degli esposti rispetto ai non esposti che sviluppano la malattia suo totale dei non esposti. Il RR ha senso calcolarlo su studi di coorte quindi quando si guarda l’incidenza degli eventi, mente l’OR ha senso calcolarlo in studi caso-controllo. Poiché si sta lavorando con probabilità condizionate, l’evento che condiziona è in qualche modo fissato, mentre l’evento che non condiziona dovrebbe essere casuale. Nello studio di coorte l’evento casuale è la malattia perché si sviluppa nel tempo e il fattore di esposizione è fissato all’inizio, viceversa nello studio caso-controllo la malattia è già stata sviluppata e quello che si guarda è la frequenza che oscilla del fattore di esposizione. L’interpretazione numerica del rischio relativo è identica all’OR. Il valore nullo è 1, cioè implica che non c’è associazione. Se è >1, il fattore di esposizione incrementa il rischio. Se è <1, è protettivo. Modello di regressione di Poisson Il calcolo del rischio relativo considera un fattore di esposizione binario. Vi possono avere più cofattori da tenere in considerazione. Come nella regressione logistica, si tratta di confrontare rischio relativo crudo e aggiustato. Il modello di regressione di Poisson prende il nome dalla variabile casuale di Poisson che ha una certa distribuzione di probabilità e che descrive l’incidenza degli eventi, specialmente quando sono rari che accadono in un certo intervallo di tempo. Si immagina di osservare eventi in un tempo e questo processo segue la legge della probabilità della variabile aleatoria di Poisson. Si applica un modello di regressione con scala non lineare, ma che poi lo diventa: μ è il numero atteso di eventi aspettati di osservare in una certa popolazione in funzione di alcune caratteristiche della popolazione, dove e è il fattore di esposizione e c sono le variabili di confondimento. Il modello di regressione di Poisson lavora sulla scala del numero di eventi attesi e per ciascuno degli eventi di interesse calcola un coefficiente. Se si fa l’esponenziale di questo esponente, si ottiene il rischio relativo di quella variabile aggiustato per la presenza del confondimento. Il ragionamento è uguale a quello della regressione logistica, tuttavia i b, se elevati all’esponenziale, diventano dei rischi relativi (mentre prima diventavano OR). La variabile dipendente è il numero atteso di nuovi casi sotto la condizione i. In base al valore che assume l’esposizione e che assumono le variabili di confondimento, si stima il numero atteso, ossia l’incidenza di nuovi casi. Pi indica la popolazione a rischio osservata: non è un parametro stimato ma che si fornisce al modello, serve per trasformare il valore atteso di nuovi casi in un tasso di incidenza. Poi ci sono delle variabili di esposizione e alcune di confondimento. Si vuole arrivare ad una scala lineare. La vera equazione è sul logaritmo del numero atteso di eventi: se si applica questa trasformazione, si ottiene un’equazione lineare (semplice da risolvere rispetto ai beta). L’interpretazione va fatta tornando sulla scala dell’incidenza. Con il modello di Poisson, è possibile stimale rischi relativi o incidence rate ratio aggiustati, quindi che tengano conto degli altri fattori di confondimento. Ad esempio, l’esposizione può essere 0 o 1. Nella formula di Poisson c’è il tasso di incidenza negli esposti quindi coloro i quali hanno 1 nella variabile e ed il tasso di incidenza nei non esposti (0 nella variabile). Se si fa il rapporto tra queste 2 quantità, ovvero il rischio relativo, si ottiene un’espressione che dipende da b e dalle variabili di confondimento. Se 2 individui hanno gli stessi valori per le variabili c, si ottiene RR=eβE, ossia l’impatto del fattore di esposizione assumendo che queste 2 variabili siano uguali. Il RR al fattore di esposizione si interpreta come l’impatto del fattore di esposizione a parità delle altre co-variate. Quindi se 2 individui hanno valori uguali nelle co-variate ma uno è esposto e l’altro no, l’esponenziale di βE è il rischio relativo aggiustato. Relative risk The Relative Riskfor an outcome D associated with a binary riskfactor E, denoted by RR,is defined as follows: 𝑃 𝐷 𝐸 𝑅𝑅 = 𝑃 𝐷 𝐸ത D Not D Tot E a b a+b Not E c d c+d Tot a+c b+d N RR=a/(a+b):c/(c+d)

Per capire se ha senso mettere i confondimenti nell’equazione si fa un confronto tra modello senza le variabili confondenti (RR crudo), rispetto al modello con le variabili di confondimento (RR aggiustato): se il rapporto tra queste 2 quantità è 0,9-1,1, non c’è confondimento nello studio, quindi la stima cruda e quella aggiustata sono equivalenti. Altrimenti, bisogna usare il rischio relativo aggiustato. La regressione di Poisson si usa negli studi di coorte perché riesce a tener conto del problema dei tempi di osservazione variabili. Se si usa come base di popolazione le persone/tempo, tramite la regressione di Poisson si può stimare i tassi di incidenza e gli incidence rate ratio aggiustati e crudi. Nella regressione logistica, non c’è la dimensione del tempo: il fattore di esposizione è misurato contemporaneamente alla malattia. In uno studio di coorte non sarebbe corretto applicare la regressione logistica perché non tiene conto che le persone hanno tempo variabili di osservazione.

Analisi di sopravvivenza

Il follow up è un aspetto che non può essere ignorato nello studio, infatti permette di stabilire un rapporto di causa-effetto tra fattore di rischio ed incidenza di malattia. Il fatto che vi sia questo intervallo di tempo tra manifestazione della causa e l’effetto, aiuta a stabilire la relazione tra questi 2 fattori. In studi caso-controllo e trasversali, in cui il follow up è assente, è difficile stabilire il rapporto tra causa ed effetto, poiché l’esposizione al fattore e l’ outcome sono misurati nello stesso istante, quindi non si può sapere se l’esposizione sia stata antecedente alla malattia o meno. Inoltre, dal punto di vista epidemiologico, questi studi, soprattutto per quanto riguarda quelli trasversali, sono in grado di fornire informazioni riguardo la prevalenza della malattia, ma non riguardo la sua incidenza, ovvero non sono utili a definire il numero di nuovi casi nel tempo. In ogni caso, a partire dagli studi caso-controllo, è possibile elaborare misure che quantifichino l’associazione tra fattore di esposizione e malattia, con l’ odds ratio. Solo se si è sicuri che l’esposizione verificatasi nei casi sia antecedente alla malattia si parla di rapporto di causa-effetto. Gli studi in cui è presente il follow up sono:

  • Studi di coorte.
  • Clinical trial randomizzati : i pazienti sono arruolati, randomizzati e seguiti per un periodo di tempo. In tali studi, il follow up permette sia di valutare l’incidenza della malattia sia di dare misure di associazione tra fattore di esposizione e manifestazione della malattia. Si parla di hazard ratio , o rapporto di rischio , misura di associazione che mette in relazione esposizione, tempo ed evento. Metodi di sopravvivenza Metodi statistici per analizzare dati dove la variabile di interesse è il tempo tra un’origine e un evento; l’oggetto di interesse dello studio è la durata, quanto tempo passa tra prima volta che si è visto il paziente a quando egli svilupperà l’evento. Se ci si focalizza sulla sopravvivenza dei soggetti, intesa come stato di vita, quindi l’oggetto d’interesse è il decesso. Alla fine del periodo di osservazione, i pazienti sono identificati con una coppia di valori:
  • C ( condizione ): il paziente potrà essere sopravvissuto (0) o deceduto (1), variabile binaria.
  • T ( durata dell’osservazione ): diverse nei diversi pazienti: o Alcuni pazienti sono deceduti nel follow up. o I pazienti non deceduti si dividono a loro volta in: § Pazienti che hanno concluso il follow up senza che si sia verificato l’evento. § Pazienti persi durante il follow up. All’inizio dello studio, il campione ha una dimensione; alla fine sarà minore, contando sia i deceduti sia i pazienti persi durante il follow up. In alcuni casi l’oggetto di interesse non coincide con il decesso; il termine sopravvivenza asserisce alla sopravvivenza libera da un evento, anche non fatale (ad esempio una ri- ospedalizzazione), può essere qualsiasi fenomeno di cui mi interessa misurare l’incidenza.

stato il momento in cui tale paziente abbia manifestato la ricorrenza. Se l’osservazione è lunga e gli intervalli tra le visite brevi, si può decidere di approssimare la data dell’evento con la data della prima visita in cui si riscontra la ricorrenza. Se non vi fosse il problema della censura, e le persone fossero state seguite per lo stesso periodo di tempo, varrebbe l’equazione: Nell’analisi di sopravvivenza, si lavora su dati campionari, quindi bisogna immaginare che il tempo di sopravvivenza nella popolazione generale dalla quale si è estratto il campione sia una variabile casuale, a cui si associa una certa distribuzione di probabilità. Se t corrisponde al tempo di sopravvivenza, allora: 1 - S = f dove f = incidenza cumulativa di eventi, quindi la probabilità di osservare un evento prima del tempo t. Inoltre bisogna considerare il numero di decessi all’anno, al fine di definire la probabilità di sopravvivenza ad ogni tempo t dell’osservazione. Per stabilire tale probabilità è sufficiente togliere dalla somma totale dei soggetti il numero di morti ogni anno; ma il problema è come inserire nella formulazione della probabilità di decesso l’informazione relativa ai pazienti censurati. Kaplan e Meier hanno risolto tale problema: i censurati vanno considerati presenti nell’insieme delle persone a rischio nell’intervallo in cui sono stati censurati, ed eliminati dallo stesso insieme nell’intervallo successivo. È un processo iterativo, che sfrutta un meccanismo di fudging , la cui applicabilità è dimostrabile statisticamente. Stima di sopravvivenza Per dare una stima di sopravvivenza anno per anno a partire dal campione preso in esame, si ragiona:

  • 1° anno probabilità calcolata con Kaplan-Meier.
  • 2° anno, probabilità di sopravvivenza corrisponde al prodotto tra la probabilità di sopravvivere al primo anno e probabilità di sopravvivere al secondo anno. Per arrivare vivo al 2° anno bisogna essere sopravvissuto al 1° anno; si moltiplica in modo iterativo la probabilità di sopravvivere gli anni precedenti a quella di sopravvivere all’anno studiato. La funzione di Kaplan-Meier corrisponde ad uno stimatore basato sul concetto di moltiplicare la probabilità di sopravvivenza istante dopo istante lungo il periodo di osservazione. Al termine dello studio, si ottiene un grafico a gradini : durante il follow up si ha diminuzione del campione. Kaplan e Meier hanno suggerito di dividere il follow up in tanti piccoli intervalli, ciascuno delimitato dalla manifestazione di un evento; per ogni intervallo, è necessario contare i soggetti censurati e che hanno subito l’evento, ed eliminarli dalle persone a rischio nell’intervallo successivo; a questo punto si può fare il calcolo delle probabilità condizionate. Ciò che si ottiene è la stima della funzione di sopravvivenza per ciascun intervallo del follow up , e tale funzione presenta un valore diverso per ogni intervallo, ovvero ogni qualvolta che si verifichi un evento. Volendo stimare la sopravvivenza mediana, si può ricercare nel grafico il punto corrispondente a 0,5, tirare una linea e osservare quale sia il tempo a cui corrisponde una sopravvivenza del 50%. Alcune volte non si è in grado di conoscere il tempo mediano: se più della metà del campione ha sperimentato l’evento allora si può conoscere tale valore, ma se lo studio presenta alta percentuale di sopravvivenza, ed è associato ad una curva alta, o se la curva scende precipitosamente, raccolta dei dati e calcolo della mediana subiscono modificazioni. Ad esempio, nei clinical trial , spesso non viene ricercato il tempo di sopravvivenza mediano, perché spesso meno della metà dei soggetti subisce l’evento durante il follow up. Tali studi possono essere utili per stimare la sopravvivenza dei soggetti nei vari intervalli di tempo, e per farlo basta ricercare nell’asse del follow up gli intervalli di tempo di interesse e vedere la differenza tra le varie curve. I dati sono di tipo campionario, quindi l’informazione finale sulla stima puntuale della sopravvivenza sarà accompagnata da intervalli di confidenza. Più si va avanti nel follow up , più la dimensione del campione diminuisce, e quindi la precisione delle stime tende anch’essa a calare. Test di ipotesi

Una volta stimate le curve, per valutare un fattore di esposizione che divide i pazienti in gruppi, le si confronta tramite test di ipotesi. Si ha un’ ipotesi nulla e un’ ipotesi alternativa. La prima è la negazione di quello che si pensa di trovare (l’ipotesi nulla dice che non c’è differenza tra i gruppi), mentre l’ipotesi alternativa nega l’ipotesi nulla (differenza statistica significativa). Il test più applicato per confrontare le curve di sopravvivenza è il test log-rank. Si sta lavorando su dati campionari e si deve capire se quello che si osserva su questi dati sia legato ad oscillazioni dovute al campionamento (variabilità casuale) o ad una differenza sistematica della popolazione da cui si sono estratti i dati. L’ipotesi nulla è: non c’è differenza tra queste curve, i 2 gruppi hanno lo stesso meccanismo di sopravvivenza; quindi, calcolando gli eventi attesi, si distribuirebbero uniformemente nei 2 gruppi e saranno simili agli eventi osservati. Viene svolto un calcolo su eventi attesi e eventi realmente osservati. Sono calcolate le differenze nel follow up e se sono rilevanti, si ottiene un p- value basso. Questo perché la statistica dei test che si calcola sui dati posseduti ha una certa distribuzione di probabilità e se la probabilità di osservarlo è bassa significa che l’ipotesi nulla non è vera. Se il p value è <5% si rigetta l’ipotesi nulla, viceversa se > 5 %. Il p value un valore compreso tra 0 e 1, il 5% è un cut off deciso arbitrariamente. Funzione di incidenza cumulativa Analogamente alla funzione di sopravvivenza, definita come la probabilità di sopravvivere oltre l’istante t , si può studiare la funzione di incidenza cumulativa (espressa come 1-funzione di sopravvivenza), cioè il tasso di eventi accumulato fino all’istante t. La prima mostra i pazienti liberi da evento in un certo tempo, la seconda quanti pazienti lo hanno sperimentato fino al tempo t. Quando il tasso di eventi è basso, si usa la funzione di incidenza cumulativa per focalizzare l’attenzione sull’accumulo degli eventi, dimostrando che vi era una differenza statisticamente significativa tra i 2 farmaci anche se gli eventi erano molto pochi. Funzione di azzardo Può essere vista come un tasso di rischio istantaneo , quindi quantifica la probabilità di sperimentare un evento in un intervallo breve. Può essere immaginata come “la velocità della mortalità”, cioè se la sopravvivenza ha una certa forma, la derivata della sopravvivenza è definita dalla funzione di azzardo. La funzione di azzardo cumulativo è l’integrale della funzione di azzardo. Essa indica la probabilità di sperimentare un evento entro un istante t , se potenzialmente il paziente è vivo in quel momento. Questa funzione è utile per ricollegarsi all’ assunzione degli azzardi proporzionali. Il test log-rank verifica se gli eventi in 2 gruppi sono diversi ad ogni istante t dagli eventi aspettati se i 2 gruppi avessero la stessa probabilità di sopravvivenza. Alla fine, il test fa una somma di queste differenze, ottenendo un unico numero che vale per tutto il follow up. Questo significa che si assume che il rapporto tra le curve sia costante nel tempo. Questa assunzione non viene fatta a livello delle curve di sopravvivenza, ma delle funzioni di azzardo. Dati 2 gruppi e le relative funzioni di azzardo, si può dire che la funzione di azzardo al tempo t nel gruppo 1 e 2, in rapporto tra di loro, è costante per tutta la durata del follow up. Se questa assunzione è vera, ha senso applicare il test log-rank , che vale per tutto il follow up. Sennò, ad esempio se le funzioni di azzardo si incrociano, non si può applicare, perché per l’inversione delle curve si otterrebbe effetto nullo. Modello di regressione Negli studi, soprattutto osservazionali, ci sono caratteristiche che incidono sulla sopravvivenza. Cox, ha definito un modello di regressione adatto ai dati di sopravvivenza. Stima il rischio istantaneo di evento al tempo t usando la funzione di azzardo, in funzione delle caratteristiche dei pazienti. Si differenzia dagli altri in quanto permette di considerare in modo omnicomprensivo le caratteristiche dei dati di sopravvivenza:

  • Regressione logistica: outcome binario, ma ignora il tempo, si usa in studi trasversali o caso-controllo.
  • Regressione lineare: outcome numerico dando direttamente i tempi di sopravvivenza, ignora la censura e stima un valore atteso in media.