

















Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Infermieristica (abilitante alla professione sanitaria di Infermiere) - Corso di laurea C - Roma Azienda Policlinico Umberto I STATISTICA Blocco: INFERMIERISTICA BASATA SULLE PROVE DI EFFICACIA
Tipologia: Dispense
1 / 25
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!


















La statistica è estremamente importante per saper leggere, capire e valutare con il proprio senso critico i dati (numeri) da cui siamo giornalmente bombardati È uno strumento che ci permette di interpretare i dati e trarre conclusioni ed informazioni sulla realtà da una valutazione oggettiva dei fenomeni quantitativi che ci circondano.
La statistica riguarda il modo con cui si raccolgono, raggruppano, analizzano, elaborano e interpretano i dati
v Statistica descrittiva Ha a che fare con la presentazione, organizzazione e sintesi dei dati ¬Tabelle, grafici, indici di sintesi v Statistica Inferenziale Consente di pervenire ad una conclusione sulla base dell’informazione contenuta in un campione che è stato estratto da quella popolazione ¬Stima di parametri ¬Test di ipotesi
dell’indagine Variabili o Caratteri: aspetti rilevanti, caratteristiche delle unità di riferimento che varia da soggetto a soggetto à Qualitative: indicano una caratteristica non misurabile à Quantitative: indicano un dato misurabile, cioè associabile ad un numero
Proprietà di un campione casuale:
Le variabili classificate in qualitative e quantitative, vengono divise in sottogruppi: QUALITATIVE à Valori o dati sono detti anche modalità ¬ dicotomiche (o binarie) ¬ nominali ¬ ordinali (o classificate) QUANTITATIVE à Valori o dati numerici ¬ discrete ¬ continue (o dimensionali)
Dicotomica: prevede due modalità à dicotomica dal greco "divisa in due“ (es. sano/malato, si/no, buono/cattivo, vivo/morto, maschio/femmina, placebo/terapia) Nominale: le osservazioni possono essere classificate in varie categorie (es. colore della pelle: ad ogni colore potrebbe essere assegnato un numero che è soltanto un'indicazione numerica di un colore, non ha nulla a che fare con la qualità, il valore o la posizione del colore) Ordinale: le osservazioni possono essere ordinate secondo qualche criterio (es. dolore: viene descritto secondo una scala da 0 a 10, con 0 che indica nessun dolore e 10 il peggior dolore immaginabile)
Con una variabile nominale, per es. colore della pelle, ci potrebbe essere un problema: come distinguere una colorazione della pelle normale da una anormale? I ricercatori potrebbero “scegliere” una nuova variabile con due livelli:
Discreta: le differenti categorie sono completamente separate l’una dall’altra ed assume valori interi (es. numero di bambini nati vivi, numero di decessi, numero di figli) Continua: può assumere qualsiasi valore entro uno specifico intervallo di valori (anche frazionari) (es. altezza, peso, pressione sanguigna (sistolica e diastolica))
La proporzione rappresenta un importante tipo di variabile in medicina, e condivide alcune proprietà di variabile discreta ed altre di variabile continua. Non ha alcun senso dire che si è verificata una frazione di morte. Non ha alcun senso dire che una frazione di una persona ha sofferto un certo evento. Ma ha un senso dire che un evento discreto (es. la morte) o una caratteristica discreta (es. la presenza di una lesione da pressione) si è verificata in una frazione della popolazione. Le proporzioni sono variabili create dal rapporto fra variabili discrete al numeratore e al denominatore. A seconda delle circostanze, possono essere analizzate come variabili discrete o continue.
PROPORZIONE: gli eventi al numeratore fanno parte di quelli al denominatore e, dunque, sono compresi in esso (porzione): Mortalità = N° morti/ N° abitanti
Descrivere variabili qualitative
Numero di osservazioni corrispondente ai diversi valori (modalità/intervallo di classe) della variabile
Proporzione tra il numero di osservazioni corrispondente ai diversi valori (modalità/intervallo di classe) della variabile e la dimensione campionaria
Si ottiene moltiplicando le frequenze relative per 100 ed indica quante volte un fenomeno ai manifesta su una casistica di 100 osservazioni
FREQUENZA ASSOLUTA (ni) (Ottenuta tramite un conteggio) Numero di osservazioni corrispondente ai diversi valori (modalità/intervallo di classe) della variabile Osservazionii: Þ Ogni frequenza deve assumere valore tra zero e il numero totale delle osservazioni Þ Il totale delle frequenze deve essere pari al totale delle osservazioni
o FREQUENZA RELATIVA (pi=ni/n) Proporzione tra il numero di osservazioni corrispondente ai diversi valori (modalità/intervallo di classe) della variabile e la dimensione campionaria Osservazioni: Þ Ogni frequenza relativa è compresa tra zero ed uno Þ Il totale delle frequenze relative deve essere pari ad uno o FREQUENZA RELATIVA PERCENTUALE (pi%=ni/n*100) Si ottiene moltiplicando le frequenze relative per 100 ed indica quante volte un fenomeno ai manifesta su una casistica di 100 osservazioni Osservazione: Valgono le condizioni precedenti, solo che il valore 1 diventa 100%
Esempio sulle frequenze(1/4) Si vuole valutare l’efficacia di uno psicofarmaco nel curare forme di balbuzie. L’esperimento coinvolge dei pazienti assegnati in modo casuale a 2 gruppi, A e B:
p 1 (A)=50/150=0,33; p 1 (B)=33/100=0,33; p 2 (A)=80/150=0,53; … Con le frequenze relative i due gruppi mostrano lo stesso effetto. EFFETTO ni (A) ni (B) pi (A) pi (B) migliorato 50 33 0,33 0, invariato 80 53 0,53 0, peggiorato 20 14 0,14 0, Totale 150 100 1 1
Tabelle a singola entrata
Tabelle a “n” entrate
Età Variabile ordinale Partendo da questi dati grezzi: Freq. cumulativa Freq. assoluta relativa^ Freq. Indice rappresentato 10- Tot. 30-
Classi di Modalità 6 3 13 6/ 3/ 4 4/ 6/ 13/ 10/ Conta dei soggetti che nel campione presentano quella specifica modalità In questo caso, ha senso la frequenza cumulativa! Prof A. Mannocci Tabella a doppia entrata per 2 variabili: ordinale e dicotomica M (^) F Tot. Modalità della v. sesso Modalità della v. esposizione non Tot. lieve medio forte Variabile dicotomica 2 Sesso 2 1 7 4 0 3 0 1 2 6 6 3 1 3 13 Conta dei soggetti nel campione che presentano la combinazione di entrambe le modalità Esposizione Variabile ordinale 1 Prof A. Mannocci Tabella a singola entrata per 1 variabile ordinale Età Variabile ordinale
Freq. cumulativa Freq. assoluta Freq. relativa Indice rappresentato 10- Tot. 30-
Classi di Modalità 6 3 13 6/ 3/ (^4) 4/ 6/ 13/ 10/ Conta dei soggetti che nel campione presentano quella specifica modalità In questo caso, ha senso la frequenza cumulativa! Prof A. Mannocci Tabella a doppia entrata per 2 variabili: ordinale e dicotomica M (^) F Tot. Modalità della v. sesso Modalità della v. esposizione non Tot. lieve medio forte Variabile dicotomica 2 Sesso 2 1 7 4 0 (^3 ) (^1 ) 6 6 3 1 3 13 Conta dei soggetti nel campione che presentano la combinazione di entrambe le modalità Esposizione Variabile ordinale 1 Prof A. Mannocci
o Esiste per i dati numerici continui e discreti e per i dati ordinali o Non è sensibile ai valori estremi a differenza della media o È il migliore indice di sintesi nelle distribuzioni asimmetriche
Si definisce moda di un insieme di dati o di una distribuzione di frequenza la modalità (il valore, l’intervallo di classe) della variabile cui corrisponde la massima frequenza Esempio: Le età di 15 soggetti arruolati in uno studio sull’abitudine al fumo sono: 17, 32, 51, 30, 21, 27, 25, 19, 18, 22, 17, 46, 28, 28, 19
Indici di dispersione Misurano la variabilità del fenomeno oggetto di studio, cioè valutano sinteticamente le disuguaglianze tra i valori
È un valore sintetico che vuole esprimere la media delle distanze al quadrato di ogni singola osservazione dalla media aritmetica del campione Esempio I volumi espiratori forzati in 13 adolescenti asmatici (in litri) sono pari a: 2.3; 2.1; 3.5; 2.6; 2.8; 2.8; 4.0; 2.2; 2.6; 3.0; 4.0; 2.8; 3.
È un valore sintetico che vuole esprimere la distanza media di ogni singola osservazione dalla media aritmetica del campione E’ la radice quadrata della varianza ed ha le stesse proprietà Esempio: Considerando l’esempio precedente
Riporta l’indice di precisione alla stessa scala della media aritmetica Ø l’unità di misura non è al quadrato!
È indicato da un numero che rappresenta lo spazio entro il quale si distribuiscono le nostre osservazioni; esso è la differenza tra il valore massimo e minimo: Range = max - min Calcolo: Esempio: Il volume espiratorio forzato in 13 adolescenti asmatici (in litri): 2.3; 2.1; 3.5; 2.6; 2.8; 2.8; 4.0; 2.2; 2.6; 3.0; 4.0; 2.8; 3.
È il dato per cui almeno p% delle osservazioni sono minori di esso e 1-p% delle osservazioni sono maggiori o uguali ad esso. Quartili particolari:
Consideriamo n osservazioni ordinate. Calcoliamo l’ espressione: (np)/ Ø se il risultato NON è un numero intero (3.2; 4.5; 7.65): §il p-esimo percentile sarà l’osservazione che si trova alla posizione data da np/100 approssimato per eccesso Ø se il risultato è un numero intero (1; 2; 3;...): § il p-esimo percentile sarà la media tra l’osservazione nella posizione (n*p/100) e l’osservazione successiva ((np/100)+1) Esempio: Calcolare il 75-esimo percentile nel nostro esempio di 13 osservazioni:
84,4% non fumatori 15,6% fumatori Femmine 87,2% non fumatori 12,8% fumatori
o Rappresenta variabili qualitative sull’asse x o Ogni modalità è una barra: à la posizione della base del rettangolo (di larghezza costante) è centrata sul nome della modalità à l’altezza del rettangolo è proporzionale alla frequenza assoluta per la modalità
Rappresentazioni grafiche della distribuzione di frequenza per variabili QUANTITATIVE
Le osservazioni di una variabile possono essere visualizzate su un piano cartesiano ponendo i valori della variabile su un asse (x) e la frequenza con cui esso appare sull'altro asse (y)
Row % Col %
Row % Col %
Basso peso alla nascita Madre fumatrice
Row % Col %
Row % Col %
Row % Col %
Diagrammi a barre small medio large Exlarge Frequenza delle osservazioni 0 n (^) y (^) v Rappresenta variabili qualitative sull’asse x v Ogni modalità è una barra: ! la posizione della base del rettangolo (di larghezza costante) è centrata sul nome della modalità ! l’ altezza del rettangolo è proporzionale alla frequenza assoluta per la modalità Diagramma a barre: 2 variabili binomiali Basso peso alla nascita Madre fumatrice^0 1 TOTAL 0 Row % Col % 629
55
684
1 Row % Col % 99
15
114
TOTAL Row % Col % 728
0 70
0 798
0 1 0 0 2 0 0 3 0 0 4 0 0 5 0 0 6 0 0 C O U N T (^0) l o w 1 0 1
Per rappresentare le caratteristiche della distribuzione di frequenza di dati quantitativi una scelta può essere un istogramma:
I dati quantitativi vengono divisi in classi Per ogni classe si costruisce un rettangolo:
Sono utili per verificare la asimmetria delle distribuzioni di frequenza. Mostra una sintesi dei dati. La scatola centrale si estende al 25º percentile al 75º percentile (i quartili dei dati) La linea dentro la scatola rappresenta la mediana Le linee al di fuori della scatola si estendono ai valori più estremi. Possono assumere diversi valori: minimo massimo, 5 º e 95º percentile, 2SD dalla mediana a seconda del software
Sono utili per illustrare la relazione tra due diversi caratteri (X e Y) che assumono modalità numeriche Ogni punto del grafico rappresenta una unità statistica Se due variabili non sono correlate i punti si distribuiscono casualmente sul piano cartesiano. Istogramma: variabile continua (peso alla nascita) Frequency (^1000 2000) Peso alla nascita (grammi) 3000 4000 5000 0 50 100 150 ! " L’area delle barre rappresenta la distribuzione di Frequenza DIAGRAMMI A SCATOLA (Box plot) n La scatola centrale si estende dal 25 ° percentile al 75° percentile (i “quartili” dei dati) n La linea dentro la scatola rappresenta la mediana n Le linee al di fuori della scatola si estendono ai valori più estremi. Possono assumere diversi valori: min e max, 5° e 95° percentile, 2SD dalla mediana a seconda del software.
Numerosita' della popolazione (^4437) Numero di matrimoni 210864 401851 2.4e+07 (^)! Ogni punto del grafico rappresenta una unità statistica ! Se due variabili non sono correlate i punti si distribuiscono casualmente sul piano cartesiano. Grafico: DIAGRAMMI DI DISPERSIONE A DUE DIMENSIONI Sono utili per illustrare la relazione tra due diversi caratteri (X e Y) che assumono modalità numeriche
Se trovo tutte mele rosse à non posso asserire che tutte le mele esistenti sono rosse(dovrei controllare il colore in tutta la “popolazione mele”), posso solo dire che non rifiuto H0!
Tornando sui nostri “passi”... Una volta formulate le ipotesi è necessario fissare l’errore che siamo disposti a commettere con il nostro test. Ma cosa significa commettere un errore in un test statistico? Il test d’ipotesi può essere paragonato ad un processo penale: La giuria ha a disposizione delle “prove” sulla base delle quali deve valutare l’innocenza dell’imputato è o non è compatibile con le prove a disposizione. Il ricercatore ha a disposizione un “campione” sulla base del quale deve verificare se una certa l’ipotesi (H0) è o non è in accordo con i dati a disposizione. Come abbiamo visto esistono dunque 2 tipi di errore: Errore α (Errore di I tipo): esprime la probabilità di rifiutare l’ipotesi nulla quando questa è vera, anche nota come livello di significatività. Errore β (Errore di II tipo): esprime la probabilità di non rifiutare l’ipotesi nulla quando questa è falsa Per convenzione, i livelli soglia delle l’errore a ai quali di norma si ricorre sono tre: 0,05 (5%); 0,01 (1%); 0,001 (0.1%) La scelta del livello di errore è comunque arbitraria e a priori (prima di compiere il test)! In una pubblicazione scientifica, utilizzare il termine significativo, es. la media di due gruppi è significativa diversa, indica che è stato applicato un test e il suo errore è inferiore al 5%.
Per ottenere risultati corretti un ricercatore deve conoscere i diversi tipi di variabile e deve saper scegliere i test statistici appropriati per ciascun tipo di variabile.
... dimostra che la distribuzione campionaria delle medie si approssima alla distribuzione normale qualunque sia la forma della distribuzione della popolazione (quando si considera un campione di ampiezza n≥30). Questo teorema è alla base di tutta la statistica, in quanto non si lavora mai con la distribuzione della popolazione, ma con suoi campioni rappresentativi. Sapendo che la distribuzione campionaria delle medie si distribuisce normalmente è possibile sfruttare le sue proprietà per la verifica dei test d’ipotesi Se è ragionevole assumere che la distribuzione originaria dei dati sia normale o possa comunque essere approssimata alla normale (TLC) utilizzeremo i TEST PARAMETRICI. Test Parametrici (sulla media) SI NO Test per Campioni Indipendenti: Test di Wilcoxon della somma dei ranghi (alias Mann-Whitney ) Test per Dati appaiati (paired): Test del segno e Test di Wilcoxon dei ranghi con segno Se i campioni sono numerosi, almeno 30 osservazioni per gruppo.TLC* Test non Parametrici (sulla mediana) Data una variabile quantitativa. Si distribuisce normalmente? Scelta del test-III passo **1campione 2campioni
2 campioni 1campione 2campioni 2 campioni Test z Test t-student** per campioni appaiati Test t-student per campioni indipendenti Test ANOVA o Analisi della varianza Test di Wilcoxon *TLC Teorema del Limite Centrale^ Test di Kruskall Wallis
… dimostra che la distribuzione campionaria delle medie si approssima alla distribuzione normale qualunque sia la forma della distribuzione della popolazione (quando si considera un campione di ampiezza n≥30).
à Test basati sulle distribuzioni z e t Le ipotesi per i test parametrici, quando il parametro da stimare è rappresentato dalle media, sono: Test z à H0: media =μ0 (μ0 è un dato valore che vogliamo confrontare) Test t per 2 campioni à H0: media1= media Test ANOVA à H0: media1=...=mediak , ove k≥
Una volta scelto il test, questo rilascia un valore detto statistica del test. Per concludere il test occorre confrontare l’errore determinato dalla statistica del test, p, con il livello di significatività, a (II passo). Se p≤a à Rifiuto H Se p>a à Non Rifiuto H Vediamo più in dettaglio alcuni test Parametrici: Test t per 2 campioni appaiati Test t per 2 campioni indipendenti Test ANOVA
Quando si intende confrontare le medie tra due campioni di dati, è necessario innanzitutto valutare se le misure sono state eseguite sugli stessi soggetti, ma in tempi diversi ad esempio prima e dopo l’esposizione ad un composto chimico o la somministrazione di un farmaco in tal caso parleremo di campioni appaiati à t-test per dati appaiati (paired) Operativamente il test è basato su:
Operativamente il test è basato su:
Media dei metri percorsi nei due tempi è la stessa
Esistono due misure di variabilità in questo test: v La variabilità tra gruppi: Media quadratica tra gruppi v La variabilità all’interno dei gruppi: . Media quadratica all’interno dei gruppi Osservazioni
vicine.
R.A.Fischer):
Osservazione. Se il test ANOVA rilascia un p significativo (<a), rifiuteremo l’ipotesi nulla, ma non è chiaro dal test quali gruppi abbiano fatto la differenza. Esistono alcuni test per fare questa verifica per esempio- test t di Bonferroni - test HSD di Tukey Test per variabili quantitative. Il caso dei test non parametrici
Test del segno
Se i campioni non sono indipendenti (dati appaiati) si può utilizzare tale test, anche se poco diffuso nella ricerca medica. Tale test esamina la differenza tra i valori di ciascuna coppia di dati:
Il test perde l’informazione di quanto siano ampie le differenze. L’ ipotesi nulla è: H 0 : le mediane tra i due gruppi siano uguali cioè mediana gruppo1 = mediana gruppo2 oppure. mediana gruppo1 - mediana gruppo2 = 0 Esempio L’ipotesi nulla è median LDLmais=median LDL (^) avena
più diffuso. Anch’esso esamina la differenza tra i valori di ciascuna coppia di dati: esclude le differenze nulle; ordina le differenze diverse da zero, ignorando il segno e a ciascuna viene attribuito una graduatoria, rango, dalla differenza più grande a quella più piccola; àle differenze uguali assumono il rango medio
Esempio L’ipotesi nulla è che medianLDLmais=medianLDLavena