Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


statistica medica (inf), Sbobinature di Statistica Medica

sbobina di statistica medica (corso di laurea in inferm.)

Tipologia: Sbobinature

2025/2026

In vendita dal 10/03/2026

luca-dgc-
luca-dgc- 🇮🇹

6 documenti

1 / 41

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
STATICA MEDICA lezione del 14/11/2022
Perché si studia la sta?s?ca?
Il modulo si propone di fornire le conoscenze di base e i principi metodologici per un correFo
approccio scien?fico allo studio dello stato di salute e di malaHa di una popolazione. Cos?tuisce il
primo gradino nelle conoscenze di un operatore sanitario affinché possa sia produrre che valutare
evidenze scien?fiche derivan? dalla ricerca sul campo. Cioè l’infermiere oltre ad apprendere quelli
che sono i principi base del “saper fare” deve conoscere anche la ricerca infermieris?ca, poiché
sono 2 canali interdipenden?.
Alla base della ricerca c’è un metodo che ci permeFe di capire il perché ad esempio una terapia sia
più efficace di un’altra o perché in una determinata area circoscriFa si sviluppa una malaHa
piuFosto che in un’altra.
La ricerca per dimostrare le evidenze scien?fiche che tes?moniano l’efficacia di un’azione, di una
terapia,di un servizio, di un comportamento piuFosto che di un altro, si avvale della sta?s?ca. La
sta?s?ca è uno strumento che ci permeFe di interpretare i da? e trarre conclusioni ed informazioni
sulla realtà da una valutazione oggeHva dei fenomeni quan?ta?vi che ci circondano.
Noi ci focalizzeremo sulla ricerca medica e quindi della sta?s?ca medica.
La sta?s?ca medica è uno strumento per:
- Iden?ficare le cause e i faFori di rischio delle malaHe —>iden?ficare la causa è un
obbieHvo pretenzioso che si raggiunge con l’u?lizzo di studi sperimentali. Mentre i faFori
di rischio sono elemen? associa? allo sviluppo della malaHa che aFraverso la raccolta da?
ne verifichiamo la veridicità;
- Conoscere la storia naturale della patologia;
- Analizzare la distribuzione delle malaHe nelle popolazioni —>sapere come si distribuisce
una malaHa in una regione, area ecc.. ci permeFe di pianificare e organizzare campagne di
prevenzione;
- Valutare gli interven? sanitari —>soggeH della ricerca sono anche i servizi sanitari
disponibili.
La sta?ca medica rappresenta la metodologia generale per lo studio dei fenomeni colleHvi e
quindi della variabilità aFraverso:
Osservazione dei fenomeni: ci insegna come osservare la realtà, come raccogliere i da?,
con quali strumen?, su chi, su quan?, ecc..;
Traduzione in simboli: ci insegna come riassumere in modo correFo i da? raccol?, come
esprimerli e rappresentarli in modo sinte?co e appropria? in funzione del ?po di variabile e
delle sua distribuzione;
Evidenza delle irregolarità: consente di evidenziare quei fenomeni che si discostano dalla
“ normalità” cioè dai valori più frequen? in un set di da?. Lapprofondimento di tali
irregolarità,spesso, è molto forma?vo e può generare nuove ipotesi;
Verifica ipotesi: offre la possibilità di verificare se un’ipotesi posta sia o no confutata
dall’osservazione della realtà.
Studio dei faFori di rischio per una determinata patologia nella popolazione generale.
La conoscenza dello stato di salute di una popolazione è un obbieHvo prioritario per
l’appropiatezza degli interven? sanitari, la realizzazione nella produzione di servizi e nel consumo
di risorse. Per far ciò bisogna definire bene 4 pun?, rispondendo a 4 domande:
1. Chi? Denire il soggeFo della ricerca e stabilire l’area entro la quale si deve svolgere la
ricerca (popolazione);
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29

Anteprima parziale del testo

Scarica statistica medica (inf) e più Sbobinature in PDF di Statistica Medica solo su Docsity!

STATICA MEDICA lezione del 14/11/ Perché si studia la sta?s?ca? Il modulo si propone di fornire le conoscenze di base e i principi metodologici per un correFo approccio scien?fico allo studio dello stato di salute e di malaHa di una popolazione. Cos?tuisce il primo gradino nelle conoscenze di un operatore sanitario affinché possa sia produrre che valutare evidenze scien?fiche derivan? dalla ricerca sul campo. Cioè l’infermiere oltre ad apprendere quelli che sono i principi base del “saper fare” deve conoscere anche la ricerca infermieris?ca, poiché sono 2 canali interdipenden?. Alla base della ricerca c’è un metodo che ci permeFe di capire il perché ad esempio una terapia sia più efficace di un’altra o perché in una determinata area circoscriFa si sviluppa una malaHa piuFosto che in un’altra. La ricerca per dimostrare le evidenze scien?fiche che tes?moniano l’efficacia di un’azione, di una terapia,di un servizio, di un comportamento piuFosto che di un altro, si avvale della sta?s?ca. La sta?s?ca è uno strumento che ci permeFe di interpretare i da? e trarre conclusioni ed informazioni sulla realtà da una valutazione oggeHva dei fenomeni quan?ta?vi che ci circondano. Noi ci focalizzeremo sulla ricerca medica e quindi della sta?s?ca medica. La sta?s?ca medica è uno strumento per:

  • Iden?ficare le cause e i faFori di rischio delle malaHe —>iden?ficare la causa è un obbieHvo pretenzioso che si raggiunge con l’u?lizzo di studi sperimentali. Mentre i faFori di rischio sono elemen? associa? allo sviluppo della malaHa che aFraverso la raccolta da? ne verifichiamo la veridicità;
  • Conoscere la storia naturale della patologia;
  • Analizzare la distribuzione delle malaHe nelle popolazioni —>sapere come si distribuisce una malaHa in una regione, area ecc.. ci permeFe di pianificare e organizzare campagne di prevenzione;
  • Valutare gli interven? sanitari —>soggeH della ricerca sono anche i servizi sanitari disponibili. La sta?ca medica rappresenta la metodologia generale per lo studio dei fenomeni colleHvi e quindi della variabilità aFraverso:
  • (^) Osservazione dei fenomeni: ci insegna come osservare la realtà, come raccogliere i da?, con quali strumen?, su chi, su quan?, ecc..;
  • (^) Traduzione in simboli: ci insegna come riassumere in modo correFo i da? raccol?, come esprimerli e rappresentarli in modo sinte?co e appropria? in funzione del ?po di variabile e delle sua distribuzione;
  • (^) Evidenza delle irregolarità: consente di evidenziare quei fenomeni che si discostano dalla “ normalità” cioè dai valori più frequen? in un set di da?. L’approfondimento di tali irregolarità,spesso, è molto forma?vo e può generare nuove ipotesi;
  • (^) Verifica ipotesi: offre la possibilità di verificare se un’ipotesi posta sia o no confutata dall’osservazione della realtà. Studio dei faFori di rischio per una determinata patologia nella popolazione generale. La conoscenza dello stato di salute di una popolazione è un obbieHvo prioritario per l’appropiatezza degli interven? sanitari, la realizzazione nella produzione di servizi e nel consumo di risorse. Per far ciò bisogna definire bene 4 pun?, rispondendo a 4 domande:
  1. Chi? Definire il soggeFo della ricerca e stabilire l’area entro la quale si deve svolgere la ricerca (popolazione);
  1. Cosa? Analizzare la presenza di faFori di rischio (della malaHa presa in considerazione) per valutare l’incidenza nella popolazione;
  2. Perché? Definire lo scopo della ricerca;
  3. Come? Avvalersi di fon? e da? idonei a iden?ficare le caraFeris?che anagrafiche e cliniche della popolazione presa in esame. Le tappe di una ricerca La tappa fondamentale è la pianificazione dell’indagine. Ma prima di essa bisogna comunque chiarire lo scopo dell’indagine e formulare l’ipotesi scien?fica (fase preliminare); dopo la fase preliminare e la pianificazione dell’indagine segue l’analisi dei da?, l’interpretazione dei risulta? oFenu? e infine la stesura di una relazione o tesi in base alla circostanza e alo scopo della ricerca. È sempre un bene rendere nota l’evidenza scien?fica (risulta? della ricerca)indipendente se si è oFenuto un feedback posi?vo o nega?vo, anche la non collaborazione dei soggeH cos?tuisce essa stessa una risposta. NB: un ricercatore per poter avviare uno studio( indagine) deve prima scrivere un protocollo della ricerca che poi verrà vagliato dal comitato e?co e solo dopo l’approvazione di quest’ul?mo, il ricercatore potrà dare inizio alla ricerca. Esistono varie ?pologie di studi che variano a seconda dell’obieHvo. Fondamentale sono 2:
  • (^) Studio sperimentale —> offrono al ricercatore la possibilità di intervenire in maniera direFa sulle variabili indipenden?, ovvero l'esposizione ad una sostanza o ad una procedura, per poter determinare l'effeFo della variabile dipendente, cioè l'esito. L'obieHvo è quelli di s?mare l'efficacia di un intervento preven?vo, di cura o riabilitazione. I gruppi che vengono compara? sono simili nelle caraFeris?che che possono influire sulle risposte, ad eccezione della valutazione che si sta valutando. I gruppi sono compos? in maniera aleatoria. In base all’aFribuzione del traFamento si definisce: sperimentazione controllata randomizzato quando i partecipan? vengono assegna? in modo casuale a due gruppi, il gruppo sperimentale che riceve il traFamento o il gruppo di controllo/confronto; sperimentazione controllata non randomizzata quando l'esposizione all'agente oggeFo di ricerca è aFribuita in maniera non casuale. Si u?lizza quando non è possibile eseguire una S. P. randomizzato o non si ri?ene opportuno.
  • (^) Studio osservazionale —>Studio epidemiologico anali?co nel quale il ricercatore non determina l'assegnazione dei soggeH a ciascun gruppo, ma si limita a registrare (osservare) quello che avviene nella realtà. Se esiste un gruppo di controllo lo studio sarà di ?po anali?co, che a sua volta si suddivide in:
  • Trasversale, raccoglie informazioni riguardan? l’esposizione ai faFori di rischio e l’insorgenza della patologia nello stesso momento e sullo stesso soggeFo. È uno studio nel quale la presenza o l’assenza di una variabile sanitaria prestabilita come esito, viene determinata per ciascun soggeFo arruolato ad una determinata scadenza. Lo scopo è raccogliere, elaborare ed interpretare le informazioni rela?ve alla distribuzione di una data patologia in dato momento, fornendo così il tasso di prevalenza della patologia e la prevalenza del faFore di rischio associato;
  • Corte, prende in considerazione un gruppo di individui che presentano caraFeris?che comuni (sesso, età, etnia…) e che hanno come unica differenza tra loro l’esposizione o meno al faFore di rischio (es. fumo di sigareFa).Questo gruppo viene osservato per un periodo di tempo prestabilito, al termine del quale si analizzerà la presenza o meno dell’esito aFeso (es. cancro ai polmoni).In questa ?pologia di studi è fondamentale stabilire a priori il tempo di osservazione e l’esito da valutare;

Campionamen? probabilis?ci Ogni unità che compone la popolazione ha una probabilità nota di essere inclusa nel campione; probabilità che è affidata esclusivamente al caso. Abbiamo 3 ?pologie di campionamen? probabilis?ci:

  • (^) Casuale Semplice, dove ogni elemento della popolazione ha la stessa probabilità di essere incluso nel campione, L’Unità di campionamento è l’individuo. La procedura è formata da 3 fasi: 1)preparare una base di campionamento; 2)scegliere l’ampiezza del campione;3) selezionare gli elemen? del campione u?lizzando una tavola di numeri casuali;
  • (^) Stra?ficato, dove la popolazione è suddivisa in stra? omogenei al loro Interno rispeFo alla variabile di stra?ficazione. Il campione è casuale semplice viene selezionato entro ogni strato. È possibile un campionamento proporzionale (viene estraFa la stessa proporzione di individui per ciascun strato)e non proporzionale ( non riproduce la composizione della popolazione, e nelle analisi andrà dunque effeFuata una operazione di ri-ponderazione);
  • (^) Cluster o grappoli, Le unità campionarie sono cos?tuite da gruppi di individui. TuH i componen? del grappolo vengono inclusi nella rilevazione. Quando si u?lizzano le ripar?zioni territoriali per estrarre le unità si parla di campionamento per aree. Le funzioni principali della sta?s?ca medica:
  1. Descri'va: data dall’insieme di tecniche per la raccolta, l’organizzazione e la sintesi di da?, rappresenta la prima fase di qualsiasi ricerca o scopo di uno studio esplora?vo (se non conosco i da?, le caraFeris?che del campione non riesco a formulare le ipotesi);
  2. Inferenziale: è l’insieme di procedimen? u?li a trarre conclusioni sulla popolazione obieHvo (dopo la descrizione il processo logico dell’inferenza gira verso la s?ma di parametri e verifica delle ipotesi). Con l’inferenza si hanno a disposizione una serie di test e metodi che ci permeFono di generalizzare quello che capiamo dal campione sulla popolazione. DEFINIZIONI DI BASE Unità sta)s)ca = minima unità da cui si raccolgono i da? in un’indagine; in base a quello che studiamo, l’oggeFo del nostro studio si iden?fica come unità sta?s?ca (es. individuo, regione, Stato). La natura dell’unità sta?s?ca è varia, ma è comunque costante, dipende dallo studio. In tabella ogni riga corrisponde ad una unità sta?s?ca, e la somma di tuFe sarà il totale delle unità sta?s?che. Variabile = caraFeris?ca che può assumere valori diversi nelle diverse unità sta?s?che. In tabella sono le colonne (es. altezza, peso, età dei pazien? che sono l’unità sta?s?ca). Osservazione = valore numerico assunto da una variabile in una determinata unità sta?s?ca (es. unità sta?s?ca=individuo, variabile=peso, osservazione=80kg). Le variabili possono essere di diversi ?pi, possiamo rilevare da? rela?vi a numeri o a delle modalità/categorie. È fondamentale saper riconoscere le variabili perché la tecnica sta?s?ca da u?lizzare per riassumere un dato viene condizionata dal ?po di variabile. Le variabili si possono dividere in QUALITATIVE , caraFeris?che che non sono misurabili ma possono essere classificate in categorie, e QUANTITATIVE, caraFeris?che numeriche. Le variabili qualita 6 ve possono essere ordinali (esiste un ordine tra le modalità, es. grado di istruzione, gravità di un sintomo) oppure nominali (non esiste un conceFo di ordine entro le diverse modalità; possono essere di ?po dicotomico, ovvero ci sono due modalità della variabile, es. ipertensione si/no oppure di ?po politomico, quando la variabile ha più di due modalità, es. gruppo sanguigno).

Le variabili quan 6 ta 6 ve si dividono in discrete e con 6 nue : tuFo quello che deriva da conteggi è una variabile discreta, che assume SEMPRE valori interi (es, NUMERO DI ricoveri); mentre le variabili con?nue possono essere misurate con uno strumento, hanno un’unità di misura e possono assumere qualsiasi valore (es. peso). Dal punto di vista sta?s?co le variabili possono essere classificate (indipendentemente dal ?po) come:

  • Di risposta (endpoint): descrivono il fenomeno e la sua variabilità; su questa variabile si vanno a studiare gli effeH delle altre variabili, quindi è il fenomeno che s vuole studiare;
  • Esplica?ve: spiegano la variabilità dei da? raccol? misurando la variabile di risposta (vengono definite spesso faFori). Una volta che abbiamo stabilito le nostre variabili, si deve par?re dall’osservazione del fenomeno, quindi dobbiamo osservare il fenomeno e capire su chi o che cosa misurare il fenomeno (i casi, le caraFeris?che dei casi); la fonte dei da?; organizzare i da? raccol? per l’analisi aFraverso una matrice di da? grezzi (struFurata per tuFe le variabili e tuFe le unità); poi bisogna descrivere il fenomeno: dobbiamo u?lizzare dei metodi per rappresentare i da? raccol?, come la costruzione di tabelle tramite le distribuzioni di frequenza, e le misure di posizione e dispersione, che sono gli indicatori che si calcolano. Quando si hanno delle variabili quan?ta?ve con?nue, conviene raggruppare in classi le osservazioni della variabile, altrimen? il dato rimane molto disperso. Quante classi? Di quale ampiezza? Ci sono mol?ssimi algoritmi per calcolare le classi e l’ampiezza e anche molte regole. Noi ne vediamo due:
  • 1° regola: il numero delle classi nella tabella di frequenza deve essere approssima?vamente uguale alla radice quadrata del valore della dimensione n del campione,
  • 2° regola: determinare l’ampiezza di ogni classe. ESEMPIO
  • (^) Campione di 30 soggeH (n);
  • (^) Valore massimo della distribuzione = 42;
  • (^) Valore minimo della distribuzione = 5. Calcolo PESO (Kg) Fx 50 2 55 5 65 15 … … 86 2 Tot. 500

√ n

Quando bisogna calcolare le frequenze percentuali in una tabella a doppia entrata (cioè con due variabili), si possono calcolare frequenze percentuali diverse tra loro:

  • FREQUENZE DI DISTRIBUZIONE^ CONGIUNTE! “quante sono le femmine che fanno running?”
  • FREQUENZE DI DISTRIBUZIONE MARGINALI! “quante sono le femmine?”
  • FREQUENZE DI DISTRIBUZIONE^ CONDIZIONATE! “tra tuFe le femmine, quante fanno running?”. Ques? risulta? danno, quindi, tuFe informazioni diverse. ESERCIZI 1)La seguente tabella riporta la distribuzione del numero di figli in un campione di famiglie.
  1. Qual è l’unità sta?s?ca? FAMIGLIA
  2. Quante sono le unità sta?s?che?
  3. Qual è la variabile in studio? NUMERO DI FIGLI
  4. Che ?po di variabile è? QUANTITATIVA DISCRETA Sport individuale 130 20 150 Sport di squadra 70 0 70 Running 40 15 55 Palestra 45 45 90 Gruppi di cammino 12 60 72 Altro 48 15 63 345 155 500

N° figli Fx 0 10 1 3 2 6 3 8 4 31 5 15 6 2 Tot. 75

  1. È stato determinato il gruppo sanguigno di 32 individui maschi e femmine con i seguen? risulta?:
  1. Qual è la variabile in studio e che ?po di variabile si traFa? La variabile in studio è il GRUPPO SANGUIGNO ed è una VARIABILE QUALITATIVA NOMINALE POLITOMICA
  2. Costruire, per il totale delle unità sta?s?che, una distribuzionedi frequenza assoluta, rela?va e percentuale. Sta?s?ca 21/ Un altro metodo a disposizione per classificare le informazioni è aFraverso la RAPPRESENTAZIONE GRAFICA. Ci sono diversi ?pi di grafici:
  • Istogrammi;
  • Grafici a barre;
  • Aerogrammi circolari (grafici a torta);
  • Poligono di frequenza. La scelta del grafico dipende dal ?po di VARIABILE. Se si ha una variabile QUALITATIVA NOMINALE POLITOCOTOMICA O DICOTOMICA! GRAFICO A BARRE (per una migliore comprensione del fenomeno, è conveniente meFere in ordine crescente o decrescente le categorie delle variabili). Quindi, quando si hanno 2 variabili conviene questo grafico. Una sua alterna?va è l’AEROGRAMMA CIRCOLARE (in questo caso bisogna riportare e?cheFe di categoria e frequenza percentuale). Se si hanno variabili QUANTITATIVE CONTINUE O DISCRETE! ISTOGRAMMA. Questo va a rivelare la forma di una distribuzione di frequenza. (Per questo ?po di variabili conviene raggruppare per classi) Il POLIGONO DI FREQUENZA è una linea spezzata dove ogni punto corrisponde al valore centrale di ogni classe (quindi, capiamo che viene u?lizzato per le variabili quan?ta?ve). Spesso viene sovrapposto all’istogramma.

MASCHI FEMMINE

A-A-B-0-A-0-AB-0-A-A-A-0-0-B-0-0 B-0-0-A-A-AB-0-A-B-A-0-AB-A-0-B-

Frequenza assoluta Frequenza rela?va Frequenza percentuale A 11 0,34 (!11/32) 34% (! 0,34 · 100) B 5 0,16 16% AB 3 0,09 9% 0 13 0,4 40% Tot. 32 1 100

A) 23; 28 ; 28 ; 31; 32; 34; 37; 42; 50; 61.

RISULTATO: il valore 28 è la moda, poiché ricorre più frequente. B) 27 ; 27 ; 27 ; 55 ; 55 ; 55 ; 88; 99. RISULTATO: I valori 27 e 55 sono entrambi mode, si parla di distribuzione bimodale. C) 1; 2; 3; 4; 5; 6; 7. RISULTATO: Non vi è alcuna moda. Esistono distribuzioni unimodali dove c’è un valore solo che corrisponde alla moda e distribuzioni bimodali cioè esistono più osservazioni che ripetono frequentemente. ESEMPIO 2: Perché 175 è la moda? Perché è l’osservazione con più frequenza, 52. CLASSE MODALE: La moda in questo caso è 180,5-185,5 che è la classe di riferimento più osservata, 19. ESEMPIO 3: La durata della sopravvivenza (in gg) di 9 pazien? arruola? in un programma di trapianto cardiaco: 3; 15; 23; 46; 64; 126; 279; 623; 1350. La media è di 281 giorni, facendo la sommatoria tra tuH i numeri diviso il totale (9). La mediana è di 64 giorni. Nota Bene: Xi Fi 170 10 171 31 175 52 176 40 179 12 180 8 Xk Fi 170,5-175,5 173 10 175,5-180,5 178 12 180,5-185,5 183 19 185,5-190,5 188 10 190,5-195,5 193 6 totale 57

  • (^) I valori più grandi influenzano la media!
  • (^) La mediana mostra meglio le caraFeris?che della distribuzione. PROPRIETA’ MEDIA:
  • (^) U?lizza l’informazione contenuta in tuH i da?;
  • (^) È facilmente traFabile dal punto di vista matema?co;
  • (^) È influenzata dalle osservazioni estreme, non è una buona misura di posizione per distribuzione asimmetriche. MEDIANA:
  • (^) È unica;
  • (^) Non è influenzata dalle osservazioni estreme;
  • (^) Non risente l’asimmetria della distribuzione. MODA:
  • (^) Può esistere più di una moda, ma può anche non esistere;
  • (^) Non è una buona misura del centro di una distribuzione;
  • (^) È la misura che varia da un campione all’altro della popolazione. In una distribuzione simmetrica la media, la moda e la mediana coincidono, in una distribuzione asimmetrica non coincidono. ESEMPIO: Calcolare la media, moda e mediana delle seguen? osservazioni: 2, 6, 8, 25, 26, 31, 85. Media: La mediana è 25 (valore centrale). La moda non è presente. Nella famiglia della mediana esistono anche i quan?li che sono quegli indicatori che dividono in serie ordinata i nostri da?. I quan?li si suddividono:
  • QUARTILI: sono 3 (Q1; Q2; Q3) e dividono la serie ordinata in 4 par?, contenen? il 25% delle osservazioni. I. Il primo quar 6 le separa il 25% inferiore delle osservazioni dal 75% superiore delle osservazioni; II. Il secondo quar 6 le coincide con la mediana, separa il 50% inferiore delle osservazioni dal 50% superiore delle osservazioni; III. Il terzo quar 6 le separa il 75% inferiore delle osservazioni dal 25% superiore delle osservazioni.

mediana si trovano a sinistra della moda. Per descrivere correFamente una distribuzione di frequenza (probabilità), alla misura di posizione bisogna sempre abbinare una misura di dispersione; quindi, entriamo nell’ambito di dover quan?ficare la variabilità. Abbiamo a che fare con tuH i fenomeni biologici che possono comportare tanta variabilità da un soggeFo e l’altro tra una misura e l’altra. Le due distribuzioni di frequenza hanno la stessa media ma forma diversa; i da? rela?vi al gruppo 2 sono più vicini alla media di quelli del gruppo 1. In altri termini, nel secondo gruppo c’è meno dispersione. Si rende necessario allora costruire un’altra misura descriHva, in grado di misurare la dispersione dei da? intorno alla misura di posizione; essa indica quanto i da? distano dalla misura di posizione e tra di loro. Con le misure di dispersione ci serve per capire quando i da? distano da una misura di posizione tra loro. ESEMPIO: Ques? due campioni hanno la stessa media, secondo voi avranno anche la stessa dispersione? La risposta è no. Quello che vediamo rappresentato nel campione A le osservazioni intorno alla media sembrano meno disperse, cioè sono più vicine al valore medio. Nel campione B che ha la stessa media, gli altri valori sembrano più lontani cioè si disperdono di più rispeFo al valore medio. Quindi sicuramente avrà lo stesso valore medio ma avrà una dispersione diversa. Come si può evidenziare la differenza dell’altezza? Bisogna trovare la distanza e calcolare la media della distanza.

Quindi per trovare la distanza bisogna fare la differenza tra il valore medio e il campione. Questa distanza non è altro che uno ‘’scarto’’. Si prende ogni osservazione dell’altezza e si soFrae con la media: - ) Dopo aver calcolato la distanza di ogni altezza si può calcolare la media della distanza: La varianza è una misura di variabilità di dispersione che quan?fica quanto si disperdono i da? intorno al valore medio. Più la variabilità è alta e più la nostra media è precisa oppure no per rappresentare quel dato. Formula: La deviazione standard è la misura di dispersione più importante e u?lizzata per le variabili quan?ta?ve. È una misura della variazione dei valori rispeFo alla media. Si traFa di una ‘’media’’ delle differenze delle osservazioni della variabile dalla media calcolata sul campione. La formula: Quando si ha a che fare con campioni di piccola dimensione (n<30) è più conveniente dividere N- anziché per N. Si dimostra infaH, che una deviazione standard campionaria calcolata u?lizzando n-1 come denominatore è, per piccoli campioni, una s?ma correFa della popolazione di appartenenza del campione. LEZIONE DEL 01/12/ PROPRIETA’ DELLA DEVIAZIONE STANDARD

( xi ¯ x

Σ( xi − x ¯)

n

s^2 =

Σ( xi − x ¯)

2

n − 1

ds =

Σ( xi − ¯ x )

2

n − 1

Calcolare la D.S. applicando la seguente formula: D.S.= FORMULA PER IL CALCOLO DELLA DS PER DATI RAGGRUPPATI Se abbiamo una tabella che riporta delle osservazioni raggruppate con le loro frequenze bisogna applicare la formula riportata sopra. ESEMPIO: Qual è la moda del numero di visite? La risposta è 3 perché il numero che ha maggior frequenza perché ha 45 soggeH. Dopo bisogna calcolare la media pesata e si oHene 3.25. La sommatoria di tuH i prodoH è 455. COEFFICIENTE DI VARIAZIONE Il C. di variazione è uguale alla deviazione standard divisa per la media e indica la variabilità di un fenomeno in termini percentuali. Il coefficiente di variazione è adimensionale, quindi non ?ene conto di quello che è l’unità di misura. FORMULA ESEMPIO:

ds

x ¯

∙ 100 = CV %

media ds CV% Altezza (cm) 173,58 7,67 4, Peso (kg) 78,26 11,94 15,

CVA =

dia 200 = (^) CV ⑳ 0 X (^100)

RICORDA: Per variabilità noi intendiamo la deviazione standard, invece se avessimo il caso di dover calcolare il grado di variabilità del fenomeno si calcola il coefficiente di variazione. Quando devo u?lizzare il C.V.?

  • (^) Due variabili quan?ta?ve diverse;
  • (^) Stessa variabile misurata in due campioni diversi. RANGE O CAMPO DI VARIAZIONE : il range è dato dal valore massimo osservato meno il valore minimo osservato. ESEMPIO: 4, 7, 7, Si prende il valore massimo della osservazione e il valore minimo. In questo caso il valore massimo è 7 e il valore minimo è 4. Quindi 7-4= 3 ESEMPIO 2: 1, 3, 14 Il valore massimo è 14 e il valore minimo è 1. Quindi 14-1= 13 Il range è molto susceHbile per gli outliers, trascura tuFa l’informazione contenuta nei da? e non si u?lizza per da? in classi. Quale misura di dispersione usare?
  • (^) DEVIAZIONE STANDARD: se si deve descrivere la variabilità di una variabile quan?ta?va;
  • (^) COEFFICIENTE DI VARIAZIONE: se si stabilire una differenza nella variabilità;
  • (^) RANGE: se si vuole dare una descrizione in più. LEZIONE 05/ La seguente tabella riporta le ore di sonno di 45 pazien? ricovera? in ospedale in seguito alla somministrazione di un certo aneste?co. Calcolare, a par?re dalla tabella di frequenza, la frequenza rela?va, la frequenza percentuale, la media, la moda, la mediana, la varianza e la deviazione standard. MODA = 5

CVB =

Ore di sonno(x) F(x) Frequenza relativa Frequenza percentuale Frequenza cumulata assoluta 2 5 5/45= 0,11 0,11*100= 11% 5 5 16 16/45= 0,36 36% 5+15= 21 8 13 13/45= 0,29 29% 21+13= 34 9 5 5/45= 0,11 11% 34+5= 39 12 4 4/45= 0,09 9% 39+4= 43 15 2 2/45= 0,04 4% 43+2= 45 Totale 45 1 100% variabilità =^ ds grado di (^) variabilità - (^) e v

↓ valore^ massimo - valore minimo

50.5 rientra nel 60 e, per questo mo?vo, la classe mediana è 70-79 ). Per poter calcolare la media pesata, bisogna prima calcolare la media per ogni classe di peso: Per il calcolo della varianza: Nella seguente tabella vengono riporta? i vo? oFenu? agli esami di maturità (in centesimi) ed il genere di alcuni studen? del liceo che hanno deciso di iscriversi al corso di laurea in scienze infermieris?che. Calcolare la misura di variabilità che? permeFe di stabilire se sono più variabili i vo? riporta? dai maschi o quelli riporta? dalle femmine.

media pesata =

(54,5^ ∙^5 ) +^ (64,5^ ∙^17 ) +^ (74,5^ ∙^38 ) +^ (84,5^ ∙^25 ) +^ (94,5^ ∙^15 )

(X − MEDIA)^2 (X − MEDIA)^2 ∗ 𝐹(𝑥)

(54.5 − 77,3)^2 (54.5 − 77,3)^2 ∗ 5

(64.5 − 77,3)^2 (64.5 − 77,3)^2 ∗ 17

(74.5 − 77,3)^2 (74.5 − 77,3)^2 ∗ 38

(84.5 − 77,3)^2 (84.5 − 77,3)^2 ∗ 25

(94.5 − 77,3)^2 (94.5 − 77,3)^2 ∗ 15

Totale 11416

var ianza =

ds = 115,31 = 10,

Femmine 60 ; 79 ; 60; 67; 89; 76; 98 Maschi 65; 77; 82; 63; 76; 83; 96

media ar it meticafemmine =

media ar it meticamaschi =

E O

TOTALE-e = Vi

Per il calcolo della deviazione standard: C’è più variabilità tra i vo? delle femmine

FEMMINE MASCHI

(X − MEDIA)^2 (X − MEDIA)^2

(60 − 75,57)^2 (65 − 77,43)^2

(79 − 75,57)^2 (77 − 77,43)^2

(60 − 75,57)^2 (82 − 77,43)^2

(67 − 75,57)^2 (63 − 77,43)^2

(89 − 75,57)^2 (76 − 77,43)^2

(76 − 75,57)^2 (83 − 77,43)^2

(98 − 75,57)^2 (96 − 77,43)^2

Totale 1253,7143 761,

dsfemmine =

dsmaschi =

CVfemmine =

ds

media

CVmaschi =

ds

media