Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Introduzione alla Statistica Medica: Rappresentazioni Grafiche e Misure di Posizione, Sbobinature di Statistica Medica

Contiene: misure di frequenza in epidemiologia, rappresentazioni grafiche, indici di distribuzione di frequenza

Tipologia: Sbobinature

2020/2021

Caricato il 30/03/2021

Gamberetto_12
Gamberetto_12 🇮🇹

5

(7)

19 documenti

1 / 24

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
STATISTICA LEZIONE 3
MISURE DI FREQUENZA IN EPIDEMIOLOGIA
Rapporti
proporzioni
tassi
Quando ci approcciamo ad un indicatore in epidemiologia dobbiamo considerare sempre due:
1. cosa c'è al numeratore
2. cosa c’è al denominatore
RAPPORTO
è un quoziente di due numeri in cui il numeratore non è necessariamente incluso nel denominatore.
il rapporto è
femmina/maschio
numero di abitanti per medico
numero partecipanti al corso per docente
due indicatori principali in campo epidemiologico sono
odds ratio
risk ratio
PROPORZIONE
il numeratore è una parte del denominatore
Il numeratore è sempre incluso nel denominatore
quindi ho una parte del totale( X ) e al denominatore il totale (X e Y) *K K= può essere una un
moltiplicatore x 100 o x 1000
se il numeratore è più piccolo del denominatore il risultato di questa divisione non potrà mai
essere maggiore di 1
Sara 1 quando il numeratore è uguale al denominatore
il risultato della frazione sarà sempre compreso tra zero e uno
PERCENTUALE
la proporzione può essere divisa in percentuale moltiplicata per 100 può essere rappresentata attraverso un
grafico a torta in cui vengono riportate le percentuali di ogni singola dato.
EPIDEMIOLOGIA
studia la frequenza delle malattie
1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18

Anteprima parziale del testo

Scarica Introduzione alla Statistica Medica: Rappresentazioni Grafiche e Misure di Posizione e più Sbobinature in PDF di Statistica Medica solo su Docsity!

STATISTICA LEZIONE 3

MISURE DI FREQUENZA IN EPIDEMIOLOGIA

● Rapporti ● proporzioni ● tassi Quando ci approcciamo ad un indicatore in epidemiologia dobbiamo considerare sempre due:

  1. cosa c'è al numeratore
  2. cosa c’è al denominatore RAPPORTO è un quoziente di due numeri in cui il numeratore non è necessariamente incluso nel denominatore. il rapporto è ● femmina/maschio ● numero di abitanti per medico ● numero partecipanti al corso per docente due indicatori principali in campo epidemiologico sono ● odds ratio ● risk ratio PROPORZIONE ● il numeratore è una parte del denominatore ● Il numeratore è sempre incluso nel denominatore ● quindi ho una parte del totale( X ) e al denominatore il totale (X e Y) *K K= può essere una un moltiplicatore x 100 o x 1000 ● se il numeratore è più piccolo del denominatore il risultato di questa divisione non potrà mai essere maggiore di 1 ● Sara 1 quando il numeratore è uguale al denominatore ● il risultato della frazione sarà sempre compreso tra zero e uno PERCENTUALE la proporzione può essere divisa in percentuale moltiplicata per 100 può essere rappresentata attraverso un grafico a torta in cui vengono riportate le percentuali di ogni singola dato. EPIDEMIOLOGIA ● studia la frequenza delle malattie

● occorrono 3 misure fondamentali : PREVALENZA,INCIDENZA CUMULATIVA, TASSO D’INCIDENZA (DENSITA’ DI INCIDENZA) PREVALENZA ● la proporzione di persone malate in un certo momento o in un periodo (prevalenza di punto,T2) ● in un momento preciso, una prevalenza puntuale( prevalenza di periodo da T1 a T3) ● al numeratore ho il numero di persone che sono affette da malattie ● al denominatore ho la popolazione che può essere affetta ( popolazione a rischio in un momento specificato per il solito fattore) FATTORI CHE INFLUENZANO LA PREVALENZA ● ciò che aumenta al numeratore fa aumentare il valore della frazione ● ciò che fa diminuire il numeratore farà diminuire il valore della frazione ● se si riduce il denominatore aumenta il valore della frazione INCIDENZA CUMULATIVA ● è il numero dei nuovi eventi, osservati in un certo periodo di tempo, fratto la popolazione a rischio ,presente all'inizio dello stesso periodo ● non parliamo di tasso di incidenza, perché è una proporzione e abbiamo il numeratore che è sempre più piccolo del denominatore ● i tassi sono indicatori che al denominatore i tempi ● l'incidenza è l'indicatore calcolato. Per esempio i registri tumori, l’incidenza non considera tutti i soggetti malati di cancro in un anno, ma solo i nuovi casi I TASSI ● possono cambiare nel tempo

Oltre le tabelle si possono utilizzare i grafici perché: ● non sempre le tabelle dei dati consentono di avere una visione globale del fenomeno; ● i grafici ci consentono di cogliere con immediatezza le principali caratteristiche della distribuzione statistica; ● il grafico deve essere comprensibile, corredato da un titolo e da una scala di misura; ● la scala di misura non deve essere nè troppo dilatata nè troppo complessa, per non alterare il reale andamento di un fenomeno. I grafici hanno un impatto più diretto, danno più facilmente l'idea di come si presenta un fenomeno. TIPI DI RAPPRESENTAZIONE GRAFICA Questi sono i tipi di grafici utilizzati in epidemiologia e statistica medica: ● diagramma barra ● istogramma ● diagramma ad aree ● areali o settori di cerchio o torte ● diagramma a punti ● diagramma lineare ● poligono di frequenza ● diagramma base circolare ● cartogramma ● ideogramma ● piramide delle età ● box plot ASSI CARTESIANI il riferimento di tutti grafici sono gli assi cartesiani. Il grafico si costruisce sull'asse orizzontali delle X (delle ascisse) e asse verticale y (ordinate), che definiscono lo spazio dove viene rappresentato ogni punto, ogni valore del fenomeno. Ogni punto può essere identificato da una coppia ordinata di valori XY. DIAGRAMMA A BARRE Indica per misure qualitative. La lunghezza del segmento corrisponde alla frequenza della modalità della variabile che viene rappresentata. DIAGRAMMA A BARRE O DIAGRAMMA A RETTANGOLI DISTANZIATI O CANNE D’ORGANO ● si può usare per le variabili qualitative ● costituito da rettangoli che hanno tutti la stessa base ma la lunghezza è proporzionale alla frequenza (l'intensità) del fenomeno ● i rettangoli possono essere disposti sia orizzontalmente che verticalmente all'asse delle ascisse ● i dati sono categorici e ci possono essere spazi fra le barre (cioè queste bare possono essere separati da piccoli spazi)

presenta la mortalità, per tumori, in una regione delle Marche. Si tratta di un diagramma standardizzato (tassi per 100.000 residenti, il periodo 1980-1988, sesso maschile). La variabile che è stata indagata è quella di essere malati o meno. Dalla lunghezza delle barre si capisce quali sono i tumori più frequenti. ISTOGRAMMA ● trova applicazione per la distribuzione di variabili quantitative, in cui valori sono raggruppati in classi ● l’ampiezza delle classi è l'asse delle X, l'asse delle Y è l'intensità del fenomeno e non ci deve essere spazio tra le barre I rettangoli sono rappresentati da una base che rappresenta l'ampiezza della classe raggruppati valori in 80-85, 85-90, 90-95, 95-100. Se l'ampiezza della classe cambia cambierà anche la base dei rettangoli. L’area interna è la misura dell'intensità, della rappresentazione del fenomeno all'interno di questa classe. ● composto da una serie continua di rettangoli con un lato adiacente ● la base è in proporzione all'ampiezza della classe ● l'altezza è proporzionale all'entità del fenomeno , densità di frequenza, perché l'area corrisponde alla frequenza di ogni categoria ISTOGRMMA A CANNE D’ORGANO rappresentati i valori della pressione arteriosa. I valori inferiori a 120 sono considerati bassi per una persona adulta ; i valori tra 120-140 sono considerati medi; i valori maggiori di 140 considerati valori alti.

I valori riportati sull'asse verticale indicano la densità di frequenza per una prefissata ampiezza di classe. RICAPITOLANDO: grafico a barre : i dati presentati sono categorici, quindi lo usiamo per dati nominali ed ordinali, possono esserci spazi tra le barre istogramma : i dati presentati sono quantitativi continui e le barre devono essere contigue, non ci devono essere spazi poligono di frequenza : rappresentiamo tutte le osservazioni nel punto centrale della classe GRAFICO LINEARE SU SCALA ARITMETICA Ci sono due variabili, la variabile indipendente ( il dato, la grandezza che sto studiando) sull'asse orizzontale delle ascisse mentre sull'asse verticale si riporta la frequenza. Per ogni punto si avrà una coppia di valori (che rappresentano i dati) e unendo i punti si ottengono delle linee. Questo tipo di rappresentazione viene utilizzato per le variazioni di fenomeni nel tempo Scala aritmetica, una scala semplice se c'è una differenza troppo grande fra le aree che sto considerando può capitare che sia costretta ad uscire fuori dallo spazio GRAFICO LINEARE SU BASE LOGARITMICA ● In questi grafici, la scansione dell'asse delle ordinate è effettuate su base logaritmica e questa è una tecnica che serve per comprimere i valori (per ridurre le distanze tra le curve) e ciò consente di contenere in un piccolo segmento variazioni di entità notevole ● è adottato quando si vogliono rappresentare fenomeni che subiscono variazioni di grande entità o che per l'uso di scale molto diverse non sarebbero evidenziati in un grafico aritmetico lineare. DIAGRAMMA A SETTORI CIRCOLARI O TORTA ● il grafico più usato soprattutto per le variabili qualitative ,ma si può usare anche per le quantitative.

● consiste nel dividere la circonferenza in settori proporzionali all'intensità del fenomeno. Sono sempre le percentuali che vengono rappresentate nelle torte. Le frequenze o le quantità di una variabile qualitativa sono rappresentate da superfici di figure piane( quadrati,rettangoli, più frequentemente cerchi) A seconda della grandezza del numero varia la dimensione della fetta della torta. In questa maniera si può individuare quali sono le modalità più frequenti. DIAGRAMMA AD AREE Viene poco utilizzato. Rappresenta le neoplasie maligne (polmone,prostata, colon) nel corso di quattro anni di registrazione di un registro. questa striscia blu indica la distribuzione del tumore. il tumore più frequente tra questi tre sarà il colon perché è quello con area più estesa. DIAGRAMMA AD AREE Questi diagrammi rettangolari. Si suddividono il rettangolo, o quadrato, in tanti quadrati in proporzione alla frequenza percentuale del fenomeno RAPPRESENTAZIONI GRAFICHE: diagramma a torta Il diagramma circolare, diagramma a torta, ci possono essere degli spazi tra le fette.

CARTOGRAMMA

Altro grafico molto utilizzato ● integrano delle carte geografiche con determinazioni statistiche, cioè entità o frequenze di un certo fenomeno nelle regioni che costituiscono il territorio; ● le aree territoriali si colorano in proporzione, secondo l'intensità della diffusione ● utilizzato per valutare il campo visivo (ex quando si va dall'oculista) la mortalità per neoplasie del retto nella regione Marche ogni area è una Usl(non erano ancora state accorpate a asl) negli anni 80. Ogni Usl ha un suo valore di SRM. Ad ogni valore corrisponde un colore diverso qui abbiamo un unico colore con le varie sfumature e il colore più scuro indica le zone che presentano valori più elevati suddividere in classi di valori, raggruppare i risultati in classi e, ad ogni classe, attribuire un'intensità di colore in proporzione PIRAMIDE DELL’ ETA’ Un grafico molto utilizzato in demografia è la piramide dell'età. ● costituito da due istogrammi orizzontali, uno per i maschi uno per le femmine, disposti a basi contrapposte con l'asse delle ordinate( classi d’età) come limite di separazione ● in un diagramma cartesiano vengono impegnati il 1° quadrante per un sesso, il 2° quadrante per l’altro ● si chiama piramide perché nel passato l'istogramma dava valori della base più elevati rispetto all'età più avanzate

l'Algeria nel 1985 ,distribuzione di fasce di età. Da un lato vi sono i maschi e specularmente vi è il diagramma delle femmine. Si possono notare 2 caratteristiche:

  1. maschi e femmine sono rappresentati in modo diciamo uguale (distribuzione simmetrica)
  2. le fasce di età più rappresentate sono i bambini e gli anziani (poiché gli anziani erano pochi e si moriva prima) ESEMPIO: cosa succede oggi? La piramide dell'età si è trasformata in una botte dell'età (come una botte). Perché nascono pochi bambini ,quindi le fasce di età infantili sono meno rappresentati. Quelle più frequenti sono quelle dell'età adulta.
  3. i maschi sono i blu e in rosa abbiamo le donne
  4. nelle fasce di età più anziane ci sono meno maschi rispetto alle femmine , sopravvivono di più le donne e quindi in queste fasce di età sono più rappresentate. questo è un grafico che potete trovare nella demografia della popolazione della regione ,riferita all'anno 2017. Sono disponibili su Internet, sono dati Istat risalenti al 1 gennaio 2017 ed è una piramide dell’età che raccoglie all'interno altri indicatori

DIAGRAMMA A BASE CIRCOLARE

● Qui il raggio viene diviso in classi. ● Prendiamo ad esempio la percentuale di livelli di pioggia caduti nei primi sei mesi. ● Costruendo la linea sui valori rilevati si vede molto chiaramente che i mesi con maggiore pioggia sono i mesi di febbraio, marzo BOX-PLOT ● E’ un grafico che prevede che si conoscano dei parametri di tendenza centrale. ● Sintetizza una distribuzione di dati, utile per esaminare i valori di una variabile, in più gruppi di confronto. quindi primo 25% 50% 50% 75% e 100% è un modo per rappresentare queste parti della distribuzione GRAFICO A DISPERSIONE O A PUNTI ● utilizzato per illustrare la relazione tra due diverse misure continue ● ogni punto del grafico rappresenta una coppia di valori

relazione fra i valori di colesterolemia e i valori di pressione arteriosa. Troppo colesterolo comporta una presenza di placche all'interno delle arterie (che determina l'aumento dei valori della pressione). Man mano che aumenta la quantità di colesterolo nel sangue abbiamo un aumento della pressione. Possiamo sintetizzare con una linea e riconoscere che esiste una relazione in crescendo Grafico dI morte bambini. La torta fa capire qual è il fenomeno più frequente grafico AIDS, la tabella già mi indica un andamento in crescendo del fenomeno

● i risultati di probabilità di esperimenti condotti in maniera casuale si distribuiscono in maniera normale ● i risultati di ripetute misurazioni si distribuiscono in modo normale ● variabili biologiche, che non si distribuiscono in modo normale, possono essere ricondotte alla distribuzione normale per mezzo di trasformazioni matematiche( ad esempio il logaritmo). ● ciò permette di utilizzare ampiamente le proprietà della curva di gauss nelle inferenze( previsione) statistiche sui fenomeni biologici. TENDENZA CENTRALE E VARIABILITÀ’ ● per rappresentare una serie di dati dunque è possibile ricorrere alle distribuzione di frequenza e in particolare nella distribuzione normale(gauss), poiché i dati, provenienti da rilevazioni di interesse biologico ,si distribuiscono nella loro maggioranza in maniera approssimativamente normale ● per rendere comparabili e rappresentabili ,oltre che graficamente anche statisticamente, due distribuzioni di frequenza , è però necessario definiri con semplici misure che rappresentino la loro configurazione in forma matematica ● indicare la posizione (lungo l'asse delle ascisse )e la dispersione dei valori attorno ai valori centrali tre fenomeni e un dato quantitativo, il peso. Le curve sono uguali come forma ma sono posizionate su valori diversi. Le variabilità, cioè la larghezza della campana, sono uguali. INDICI DI DISTRIBUZIONI DI FREQUENZA Le caratteristiche fondamentali di una distribuzione di frequenza (parametri statistici di una curva normale) sono quindi dati dalle seguenti misure: ● misure di posizione o tendenza centrale ( le medie ferme, lasche) o medie in senso lato ● di dispersione o variazione (assoluti, il campo di variazione ,lo scostamento quadratico medio, la deviazione standard e coefficiente di variazione che l'unico elemento di gestione relativo) ● indici di forma MISURE DI POSIZIONE

● hanno il vantaggio di sintetizzare le modalità di distribuzioni considerate, cioè indicano la tendenza centrale dei valori della curva (ossia i valori centrali attorno ai quali si addensano i valori distribuzione) ● una sintesi rappresentativa della distribuzione espressa attraverso la stessa scala di misura del fenomeno e capace di “sostituire” in un certo senso tutte le osservazioni. ● per forza di cose, sacrifica la variabilità delle informazioni TIPOLOGIE DI MEDIA ● Media di calcolo o ferme o analitiche, sono quelle che si calcolano tenendo conto di tutti i valori della distribuzione e possono essere la media aritmetica, geometrica e armonica. ● le medie lasche, invece considerano solo alcuni valori e sono moda, mediana e quattrini. MEDIE ANALITICHE ● se i dati sono di tipo quantitativo possono eseguire delle operazioni di calcolo VALORE CENTRALE DELLA CLASSE ● il più semplice indicatore è il valore centrale della classe (la semisomma delle due misure estreme) ● questo indice trascura tutti i singoli valori ● è opportuno sfruttare l'informazione fornita da tutte le misure MEDIA ARITMETICA ● si calcola sommando i singoli dati e dividendo il totale per il numero dei valori sommati ● si indica con M ,la media ● quando è riferito ad un campione si indica con la X^- ( X con un trattino sopra) , se si riferisce all'intera popolazione col μ ● semplice, è rapporto tra la somma dei valori e il numero degli stessi ● la ponderata, è il rapporto tra la somma dei prodotti di ogni valore per il suo peso. Al denominatore non avremo il numero dei valori ma la sommatoria dei pesi,quindi delle frequenze CENTRO DI UNA DISTRIBUZIONE Ho un insieme di elementi da X1 a XN , quindi la media semplice sarà la somma di x1,x2 ecc fratto N La media ponderata, ho un insieme di elementi X1 ,X2..XN e dei pesi ( le frequenze) P1,P2…PN. La media ponderata sarà X1P1+X2P2+...XN*PN/P1+P2…+PN X 1 per il suo peso , X2 per il suo peso, li sommo e al denominatore sommo solo i pesi test attitudinale che è stato somministrato da un gruppo di 25 soggetti Questi 25, rappresentano il totale. Per la media ponderata moltiplico la frequenza per il valore quindi: 2 × 2, 4 × 5 e poi li sommo e li divido con la somma dei pesi

MEDIA GEOMETRICA

● E’ la radice ennesima del prodotto di n osservazioni ● è una media che si utilizza quando i dati appaiono legati tra loro da un fattore moltiplicativo ( in matematica si parlerebbe di successione geometrica) ● Serve per rendere più reale il valore medio. ● MEDIA ARMONICA ● è il reciproco della media aritmetica dei reciproci delle osservazioni ● utilizzata nei tempi di reazioni di prove di tossicità oppure nei calcoli di sopravvivenza, quando si considerano valori molto grandi ● il rapporto tra il numero dei termini della distribuzione e la somma dei reciproci dei singoli termini

la digitale è un farmaco che in passato è stato molto utilizzato per lo scompenso cardiaco. Si tratta di un farmaco tossico che da effetti collaterali. MEDIA TRONCATA O TRIMMATA In alcuni casi è opportuno troncare la media perché ● è sensibile a dati particolarmente scostati rispetto all'insieme degli altri ● utilizzando gli indici di posizione oppure facendo riferimento alla media calcolata, dopo aver eliminato i valori più estremi, si può sopperire a questo problema ● la quantità dei dati da scartare viene decisa a priori e bisogna indicarlo nello studio per spiegare il motivo LIMITI DELLA MEDIA La media aritmetica è la misura di posizione più usata ma a volte altre misure si dimostrano più utili. MEDIE LASCHE O DI POSIZIONE MEDIANA ● Rappresentata dal valore centrale di una serie numerica allorquando i dati sono disposti in ordine crescente ● la mediana è il valore che corrisponde alla metà della mia distribuzione ● non può essere rilevata per dati nominali qualitativi, ma solo per dati ordinati in sequenza ● se il numero dei dati esaminati è dispari, la mediana corrisponde al valore posto al centro. ex 1 2 3 la mediana è 2 ● se è par,i la mediana è rappresentata dalla media aritmetica dei due valori centrali. esempio 2 4 6 8 la mediana è 4+6/2= ● quando la distribuzione è organizzata per frequenze, la mediana si definisce come la modalità che è più grande del 50% delle osservazioni e che è la più piccola del 50% ● non è influenzata dai valori estremi ma solo dal numero delle osservazioni ● non risente di valori anomali