Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


CONCETTI DI STATISTICA MEDICA, Dispense di Statistica Medica

Dispensa contenente concetti di statistica medica: misurazioni, variabili, distribuzioni di frequenza, misure d’ordine in una distribuzione, rappresentazioni grafiche, misure di posizioni.

Tipologia: Dispense

2019/2020

Caricato il 13/04/2020

Nicolamazzoleni21
Nicolamazzoleni21 🇮🇹

4.2

(54)

64 documenti

1 / 4

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
1
CONCETTI DI STATISTICA MEDICA
Introduzione
In Medicina, l’apprendimento e l’acquisizione delle competenze professionali è stato basato sulle autorità del settore
(esperti, libri di riferimento, conferenze), per cui l’approccio autoritario portava al principio d’autorità e al paradigma
storico. Tale paradigma si basava sulle seguenti assunzioni:
Osservazioni non sistemiche basate sull’esperienza clinica sono valide per basare e formare le conoscenze
mediche sulla prognosi, la diagnosi e l’efficacia dei trattamenti;
La conoscenza dei meccanismi biologici e fisiologici è sufficiente per guidare la pratica clinica;
Il buon senso, l’esperienza clinica e la conoscenza dei meccanismi biologici sono sufficienti per valutare nuovi
strumenti diagnostici e nuovi trattamenti;
Gli esperti devono produrre per consenso “linee guida per il trattamento e la diagnosi di patologie”.
Secondo il nuovo paradigma, le decisioni e le conoscenze su test diagnostici, prognosi e trattamenti devono essere
basate sull’evidenza proveniente dalla ricerca clinica (EBM):
L’esperienza clinica è basilare, ma l’osservazione clinica deve essere fatta in modo sistemico, riproducibile e
quantitativo (adottare la metodologia delle ricerca);
La conoscenza dei meccanismi biologici è necessaria, ma non sufficiente per predire la migliore pratica clinica;
La formazione e la pratica medica deve essere basate anche sulla capacità medica di acquisire l’informazione
sulla miglior evidenza possibile (basata sui risultati delle più importanti ricerche cliniche) circa un problema
clinico (capacità di consultare la letteratura medica e le banche dati).
La RICERCA SCIENTIFICA è il processo di indagine della realtà mirato a produrre conoscenze nuove e generalizzabili su
fenomeni di interesse, basato su sistematicità, misurazione quantitativa e riproducibilità del metodo. Il processo di
ricerca scientifica, sperimentale o indagine, genera l’evidenza empirica (DATI) relativa al problema in studio.
L’individuazione di regolarità o particolari andamenti nei dati permette di sviluppare LEGGI SCIENTIFICHE, descrizioni
generalizzate, di solito espresse in termini matematici, che descrivono il comportamento empirico di un fenomeno.
La matematica è fondamentale per la ricerca scientifica, poiché permette di formulare modelli quantitativi le cui
predizioni possono essere sottoposte a verifica sperimentale.
La STATISTICA si definisce come l'insieme di metodi di natura logica e matematica atti a raccogliere, analizzare ed
interpretare dati numerici o numerabili. L'applicazione della statistica alla metodologia di ricerca permette una più
corretta e obiettiva interpretazione dei fenomeni osservati ed esprime un diverso grado di credibilità dei risultati
ottenuti. La scienza statistica comprende due argomenti principali che raggruppano specifiche metodologie:
1. statistica descrittiva, in cui gli strumenti analitici hanno il compito di organizzare, elaborare e presentare i dati;
2. statistica inferenziale, in cui le metodologie servono a trarre conclusioni pertinenti riguardanti la popolazione a
partire dai risultati forniti da un campione rappresentativo di essa (stima di parametri, test di ipotesi).
Si definisce UNIVERSO o POPOLAZIONE (simbolo U) la massa di possibili individui o osservazioni, mentre il CAMPIONE
è formato da osservazioni effettivamente utilizzate, purché tratte dalla massa secondo criteri opportuni. Ogni singolo
soggetto in esame prende il nome di UNITÀ STATISTICA, il rilievo che si esegue da luogo all'osservazione e l'insieme
delle osservazioni costituisce il DATO STATISTICO.
La statistica presenta diverse finalità:
Descrivere i dati: condensare un gran numero di dati rilevati in pochi valori riassuntivi, capaci di indicare
importanti proprietà della popolazione oggetto di indagine;
Esplorare le relazioni: definire e descrivere le relazioni tra le variabili rilevate;
Fare previsioni: utilizzare i dati raccolti per prevedere i valori che ci si aspetta di trovare nella popolazione
oggetto di indagine in particolari condizioni;
Classificare: descrivere ed analizzare gruppi definiti sulla base di aspetti comuni misurate da variabili rilevate;
Valutare ipotesi: stabilire quanto è verosimile che esista una relazione tra le variabili;
Generare ipotesi: grazie alle 5 fasi precedentemente descritte le variabili divengono meglio comprensibili, ed
è possibile che questo porti a proporre nuove idee a proposito della popolazione indagata.
Tutti gli obiettivi che abbiamo elencato sono sistemi differenti per affrontare lo stesso problema: la VARIABILITÀ.
I metodi statistici chiamano in causa osservazioni che variano da campione a campione e portano un certo grado di
incertezza in ogni analisi. L’obiettivo primario di pressoché tutti i metodi statistici è quello di comprendere il
comportamento di un fenomeno tenendo conto degli effetti di questa variabilità.
pf3
pf4

Anteprima parziale del testo

Scarica CONCETTI DI STATISTICA MEDICA e più Dispense in PDF di Statistica Medica solo su Docsity!

CONCETTI DI STATISTICA MEDICA

Introduzione

In Medicina, l’apprendimento e l’acquisizione delle competenze professionali è stato basato sulle autorità del settore (esperti, libri di riferimento, conferenze), per cui l’approccio autoritario portava al principio d’autorità e al paradigma storico. Tale paradigma si basava sulle seguenti assunzioni:

  • Osservazioni non sistemiche basate sull’esperienza clinica sono valide per basare e formare le conoscenze mediche sulla prognosi, la diagnosi e l’efficacia dei trattamenti;
  • La conoscenza dei meccanismi biologici e fisiologici è sufficiente per guidare la pratica clinica;
  • Il buon senso, l’esperienza clinica e la conoscenza dei meccanismi biologici sono sufficienti per valutare nuovi strumenti diagnostici e nuovi trattamenti;
  • Gli esperti devono produrre per consenso “linee guida per il trattamento e la diagnosi di patologie”. Secondo il nuovo paradigma, le decisioni e le conoscenze su test diagnostici, prognosi e trattamenti devono essere basate sull’ evidenza proveniente dalla ricerca clinica (EBM):
  • L’esperienza clinica è basilare, ma l’osservazione clinica deve essere fatta in modo sistemico, riproducibile e quantitativo (adottare la metodologia delle ricerca);
  • La conoscenza dei meccanismi biologici è necessaria, ma non sufficiente per predire la migliore pratica clinica;
  • La formazione e la pratica medica deve essere basate anche sulla capacità medica di acquisire l’informazione sulla miglior evidenza possibile (basata sui risultati delle più importanti ricerche cliniche) circa un problema clinico (capacità di consultare la letteratura medica e le banche dati). La RICERCA SCIENTIFICA è il processo di indagine della realtà mirato a produrre conoscenze nuove e generalizzabili su fenomeni di interesse, basato su sistematicità, misurazione quantitativa e riproducibilità del metodo. Il processo di ricerca scientifica, sperimentale o indagine, genera l’ evidenza empirica (DATI) relativa al problema in studio. L’individuazione di regolarità o particolari andamenti nei dati permette di sviluppare LEGGI SCIENTIFICHE, descrizioni generalizzate, di solito espresse in termini matematici, che descrivono il comportamento empirico di un fenomeno. La matematica è fondamentale per la ricerca scientifica, poiché permette di formulare modelli quantitativi le cui predizioni possono essere sottoposte a verifica sperimentale. La STATISTICA si definisce come l'insieme di metodi di natura logica e matematica atti a raccogliere, analizzare ed interpretare dati numerici o numerabili. L'applicazione della statistica alla metodologia di ricerca permette una più corretta e obiettiva interpretazione dei fenomeni osservati ed esprime un diverso grado di credibilità dei risultati ottenuti. La scienza statistica comprende due argomenti principali che raggruppano specifiche metodologie:
  1. statistica descrittiva , in cui gli strumenti analitici hanno il compito di organizzare, elaborare e presentare i dati;
  2. statistica inferenziale , in cui le metodologie servono a trarre conclusioni pertinenti riguardanti la popolazione a partire dai risultati forniti da un campione rappresentativo di essa (stima di parametri, test di ipotesi). Si definisce UNIVERSO o POPOLAZIONE (simbolo U) la massa di possibili individui o osservazioni, mentre il CAMPIONE è formato da osservazioni effettivamente utilizzate, purché tratte dalla massa secondo criteri opportuni. Ogni singolo soggetto in esame prende il nome di UNITÀ STATISTICA, il rilievo che si esegue da luogo all'osservazione e l'insieme delle osservazioni costituisce il DATO STATISTICO. La statistica presenta diverse finalità:
  • Descrivere i dati : condensare un gran numero di dati rilevati in pochi valori riassuntivi, capaci di indicare importanti proprietà della popolazione oggetto di indagine;
  • Esplorare le relazioni : definire e descrivere le relazioni tra le variabili rilevate;
  • Fare previsioni : utilizzare i dati raccolti per prevedere i valori che ci si aspetta di trovare nella popolazione oggetto di indagine in particolari condizioni;
  • Classificare : descrivere ed analizzare gruppi definiti sulla base di aspetti comuni misurate da variabili rilevate;
  • Valutare ipotesi : stabilire quanto è verosimile che esista una relazione tra le variabili;
  • Generare ipotesi : grazie alle 5 fasi precedentemente descritte le variabili divengono meglio comprensibili, ed è possibile che questo porti a proporre nuove idee a proposito della popolazione indagata. Tutti gli obiettivi che abbiamo elencato sono sistemi differenti per affrontare lo stesso problema: la VARIABILITÀ. I metodi statistici chiamano in causa osservazioni che variano da campione a campione e portano un certo grado di incertezza in ogni analisi. L’obiettivo primario di pressoché tutti i metodi statistici è quello di comprendere il comportamento di un fenomeno tenendo conto degli effetti di questa variabilità.

Misurazione

La MISURAZIONE è l’osservazione che permette di associare coerentemente numeri alle caratteristiche di un insieme di oggetti o individui; lo scopo della misurazione è di stabilire una corrispondenza tra un sistema relazionale empirico e un sistema relazionale numerico che conservi le proprietà fondamentali del primo. Sulla base del tipo di relazioni che si possono individuare tra caratteristiche di soggetti appartenenti a un collettivo, si hanno quattro SCALE DI MISURA:

  1. SCALA NOMINALE: misure qualitative riferibili ad attributi o qualità espressi con nomi o forme verbali (i valori numerici permettono solo di definire l’equivalenza tra caratteristiche: A = B o A ≠ B);
  2. SCALA ORDINALE: i valori numerici assegnati permettono di ordinare le osservazioni in base ad un andamento crescente o decrescente della caratteristica (ordine: A < B o A > B);
  3. SCALA AD INTERVALLO: la differenza tra le misure è proporzionale alla distanza tra caratteristiche (A - B);
  4. SCALA DI RAPPORTO: il rapporto tra le misure è uguale al rapporto tra caratteristiche (A / B). Le principali proprietà di una misura sono:
  • VALIDITÀ: capacità di un procedimento di misurare effettivamente ciò che intende misurare ( gold standard );
  • ACCURATEZZA: vicinanza di un valore misurato al valore vero;
  • PRECISIONE: vicinanza di misure ripetute ad un unico valore;

Variabili

La statistica descrittiva ha come primo scopo quello di riassumere le informazioni provenienti da una massa di dati, permettendo al lettore di individuare a prima vista le caratteristiche di un gruppo di valori. Quando si compie una rilevazione di dati, in realtà si rilevano i valori o le modalità con quali si presentano determinate VARIABILI; ognuna di queste presenta particolari caratteristiche che permettono di classificarla in una precisa categoria. In funzione delle proprie caratteristiche, le variabili possono essere suddivise in :

  • Variabili qualitative , espresse mediante attributi (colore dei capelli, sesso, stato civile);
  • Variabili quantitative , indicate da numeri (età, peso, altezza). Le variabili quantitative possono essere suddivise a loro volta in due sottogruppi:
  • Variabili qualitative nominali : l'attributo che indica la caratteristica ha il solo scopo di rappresentare la modalità con cui si presenta il dato. Si indicano come variabili dicotomiche le grandezze che ammettono solo due risposte possibili, mentre sono variabili policotomiche quelle con più risposte ammissibili;
  • Variabili quantitative ordinali : l'attributo ha ancora lo scopo di rappresentare la modalità con cui si presenta il dato, ma queste modalità sono organizzate in una scala di valori logici. Le variabili quantitative, invece, possono essere suddivise in:
  • Variabili quantitative discrete : numeri non necessariamente interi, collocabili in una scala di tipo ordinale, ma capaci di assumere solo certi valori puntuali (numero dei membri della famiglia, frequenza cardiaca);
  • Variabili quantitative continue : possono assumere tutti gli infiniti valori all'interno o meno di un determinato intervallo e qualsiasi altro dato misurabile e rappresentabile attraverso un numero reale (peso, altezza).

Distribuzioni di frequenza

Si definiscono SERIE STATISTICHE le successioni qualitative di dati ordinati all'interno di una tabella secondo un certo criterio, in cui ad ogni modalità viene associata la frequenza con cui questa si presenta nel gruppo di soggetti sui quali è stata effettuata la rilevazione. Nelle SERIAZIONI, invece, gli elementi di ordinamento quantitativo sono costituiti da valori della variabile e dalle FREQUENZE (numero delle volte che l'intensità quantitativa si presenta). Il metodo più semplice e immediato per rappresentare in modo sintetico un insieme di osservazioni individuali relative ad una certa variabile è mediante la DISTRIBUZIONE DI FREQUENZA, l’insieme dei possibili valori di una variabile con associata la frequenza con cui tali valori sono stati rilevati nel campione. Il criterio di classificazione deve essere esaustivo e non ambiguo: ogni unità statistica deve essere assegnata ad un’unica modalità o intervallo di classe. La FREQUENZA ASSOLUTA ( ni ) è il numero di osservazioni corrispondente alle diverse modalità o valori (intervalli di classe) della variabile; la FREQUENZA RELATIVA ( Pi = ni / N ) è il rapporto tra il numero di osservazioni corrispondente alle diverse modalità o valori della variabile e la dimensione campionaria. La frequenza relativa si usa per il confronto della distribuzione di una variabile in campioni di dimensioni diverse. La FREQUENZA ASSOLUTA CUMULATA ( Fi ) è il numero di osservazioni il cui valore è inferiore o uguale a un dato valore xi; la FREQUENZA RELATIVA CUMULATA ( Pi = Fi / N ) è il rapporto tra la frequenza assoluta cumulata e il numero di campioni coinvolti. La curva ad ogiva fornisce, invece, la rappresentazione grafica della distribuzione di frequenza di una variabile quantitativa: costituisce il poligono delle frequenze relative cumulate. P(x 1 < X < x 2 ) = F (x 1 ) - F (x 2 ).

Misure di posizioni

Una serie di dati (misurazioni) è compiutamente descritta da tre proprietà principali:

  • La tendenza centrale o posizione
  • La dispersione o variabilità
  • La forma Queste misure descrittive sintetiche sono chiamate STATISTICHE quando sono calcolate su un campione di dati, mentre si definiscono PARAMETRI quando descrivono la popolazione. Gli INDICI DI POSIZIONE si dividono in tre categorie: moda, media (aritmetica, armonica, geometrica) e mediana. La MODA di un insieme di dati o di una distribuzione la modalità è il valore (o l’intervallo di classe) della variabile a cui corrisponde la massima frequenza; la moda può essere unica o comprendere più valori con uguale rappresentanza. La MEDIANA (Me) è il valore centrale di una serie ordinata di dati e costituisce il sinonimo di 50-esimo percentile; in questo caso le osservazioni vengono separate dal valore mediano in due parti numericamente uguali.
  • Se n è dispari: 𝑀𝑒 = 𝑥𝑛+ 1 2
  • Se n è pari: 𝑀𝑒 = 𝑋𝑛 2 +𝑋 (^) 𝑛 2 + 1 2 Per calcolare la mediana, dato un insieme di elementi o valori, è utile procedere in questo modo:
  1. Ordinare le unità secondo un ordine crescente di valori;
  2. Identificare l’unità centrale nella serie ordinata di dati;
  3. La mediana è il valore che la variabile assume sull’unità che divide il campione in due parti numericamente uguali (le misure di posizione sono valori, non frequenze). La MEDIA ARITMETICA di un insieme di osservazioni è pari alla somma di valori diviso il numero totale di osservazioni; se una variabile assume lo stesso valore in più unità statistiche, la media può essere calcolata moltiplicando quel valore per la frequenza con cui compare nella distribuzione (MEDIA ARITMETICA PONDERATA). La media aritmetica gode di proprietà, le due principali dal punto di vista applicativo sono legate al concetto di scarto:
  • La somma algebrica degli scarti delle osservazioni dalla loro media aritmetica è pari a zero;
  • La somma dei quadrati degli scarti delle osservazioni da un qualsiasi valore A è minima quando A è pari alla media aritmetica. Quando la distribuzione è molto asimmetrica la media aritmetica non è una buona misura del valore centrale; per rendere simmetrica la distribuzione si opera la trasformazione logaritmica dei dati ( Xi = log (Yi) )

Se si chiama u la media aritmetica dei logaritmi delle osservazioni: 𝑢 =

∑ 𝑛 𝑖= 1 log 𝑌𝑖 𝑛 La MEDIA GEOMETRICA è definita da: 𝑀𝑔 = antilog 𝑢 Misure in progressione geometrica sono ampiamente utilizzate in microbiologia e sierologia, che prevedono titolazioni di soluzioni ottenute medianti diluizioni costanti. Le misure sono espresse in scala di rapporto: si possono utilizzare tutti gli indici di tendenza centrale. Nella media geometrica i dati differiscono per ordine di grandezza; trattandosi di concentrazioni, i valori sono compatibili con diluizioni costanti. Si definisce MEDIA ARMONICA il reciproco della media aritmetica dei reciproci dei dati e si applica quando ha senso

calcolare il reciproco dei dati: 𝑀ℎ =

𝑛 ∑ (^) 𝑥^1 𝑖 Moda Mediana Media aritmetica + Buona misura quando un valore ha una frequenza molto elevata Buona misura con distribuzioni asimmetriche Buona misura con distribuzioni simmetriche, facile da trattare matematicamente, utilizza tutta l’informazione contenuta nei dati

- Dipende dal raggruppamento arbitrario dei dati, varia molto da campione a campione Difficile da trattare aritmeticamente È inaffidabile in caso di distribuzioni asimmetriche, è poco robusta in presenza di valori anomali