Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Introduzione alla Biometria: Metodo Scientifico, Statistica e Ricerca Clinica, Appunti di Probabilità e Statistica

Statistica descrittive e inferenziale

Tipologia: Appunti

2015/2016

Caricato il 06/02/2016

Ludovica117
Ludovica117 🇮🇹

4.6

(18)

2 documenti

1 / 113

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
2008 Biometria - RPSorge2008 Biometria - RPSorge
Statistica
Statistica
Roberto Sorge
UNIVERSITA' DEGLI STUDI DI ROMA "TOR VERGATA"
Facoltà di Medicina e Chirurgia. Laboratorio di Biometria
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Anteprima parziale del testo

Scarica Introduzione alla Biometria: Metodo Scientifico, Statistica e Ricerca Clinica e più Appunti in PDF di Probabilità e Statistica solo su Docsity!

2008 Biometria - RPSorge2008 Biometria - RPSorge

Statistica Statistica

Roberto Sorge [email protected] UNIVERSITA' DEGLI STUDI DI ROMA "TOR VERGATA" Facoltà di Medicina e Chirurgia. Laboratorio di Biometria

La statistica è una branca della matematica

applicata ai dati di osservazione, che permette di sintetizzare con degli indici i fenomeni e di stimare l’attendibilità dei risultati e le tendenze future. La ricerca scientifica è una branca della scienza che intende comprendere i fenomeni, osservarne gli esiti e formulare leggi e/o definire metodi capaci di aumentare la conoscenza fino a prevederli.

Gli argomenti della statistica

La statistica descrittiva definisce gli indici che permettono di classificare il fenomeno e di collocarlo nello spazio statistico di riferimento. La statistica inferenziale definisce le regole ed i metodi atti all’estrazione di campioni affinché rappresentino con sufficiente aderenza la popolazione di origine. Essa fonda:

  • (^) sul campionamento statistico
  • (^) sulla stima puntuale e/o di intervallo
  • (^) sulle prove dell'ipotesi e dell’estensione dei risultati alla popolazione La teoria delle decisioni studia e definisce le soluzioni ottimali quando le esperienze portano a condizioni di incertezza determinando in termini probatori l’affidabilità dei risultati e dei test utilizzati per verificare le ipotesi di lavoro.

Il metodo scientifico permette di fornire le

risposte razionali alle ipotesi da verificare. Galileo fu l’ideatore del metodo scientifico. Il metodo galileano si basa su due passaggi fondamentali:

  • (^) Riproducibilità delle esperienze. La riproducibilità sperimentale serve a verificare l’attendibilità dei risultati.
  • (^) Confronto delle esperienze. Il confronto di esperienze serve a stabilire se i risultati possono essere ottenuti in altri modi o in altre condizioni.

2008 Biometria - RPSorge Un protocollo sperimentale è l’insieme di operazioni che il ricercatore deve “progettare ad hoc” perché possa analizzare il fenomeno. Essendo il protocollo “sperimentale”, ossia “mai provato prima”, all’inizio non potrà che avvalersi dell’esperienza del ricercatore. Dopo la fase di rodaggio e di affinamento un protocollo sperimentale potrà essere validato e riconosciuto efficace anche da altri ricercatori per essere considerato protocollo standardizzato. I protocolli possono dividersi in:

protocolli longitudinali se, su un campione di

elementi si valutano le modificazioni di un parametro al

variare del tempo. In questo caso i dati di confronto sono detti “appaiati”. protocolli trasversali se, su più campioni di elementi si valutano le modificazioni di un parametro rispetto ai diversi trattamenti a cui vengono sottoposti i campioni. In questo caso i dati si dicono “indipendenti” perché il confronto e tra campioni indipendenti anche se partiti con Il protocollo sperimentale Il protocollo sperimentale

I protocolli possono dividersi in :

  • Protocolli longitudinali per valutare le modificazioni di uno o più parametri su un campione al variare del tempo. (VALUTAZIONI ENTRO GRUPPO => dati appaiati)
  • Protocolli trasversali per valutare l’efficacia di nuovi trattamenti. (VALUTAZIONI TRA GRUPPI => dati indipendenti).

La scala di misura è generalmente rappresentabile con

una linea, chiamata asse. Essa può avere un’origine 0 e una norma che rappresenta l’unità di misura. Es. Con la Norma “|_________|=1” si potrà costruire la seguente scala: _|_________|_________|_________|_________|_________|_________|__________|_________| -1 0 1 2 3 4 5 6 7 Potere misurante Scala di rapporti.Scala di rapporti. EE’ la scala quantitativa per eccellenza con’ la scala quantitativa per eccellenza con il il puntopunto didi origineorigine 00 concon unauna normanorma costantecostante ee puòpuò rappresentare misure diverse. (es. può rappreentare il peso , la rappresentare misure diverse. (es. può rappreentare il peso , la statura, ecc. con gli stessi valori di scala!) statura, ecc. con gli stessi valori di scala!) Scala Scala didi intervalli.intervalli. EE’’ comecome (^) lala (^) scalascala didi rapportirapporti concon lala limitazione che può rappresentare una sola misura alla volta (es. limitazione che può rappresentare una sola misura alla volta (es. caso delle temperature). caso delle temperature). Scala ordinale o per ranghi. Scala ordinale o per ranghi. EE’ una scala qualitativa che’ una scala qualitativa che non necessita del punto 0 rappresentando caratteri ordinati in non necessita del punto 0 rappresentando caratteri ordinati in crescita crescita oo inin decrescitadecrescita comecome numerinumeri (1,2,3,4,(1,2,3,4, ecc.)ecc.) oo simbolisimboli (A,B,C,D, ecc.). (A,B,C,D, ecc.). Scala nominale o classificatoria. Scala nominale o classificatoria. (^) EE’ una scala qualitativa’ una scala qualitativa per dati esclusivamente simbolici (es. M,F; Si,No; ecc.). per dati esclusivamente simbolici (es. M,F; Si,No; ecc.).

che comporta le seguenti importanti considerazioni:  (^) L’errore potrà essere azzerato solo quando il valore medio di infinite misure risulta coincidente con il valore vero.  (^) Nel caso di un numero di misure finito, il valore medio rappresenta la migliore stima del valore vero, è l’errore sarà il più piccolo possibile.  (^) All’aumentare del numero di misure, la media tenderà sempre più al valore vero.

Ogni misura comporta un errore. Se infatti, misuriamo una

qualsiasi proprietà di un certo oggetto, l’errore può essere identificato come lo scarto tra due valori: ERRORE = valore misurato - valore vero il valore vero rappresenta l’effettivo valore di tale proprietà ed è il valore ideale che però nessuno conosce. Se ora effettuiamo un certo numero di misure possiamo sostituire il valore misurato con il valore della media: errore = media - valore vero < ERRORE e che dovrebbe rendere più piccolo l’errore stesso. Se immaginiamo ora di poter condurre infinite misure con il passaggio al limite avremo l’espressione:

La curva degli errori casuali: la gaussiana

valore vero = media N ° d i p a llin e x c o lo n n a Larghezza

A lte z z a

Un gioco da luna park prevede di inserire per un totale di 35 lanci il maggior numero di palline nella colonna centrale, ma come si vede il giocatore può compiere degli errori di lancio mandando le palline a destra e a sinistra della colonna centrale.

Due amici si sfidano al gioco cercando di inserire per un totale di 35 lanci il maggior numero di palline nella colonna centrale. Ebbene il giocatore di destra ha sicuramente vinto; ha inserito 8 palline (100x8/3523% di successi) mentre il suo avversario solo 6 (6/3517%). A ben vedere il giocatore di destra è più preciso perchè ha più palline addensate attorno alla colonna centrale. La curva degli errori casuali: la dispersione

2008 Biometria - RPSorge2008 Biometria - RPSorge

Le distribuzioni di frequenza, gli istogrammi Le distribuzioni di frequenza, gli istogrammi

Le frequenze assolute, relative e cumulate Le frequenze assolute, relative e cumulate La frequenza assoluta è il numero di volte che un carattere o un dato è uguale o contenuto in un determinato intervallo di classe. La frequenza relativa è invece il rapporto tra la frequenza assoluta e la somma di tutte le frequenze assolute (=N° dati). La frequenza cumulata è la somma delle frequenze assolute o relative delle classi fino a comprendere quella con modalità del carattere considerato. Riprendendo l Riprendendo l’esempio:’esempio: N°N° DATODATO Diamet Diamet ri ri (cm) (cm) 11 1.01. 22 2.32. 33 2.52. 44 2.62. 55 3.83. 66 3.93. 77 4.04. 88 4.04. 99 4.44. 1010 4.64. 1111 5.05. 1212 6.06. ClasClas sisi Limiti diLimiti di ClasseClasse Freq.Freq. AssolutAssolut ee Freq.Freq. RelativeRelative Freq.Freq. CumulatCumulat ee Freq.Freq. Rel.Rel. CumulatCumulat ee 11 0.990 -0.990 - 1.9941. 11 1/12 =1/12 = 0.080. (^11) 0.080. 22 1.994 -1.994 - 2.9982. 33 3/12 =3/12 = 0.250. (^44) 0.330. 33 2.998 -2.998 - 4.0024. 44 4/12 =4/12 = 0.340. 88 0.670. 44 4.002 -4.002 - 5.0065. 33 3/12 =3/12 = 0.250. 1111 0.920. 55 5.006 -5.006 - 6.0106. 11 1/12 =1/12 = 0.080. (^1212) 1.001.

Istogramma di frequenze assolute e Istogramma di frequenze assolute e

relative relative

La frequenza relativa di una classe di dati di una variabile distribuita in modo gaussiano è una prima approssimazione del valore di probabilità che avrebbe nella popolazione di riferimento. Infatti aumentando l’ampiezza del campione e quindi aumentando le classi

all’infinito, le frequenze relative tendono a

identificarsi ai valori puntuali delle probabilità:

Allora… se conosciamo già la distribuzione della variabile e l’istogramma risulta platealmente diverso da quello atteso dobbiamo pensare ad un campionamento errato mentre se non conosciamo la distribuzione della variabile si tratta di valutare facendo più campionamenti se la distribuzione si ripete similmente oppure risulta diversa per problemi di campionamento. Tuttavia gli istogrammi possono avere anche altri andamenti: