




























































































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Statistica descrittive e inferenziale
Tipologia: Appunti
1 / 113
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!





























































































2008 Biometria - RPSorge2008 Biometria - RPSorge
Roberto Sorge [email protected] UNIVERSITA' DEGLI STUDI DI ROMA "TOR VERGATA" Facoltà di Medicina e Chirurgia. Laboratorio di Biometria
applicata ai dati di osservazione, che permette di sintetizzare con degli indici i fenomeni e di stimare l’attendibilità dei risultati e le tendenze future. La ricerca scientifica è una branca della scienza che intende comprendere i fenomeni, osservarne gli esiti e formulare leggi e/o definire metodi capaci di aumentare la conoscenza fino a prevederli.
La statistica descrittiva definisce gli indici che permettono di classificare il fenomeno e di collocarlo nello spazio statistico di riferimento. La statistica inferenziale definisce le regole ed i metodi atti all’estrazione di campioni affinché rappresentino con sufficiente aderenza la popolazione di origine. Essa fonda:
risposte razionali alle ipotesi da verificare. Galileo fu l’ideatore del metodo scientifico. Il metodo galileano si basa su due passaggi fondamentali:
2008 Biometria - RPSorge Un protocollo sperimentale è l’insieme di operazioni che il ricercatore deve “progettare ad hoc” perché possa analizzare il fenomeno. Essendo il protocollo “sperimentale”, ossia “mai provato prima”, all’inizio non potrà che avvalersi dell’esperienza del ricercatore. Dopo la fase di rodaggio e di affinamento un protocollo sperimentale potrà essere validato e riconosciuto efficace anche da altri ricercatori per essere considerato protocollo standardizzato. I protocolli possono dividersi in:
variare del tempo. In questo caso i dati di confronto sono detti “appaiati”. protocolli trasversali se, su più campioni di elementi si valutano le modificazioni di un parametro rispetto ai diversi trattamenti a cui vengono sottoposti i campioni. In questo caso i dati si dicono “indipendenti” perché il confronto e tra campioni indipendenti anche se partiti con Il protocollo sperimentale Il protocollo sperimentale
I protocolli possono dividersi in :
una linea, chiamata asse. Essa può avere un’origine 0 e una norma che rappresenta l’unità di misura. Es. Con la Norma “|_________|=1” si potrà costruire la seguente scala: _|_________|_________|_________|_________|_________|_________|__________|_________| -1 0 1 2 3 4 5 6 7 Potere misurante Scala di rapporti.Scala di rapporti. EE’ la scala quantitativa per eccellenza con’ la scala quantitativa per eccellenza con il il puntopunto didi origineorigine 00 concon unauna normanorma costantecostante ee puòpuò rappresentare misure diverse. (es. può rappreentare il peso , la rappresentare misure diverse. (es. può rappreentare il peso , la statura, ecc. con gli stessi valori di scala!) statura, ecc. con gli stessi valori di scala!) Scala Scala didi intervalli.intervalli. EE’’ comecome (^) lala (^) scalascala didi rapportirapporti concon lala limitazione che può rappresentare una sola misura alla volta (es. limitazione che può rappresentare una sola misura alla volta (es. caso delle temperature). caso delle temperature). Scala ordinale o per ranghi. Scala ordinale o per ranghi. EE’ una scala qualitativa che’ una scala qualitativa che non necessita del punto 0 rappresentando caratteri ordinati in non necessita del punto 0 rappresentando caratteri ordinati in crescita crescita oo inin decrescitadecrescita comecome numerinumeri (1,2,3,4,(1,2,3,4, ecc.)ecc.) oo simbolisimboli (A,B,C,D, ecc.). (A,B,C,D, ecc.). Scala nominale o classificatoria. Scala nominale o classificatoria. (^) EE’ una scala qualitativa’ una scala qualitativa per dati esclusivamente simbolici (es. M,F; Si,No; ecc.). per dati esclusivamente simbolici (es. M,F; Si,No; ecc.).
che comporta le seguenti importanti considerazioni: (^) L’errore potrà essere azzerato solo quando il valore medio di infinite misure risulta coincidente con il valore vero. (^) Nel caso di un numero di misure finito, il valore medio rappresenta la migliore stima del valore vero, è l’errore sarà il più piccolo possibile. (^) All’aumentare del numero di misure, la media tenderà sempre più al valore vero.
qualsiasi proprietà di un certo oggetto, l’errore può essere identificato come lo scarto tra due valori: ERRORE = valore misurato - valore vero il valore vero rappresenta l’effettivo valore di tale proprietà ed è il valore ideale che però nessuno conosce. Se ora effettuiamo un certo numero di misure possiamo sostituire il valore misurato con il valore della media: errore = media - valore vero < ERRORE e che dovrebbe rendere più piccolo l’errore stesso. Se immaginiamo ora di poter condurre infinite misure con il passaggio al limite avremo l’espressione:
valore vero = media N ° d i p a llin e x c o lo n n a Larghezza
Un gioco da luna park prevede di inserire per un totale di 35 lanci il maggior numero di palline nella colonna centrale, ma come si vede il giocatore può compiere degli errori di lancio mandando le palline a destra e a sinistra della colonna centrale.
Due amici si sfidano al gioco cercando di inserire per un totale di 35 lanci il maggior numero di palline nella colonna centrale. Ebbene il giocatore di destra ha sicuramente vinto; ha inserito 8 palline (100x8/3523% di successi) mentre il suo avversario solo 6 (6/3517%). A ben vedere il giocatore di destra è più preciso perchè ha più palline addensate attorno alla colonna centrale. La curva degli errori casuali: la dispersione
2008 Biometria - RPSorge2008 Biometria - RPSorge
Le frequenze assolute, relative e cumulate Le frequenze assolute, relative e cumulate La frequenza assoluta è il numero di volte che un carattere o un dato è uguale o contenuto in un determinato intervallo di classe. La frequenza relativa è invece il rapporto tra la frequenza assoluta e la somma di tutte le frequenze assolute (=N° dati). La frequenza cumulata è la somma delle frequenze assolute o relative delle classi fino a comprendere quella con modalità del carattere considerato. Riprendendo l Riprendendo l’esempio:’esempio: N°N° DATODATO Diamet Diamet ri ri (cm) (cm) 11 1.01. 22 2.32. 33 2.52. 44 2.62. 55 3.83. 66 3.93. 77 4.04. 88 4.04. 99 4.44. 1010 4.64. 1111 5.05. 1212 6.06. ClasClas sisi Limiti diLimiti di ClasseClasse Freq.Freq. AssolutAssolut ee Freq.Freq. RelativeRelative Freq.Freq. CumulatCumulat ee Freq.Freq. Rel.Rel. CumulatCumulat ee 11 0.990 -0.990 - 1.9941. 11 1/12 =1/12 = 0.080. (^11) 0.080. 22 1.994 -1.994 - 2.9982. 33 3/12 =3/12 = 0.250. (^44) 0.330. 33 2.998 -2.998 - 4.0024. 44 4/12 =4/12 = 0.340. 88 0.670. 44 4.002 -4.002 - 5.0065. 33 3/12 =3/12 = 0.250. 1111 0.920. 55 5.006 -5.006 - 6.0106. 11 1/12 =1/12 = 0.080. (^1212) 1.001.
La frequenza relativa di una classe di dati di una variabile distribuita in modo gaussiano è una prima approssimazione del valore di probabilità che avrebbe nella popolazione di riferimento. Infatti aumentando l’ampiezza del campione e quindi aumentando le classi
identificarsi ai valori puntuali delle probabilità:
Allora… se conosciamo già la distribuzione della variabile e l’istogramma risulta platealmente diverso da quello atteso dobbiamo pensare ad un campionamento errato mentre se non conosciamo la distribuzione della variabile si tratta di valutare facendo più campionamenti se la distribuzione si ripete similmente oppure risulta diversa per problemi di campionamento. Tuttavia gli istogrammi possono avere anche altri andamenti: