Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli

Dispensa Elementi di statistica, Dispense di Matematica

Elementi di statistica

Tipologia: Dispense

2014/2015

Caricato il 19/10/2015

Mikele63
Mikele63 🇮🇹

1 documento

Anteprima parziale del testo

Scarica Dispensa Elementi di statistica e più Dispense in PDF di Matematica solo su Docsity! ELEMENTI DI STATISTICA La statistica rappresenta una raccolta di metodi e strumenti matematici atti ad organizzare una o più serie di dati che descrivono una categoria di fatti. E’ la scienza che studia i fenomeni collettivi o di massa come ad esempio il numero di componenti delle famiglie di una data area geografica, l’età dei cittadini di un certo paese, la lunghezza delle foglie di un tipo di pianta. La statistica insegna a individuare i modi in cui un fenomeno si manifesta, a descriverlo sinteticamente e a trarne da esso conclusioni più generali di fenomeni più ampi. Alcune definizioni: Popolazione statistica: insieme degli elementi a cui si riferisce l’indagine statistica (ad esempio, nell’indagine relativa all’opinione degli americani riguardo una nuova elezione presidenziale, la popolazione statistica è rappresentata da tutti i cittadini USA). Unità statistica: ogni elemento della popolazione statistica, la minima unità della quale si raccolgono i dati (nell’esempio precedente, l’unità statistica è rappresentata da un cittadino). Campione statistico: un qualsiasi insieme di unità statistiche prese da tutta la popolazione. Un campione è dunque un sottoinsieme di misurazioni selezionate dalla popolazione (esempio 1.000 cittadini estratti a caso o distribuiti geograficamente). Variabile statistica: l’insieme delle manifestazioni/osservazioni di un carattere rilevabili sulle unità statistiche. Le variabili statistiche vengono classificate come segue: variabile quantitativa: quando assume valori numerici; variabile qualitativa: quando assume valori non numerici. A sua volta, la variabile quantitativa può essere: continua: quando assume valori continui in un intervallo (ad esempio, peso e statura di una persona); discreta: quando assume valori discreti (ad esempio, numero di pazienti di un medico). Analogamente, la variabile qualitativa può essere: ordinale: quando i dati sono in un ordine (ad esempio, la top ten degli artisti musicali); categorica: uomo/donna, basso/medio/alto, ecc. I dati codificati di una rilevazione statistica effettuata su n unità statistiche con riferimento a p variabili, vengono raccolti in una tabella che viene chiamata “matrice dei dati”. N. Sesso Titolo di studio Età Peso N. ricoveri 1 M Licenza media inferiore 35 65 3 2 F Diploma 45 73 1 … … … … … … N F Laurea 60 55 6 Ogni riga rappresenta un’unità statistica; ogni colonna rappresenta una variabile. La matrice dei dati contiene tutte le informazioni analitiche di ciascuna unità statistica. Quando i dati sono molti, l’analisi diretta della matrice non consente di cogliere in via immediata gli aspetti salienti del fenomeno. Occorre perciò ottenere una sintesi attraverso un’elaborazione statistica dei dati. Per questo, vengono utilizzati gli indici statistici che servono a sintetizzare una certa caratteristica e a confrontare situazioni differenti. Tra gli indici statistici, definiamo la media, la mediana e la moda nonché la varianza e lo scarto quadratico medio. Media aritmetica In un insieme di dati statistici si dice media aritmetica semplice il numero ottenuto addizionando tutti i dati e dividendo tale somma per il numero dei dati. Siano x1, x2,..., xn gli n valori assunti da una variabile statistica. La media aritmetica semplice è il numero che si ottiene addizionando tutti i dati e dividendo la somma per il numero dei dati Se ad esempio uno studente A ha riportato i voti: 5, 7, 8, 9, la media aritmetica si calcola addizionando tutti i voti e dividendo il risultato per il numero dei voti che è 4: F 0 6 D = (5 + 7 + 8 + 9)/ 4 = 29 / 4 = 7,25 Se i valori xi compaiono più volte cioè hanno frequenze fi diverse (il valore x1 ha frequenza f1, il valore x2 ha frequenza f2,...), la media aritmetica si chiama ponderata. La moda viene utilizzata solamente a scopi descrittivi perché è meno stabile e meno oggettiva delle altre misure di tendenza centrale. La mediana si utilizza quando si vuole attenuare l’effetto di valori estremi. Questi ultimi, infatti, potrebbero essere il frutto di errori. Facciamo un esempio: rileviamo le età di bambini frequentanti la scuola elementare e supponiamo di aver ottenuto i seguenti dati: 7, 9, 9, 8, 7, 6, 10, 9, 80. L’ultimo dato, evidentemente errato, fa si che la media sia pari a 32,22. La mediana, invece, è uguale a 9. E’ evidente che il dato della mediana è più rappresentativo di quello della media che, quindi, non sempre è la più adatta da usare per riassumere il significato dei dati tabulati. A rendersene conto in maniera magistrale fu il poeta romanesco Trilussa (1871-1950) nel seguente, famosissimo sonetto: « Sai ched'è la statistica? È 'na cosa che serve pe fà un conto in generale de la gente che nasce, che sta male, che more, che va in carcere e se sposa. Ma pe' me la statistica curiosa è dove c'entra la percentuale, pe' via che, lì, la media è sempre eguale puro co' la persona bisognosa. Me spiego: da li conti che se fanno seconno le statistiche d'adesso risurta che te tocca un pollo all'anno: e, se nun entra nelle spese tue, t'entra ne la statistica lo stesso perch'è c'è un antro che ne magna due. » Varianza La varianza è un indice di variabilità calcolabile solamente per variabili quantitative; essa appartiene alla famiglia degli indici di dispersione che si basano sulle differenze (nel caso della varianza, le differenze al quadrato) tra le modalità osservate xi e un prefissato indice di posizione (nel caso della varianza, la media aritmetica F 06 DF 02 9F 02 E Nel caso di una serie, la varianza corrisponde alla somma dei quadrati degli scarti degli n valori aventi media F 06 D, divisa per il numero dei valori: La varianza è zero quando tutti i valori della variabile sono uguali tra loro e quindi non c’è variabilità nella distribuzione. In ogni caso la varianza è un numero positivo in quanto si calcola addizionando i quadrati degli scarti. C’è da osservare, inoltre, che tanto maggiore è la varianza, tanto più i valori sono dispersi, ossia si allontanano dalla media; viceversa, tanto minore è la varianza, tanto più i valori sono concentrati intorno alla media. Deviazione standard o scarto quadratico medio Poiché la varianza è una quantità di secondo grado, si preferisce calcolare la sua radice quadrata, che viene chiamata deviazione standard o scarto quadratico medio. Al centro della formula della deviazione standard si trova l’espressione xi- F 06 D, che indica la differenza tra il valore di x e la media aritmetica della distribuzione: la media costituisce il punto fisso attorno al quale viene misurata la dispersione. Quando la deviazione standard non supera il 10-15 % della media, le misure possono considerarsi abbastanza omogenee; quanto più tale soglia viene superata, tanto maggiore sarà lo squilibrio tra le osservazioni. Per calcolare lo scarto quadratico medio di una distribuzione si utilizza una tabella in cui si riportano nella prima colonna i dati xi, nella seconda colonna gli scarti dei dati dalla media xi- F 06 D e nell’ultima colonna i quadrati degli scarti della media. ESEMPIO Calcoliamo lo scarto quadratico medio della distribuzione: 3, 5, 7, 8, 9. Dopo aver trovato la media aritmetica F 06 D = (3 + 5 + 7 + 8 + 9)/5 = 32/5 = 6.4, costruiamo la tabella: Valori Xi Scarti Quadrati degli scarti 3 3-6.4 = -3.4 11.56 5 5-6.4 = -1.4 1.96 7 7-6.4 = 0.6 0.36 8 8-6.4 = 1.6 2.56 9 9-6.4 = 2.6 6.76 Totale 23.2 La somma dei quadrati degli scarti è 23,2, che diviso per n=5 dà la varianza 4,64 la cui radice quadrata è lo scarto quadratico medio = 2,15. Lo scarto quadratico medio è un’utile misura di dispersione, come mostra l’esempio seguente, in cui si confrontano due distribuzioni statistiche aventi la stessa media aritmetica. ESEMPIO Sono assegnate le distribuzioni: I) 122, 124, 128, 130 II) 121, 125, 127, 131 Esse hanno entrambe media F 06 D = 126 e, come si può notare, la seconda distribuzione ha una maggiore dispersione rispetto alla prima. Ciò si evidenzia con il calcolo dello scarto quadratico medio che, per la prima distribuzione è = 3,16, invece per la seconda è = 3,61. In conclusione, lo scarto quadratico medio caratterizza la dispersione dei dati, poiché tanto più è grande tanto maggiore è la dispersione intorno alla media. La distribuzione normale Nello studio delle distribuzioni statistiche occupa un posto di primo piano la determinazione della media e dello scarto quadratico medio non soltanto perché questi valori consentono di approfondire il fenomeno in oggetto, ma anche perché sono parametri utili nel confronto di distribuzioni diverse tra loro. Quando si rappresentano graficamente i dati raccolti in un’indagine statistica che riguarda sia fenomeni sociali che naturali, ci si aspetta di ottenere una distribuzione normale o "a campana". Essa ha la caratteristica di presentare un’alta densità di valori al centro e una bassa densità alle due estremità destra e sinistra, il che vuol dire che la maggior parte delle frequenze si distribuisce verso il centro. La curva normale teorica è una curva simmetrica con asse di simmetria verticale coincidente con il valore della moda, della media e della mediana della distribuzione. La simmetria della curva comporta che le osservazioni equidistanti dal massimo centrale hanno la stessa frequenza.
Docsity logo


Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved