


Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Una introduzione alla statistica descrittiva, inclusi concetti come modalità, frequenze, tabelle statistiche, rappresentazioni grafiche e misura della variabilità. Vengono anche introdotti i concetti di composizione, coesistenza e derivazione di rapporti statistici. Il documento include esempi di diagrammi polari e normali.
Tipologia: Appunti
1 / 4
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!



La statistica si occupa dello studio dei fenomeni della raccolta dei dati e il tutto viene riportato su grafici e tabelle. Gli strumenti sono sia strumenti tecnici che metodologici e si parte dall’osservazione di campioni. STATISTICA DESCRITTIVA si prendono i fenomeni della popolazioni e si osservano le caratteristiche N: popolazione X: caratteristica Le caratteristiche possono essere quantitative o qualitative. La prima si può quantificare le seconde sono espresse da qualità. Nel caso di quantitativa parleremo di variabile statistica vs nel caso di analisi qualitativa parleremo di mutabile statistica. Un carattere quantitativo viene definito discreto quando è possibile rilevare una certa quantità e i caratteri possono essere ordinabili e non ordinabili. I primi quando ce una conseguenza logica e non ordinabili quando non ce una conseguenza logica. Ci sono mutabili statistiche che vengono definite cicliche cioè ciclicamente definiscono lo stesso ordine. È importante in statistica la frequenza con cui si manifestano il fenomeno Una volta raccolti i dati per esemplificazione vengono costruite delle tabelle in modo da descrivere il fenomeno, la tabella è costituita da colonne e si leggono da sinistra verso destra, nella prima colonna ce la descrizione delle modalità del carattere nella seconda le frequenze. In una tabella statistica oltre alla modalità del carattere xi alle frequenze ni possiamo calcolare, non solo le frequenze relative (ogni singolo elemento diviso il totale) e poi le frequenze percentuali (fr. Relativa x 100) possiamo anche costruire delle frequenze cumulate che esprimono quanto osservazioni si presentano con la stessa modalità e anche di queste possiamo calcolare le relative e le percentuali. Esistono i rapporti statistici che si possono costruire con modalità diverse e possono essere di tre tipi: composizione, coesistenza e derivazione. Composizione: detti anche parte del tutto, sono quelli in cui una parte viene confrontata con totale e il risultato è minore di 1 Coesistenza: si mettono a confronto grandezze che appartengono alla stessa popolazione e sono parti di essa Derivazione: in cui le due quantità non appartengono alla stessa popolazione ma sono uno il fondamento dell’altro RAPPRESENTAZIONI GRAFICHE Nella statistica descrittiva descrive il fenomeno quantitativo e utilizza le rapp grafiche non si sostituiscono alla tabella statistica ma sono un completamento per rendere la descrizione più esplicita. Le rappresentazioni possono essere rappresentate su un riferimento cartesiano in cui ce una coppia xi e ni, quindi mediante le coordinate dei punti possiamo riportarle su un grafico. Possiamo avere una linea continua o spezzata cartesiana, ma la cosa fondamentale è rispettare la misura. Le rappresentazioni possono essere diverse, possiamo avere un diagramma a barre o polare (per le mutabili cicliche). Diagramma polare: si prende una ipotetica circonferenza e si suddivide in raggi vettori e il n di questi raggi vettori dipende dalle modalità che abbiamo. Il primo raggio i vettore è detto asse polare tra il raggio vettore e l’asse polare si forma un angolo chiamato argomento. VALORI MEDI: Dobbiamo essere in grado di manipolare i risultati perché dobbiamo sintetizzare quanto osservato, e allora possiamo utilizzare i valori medi o indici di esposizione. I valori medi si dividono in due cluster e sono le medie di calcolo e posizione. Le medie di calcolo sono valori ottenuti fissando una quantità invariante e dunque una media aritmetica. Media aritmetica: la somma di tutti i valori e si divide per il numero dei valori Media geometrica: si fa la radice quadrata dei valori elevati al numero dei valori Medie di posizione: le medie precedenti hanno un valore matematico le medie di posizione si possono dare anche valori tipici di ciò che io osservo ed è il caso della MEDIANA ( valore centrale qualora è dispari se è pari invece si prendono i due valori centrali e si sommano e si dividono per 2) N.B: si mettono in ordine crescente
Molte volte durante le osservazioni possiamo parlare di quantili e quartili, si parla di quartili quando la distribuzione viene divisa in 4. Il terzo quartile è simmetrico al 1 (3/4) il secondo quartile coincide con la Mediana (1/2). La moda: che è il carattere che si presenta il maggior numero di volte (quando il carattere si ripete più di una volta si sommano e si divide per il numero di volte in cui si ripresenta e si chiama moda puntuale) La moda puntuale può essere rappresentata mediante gli istogrammi. LA MISURA DELLA VARIABILITÀ: Un carattere si può presentare sotto diverse modalità si parla dunque di variabilità che deve sottostare a delle condizioni: -la misura della variabilità deve essere nulla se tutti i termini osservati sono uguali -la variabilità deve crescere al crescere della differenzia tra le modalità -se i caratteri che si presentano sono diversi si parla di dispersione -la disuguaglianza che misura la distanza tra i vari caratteri Per quantificare la variabilità si usa il campo di variazione W= xn – xi (misura il range delle modalità). Possiamo calcolare anche il range fra due quartili estremi (differenza interquantilica) dq= Q3 – Q Per la misura della dispersione possiamo usare lo scarto semplice medio (s.s.m)= Che costituisce la media aritmetica degli scarti e la media aritmetica della distribuzione e si usa il valore assoluto per ottenere un numero positivo La devianza: è la somma dei quadrati degli scarti e la media aritmetica Se la devianza si divide per M otteniamo la varianza Lo scarto quadratico medio (s.q.m) è la media aritmetica degli scarti, quindi lo scarto quadratico medio sarà sempre maggiore o uguale dello scarto semplice medio La concentrazione è il modo per misurare la variabilità di un carattere cioè la distribuzione fra gli N osservati, quando abbiamo una stessa quantità sin parla di equidistribuzione. Si può parlare di massima concentrazione quando è tutto concentrato in un solo carattere osservato.
È una metodologia più rigorosa e si fonda sull’individuazione dell’asse funzione che presenta la minore sommatoria quadratica. Bisogna minimizzare le funzioni uguagliante a 0 derivante prime e viene utilizzata non più una retta ma una parabola interpolatrice. Per semplificare i calcoli e rimuovere molti ostacoli possiamo effettuare la traslazione degli assi, cioè in un riferimento cartesiano si fanno scorrere gli assi uno sull’altro senza che le curve subiscono modificazioni. Quindi si può traslare l’asse delle ordinate facendolo scorrere sull’asse delle ascisse, ovviamente le nuove ascisse saranno riferite a questa nuova origine degli assi. Applicando il metodo delle ordinate fisse si posizione l’asse delle nuove ordinate in corrispondenza dell’ascisse e l’operazione ancora più vantaggiosa nel caso dei minimi quadrati. Qualunque metodo utilizzato dopo la rappresentazione analitica bisogna valutare quanto sia valido l’adattamento scelto, quindi bisogna vedere la bontà dell’adattamento. LA RELAZIONE TRA VARIABILI La statistica multivariata si occupa di studiare la relazione fra tutti i caratteri osservati sulla singola unità statistica, se osserviamo due caratteri (X Y) si parla di statistica bivariata. Si fa una tabella doppia esplicitando le modalità del carattere di x e y, per agevolare la lettura delle informazioni si usa la tabella a doppia entrata che è formata da s+1 righe, t+1 colonne, 1 colonna madre (prima riga a sinistra) che contiene le modalità del carattere x e una riga madre (la prima in alto che contiene le modalità del carattere y). Ognuno delle t colonne rappresenta le distribuzioni condizionate del carattere x e quindi si può calcolare la distribuzione marginale della x, stessa cosa della y. (Distribuzione tot del carattere). Ognuna delle distribuzioni marginali costituisce una normale distribuzione di frequenza, quindi è possibile fare una rappresentazione in forma di tabella a nova (completa descrizione di tutte le tecniche). Tra i caratteri che si osservano si possono verificare 3 condizioni: