





Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Le frequenze relative e le distribuzioni statisticali, incluse le frequenze cumulate, le distribuzioni di frequenza divise in classi, le mediane e i quartili. Viene inoltre discusso come calcolare la media aritmetica, la media quadratica e l'indice di variabilità in una distribuzione di frequenza. Il documento include anche la trasformazione di una distribuzione e il calcolo della media aritmetica ponderata.
Tipologia: Sintesi del corso
1 / 9
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!






COLLETTIVO STATISTICO: Insieme di casi individuali in cui si manifesta il fenomeno oggetto di studio, si può utilizzare per parlare di totalità di casi, la popolazione, e parte della totalità dei casi, il campione. La popolazione può essere finita infinita ed indefinita. UNITA’ STATISTICA: è il caso individuale componente del collettivo oggetto di studio. CARATTERE: ogni aspetto elementare, ogni caratteristica oggetto di rilevazione nelle unità statistiche del collettivo. MODALITA’: i diversi modi con cui il carattere si manifesta nelle unità statistiche del collettivo. La modalità può essere di tipo qualitativo e quantitativo. QUALITATIVO: quando si tratta di parole e si divide in sconnesso e ordinabile. Sconnesso quando non segue un ordine ben preciso e a sua volta può dividersi in dicotomico e politomico, dicotomico quando possono assumere due modalità, e politomico quando possono assumere diverse modalità finite stabilite in precedenza. Ordinabile quando segue un ordinamento preciso che può essere rettilineo o ciclico. Rettilineo quando segue un ordinamento che prevede un inizio ed una fine; ciclico quando non presenta un vero inizio ed una vera fine. QUANTITAVO: si tratta di forme numeriche, e si dividono principalmente in discreti e continui, discreti quando sono numeri interi, continui quando sono numeri decimali. I caratteri, sia discreti che continui, possono essere distinti in variabile a scala di rapporti e variabile a scala di intervalli, a seconda di come è visto lo 0: Se è una variabile a scala di rapporti, lo zero è visto come una quantità, come assenza. Se è una variabile a scala di intervalli lo zero è visto come una convenzione, 0 non significa quindi assenza di qualcosa, come ad esempio nel caso della temperatura. Le modalità di un carattere devono, per la distribuzione di frequenza, essere prese una sola volta, quindi NON SOVRAPPOSTE, ed ESAUSTIVE, cioè devono appresentare tutti i possibili modi di essere del carattere. DISTRIBUZIONE DI FREQUENZA: è la costruzione di un’altra tabella, in cui si prende un carattere della distribuzione disaggregata e si conta la frequenza assoluta : cioè quante volte le unità statistiche, del collettivo di riferimento, presentano le diverse modalità del carattere scelto per costruire la distribuzione id frequenza. FREQUENZA RELATIVA: la frequenza relativa ha il pregio di consentire una valutazione rapida del peso, dell’importanza della singola modalità nell’ambito della distribuzione di frequenza. Si calcola con un rapporto: fi= frequenza della modalità x1\ numero totale delle unità; fi=ni\N. FREQUENZA PERCENTUALE: ha anch’essa il pregio di consentire una valutazione rapida dell’importanza della singola modalità all’interno della distribuzione di frequenza ma in numeri percentuali. Si ottiene infatti moltiplicando la frequenza relativa per 100. Pi= fix100. FREQUENZA CUMULATA: la frequenza cumulata ha senso solo se il carattere è un carattere QUANTITATIVO o QUALITATIVO ORDINALE, si può fare la frequenza cumulata ASSOLUTA, RELATIVA E PERCENTUALE, e si calcola allo stesso modo solo che si prende in considerazione una sola delle 3 frequenze alla volta per calcolarla. Si calcola facendo la sommatoria della frequenza scelta, partendo dalla prima, che sarà rispettivamente uguale, si va ad incrementare la somma con le frequenze successive fino ad arrivare all’ultima che coincide con il totale delle frequenze. Frequenza cumulata assoluta: N1= n1 N2=n1+n2 N3=N2+n3 Nk= Nk Frequenza cumulata relativa: F1=f1 F2=f1+f2 F3=F2+f3 FK=FK Frequenza cumulata percentuale P1=p1 P2=p1+p2 P3=P2+p3 Pk= Pk DISTRIBUZIONE DI FREQUENZA DIVISA IN CLASSI: solitamente quando in una distribuzione disaggregata ci sono molte unità statistiche, esse vengono raggruppate in classe per poi essere osservate nella distribuzione di frequenza su un carattere ben preciso. La suddivisione in classi prevede:
Alcune volte conviene elevare al quadrato le quantità osservate per poter operare con numeri non negativi; la media aritmetica dei valori trasformati è espressa nel quadrato dell’unità di misura del carattere, bisogna perciò effettuare la trasformazione inversa. La media quadratica di una distribuzione statistica disaggregata è la radice quadrata dei termini al quadrato della distribuzione. A. Si eleva al quadrato B. Si somma tutto C. Si divide per N D. Si fa la radice quadrata Valgono le stesse proprietà della media aritmetica. Distribuzione di frequenza per calcolare la media quadratica in una distribuzione di frequenza bisogna fare come nella media aritmetica soltanto che il carattere x sarà elevato al quadrato: si sommano i prodotti tra i caratteri al quadrato per le frequenze assolute corrispondenti e si divide tutto per le frequenze assolute N. MEDIA ARITMETICA PONDERATA: vi sono situazioni in cui è necessario assegnare a ogni osservazione una misura d’importanza, collegata alla natura dei dati, per questo, siano x1, x2, x3.. le osservazioni e w1, w2, w3 i rispettivi pesi. Allora la media aritmetica ponderata è data dal rapporto tra la somma delle osservazioni moltiplicate per i rispettivi pesi e la somma dei pesi: m= x1 x w1 + x2 x w2 + x3 x w3 \ w1+w2+w la media aritmetica ponderata gode di tutte le proprietà della media aritmetica, solo che vanno adattate alla nuova situazione. MEDIE LASCHE: LA MEDIANA: la mediana è una media lasca, può essere utilizzata quindi sia per i termini quantitativi che per i qualitativi ordinati. Su una distribuzione disaggregata. La mediana è largamente utilizzata e diversamente dalle altre medie richiede che preliminarmente i termini siano ordinati.
qi= x2 + x3 \ 2 Secondo quartile: N x 2\4, successivamente, dopo aver trovato il numero della x corrispondente, visto che la distribuzione è pari, si prende il valore successivo e si fa la media aritmetica. Terzo quartile: Nx 3\4, successivamente, dopo aver trovato il numero della x corrispondente, visto che la distribuzione è pari, si prende il valore successivo e si fa la media aritmetica. N.B. SE IL RISULTATO DEI QUARTILI SARA’ UN NUMERO CON LA VIRGOLA, SI PRENDE IL NUMERO INTERO, SENZA LA VIRGOLA, E SI SOMMA AD UNO. Quando la distribuzione è dispari: Primo quartile: N x 1
Secondo quartile: N x 2
Terzo quartile: Nx 3
N.B. SE IL RISULTATO DEI QUARTILI SARA’ UN NUMERO CON LA VIRGOLA, SI PRENDE IL NUMERO INTERO, SENZA LA VIRGOLA E SI SOMMA AD UNO. Es: 3,5 3 +1 = 4. I decili e i centili, si svolgono allo stesso modo, si moltiplica N per il decile o il centile che si vuole trovare diviso 10 o 100, es: N x 7\10, N x 60\100. Mediana, su una distribuzione di frequenza: nella distribuzione di frequenza non c’è bisogno di ordinare i termini della distribuzione. Bisogna però calcolare la frequenza assoluta cumulata. Una volta trovata la frequenza cumulata, si procede come nella distribuzione disaggregata: se N è pari: la semisomma di N\2 + N\2+1 tutto diviso 2 se N è dispari: N\2 + la frequenza assoluta cumulata serve perché, poiché nella distribuzione di frequenza non tutte le unità statistiche sono specificate, la mediana sarà il numero della frequenza cumulata che più si avvicina al calcolo della mediana. In questo modo la mediana sarà la modalità corrispondente alla frequenza cumulata. Quartili Si lavora in modo analogo alla mediana, una volta individuate le frequenze cumulate, si individuano le frequenze cumulate che corrispondono, o si avvicinano, ai quartili, e in base a questo si individuano le modalità che corrispondono alla frequenza cumulata, modalità che sono i quartili. Per i decili e i centili si lavora allo stesso modo. Mediana su una distribuzione di frequenza con modalità raggruppate in classi: per calcolare la mediana nelle distribuzioni divise in classi si procede in diverse fasi:
In cui: ch(sx) è il limite inferiore della classe mediana N\2 sono le frequenze totali
Nh-1 è la frequenza cumulata delle classi inferiori alla classe mediana Nh- Nh-1 è la frequenza assoluta della classe mediana di è l’ampiezza della classe VALORE CENTRALE:
Calcolo la media aritmetica: facendo la somma delle frequenze diviso il numero delle unità statistiche Successivamente mi trovo la devianza, quindi la somma degli scarti della media aritmetica: prendo dunque l’unità statistica, gli sottraggo la media aritmetica, li elevo al quadrato e faccio la somma. Dopo aver trovato la devianza, mi calcolo la varianza, dividendo la devianza per N. Infine, mi trovo lo scarto quadratico medio, facendo la radice quadrata della varianza. Scarto quadratico medio Per una distribuzione di frequenza Devianza In questo caso la devianza è sempre la somma dei quadrati degli scarti della media aritmetica, ma visto che nella distribuzione di frequenza ho modalità diverse e diverse volte esse si presentano per ciascuna unità statistica avrò: la sommatoria degli scarti della media aritmetica elevata al quadrato (unità statistica – media aritmetica)^2 moltiplicato per la frequenza assoluta con la quale si presenta Xi Varianza La varianza resta invariata, si divide la devianza per N. E infine si mette tutto sotto radice. Per una distribuzione di frequenza con modalità raggruppate in classe A. Si calcola il valore centrale delle classi, facendo la media aritmetica dell’estremo inferiore- estremo superiore \
trovo la devianza allo stesso modo della distribuzione di frequenza ma sostituendo all’unità statistica, il valore centrale di ciascuna classe, a cui sottraggo la media aritmetica, elevo tutto al quadrato e lo moltiplico per la frequenza assoluta. C. Infine trovo la devianza e lo scarto quadratico medio. INDICE DI VARIABILITA’ RELATIVA O PERCENTUALE Questi indici consentono di effettuare confronti sulla variabilità di fenomeni che: Presentano unità di misura differenti Pur avendo la stessa unità di misura hanno valori medi differenti e quindi distribuzioni differenti Coefficiente di variazione Se ad esempio in un collettivo due situazioni hanno due unità di misura differenti e sono due elementi che non possono essere messi a confronto, o allo stesso modo, se in collettivo due elementi hanno stessa grandezza e stessa unità di misura ma sono distribuzioni con medie aritmetiche differenti si utilizza il coefficiente di variazione. Che si calcola facendo il rapporto tra lo scarto quadratico medio e la media aritmetica x100. Nel caso di un collettivo che presenta due elementi differenti, si calcola il valore percentuale di variabilità e si confrontano. MUTABILITA’ O ETEROGENEITA’ Una distribuzione di frequenze secondo un carattere qualitativo, sconnesso o ordinato, presenta la minima eterogeneità, o massima omogeneità, quando tutte le unità del collettivo statistico hanno la stessa modalità del carattere; al contrario, la distribuzione presenta la massima eterogeneità, o minima omogeneità, quando le modalità hanno tutte la stessa frequenza. MUTABILITA’ NULLA: o minima eterogeneità, si presenta quando le US presentano la massima omogeneità. MUTABILITA’ MASSIMA: o massima eterogeneità, quando le modalità hanno tutte la stessa frequenza e presentano quindi la minima omogeneità. INDICE DI GINI: lavora con le frequenze relative, raggiunge il minimo ( 0 ) nel caso di omogeneità, raggiunge il massimo ( 1 ) nel caso di massima eterogeneità e si calcola: elevando al quadrato le frequenze relative della distribuzione, sommandole, e ad 1 si sottrae il risultato della somma. NB: le frequenze relative quando vengono elevate al quadrato diventano più piccoli.
Le medie danno l’idea dell0ordine di grandezza del fenomeno studiato, gli indici di variabilità segnalano il grado di diversità tra le singole manifestazioni del fenomeno. Gli indici di forma completano il quadro delle tecniche per l’analisi e la comprensione delle caratteristiche di una distribuzione statistica secondo un carattere quantitativo. ASIMMETRIA In una distribuzione di frequenze di un carattere quantitativo discreto, avente la mediana m, si considerano le modalità a coppie: la prima e l’ultima, la seconda e la penultima, la terza e la terzultima. La distribuzione si dice simmetrica se per ciascuna delle coppie prese le modalità sono equidistanti dalla mediana e hanno la stessa frequenza. Proprietà: a) La media aritmetica coincide con la mediana b) La somma degli scarti della media aritmetica elevati a un numero dispari è uguale a 0. c) Il primo e il terzo quartile hanno la stessa distanza dalla mediana La simmetria è visibile a livello grafico, ma un indice che permette di vedere se c’è simmetria è a = media aritmetica – mediana \ scarto quadratico medio se a questa equazione il risultato è 0, la distribuzione è simmetrica se il risultato è positivo, è una distribuzione simmetrica positiva se il risultato è negativo, è una distribuzione simmetrica negativa DIAGRAMMA A SCATOLA Il diagramma a scatola è una rappresentazione grafica che ha il vantaggio di mostrare simultaneamente tutte le caratteristiche della distribuzione: quelle che attengono alla media, alla variabilità e alla forma. L’idea è quella di visualizzare, su un asse cartesiano, le seguenti quantità a) Il minimo, il termine più piccolo della distribuzione b) Il primo quartile c) La mediana d) Il terzo quartile e) Il massimo, il termine più grande della distribuzione Il primo quartile, la mediana e il terzo quartile sono rappresentati con dei segmenti orizzontali e paralleli che poi sono uniti con due segmenti verticali a formare un rettangolo, il lato inferiore del rettangolo ha un segmento perpendicolare che va dal punto medio del lato in questione al punto che rappresenta il minimo, dove si tira un segmento orizzontale, lo stesso avviene nella parte superiore del rettangolo, in cui il segmento arriva fino al punto massimo e si tira un segmento orizzontale. Il diagramma a scatola riesce a mettere in evidenza la simmetria, che sia positiva o negativa, o simmetrica; la misura della variabilità segnalata dal punto massimo e dal punto minimo, la differenza interquartile. ANALISI DELLA DISTRIBUZIONE DOPPIA: la dipendenza L’obiettivo dell’analisi della distribuzione doppia è quella di scoprire e stabilire se e in quale misura i due caratteri presentano un legame associativo, ad esempio: dato un campione di forza lavoro in cui sono rilevati i campioni “sesso” e “stato occupazionale”, una domanda che possiamo porci è in che misura le donne presentano una situazione occupazionale diversa da quella dei maschi, e se esiste una qualche forma di associazione tra i due caratteri. Per costruire una distribuzione doppia di frequenza occorre: Prendere da una distribuzione disaggregata 2 colonne, due caratteri e sintetizzarli in informazioni su una distribuzione di frequenza doppia Si continua sintetizzando le informazioni e costruendo una distribuzione di frequenza che abbia 2 caratteri X e Y Simbologia NUMEROSITA’ DEL COLLETTIVO: N CARATTERE OSSERVATO: X di cui Xi è la modalità generica, Xs è la modalità finale