Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Frequenza Relativa e Distribuzioni Statistiche, Sintesi del corso di Statistica

Le frequenze relative e le distribuzioni statisticali, incluse le frequenze cumulate, le distribuzioni di frequenza divise in classi, le mediane e i quartili. Viene inoltre discusso come calcolare la media aritmetica, la media quadratica e l'indice di variabilità in una distribuzione di frequenza. Il documento include anche la trasformazione di una distribuzione e il calcolo della media aritmetica ponderata.

Tipologia: Sintesi del corso

2019/2020

Caricato il 18/10/2021

aurora-fiore-5
aurora-fiore-5 🇮🇹

1 documento

1 / 9

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
STATISTICA, CONCETTI GENERALI:
COLLETTIVO STATISTICO: Insieme di casi individuali in cui si manifesta il fenomeno oggetto di studio, si può
utilizzare per parlare di totalità di casi, la popolazione, e parte della totalità dei casi, il campione.
La popolazione può essere finita infinita ed indefinita.
UNITA’ STATISTICA: è il caso individuale componente del collettivo oggetto di studio.
CARATTERE: ogni aspetto elementare, ogni caratteristica oggetto di rilevazione nelle unità statistiche del
collettivo.
MODALITA’: i diversi modi con cui il carattere si manifesta nelle unità statistiche del collettivo. La modalità
può essere di tipo qualitativo e quantitativo.
QUALITATIVO: quando si tratta di parole e si divide in sconnesso e ordinabile. Sconnesso quando non segue
un ordine ben preciso e a sua volta può dividersi in dicotomico e politomico, dicotomico quando possono
assumere due modalità, e politomico quando possono assumere diverse modalità finite stabilite in
precedenza. Ordinabile quando segue un ordinamento preciso che può essere rettilineo o ciclico. Rettilineo
quando segue un ordinamento che prevede un inizio ed una fine; ciclico quando non presenta un vero inizio
ed una vera fine.
QUANTITAVO: si tratta di forme numeriche, e si dividono principalmente in discreti e continui, discreti
quando sono numeri interi, continui quando sono numeri decimali. I caratteri, sia discreti che continui,
possono essere distinti in variabile a scala di rapporti e variabile a scala di intervalli, a seconda di come è
visto lo 0:
Se è una variabile a scala di rapporti, lo zero è visto come una quantità, come assenza.
Se è una variabile a scala di intervalli lo zero è visto come una convenzione, 0 non significa quindi assenza di
qualcosa, come ad esempio nel caso della temperatura.
Le modalità di un carattere devono, per la distribuzione di frequenza, essere prese una sola volta, quindi
NON SOVRAPPOSTE, ed ESAUSTIVE, cioè devono appresentare tutti i possibili modi di essere del carattere.
DISTRIBUZIONE DI FREQUENZA: è la costruzione di un’altra tabella, in cui si prende un carattere della
distribuzione disaggregata e si conta la frequenza assoluta: cioè quante volte le unità statistiche, del
collettivo di riferimento, presentano le diverse modalità del carattere scelto per costruire la distribuzione id
frequenza.
FREQUENZA RELATIVA: la frequenza relativa ha il pregio di consentire una valutazione rapida del peso,
dell’importanza della singola modalità nell’ambito della distribuzione di frequenza.
Si calcola con un rapporto: fi= frequenza della modalità x1\ numero totale delle unità; fi=ni\N.
FREQUENZA PERCENTUALE: ha anch’essa il pregio di consentire una valutazione rapida dell’importanza
della singola modalità all’interno della distribuzione di frequenza ma in numeri percentuali.
Si ottiene infatti moltiplicando la frequenza relativa per 100. Pi= fix100.
FREQUENZA CUMULATA: la frequenza cumulata ha senso solo se il carattere è un carattere QUANTITATIVO
o QUALITATIVO ORDINALE, si può fare la frequenza cumulata ASSOLUTA, RELATIVA E PERCENTUALE, e si
calcola allo stesso modo solo che si prende in considerazione una sola delle 3 frequenze alla volta per
calcolarla.
Si calcola facendo la sommatoria della frequenza scelta, partendo dalla prima, che sarà rispettivamente
uguale, si va ad incrementare la somma con le frequenze successive fino ad arrivare all’ultima che coincide
con il totale delle frequenze.
Frequenza cumulata assoluta: N1= n1 N2=n1+n2 N3=N2+n3 Nk= Nk
Frequenza cumulata relativa: F1=f1 F2=f1+f2 F3=F2+f3 FK=FK
Frequenza cumulata percentuale P1=p1 P2=p1+p2 P3=P2+p3 Pk= Pk
DISTRIBUZIONE DI FREQUENZA DIVISA IN CLASSI: solitamente quando in una distribuzione disaggregata ci
sono molte unità statistiche, esse vengono raggruppate in classe per poi essere osservate nella
distribuzione di frequenza su un carattere ben preciso. La suddivisione in classi prevede:
1. Dividere le unità statistiche in classi
pf3
pf4
pf5
pf8
pf9

Anteprima parziale del testo

Scarica Frequenza Relativa e Distribuzioni Statistiche e più Sintesi del corso in PDF di Statistica solo su Docsity!

STATISTICA, CONCETTI GENERALI:

COLLETTIVO STATISTICO: Insieme di casi individuali in cui si manifesta il fenomeno oggetto di studio, si può utilizzare per parlare di totalità di casi, la popolazione, e parte della totalità dei casi, il campione. La popolazione può essere finita infinita ed indefinita. UNITA’ STATISTICA: è il caso individuale componente del collettivo oggetto di studio. CARATTERE: ogni aspetto elementare, ogni caratteristica oggetto di rilevazione nelle unità statistiche del collettivo. MODALITA’: i diversi modi con cui il carattere si manifesta nelle unità statistiche del collettivo. La modalità può essere di tipo qualitativo e quantitativo. QUALITATIVO: quando si tratta di parole e si divide in sconnesso e ordinabile. Sconnesso quando non segue un ordine ben preciso e a sua volta può dividersi in dicotomico e politomico, dicotomico quando possono assumere due modalità, e politomico quando possono assumere diverse modalità finite stabilite in precedenza. Ordinabile quando segue un ordinamento preciso che può essere rettilineo o ciclico. Rettilineo quando segue un ordinamento che prevede un inizio ed una fine; ciclico quando non presenta un vero inizio ed una vera fine. QUANTITAVO: si tratta di forme numeriche, e si dividono principalmente in discreti e continui, discreti quando sono numeri interi, continui quando sono numeri decimali. I caratteri, sia discreti che continui, possono essere distinti in variabile a scala di rapporti e variabile a scala di intervalli, a seconda di come è visto lo 0: Se è una variabile a scala di rapporti, lo zero è visto come una quantità, come assenza. Se è una variabile a scala di intervalli lo zero è visto come una convenzione, 0 non significa quindi assenza di qualcosa, come ad esempio nel caso della temperatura. Le modalità di un carattere devono, per la distribuzione di frequenza, essere prese una sola volta, quindi NON SOVRAPPOSTE, ed ESAUSTIVE, cioè devono appresentare tutti i possibili modi di essere del carattere. DISTRIBUZIONE DI FREQUENZA: è la costruzione di un’altra tabella, in cui si prende un carattere della distribuzione disaggregata e si conta la frequenza assoluta : cioè quante volte le unità statistiche, del collettivo di riferimento, presentano le diverse modalità del carattere scelto per costruire la distribuzione id frequenza. FREQUENZA RELATIVA: la frequenza relativa ha il pregio di consentire una valutazione rapida del peso, dell’importanza della singola modalità nell’ambito della distribuzione di frequenza. Si calcola con un rapporto: fi= frequenza della modalità x1\ numero totale delle unità; fi=ni\N. FREQUENZA PERCENTUALE: ha anch’essa il pregio di consentire una valutazione rapida dell’importanza della singola modalità all’interno della distribuzione di frequenza ma in numeri percentuali. Si ottiene infatti moltiplicando la frequenza relativa per 100. Pi= fix100. FREQUENZA CUMULATA: la frequenza cumulata ha senso solo se il carattere è un carattere QUANTITATIVO o QUALITATIVO ORDINALE, si può fare la frequenza cumulata ASSOLUTA, RELATIVA E PERCENTUALE, e si calcola allo stesso modo solo che si prende in considerazione una sola delle 3 frequenze alla volta per calcolarla. Si calcola facendo la sommatoria della frequenza scelta, partendo dalla prima, che sarà rispettivamente uguale, si va ad incrementare la somma con le frequenze successive fino ad arrivare all’ultima che coincide con il totale delle frequenze. Frequenza cumulata assoluta: N1= n1 N2=n1+n2 N3=N2+n3 Nk= Nk Frequenza cumulata relativa: F1=f1 F2=f1+f2 F3=F2+f3 FK=FK Frequenza cumulata percentuale P1=p1 P2=p1+p2 P3=P2+p3 Pk= Pk DISTRIBUZIONE DI FREQUENZA DIVISA IN CLASSI: solitamente quando in una distribuzione disaggregata ci sono molte unità statistiche, esse vengono raggruppate in classe per poi essere osservate nella distribuzione di frequenza su un carattere ben preciso. La suddivisione in classi prevede:

  1. Dividere le unità statistiche in classi
  1. Ciascuna classe deve però avere due estremi ben precisi, la prima classe avrà gli estremi Co e C1, la seconda classe deve avere come primo estremo l’ultimo dell’altra classe e così via per tutte le classi.
  2. Inoltre dopo aver diviso le classi bisogna specificare attraverso le parentesi tonda e quadra se gli estremi di quella classe sono o no compresi, ovviamente se sono compresi nella prima classe non possono essere compresi nella seconda e così via. La doppia chiusura ha senso solo per la prima e l’ultima classe. La parantesi ( significa che la classe è aperta, [ significa che la classe è chiusa.
  3. Le classi tra di loro devono avere un trattino, che sta a indicare l’interno della classe, cioè tutte le classi comprese tra un estremo ed un altro. Nelle distribuzioni di frequenza divise in classi, soprattutto per la rappresentazione grafica di esse, è utile conoscere: l’ampiezza della classe, e la densità di frequenza. _Ampiezza della classe: quante persone fanno parte di quella classe, il calcolo per trovarla è estremo inferiore
  • estremo superiore: C2- C1. Densità di frequenza: La densità di frequenza costituisce una misura del numero di unità statistiche che presentano modalità di un certo carattere incluse all'interno di una determinata classe in relazione all'ampiezza di tale classe. In termini matematici è il rapporto tra la frequenza della classe e l’ampiezza della classe; ni\di. In cui di è l’ampiezza della classe._ RAPPRESENTAZIONI GRAFICHE: DISTRIBUZIONI DI FREQUENZA PER CARATTERI QUANTITATIVI: se si considera una distribuzione di frequenza per un carattere quantitativo, si può rappresentare graficamente con un  Diagramma ad aste: la rappresentazione grafica si effettua ponendo sull’asse delle ascisse le modalità e sull’asse delle ordinate le frequenze corrispondenti, dopo aver stabilito un’opportuna scala per ciascuno degli assi. DISTRIBUZIONI DI FREQUENZE PER CARATTERI QUANTITATIVI DIVISI IN CLASSI:  Si chiama istogramma di frequenza la rappresentazione grafica che si ottiene ponendo sull’asse delle ascisse gli estremi di classe, e disegnando per ogni classe un rettangolo avente per base il segmento dell’asse delle ascisse di estremi c0 e c1, e per altezza la densità di frequenza. Si noterà che l’area del rettangolo corrisponderà alla frequenza assoluta. SERIE SCONNESSE:  Le serie sconnesse vengono generalmente rappresentati con grafici di tipo areale, in cui alle modalità del carattere si fanno corrispondere figure geometriche con aree proporzionali alle grandezze da rappresentare. Le figure geometriche più utilizzate sono i rettangoli, i nastri. E con uno stesso grafico possono essere rappresentate due o più distribuzioni relative a fenomeni interconnessi.  Il grafico a nastri può essere realizzato in modi diversi: ponendo i nastri orizzontalmente, e si fa ricorso ai nastri quando si devono rappresentare più distribuzioni percentuali di uno stesso carattere associate alle modalità di un secondo carattere.  Una rappresentazione grafica alternativa, utilizzabile quando il numero delle modalità non è elevato, è il grafico a settori circolari. SERIE STORICHE:  Per rappresentare le serie storiche in particolare quelli che si riferiscono a fenomeni di stato, si ricorre generalmente ai diagrammi cartesiani. Si pone sull’asse delle ascisse i tempi e su quello delle ordinate le intensità associate. Quando la serie storica riguarda un fenomeno di movimento, la rappresentazione grafica più appropriata è quella a nastri. I periodi vengono indicati lungo una linea orizzontale, mentre su un asse verticale viene riportata l’appropriata scala.  Quando i periodi di tempo hanno ampiezza diversa, la rappresentazione grafica più appropriata consiste nel porre sull’asse delle ascisse i periodi e sull’asse delle ordinate i rapporti tra le quantità da rappresentare e le ampiezze dei periodi a cui tali quantità si riferiscono. SERIE TERRITORIALI:  La rappresentazione principe per le serie territoriali è il cartogramma: le ripartizioni territoriali sono individuate nell’appropriata cartina geografica, le intensità corrispondenti vengono rappresentate tramite i colori o tratteggi diversi, il cui significato è specificato in apposite legende.

Alcune volte conviene elevare al quadrato le quantità osservate per poter operare con numeri non negativi; la media aritmetica dei valori trasformati è espressa nel quadrato dell’unità di misura del carattere, bisogna perciò effettuare la trasformazione inversa. La media quadratica di una distribuzione statistica disaggregata è la radice quadrata dei termini al quadrato della distribuzione. A. Si eleva al quadrato B. Si somma tutto C. Si divide per N D. Si fa la radice quadrata Valgono le stesse proprietà della media aritmetica. Distribuzione di frequenza per calcolare la media quadratica in una distribuzione di frequenza bisogna fare come nella media aritmetica soltanto che il carattere x sarà elevato al quadrato: si sommano i prodotti tra i caratteri al quadrato per le frequenze assolute corrispondenti e si divide tutto per le frequenze assolute N. MEDIA ARITMETICA PONDERATA: vi sono situazioni in cui è necessario assegnare a ogni osservazione una misura d’importanza, collegata alla natura dei dati, per questo, siano x1, x2, x3.. le osservazioni e w1, w2, w3 i rispettivi pesi. Allora la media aritmetica ponderata è data dal rapporto tra la somma delle osservazioni moltiplicate per i rispettivi pesi e la somma dei pesi: m= x1 x w1 + x2 x w2 + x3 x w3 \ w1+w2+w la media aritmetica ponderata gode di tutte le proprietà della media aritmetica, solo che vanno adattate alla nuova situazione. MEDIE LASCHE: LA MEDIANA: la mediana è una media lasca, può essere utilizzata quindi sia per i termini quantitativi che per i qualitativi ordinati. Su una distribuzione disaggregata. La mediana è largamente utilizzata e diversamente dalle altre medie richiede che preliminarmente i termini siano ordinati.

  1. Bisogna ordinare i termini della distribuzione in modo crescente
  2. Se N è dispari, si chiama mediana della distribuzione di quantità il valore centrale, cioè il posto N+1\2 della graduatoria dei termini ordinati.
  3. Se N è pari, si assume come mediana la media aritmetica dei due posti centrali della graduatoria dei termini ordinati, quindi le posizioni N\2 e N\2 +1 (si fa la semisomma) Le proprietà della mediana sono: A. Gode della proprietà di linearità, yi= a+bxi -myi= a+ bmxi B. Criterio di internalità, è compreso tra il minimo e il massimo termine del valore della distribuzione C. La somma degli scarti in valore assoluto dei valori dà una costante minima quando C è uguale alla mediana Quartili e quantili Accanto alla mediana, si possono introdurre altri valori medi, associati a particolari posizioni nella graduatoria dei termini della distribuzione. Inizieremo con i quartili, le tre quantità che suddividono la graduatoria dei termini della distribuzione in quattro termini, nel caso dei quartili, ma possono dividerla anche in 10 o 100 termini, se si tratta di decili o centili. Per calcolare i quartili bisogna: A. Ordinare i termini dal valore più piccolo al più grande B. Si suddividono i termini ordinati in gruppi della stessa numerosità C. Si individuano i quartili. Quando la distribuzione è pari:  Primo quartile: N x1\4, successivamente, dopo aver trovato il numero del termine della x corrispondente, visto che è pari, si prende anche il valore successivo e si fa la media aritmetica:

qi= x2 + x3 \ 2  Secondo quartile: N x 2\4, successivamente, dopo aver trovato il numero della x corrispondente, visto che la distribuzione è pari, si prende il valore successivo e si fa la media aritmetica.  Terzo quartile: Nx 3\4, successivamente, dopo aver trovato il numero della x corrispondente, visto che la distribuzione è pari, si prende il valore successivo e si fa la media aritmetica. N.B. SE IL RISULTATO DEI QUARTILI SARA’ UN NUMERO CON LA VIRGOLA, SI PRENDE IL NUMERO INTERO, SENZA LA VIRGOLA, E SI SOMMA AD UNO. Quando la distribuzione è dispari:  Primo quartile: N x 1
 Secondo quartile: N x 2
 Terzo quartile: Nx 3
N.B. SE IL RISULTATO DEI QUARTILI SARA’ UN NUMERO CON LA VIRGOLA, SI PRENDE IL NUMERO INTERO, SENZA LA VIRGOLA E SI SOMMA AD UNO. Es: 3,5  3 +1 = 4. I decili e i centili, si svolgono allo stesso modo, si moltiplica N per il decile o il centile che si vuole trovare diviso 10 o 100, es: N x 7\10, N x 60\100. Mediana, su una distribuzione di frequenza: nella distribuzione di frequenza non c’è bisogno di ordinare i termini della distribuzione. Bisogna però calcolare la frequenza assoluta cumulata. Una volta trovata la frequenza cumulata, si procede come nella distribuzione disaggregata: se N è pari: la semisomma di N\2 + N\2+1 tutto diviso 2 se N è dispari: N\2 + la frequenza assoluta cumulata serve perché, poiché nella distribuzione di frequenza non tutte le unità statistiche sono specificate, la mediana sarà il numero della frequenza cumulata che più si avvicina al calcolo della mediana. In questo modo la mediana sarà la modalità corrispondente alla frequenza cumulata. Quartili Si lavora in modo analogo alla mediana, una volta individuate le frequenze cumulate, si individuano le frequenze cumulate che corrispondono, o si avvicinano, ai quartili, e in base a questo si individuano le modalità che corrispondono alla frequenza cumulata, modalità che sono i quartili. Per i decili e i centili si lavora allo stesso modo. Mediana su una distribuzione di frequenza con modalità raggruppate in classi: per calcolare la mediana nelle distribuzioni divise in classi si procede in diverse fasi:

  1. Le classi vengono suddivise in modo ordinato
  2. Si calcola, anche qui, la frequenza assoluta cumulata, di cui l’ultimo valore N è la somma delle frequenze di tutte le classi. Si divide N per 2, così trovando la mediana. Es. 17\2= 8,5  mediana
  3. Si individua quale modalità è compresa la frequenza mediana e si trova così la CLASSE DI FREQUENZA MEDIANA. Per trovare il valore mediano della distribuzione a partire dalla classe di frequenza mediana:  Si moltiplica il limite inferiore della classe mediana più:  Le frequenze totali N diviso due, - la somma delle frequenze della classe inferiore a quella mediana  Dividendo il secondo punto per la frequenza assoluta corrispondente alla classe mediana  Aggiungendo a tutto l’ampiezza della classe.  M=

ch ( sx ) +

N

−( Nh − 1 )

Nh − Nh − 1

+ di

In cui: ch(sx) è il limite inferiore della classe mediana N\2 sono le frequenze totali
Nh-1 è la frequenza cumulata delle classi inferiori alla classe mediana Nh- Nh-1 è la frequenza assoluta della classe mediana di è l’ampiezza della classe VALORE CENTRALE:

 Calcolo la media aritmetica: facendo la somma delle frequenze diviso il numero delle unità statistiche  Successivamente mi trovo la devianza, quindi la somma degli scarti della media aritmetica: prendo dunque l’unità statistica, gli sottraggo la media aritmetica, li elevo al quadrato e faccio la somma.  Dopo aver trovato la devianza, mi calcolo la varianza, dividendo la devianza per N.  Infine, mi trovo lo scarto quadratico medio, facendo la radice quadrata della varianza. Scarto quadratico medio Per una distribuzione di frequenza Devianza In questo caso la devianza è sempre la somma dei quadrati degli scarti della media aritmetica, ma visto che nella distribuzione di frequenza ho modalità diverse e diverse volte esse si presentano per ciascuna unità statistica avrò: la sommatoria degli scarti della media aritmetica elevata al quadrato (unità statistica – media aritmetica)^2 moltiplicato per la frequenza assoluta con la quale si presenta Xi Varianza La varianza resta invariata, si divide la devianza per N. E infine si mette tutto sotto radice. Per una distribuzione di frequenza con modalità raggruppate in classe A. Si calcola il valore centrale delle classi, facendo la media aritmetica dell’estremo inferiore- estremo superiore \

B. Si trova lo scarto quadratico x la frequenza assoluta. x diventa il rappresentante della classe e mi

trovo la devianza allo stesso modo della distribuzione di frequenza ma sostituendo all’unità statistica, il valore centrale di ciascuna classe, a cui sottraggo la media aritmetica, elevo tutto al quadrato e lo moltiplico per la frequenza assoluta. C. Infine trovo la devianza e lo scarto quadratico medio. INDICE DI VARIABILITA’ RELATIVA O PERCENTUALE Questi indici consentono di effettuare confronti sulla variabilità di fenomeni che:  Presentano unità di misura differenti  Pur avendo la stessa unità di misura hanno valori medi differenti e quindi distribuzioni differenti Coefficiente di variazione Se ad esempio in un collettivo due situazioni hanno due unità di misura differenti e sono due elementi che non possono essere messi a confronto, o allo stesso modo, se in collettivo due elementi hanno stessa grandezza e stessa unità di misura ma sono distribuzioni con medie aritmetiche differenti si utilizza il coefficiente di variazione. Che si calcola facendo il rapporto tra lo scarto quadratico medio e la media aritmetica x100. Nel caso di un collettivo che presenta due elementi differenti, si calcola il valore percentuale di variabilità e si confrontano. MUTABILITA’ O ETEROGENEITA’ Una distribuzione di frequenze secondo un carattere qualitativo, sconnesso o ordinato, presenta la minima eterogeneità, o massima omogeneità, quando tutte le unità del collettivo statistico hanno la stessa modalità del carattere; al contrario, la distribuzione presenta la massima eterogeneità, o minima omogeneità, quando le modalità hanno tutte la stessa frequenza. MUTABILITA’ NULLA: o minima eterogeneità, si presenta quando le US presentano la massima omogeneità. MUTABILITA’ MASSIMA: o massima eterogeneità, quando le modalità hanno tutte la stessa frequenza e presentano quindi la minima omogeneità. INDICE DI GINI: lavora con le frequenze relative, raggiunge il minimo ( 0 ) nel caso di omogeneità, raggiunge il massimo ( 1 ) nel caso di massima eterogeneità e si calcola: elevando al quadrato le frequenze relative della distribuzione, sommandole, e ad 1 si sottrae il risultato della somma. NB: le frequenze relative quando vengono elevate al quadrato diventano più piccoli.

INDICI DI FORMA.

Le medie danno l’idea dell0ordine di grandezza del fenomeno studiato, gli indici di variabilità segnalano il grado di diversità tra le singole manifestazioni del fenomeno. Gli indici di forma completano il quadro delle tecniche per l’analisi e la comprensione delle caratteristiche di una distribuzione statistica secondo un carattere quantitativo. ASIMMETRIA In una distribuzione di frequenze di un carattere quantitativo discreto, avente la mediana m, si considerano le modalità a coppie: la prima e l’ultima, la seconda e la penultima, la terza e la terzultima. La distribuzione si dice simmetrica se per ciascuna delle coppie prese le modalità sono equidistanti dalla mediana e hanno la stessa frequenza. Proprietà: a) La media aritmetica coincide con la mediana b) La somma degli scarti della media aritmetica elevati a un numero dispari è uguale a 0. c) Il primo e il terzo quartile hanno la stessa distanza dalla mediana La simmetria è visibile a livello grafico, ma un indice che permette di vedere se c’è simmetria è a = media aritmetica – mediana \ scarto quadratico medio se a questa equazione il risultato è 0, la distribuzione è simmetrica se il risultato è positivo, è una distribuzione simmetrica positiva se il risultato è negativo, è una distribuzione simmetrica negativa DIAGRAMMA A SCATOLA Il diagramma a scatola è una rappresentazione grafica che ha il vantaggio di mostrare simultaneamente tutte le caratteristiche della distribuzione: quelle che attengono alla media, alla variabilità e alla forma. L’idea è quella di visualizzare, su un asse cartesiano, le seguenti quantità a) Il minimo, il termine più piccolo della distribuzione b) Il primo quartile c) La mediana d) Il terzo quartile e) Il massimo, il termine più grande della distribuzione Il primo quartile, la mediana e il terzo quartile sono rappresentati con dei segmenti orizzontali e paralleli che poi sono uniti con due segmenti verticali a formare un rettangolo, il lato inferiore del rettangolo ha un segmento perpendicolare che va dal punto medio del lato in questione al punto che rappresenta il minimo, dove si tira un segmento orizzontale, lo stesso avviene nella parte superiore del rettangolo, in cui il segmento arriva fino al punto massimo e si tira un segmento orizzontale. Il diagramma a scatola riesce a mettere in evidenza la simmetria, che sia positiva o negativa, o simmetrica; la misura della variabilità segnalata dal punto massimo e dal punto minimo, la differenza interquartile. ANALISI DELLA DISTRIBUZIONE DOPPIA: la dipendenza L’obiettivo dell’analisi della distribuzione doppia è quella di scoprire e stabilire se e in quale misura i due caratteri presentano un legame associativo, ad esempio: dato un campione di forza lavoro in cui sono rilevati i campioni “sesso” e “stato occupazionale”, una domanda che possiamo porci è in che misura le donne presentano una situazione occupazionale diversa da quella dei maschi, e se esiste una qualche forma di associazione tra i due caratteri. Per costruire una distribuzione doppia di frequenza occorre:  Prendere da una distribuzione disaggregata 2 colonne, due caratteri e sintetizzarli in informazioni su una distribuzione di frequenza doppia  Si continua sintetizzando le informazioni e costruendo una distribuzione di frequenza che abbia 2 caratteri X e Y Simbologia NUMEROSITA’ DEL COLLETTIVO: N CARATTERE OSSERVATO: X di cui Xi è la modalità generica, Xs è la modalità finale