Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Analisi Statistica: Media, Quartili, Devianza e Curve di Frequenza, Dispense di Statistica

statistica completa teoria con esericizi

Tipologia: Dispense

2015/2016

Caricato il 23/01/2016

beatrice_giacobbe
beatrice_giacobbe 🇮🇹

5

(6)

13 documenti

1 / 36

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
PARTE INIZIALE: COS'è LA STATISTICA?
La statistica è una scienza che ha un obbiettivo prioritario quello di conoscere in
maniera approfondita i fondamenti attorno a noi che devono essere soprattutto per
persone che si apprestono ad un lavoro. La statistica serve a sintetizzare informazioni
attraverso delle statistiche descrittive che si ottengono attraverso delle indagini di tipo
quantitativo. Queste a differenza di quelle qualitative si rivolgono a un numero
limitato, si rivolgono ad una moltitudine di individui. Tutto ciò che può essere
direttamente o indirettamente osservato viene definito FENOMENO, i FENOMENI
COLLETTIVI sono fenomeni naturali o sociali costituiti da una pluralità di unità
elementari la cui conoscenza e misura richiede l'osservazione di tali unità. La
statistica presenta due caratteristiche: QUALITATIVE, che identificano una
MUTABILE STATISTICA, sono ad esempio la professione o titolo di studio; e
caratteristiche QUANTITATIVE, che identificano la variabile statistica, ad esempio
reddito, età o numero di dipendenti dell'azienda. La MUTABILE STATISTICA si
divide in MUTABILE RETTILINEA, abbiamo un ordine logico e naturale di
successione delle modalità. MUTABILE CICLICA, si presenta con delle modalità
ordinabili, previa individuazione della modalità iniziale( es. i giorni della settimana o
mesi dell'anno). MUTABILE SCONNESSA, abbiamo le mutabili che si succedono
senza alcun ordine.
Le variabili statistiche invece si suddividono in DISCRETA, che si trova quando il
carattere può assumere solo valori isolati, cioè tra due modalità che si succedono non
ve ne sono altri intermedie. VARIABILE STATISTICA CONTINUA, si trova quando
il carattere può assumere un insieme continuo di valori e c'è la necessità di ricorrere a
delle sottoclassi. Possono avere una variabile divisa per intervalli ovvero si ricorre
alla classe.
Quando conduciamo un osservazione statistica si va a creare un INDAGINE
STATISTICA, che si divide in 4 fasi: rivelazione, dobbiamo capire l'oggetto e lo
scopo dell'indagine, l'unità di rivelazione, i caratteri quantitativi e qualitativi che si
vogliono rivelare, stabilire i mezzi di rivelazione, ad esempio un questionario;
L'ELABORAZIONE, quando andremo ad elaborare il dato grezzo per poterli dare
forma, significato, senso e poterlo definire come dato elaborato; PRESENTAZIONE
DEI DATI, sceglieremo come presenteremo i dati in forma chiara e compatta
mediante tabelle, grafici; INTERPRETAZIONE, quì abbiamo la fase conclusiva
dell'indagine dove avremo dato un senso a tutto, concluderemo l'indagine mostrando
gli esiti ottenuti.
RAPPRESENTAZIONI GRAFICHE: ogni tipo mutabile o variabile statistica ha la
sua rappresentazione grafica e utilizzeremo sempre il primo quadrante, positivo dal
momento che una variabile statistica non può mai essere negativa. I grafici sono:
ISTOGRAMMA, utilizzato per rappresentare le variabili statistiche continue;
DIAGRAMMI AREALI, possono essere sia gli artogrammi sia quelli suddivisi in
settori circolari in cui si ripartisce il cerchio in maniera proporzionale al peso di
ciascuna variabile o mutabile statistica; CARTOGRAMMI, vengono utilizzati per
rappresentare le serie territoriali e le serie storiche; DIAGRAMMA CARTESIANO
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24

Anteprima parziale del testo

Scarica Analisi Statistica: Media, Quartili, Devianza e Curve di Frequenza e più Dispense in PDF di Statistica solo su Docsity!

PARTE INIZIALE: COS'è LA STATISTICA? La statistica è una scienza che ha un obbiettivo prioritario quello di conoscere in maniera approfondita i fondamenti attorno a noi che devono essere soprattutto per persone che si apprestono ad un lavoro. La statistica serve a sintetizzare informazioni attraverso delle statistiche descrittive che si ottengono attraverso delle indagini di tipo quantitativo. Queste a differenza di quelle qualitative si rivolgono a un numero limitato, si rivolgono ad una moltitudine di individui. Tutto ciò che può essere direttamente o indirettamente osservato viene definito FENOMENO, i FENOMENI COLLETTIVI sono fenomeni naturali o sociali costituiti da una pluralità di unità elementari la cui conoscenza e misura richiede l'osservazione di tali unità. La statistica presenta due caratteristiche: QUALITATIVE, che identificano una MUTABILE STATISTICA, sono ad esempio la professione o titolo di studio; e caratteristiche QUANTITATIVE, che identificano la variabile statistica, ad esempio reddito, età o numero di dipendenti dell'azienda. La MUTABILE STATISTICA si divide in MUTABILE RETTILINEA, abbiamo un ordine logico e naturale di successione delle modalità. MUTABILE CICLICA, si presenta con delle modalità ordinabili, previa individuazione della modalità iniziale( es. i giorni della settimana o mesi dell'anno). MUTABILE SCONNESSA, abbiamo le mutabili che si succedono senza alcun ordine. Le variabili statistiche invece si suddividono in DISCRETA, che si trova quando il carattere può assumere solo valori isolati, cioè tra due modalità che si succedono non ve ne sono altri intermedie. VARIABILE STATISTICA CONTINUA, si trova quando il carattere può assumere un insieme continuo di valori e c'è la necessità di ricorrere a delle sottoclassi. Possono avere una variabile divisa per intervalli ovvero si ricorre alla classe. Quando conduciamo un osservazione statistica si va a creare un INDAGINE STATISTICA, che si divide in 4 fasi: rivelazione, dobbiamo capire l'oggetto e lo scopo dell'indagine, l'unità di rivelazione, i caratteri quantitativi e qualitativi che si vogliono rivelare, stabilire i mezzi di rivelazione, ad esempio un questionario; L'ELABORAZIONE, quando andremo ad elaborare il dato grezzo per poterli dare forma, significato, senso e poterlo definire come dato elaborato; PRESENTAZIONE DEI DATI, sceglieremo come presenteremo i dati in forma chiara e compatta mediante tabelle, grafici; INTERPRETAZIONE, quì abbiamo la fase conclusiva dell'indagine dove avremo dato un senso a tutto, concluderemo l'indagine mostrando gli esiti ottenuti. RAPPRESENTAZIONI GRAFICHE: ogni tipo mutabile o variabile statistica ha la sua rappresentazione grafica e utilizzeremo sempre il primo quadrante, positivo dal momento che una variabile statistica non può mai essere negativa. I grafici sono: ISTOGRAMMA, utilizzato per rappresentare le variabili statistiche continue; DIAGRAMMI AREALI, possono essere sia gli artogrammi sia quelli suddivisi in settori circolari in cui si ripartisce il cerchio in maniera proporzionale al peso di ciascuna variabile o mutabile statistica; CARTOGRAMMI, vengono utilizzati per rappresentare le serie territoriali e le serie storiche; DIAGRAMMA CARTESIANO

LINEARE, utilizzato per le variabili statistiche di tipo discreto. Viene anche utilizzata la TABELLA A DOPPIA ENTRATA che viene utilizzata nella scomposizione della devianza e per i rapporti fra due variabili (x,y) formata da: TESTATA che è l'estensione della tabella; DISTRIBUZIONI MARGINALI, il numero di riga e colonna; SERIE STORICHE che rappresentano una successione di valori in successione di unità di tempo. Normalmente le serie storiche vengono rappresentate attraverso dei grafici. Poi ci sono le frequenze, frequenze assolute che ci dicono quante volte si presenta nel nostro collettivo la modalità corrispondente. Le frequenze relative non sono altro che un rapporto tra la singola frequenza assoluta e il totale generale. La somma è sempre uguale a 1. la frequenza relativa è: ni/N, se vogliamo la frequenza relativa in %avremo ni/N per 100. NUMERI INDICI: pongono al confronto le intensità e le frequenze di uno stesso fenomeno in tempi e luoghi diversi, sono utilizzati per studiare l'evoluzione temporale o le differenze territoriali di un fenomeno d'interesse osservato in corrispondenza da costruire una serie storica. I num. indici sono SEMPLICI che servono per confrontare le intensità e le frequenze di uno stesso fenomeno in tempi e luoghi diversi. E i num. Indici COMPLESSI che vengono utilizzati per seguire la variazioni dei pezzi di un insieme di merci scelte a rappresentare un intero settore economico. RAPPORTI STATISTICI: per costruire un rapporto statistico, cioè per confrontare due quantità A e B, dobbiamo stabilire se le due grandezze sono omogenee rispetto all'unità di misura. DIFFERENZA ASSOLUTA= d{ a-b}, questa esprime di quanto differiscono tra loro i termini. Ma non è una buona misura perchè non si presta a confronto tra intensità differenti. Perciò ricorriamo alla DIFFERENZA RELATIVA= d1 = a-b/a * d2 = a-b/a* le possiamo anche calcolare con la media delle due grandezze: d3=a-b/1/ (a+b)* RAPPORTO DI COMPOSIZIONE: è il rapporto tra due grandezze a e b in cui a rappresenta parte di b. RAPPORTO DI DERIVAZIONE: è il rapporto tra le frequenze di un fenomeno e l'intensità di un collettivo che ne è il presupposto necessario. Un esempio può essere il rapporto di natalità, mortalita e nunzialità, quando rapportiamo ad esempio i nati in un anno sulla popolazione.

MEDIA ARMONICA: è quel termine o valore che sostituito ai singoli termini di una distribuzione lascia inalterata la somma dei reciproci termini: nel caso di una serie: N/ ∑ 1/ Xi nel caso di una distribuzione: N/∑ ni/xi MEDIA GEOMETRICA: è quel valore che sostituito ai singoli termini di una distribuzione ne lascia inalterato il prodotto. Questa media contiene i logaritmo; il logaritmo di una potenza è uguale all'esponente. Mg=radice di x1x2xixs= radice di pigreca xini MEDIE DI POSIZIONE O LASCHE:** cercano di individuare i valori tipici della distribuzione oppure dell'intero collettivo. Il VALORE CENTRALE esprime il centro del campo di variazione di una variabilità statistica ordinata in cui individuiamo x come prime valore e xn l'ultimo valore. xi+xn/ MODA: è la modalità in cui corrisponde la massima frequenza. Si può facilmente individuare essendo la massima frequenza. Esempio: 1 18 2 16 3 11 4 30 5 15 6 6 30 è la massima frequenza. L'unico problema è quando abbiamo la frequenza bimodale in cui ci sono 2 numeri che si ripetono più frequentemente e allora faremo così:

Mo= L1 + f3/ f1+f3= (L2-L1)

L1 è l'estremo inferiore della classe modale L2 è l'estremo superiore della classe modale

sono 3 ed è quel valore che divide la distribuzione in quattro parti.

  • Q1: 25% cioè ¼ dei termini della distribuzione al di sotto e il 75% dei termini al di sopra.
  • Q2: corrisponde alla mediana
  • Q3: 75% cio ¾ dei termini della distribuzione si trovano al di sotto e il 25% al di sopra della distribuzione. ESERCIZI QUARTILI: Xi ni NI(frequenze cumulate di ni) 1 16 16 2 15 31 3 16 45 4 13 48 5 16 64 N= Formula Q1= x(N/4) + x (N/4 +1 ) tutto/2 = 16+17/2= 23,5, quindi seconda posizione, andiamo a vedere nelle Ni e vediamo dove corrisponde Formula Q2= x(N/2)+ x(N/2+1) tutto/2= 32+38/2= 64/2= 32, ciò vuol dire terza posizione. Formula Q3= x(3N/4) + ( 3N/4+1) tutto/2= 48+49/2= 48,5 quindi quarta posizione DIFFERENZA INTERQUARTILICA:

Dq= Q3-Q

presume che conosciamo già i quartili, è quell'intervallo in cui è compreso il 50% dei termini della distribuzione lasciando al di fuori il restante 50%.

CAMPO QUADRATICO MEDIO: utilizza la media quadratica degli scarti. ( formula che è sempre presente agli esami). FORMULA: radice di ∑( xi - μ) elevato alla seconda / N

VARIANZA: non è altro che lo scarto quadratico medio al quadrato per

cui verrà estratta la radice alla formula dello carto qudratico medio. FORMULA nel caso di una serie= = (xi - μ) elevato alla seconda / N Nel caso di distribuzione= = ∑ ( xi - μ) elevato alla seconda * ni / N SOTTO C'è LA DIMOSTRAZIONE DELLA VARIANZA CHE BISOGNA SAPERE BENE PERCHè LA CHIEDE.

DEVIANZA: la ritroviamo nei rapporti tra 2 variabili, dipendenza e

interdipendenza. Parliamo di SCOMPOSIZIONE DELLA DEVIANZA con cui indichiamo una particolare caratteristica della devianza, cioè quella di essere scomposta. Si può scomporre quando abbiamo una variabile divisa in sottogruppi. La devianza si divide in INTERNA ED ESTERNA. Quella interna è la somma delle devianze dei singoli sottogruppi. Quella esterna è ottenuta dalla devianza delle singole medie di ogni sotto gruppo e la media totale. La MEDIA TOTALE è la somma di devianza interna e devianza esterna. Ora mostro la SCOMPOSIZIONE DELLA DEVIANZA:

QUADRATO LATINO: è una tabella a doppia entrata che si utilizza per effettuare la differenza media di gini, in modo da poter considerare le modalità in valore assoluto poiché altrimenti per la prima proprietà della variabilità sarebbe nullo il numeratore della differenza di gini. Xi h 1 (elevato 4) 2 (elevato 6) 3 (elevato 2) 4 (elevato 5) Tot. RIGA. 1 0 24 16 60 100 2 24 0 12 60 96 3 16 12 0 10 38 4 60 60 10 0 13 Tot. COLONNA 100 96 380 130 364 DELTA= 100+96+38+130 / 17*16 = 364 / 272 = 1, LA CONCENTRAZIONE: ESEMPIO CONCENTRAZIONE NULLA Frazioni cumulate redditieri Frazioni cumulate reddito Xi (reddito) I (posizione) Ai (cumulate xi) Pi= i/N Qi= Ai/An pi- qi 250 1 250 1/4=0,25 250/1000= 0,

250 4 (An) 1000 (4/4=1) 1000/ = 1

N=a (redditieri)

N=

( redditieri) Pi= 1,5 1 non lo calcoliamo perchè rappresenta la sommatoria anche per pi vale la stessa cosa Pi-qi= 0 R= ∑ (Pi – qi ) / ∑ pi = 0 / 1,5 = 0 ESEMPIO CONCENTRAZIONE MASSIM Frazioni cumulate redditieri Frazioni cumulate reddito Xi(reddito) i(posizione ) Ai (cumulate xi) Pi= i/N Qi= Ai/An pi-qi 0 1 0 1/4=0,25 0/1000=0 0, 0 2 0 2/4=0,50 0/1000=0 0, 0 3 0 3/4=0,75 0/1000=0 0, 1000 4 An=1000 4/4=1 1000/ = 1

N=

(redditieri)

N=

(redditieri) Pi=1, perchè l'ultimo non lo calcoliamoperche è la sommatoria Pi-qi= 1, R= ∑ (Pi – qi ) / ∑ pi = 1,5 / 1,5 = 1 ESERCIZIO CONCENTRAZIONE INTERMEDIA Frazioni cumulate redditieri Frazioni cumulate reddito Xi(reddito) i(posizione ) Ai (cumulate xi) Pi= i/N Qi= Ai/An pi-qi

R= 1 - ∑ ( pi – pi-1) * ( qi + qi+1) questa è la formula finale che si applica quando abbiamo una variabile in classi sia discreta che continua. ESERCIZIO AREA DI CONCENTRAZIONE: reddito redditie ri Ni/N Valore centrale di xi (xi*ni ) Ai/An (^) A B A+B Xi ni Ni pi v.c ai Ai qi pi-pi-1^ qi- qi+ (pi-pi-1)

(qi+qi+ ) 0-2 40 40 0,4 1 40 40 0,08 0,4- =0, 0,08+ =0,

0,4= 0, 0,30+ ,08= 0,

0,7= 0, 0,68+ ,30=0, 98

0, 1+0, =1,

N=100 An=530^ 0, concentr azione intermedi a R= 1 - ∑ ( pi – pi-1) * ( qi + qi+1)= 0,

LE CURVE DI FREQUENZA:

ogni distribuzione di frequenza da luogo ad uno istogramma che ci permette di vedere se i dati, ovvero le osservazioni sono distribuite in modo simmetrico oppure in modo asimmetrico. I dati di una distribuzione si distribuiscono secondo una forma a campana o campanulare. Infatti la comune caratteristica a tutti i fenomeni reali è quello di presentare uno addensamento di valori che possono essere ritenuti caratteristici di una distribuzione. I valori caratteristici nello studio della curva di frequenza sono: MEDIA ARITMETICA, MODA E MEDIANA. LA SIMMETRIA: individuato un asse di simmetria, cioè la mediana che bipartisce la distribuzione, abbiamo una simmetria, quando i due rami della distribuzione presentano l'uno il disegno peculiare dell'altro, quando i due rami sono sovrapponibili. Quando le distribuzioni non presentano una perfetta asimmetria, presentano invece un grado più o meno accentuato di asimmetria. L'asimmetria la misuriamo attraverso il coefficente di asimmetria. FORMULA: ( γ si legge gamma ) *γ = ∑ ( xi – μ ) alla seconda ni / n * scarto quadratico elevato alla terza. Utilizziamo gli scarti di cubo della media aritmetica per conservare il segno che precede agli scarti. γ è un indicatore standardizzato.