




























Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
statistica completa teoria con esericizi
Tipologia: Dispense
1 / 36
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!





























PARTE INIZIALE: COS'è LA STATISTICA? La statistica è una scienza che ha un obbiettivo prioritario quello di conoscere in maniera approfondita i fondamenti attorno a noi che devono essere soprattutto per persone che si apprestono ad un lavoro. La statistica serve a sintetizzare informazioni attraverso delle statistiche descrittive che si ottengono attraverso delle indagini di tipo quantitativo. Queste a differenza di quelle qualitative si rivolgono a un numero limitato, si rivolgono ad una moltitudine di individui. Tutto ciò che può essere direttamente o indirettamente osservato viene definito FENOMENO, i FENOMENI COLLETTIVI sono fenomeni naturali o sociali costituiti da una pluralità di unità elementari la cui conoscenza e misura richiede l'osservazione di tali unità. La statistica presenta due caratteristiche: QUALITATIVE, che identificano una MUTABILE STATISTICA, sono ad esempio la professione o titolo di studio; e caratteristiche QUANTITATIVE, che identificano la variabile statistica, ad esempio reddito, età o numero di dipendenti dell'azienda. La MUTABILE STATISTICA si divide in MUTABILE RETTILINEA, abbiamo un ordine logico e naturale di successione delle modalità. MUTABILE CICLICA, si presenta con delle modalità ordinabili, previa individuazione della modalità iniziale( es. i giorni della settimana o mesi dell'anno). MUTABILE SCONNESSA, abbiamo le mutabili che si succedono senza alcun ordine. Le variabili statistiche invece si suddividono in DISCRETA, che si trova quando il carattere può assumere solo valori isolati, cioè tra due modalità che si succedono non ve ne sono altri intermedie. VARIABILE STATISTICA CONTINUA, si trova quando il carattere può assumere un insieme continuo di valori e c'è la necessità di ricorrere a delle sottoclassi. Possono avere una variabile divisa per intervalli ovvero si ricorre alla classe. Quando conduciamo un osservazione statistica si va a creare un INDAGINE STATISTICA, che si divide in 4 fasi: rivelazione, dobbiamo capire l'oggetto e lo scopo dell'indagine, l'unità di rivelazione, i caratteri quantitativi e qualitativi che si vogliono rivelare, stabilire i mezzi di rivelazione, ad esempio un questionario; L'ELABORAZIONE, quando andremo ad elaborare il dato grezzo per poterli dare forma, significato, senso e poterlo definire come dato elaborato; PRESENTAZIONE DEI DATI, sceglieremo come presenteremo i dati in forma chiara e compatta mediante tabelle, grafici; INTERPRETAZIONE, quì abbiamo la fase conclusiva dell'indagine dove avremo dato un senso a tutto, concluderemo l'indagine mostrando gli esiti ottenuti. RAPPRESENTAZIONI GRAFICHE: ogni tipo mutabile o variabile statistica ha la sua rappresentazione grafica e utilizzeremo sempre il primo quadrante, positivo dal momento che una variabile statistica non può mai essere negativa. I grafici sono: ISTOGRAMMA, utilizzato per rappresentare le variabili statistiche continue; DIAGRAMMI AREALI, possono essere sia gli artogrammi sia quelli suddivisi in settori circolari in cui si ripartisce il cerchio in maniera proporzionale al peso di ciascuna variabile o mutabile statistica; CARTOGRAMMI, vengono utilizzati per rappresentare le serie territoriali e le serie storiche; DIAGRAMMA CARTESIANO
LINEARE, utilizzato per le variabili statistiche di tipo discreto. Viene anche utilizzata la TABELLA A DOPPIA ENTRATA che viene utilizzata nella scomposizione della devianza e per i rapporti fra due variabili (x,y) formata da: TESTATA che è l'estensione della tabella; DISTRIBUZIONI MARGINALI, il numero di riga e colonna; SERIE STORICHE che rappresentano una successione di valori in successione di unità di tempo. Normalmente le serie storiche vengono rappresentate attraverso dei grafici. Poi ci sono le frequenze, frequenze assolute che ci dicono quante volte si presenta nel nostro collettivo la modalità corrispondente. Le frequenze relative non sono altro che un rapporto tra la singola frequenza assoluta e il totale generale. La somma è sempre uguale a 1. la frequenza relativa è: ni/N, se vogliamo la frequenza relativa in %avremo ni/N per 100. NUMERI INDICI: pongono al confronto le intensità e le frequenze di uno stesso fenomeno in tempi e luoghi diversi, sono utilizzati per studiare l'evoluzione temporale o le differenze territoriali di un fenomeno d'interesse osservato in corrispondenza da costruire una serie storica. I num. indici sono SEMPLICI che servono per confrontare le intensità e le frequenze di uno stesso fenomeno in tempi e luoghi diversi. E i num. Indici COMPLESSI che vengono utilizzati per seguire la variazioni dei pezzi di un insieme di merci scelte a rappresentare un intero settore economico. RAPPORTI STATISTICI: per costruire un rapporto statistico, cioè per confrontare due quantità A e B, dobbiamo stabilire se le due grandezze sono omogenee rispetto all'unità di misura. DIFFERENZA ASSOLUTA= d{ a-b}, questa esprime di quanto differiscono tra loro i termini. Ma non è una buona misura perchè non si presta a confronto tra intensità differenti. Perciò ricorriamo alla DIFFERENZA RELATIVA= d1 = a-b/a * d2 = a-b/a* le possiamo anche calcolare con la media delle due grandezze: d3=a-b/1/ (a+b)* RAPPORTO DI COMPOSIZIONE: è il rapporto tra due grandezze a e b in cui a rappresenta parte di b. RAPPORTO DI DERIVAZIONE: è il rapporto tra le frequenze di un fenomeno e l'intensità di un collettivo che ne è il presupposto necessario. Un esempio può essere il rapporto di natalità, mortalita e nunzialità, quando rapportiamo ad esempio i nati in un anno sulla popolazione.
MEDIA ARMONICA: è quel termine o valore che sostituito ai singoli termini di una distribuzione lascia inalterata la somma dei reciproci termini: nel caso di una serie: N/ ∑ 1/ Xi nel caso di una distribuzione: N/∑ ni/xi MEDIA GEOMETRICA: è quel valore che sostituito ai singoli termini di una distribuzione ne lascia inalterato il prodotto. Questa media contiene i logaritmo; il logaritmo di una potenza è uguale all'esponente. Mg=radice di x1x2xixs= radice di pigreca xini MEDIE DI POSIZIONE O LASCHE:** cercano di individuare i valori tipici della distribuzione oppure dell'intero collettivo. Il VALORE CENTRALE esprime il centro del campo di variazione di una variabilità statistica ordinata in cui individuiamo x come prime valore e xn l'ultimo valore. xi+xn/ MODA: è la modalità in cui corrisponde la massima frequenza. Si può facilmente individuare essendo la massima frequenza. Esempio: 1 18 2 16 3 11 4 30 5 15 6 6 30 è la massima frequenza. L'unico problema è quando abbiamo la frequenza bimodale in cui ci sono 2 numeri che si ripetono più frequentemente e allora faremo così:
L1 è l'estremo inferiore della classe modale L2 è l'estremo superiore della classe modale
sono 3 ed è quel valore che divide la distribuzione in quattro parti.
presume che conosciamo già i quartili, è quell'intervallo in cui è compreso il 50% dei termini della distribuzione lasciando al di fuori il restante 50%.
CAMPO QUADRATICO MEDIO: utilizza la media quadratica degli scarti. ( formula che è sempre presente agli esami). FORMULA: radice di ∑( xi - μ) elevato alla seconda / N
cui verrà estratta la radice alla formula dello carto qudratico medio. FORMULA nel caso di una serie= = (xi - μ) elevato alla seconda / N Nel caso di distribuzione= = ∑ ( xi - μ) elevato alla seconda * ni / N SOTTO C'è LA DIMOSTRAZIONE DELLA VARIANZA CHE BISOGNA SAPERE BENE PERCHè LA CHIEDE.
interdipendenza. Parliamo di SCOMPOSIZIONE DELLA DEVIANZA con cui indichiamo una particolare caratteristica della devianza, cioè quella di essere scomposta. Si può scomporre quando abbiamo una variabile divisa in sottogruppi. La devianza si divide in INTERNA ED ESTERNA. Quella interna è la somma delle devianze dei singoli sottogruppi. Quella esterna è ottenuta dalla devianza delle singole medie di ogni sotto gruppo e la media totale. La MEDIA TOTALE è la somma di devianza interna e devianza esterna. Ora mostro la SCOMPOSIZIONE DELLA DEVIANZA:
QUADRATO LATINO: è una tabella a doppia entrata che si utilizza per effettuare la differenza media di gini, in modo da poter considerare le modalità in valore assoluto poiché altrimenti per la prima proprietà della variabilità sarebbe nullo il numeratore della differenza di gini. Xi h 1 (elevato 4) 2 (elevato 6) 3 (elevato 2) 4 (elevato 5) Tot. RIGA. 1 0 24 16 60 100 2 24 0 12 60 96 3 16 12 0 10 38 4 60 60 10 0 13 Tot. COLONNA 100 96 380 130 364 DELTA= 100+96+38+130 / 17*16 = 364 / 272 = 1, LA CONCENTRAZIONE: ESEMPIO CONCENTRAZIONE NULLA Frazioni cumulate redditieri Frazioni cumulate reddito Xi (reddito) I (posizione) Ai (cumulate xi) Pi= i/N Qi= Ai/An pi- qi 250 1 250 1/4=0,25 250/1000= 0,
250 4 (An) 1000 (4/4=1) 1000/ = 1
N=a (redditieri)
( redditieri) Pi= 1,5 1 non lo calcoliamo perchè rappresenta la sommatoria anche per pi vale la stessa cosa Pi-qi= 0 R= ∑ (Pi – qi ) / ∑ pi = 0 / 1,5 = 0 ESEMPIO CONCENTRAZIONE MASSIM Frazioni cumulate redditieri Frazioni cumulate reddito Xi(reddito) i(posizione ) Ai (cumulate xi) Pi= i/N Qi= Ai/An pi-qi 0 1 0 1/4=0,25 0/1000=0 0, 0 2 0 2/4=0,50 0/1000=0 0, 0 3 0 3/4=0,75 0/1000=0 0, 1000 4 An=1000 4/4=1 1000/ = 1
(redditieri)
(redditieri) Pi=1, perchè l'ultimo non lo calcoliamoperche è la sommatoria Pi-qi= 1, R= ∑ (Pi – qi ) / ∑ pi = 1,5 / 1,5 = 1 ESERCIZIO CONCENTRAZIONE INTERMEDIA Frazioni cumulate redditieri Frazioni cumulate reddito Xi(reddito) i(posizione ) Ai (cumulate xi) Pi= i/N Qi= Ai/An pi-qi
R= 1 - ∑ ( pi – pi-1) * ( qi + qi+1) questa è la formula finale che si applica quando abbiamo una variabile in classi sia discreta che continua. ESERCIZIO AREA DI CONCENTRAZIONE: reddito redditie ri Ni/N Valore centrale di xi (xi*ni ) Ai/An (^) A B A+B Xi ni Ni pi v.c ai Ai qi pi-pi-1^ qi- qi+ (pi-pi-1)
(qi+qi+ ) 0-2 40 40 0,4 1 40 40 0,08 0,4- =0, 0,08+ =0,
0,4= 0, 0,30+ ,08= 0,
0,7= 0, 0,68+ ,30=0, 98
0, 1+0, =1,
N=100 An=530^ 0, concentr azione intermedi a R= 1 - ∑ ( pi – pi-1) * ( qi + qi+1)= 0,
ogni distribuzione di frequenza da luogo ad uno istogramma che ci permette di vedere se i dati, ovvero le osservazioni sono distribuite in modo simmetrico oppure in modo asimmetrico. I dati di una distribuzione si distribuiscono secondo una forma a campana o campanulare. Infatti la comune caratteristica a tutti i fenomeni reali è quello di presentare uno addensamento di valori che possono essere ritenuti caratteristici di una distribuzione. I valori caratteristici nello studio della curva di frequenza sono: MEDIA ARITMETICA, MODA E MEDIANA. LA SIMMETRIA: individuato un asse di simmetria, cioè la mediana che bipartisce la distribuzione, abbiamo una simmetria, quando i due rami della distribuzione presentano l'uno il disegno peculiare dell'altro, quando i due rami sono sovrapponibili. Quando le distribuzioni non presentano una perfetta asimmetria, presentano invece un grado più o meno accentuato di asimmetria. L'asimmetria la misuriamo attraverso il coefficente di asimmetria. FORMULA: ( γ si legge gamma ) *γ = ∑ ( xi – μ ) alla seconda ni / n * scarto quadratico elevato alla terza. Utilizziamo gli scarti di cubo della media aritmetica per conservare il segno che precede agli scarti. γ è un indicatore standardizzato.