




























































































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
riassunto elaborato statistica
Tipologia: Sintesi del corso
1 / 110
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!





























































































1
Statistica
2
Concetti importanti
3
Terminologia
QUALITATIVI modalità costituite da espressioni verbali
modalità costituite da numeri
Tipi di caratteri
QUANTITATIVI
ORDINABILI SCONNESSI^ D I S C R E T I
CONTINUI
Modalità ordinabili
Modalità non ordinabili
Modalità: quantità distinte
assumono valori in un intervallo di numeri reali 4
5
Esempi
6
Esempi
Genesi dei dati statistici
indagini statistiche su popolazioni finite
la rilevazione viene effettuata su tutte le unità del collettivo di riferimento
la rilevazione viene effettuata su di un sottoinsieme della popolazione, detto CAMPIONE
censuarie^ campionarie
7
estensione all’intera popolazione dei risultati ottenuti dal campione (teoria della probabilità).
8
Campionamento casuale o probabilistico
Matrice dei dati
I dati rilevati per poter essere analizzati vengono raccolti in una tabella denominata matrice dei dati. Nella matrice dei dati:
Matrice dei dati
Consideriamo una popolazione di N unità. -distribuzione statistica disaggregata (unitaria) di un carattere X è l’insieme delle osservazioni relative alle N unità. La distribuzione disaggregata sarà indicata come x 1 , x 2 , … , xN ,
x 1=osservazione relativa all’unità identificata dal numero 1, x 2 =osservazione relativa all’unità identificata dal numero 2 e così via.
Distribuzioni statistiche disaggregate
Quanti dipendenti maschi ci sono?
Dalla tabella risulta evidente la prevalenza dei maschi tra i dipendenti dell’azienda A poiché dei 12 dipendenti 9 sono maschi e 3 sono femmine.
Distribuzioni di frequenze
Distribuzione di frequenze associa a ciascuna modalità del carattere X la rispettiva frequenza. Modalità Frequenza x 1 n 1 x 2 n 2
xk nk Totale N dove n 1 , n 2 , … , nk sono le frequenze delle modalità x 1 , x 2 , … , xk. nk = numero delle unità statistiche in cui è stata osservata la modalità xk.
Distribuzioni di frequenze
frequenze relative o proporzioni : si ottengono rapportando le frequenze assolute a N. Indicheremo con f 1 , f 2 , … , fk tali quantità, essendo
Frequenze percentuali : si ottengono moltiplicando per 100 le frequenze relative.
Frequenze relative e percentuali
i 1 2 k. N
x n f (^) i i i , , , , numerototalediosservazioni
frequenza dellamodalità
Frequenze relative e percentuali
La frequenza percentuale della modalità:
100 25 % 12
(^3)
100 75 % 12
(^9)
Frequenze relative e percentuali
La frequenza percentuale :
Frequenze cumulate (caso discreto)
La percentuale di coloro che sono al massimo funzionari è
Qual è la percentuale di coloro che sono almeno funzionari?
Frequenze cumulate (caso discreto)
Le percentuali cumulate si possono calcolare per tutte le modalità della variabile categoria lavorativa e possono essere riportate nella tabella
Frequenze cumulate (caso discreto)
Notiamo che:
Consideriamo una distribuzione di frequenze secondo un carattere a modalità ordinabili. Si chiamano frequenze cumulate le quantità Ni = n 1 + n 2 + … + ni , i = 1, 2, … , k. Ni = il numero delle unità del collettivo nelle quali il carattere X assume un valore non superiore a xi Si chiamano frequenze percentuali cumulate
Frequenze cumulate
frequenza cumulata fino a (^100) 100, 1, 2, ,. numero totale di osservazioni
i i i P x^ N i k N
Distribuzione di frequenze con modalità raggruppate in classi
Supponiamo di voler calcolare la distribuzione di frequenza della variabile Stipendio
Distribuzione di frequenze con modalità raggruppate in classi A tale scopo è necessario procedere all’aggregazione in classi della variabile. Un criterio adottabile è quello di definire le seguenti classi:
La presenza del trattino verticale indica che l’estremo è incluso nel (sotto-)intervallo.
Distribuzione di frequenze con modalità raggruppate in classi
Si suddivide l’intervallo in cui variano i dati in classi (preferibilmente di uguale ampiezza) e si assegna ogni osservazione rilevata alla classe corrispondenza.
Stipendio Freq.Ass 1100 -|1660 6 1600 -|2100 4 2100 -|2600 2 Totale 12
Si chiama distribuzione di frequenze di un carattere X suddiviso in classi lo schema con cui si associa a ciascuna classe la rispettiva frequenza:
Distribuzione di frequenze con modalità raggruppate in classi
(^)
Densità di frequenza
Densità di frequenza
50 h (^) 1600 1100 0. 50
Lunghezza avambraccio (cm) Frequenza^
Ampiezza della classe
Densità di frequenza 40,5-42,5 5 2 2, 42,5-44,5 17 2 8, 44,5-46,5 25 2 12, 46,5-48,5 35 2 17, 48,5-50,5 32 2 16, 50,5-52,5 20 2 10, 52,5-54,5 6 2 3, Totale 140
Distribuzione di frequenze con modalità
raggruppate in classi
Si chiama distribuzione di quantità lo schema con cui si associa a ogni modalità del carattere X il totale dello stesso o di un altro carattere posseduto dalle unità che presentano quella data modalità di X. Lo schema è presentato di seguito per il caso di modalità non raggruppate (parte sinistra) e per il caso opposto.
Distribuzione di quantità
Distribuzione di quantità con modalità non raggruppate
Distribuzione di quantità con modalità raggruppate Modalità Quantità Modalità Quantità
x 1 t 1 c 0 -c 1 t 1
x 2 t 2 c 1 -c 2 t 2
x k tk c k - 1-c k t k
Totale T Totale T
Distribuzione di quantità
Distribuzione di quantità
Distr. di quantità in cui alla modalità del carattere N. di vani viene associato il numero totale di vani dell’insieme di appartamenti con quel numero di vani
Distribuzione di frequenze Distribuzione di quantità N.di vani N.di appart. N.di vani Totale N. vani 2 4 2 8 3 12 3 36 4 20 4 80 5 32 5 160 6 9 6 54 7 6 7 42 8 3 8 24 Totale 86 Totale 404
Distribuzione di quantità
Distr. di quantità in cui a ciascuna classe di superficie è associata la superficie complessiva dei comuni appartenenti alla classe.
Distribuzione di frequenze Distribuzione di quantità Classe di Superficie(km2)
N.Comuni Classe di Superficie (Km2)
Superficie Totale Fino a 30,5 6 Fino a 30,5 135, 30,5-40,5 8 30,5-40,5 284, 40,5-70,5 16 40,5-70,5 851, 70,5-100,5 12 70,5-100,5 992, 100,5-200,5 9 100,5-200,5 1392, 200,5 e oltre 8 200,5 e oltre 2678, Totale 59 Totale 6334,
Una serie storica è una sequenza di valori assunti da una variabile su uno stesso aggregato territoriale in istanti di tempo diversi.
Serie storiche
illustrare le distribuzioni di frequenze o di quantità. Presentano diversi vantaggi: Consentono di visualizzare le caratteristiche delle distribuzioni Agevolano il confronto tra più distribuzioni M ettendo in rilievo dati anomali, andamenti, relazioni Sono un efficace strumento per la divulgazione dei dati.
Rappresentazioni grafiche
La rappresentazione grafica più idonea per una distribuzione di frequenze secondo un carattere discreto è quella cartesiana
Sull’asse delle ascisse vengono poste le modalità x 1 , x 2 , … , xk , sull’asse delle ordinate le frequenze corrispondenti n 1 , n 2 , … , nk
La rappresentazione grafica va sotto il nome di diagramma ad aste
Caratteri quantitativi discreti
L’uso delle frequenze relative (o percentuali) non altera l’immagine della distribuzione fornita dal grafico.
N. esami Frequenza
0 14 1 41 2 83 3 116 4 56 5 5 Totale 315
Caratteri quantitativi continui
divisi in intervalli
La rappresentazione grafica più appropriata è l’ istogramma che si ottiene ponendo sull’asse delle ascisse gli estremi di classe c 0 , c 1 , …, ck e disegnando per ogni classe (ci – 1 , ci), i = 1, 2, …, k, un rettangolo avente per base il segmento dell’asse delle ascisse di estremi ci – 1 e ci e per altezza la densità di frequenza ni /di.
Istogramma Istogramma: esempio
Lunghezza avambraccio (cm) Frequenza
Ampiezza della classe
Densità di frequenza 40,5-42,5 5 2 2, 42,5-44,5 17 2 8, 44,5-46,5 25 2 12, 46,5-48,5 35 2 17, 48,5-50,5 32 2 16, 50,5-52,5 20 2 10, 52,5-54,5 6 2 3, Totale 140
Distribuzione di frequenze della lunghezza dell’avambraccio
Istogramma per la distribuzione
delle lunghezze dell’avambraccio
I caratteri qualitativi vengono generalmente rappresentate con grafici di tipo areale , in cui alle modalità del carattere si fanno corrispondere figure geometriche (rettangoli, quadrati, settori circolari ecc.) con aree proporzionali alle grandezze da rappresentare (possono essere frequenze o quantità). Le figure geometriche più spesso utilizzate sono i rettangoli ( nastri, colonne, settori circolari).
Caratteri qualitativi
grafico a settori circolari versione bidimensionale
Settori circolari distribuzione dei laureati per scuola frequentata
grafico a settori circolari versione tridimensionale
Settori circolari distribuzione dei laureati per scuola frequentata
Per il calcolo degli angoli che definiscono i quattro settori circolari si utilizzano proporzioni.
Per la modalità Liceo classico l’angolo che definisce il corrispondente settore circolare si otterrà dalla seguente proporzione:
In modo analogo si procederà per le altre tre modalità ottenendo:132.84° (Liceo scientifico), 164.52° (Ist.tec.comm.) e 28.44° (altra scuola).
360 9.5 (^) 34. 100
Serie storica degli stranieri iscritti all’ università nel periodo 2010-
Serie storiche
Anno Accademico Stranieri 2010 -2011 62074 2011 -2012 64412 2012 -2013 66781 2013 -2014 68584
Graficamente una serie storica può essere rappresentata collocando sull’asse orizzontale la variabile temporale e sull’asse verticale i valori assunti dalla variabile.
Serie storiche
62074
64412
66781
68584
58000
60000
62000
64000
66000
68000
70000
2010-11 2011-12 2012-13 2013-
Serie storiche
Grafico più appropriato fenomeno movimento
Prime iscrizioni di vetture nuove di fabbrica per tipo di alimentazione (dati in migliaia)
Grafico più efficace mostra l’andamento del fenomeno
Serie territoriali
si rappresentano spesso mediante i cartogrammi. Si tratta di rappresentazioni della distribuzione geografica di un fenomeno. Il cartogramma può consentire di evidenziare similarità tra aggregati territoriali adiacenti, consentendo di individuare ad occhio macro-aree omogenee ed eventuali andamenti del fenomeno (es. Nord-Sud, zone costiere-zone interne, ecc.).
cartogramma relativo all’indice di vecchiaia per regione
Medie
Statistica
le medie sono lo strumento con cui si sintetizzano i dati statistici. l’uso della media consente all’individuo di rappresentarsi mentalmente l’“ ordine di grandezza ” di un fenomeno, di effettuare comparazioni tra le manifestazioni di uno stesso fenomeno in tempi, luoghi o situazioni diverse.
Medie
La media aritmetica di una distribuzione statistica disaggregata è la somma dei termini x 1 , x 2 , …, x N divisa per N
i^.
N
i
N (^) x N N
x x x
1
1 2 ^1
La media aritmetica presenta le seguenti proprietà:
Se a e b sono il minimo e il massimo dell’insieme x 1 , x 2 , … , xN , la media aritmetica è compresa tra queste due quantità, ossia a μ b ( internalità)
Con riferimento all’esempio 1 , notiamo che:
La somma algebrica degli scarti dalla media aritmetica è uguale a zero
La differenze vengono denominate scarti.
1
N i i
x
( xi )
Con riferimento all’ esempio 1 , la media aritmetica. Si può facilmente verificare che gli scarti sono
e la loro somma è pari a zero:
( 5 6 ) 1 ,( 5 6 ) 1
( 6 6 ) 0 ,( 7 6 ) 1 ,( 10 6 ) 4 ,( 5 6 ) 1 ,( 6 6 ) 0 ,
( 5 6 ) 1 ,( 6 6 ) 0 ,( 7 6 ) 1 ,( 5 6 ) 1 ,( 5 6 ) 1 ,
1
( ) 1 0 1 1 1 0 1 4 1 0 1 1 0
N i i
x
La somma degli scarti al quadrato dei valori x 1 , x 2 , … , xN da una costante c è minima quando c è uguale alla media aritmetica. Con riferimento all’esempio 1 la somma dei quadrati degli scarti è.
quantità inferiore a quella che si ottiene sostituendo alla media 6 un altro numero qualsiasi.
Proprietà della media aritmetica
2 2 2 2 2 2 2 2 2 2 2 2
( 1) (0) (1) ( 1) ( 1) (0) (1) (4) ( 1) (0) ( 1) ( 1) 24
Se il singolo termine della distribuzione, xi , viene sottoposto alla trasformazione a + bxi , con a costante qualsiasi e b ≠ 0, la nuova media è legata a quella originaria dalla medesima trasformazione ( linearità)
Esempio: Con riferimento all’esempio 1 la media di X è 6. Se consideriamo la trasformazione yi = 2 + 3xi la media di Y è: 2+3(6)=
Proprietà della media aritmetica
Se un collettivo statistico di N unità viene suddiviso in L sottoinsiemi disgiunti aventi numerosità N (1), N (2), …, N ( L )^ e medie μ (1), μ (2), …, μ ( L ), allora la media aritmetica del collettivo può essere così calcolata ( proprietà associativa )
Proprietà della media aritmetica
μ ·N μ ·N μ ·N N
μ
Esempio 2 : Distribuzione per ripartizione territoriale di 300 famiglie e il corrispondente numero medio di componenti.
Nel Nord-Ovest sono presenti 150 famiglie la cui ampiezza media è pari a 2.
Proprietà della media aritmetica