


















Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
riassunto completo di statistica formule e spiegazioni libro di statistica riassunto unibs materiale completo per superamento esame
Tipologia: Dispense
1 / 26
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!



















STATISTICA = Disciplina che si occupa di predisporre adeguati metodi quantitativi
per raccogliere e organizzare, elaborare e sintetizzare, analizzare e interpretare
dati e informazioni utili per esaminare i fenomeni reali
I metodi statistici sonoZ proposti e studiati per l’analisi dei fenomeni che si
manifestano in una collettività
Con le analisi statistiche ci si propone di individuare, descrivere, interpretare e
prevedere, pur nella varietà delle singole manifestazioni, le regolarità che sono alla
base dei fenomeni
Il vocabolo Statistica si fa risalire alla parola Stato
Le prime informazioni su fenomeni reali (per motivi militari, religiosi, economici,
sociali, sanitari, ecc.) sono state raccolte ad opera di organismi statali, che ne
erano anche i principali utilizzatori
In passato la descrizione era per lo più qualitativa, con l’ausilio di tabelle; si passò
poi ad elaborazioni più sofisticate dei dati con lo scopo di mettere in luce regolarità
e relazioni fra fenomeni
Nel tempo, i metodi statistici hanno trovato applicazione in tutte le scienze
empiriche (scienze nelle quali le asserzioni sono sostenute da prove empiriche)
L’attuale disponibilità di elaboratori sempre più potenti e di programmi sempre
meno costosi e più sofisticati ha favorito lo sviluppo e la diffusione delle analisi
statistiche
Unità statistica : unità elementare su cui si osservano i caratteri oggetto di studio
Popolazione o collettivo statistico : insieme di unità statistiche
Campione : sottoinsieme della popolazione
Carattere : caratteristica di interesse COLORE - FORMA
Modalità : manifestazione del carattere VERDE - TRIANGOLO
Le modalità di un carattere devono essere:
incompatibili (non sovrapposte) : la stessa unità statistica non può essere messa
in relazione (classificata) con più di una modalità
esaustive : le modalità elencate debbono rappresentare tutti i possibili modi di
essere del carattere, così che tutte le unità statistiche del collettivo possano essere
classificate
Sono disponibili diverse fonti informative di carattere statistico a cura di Organismi
pubblici e privati
Gli Organismi pubblici agiscono secondo una gerarchia di competenze ad esempio
Enti locali: raccolgono i dati elementari
ISTAT: verifica, aggrega e pubblica i dati
SISTAN: armonizza le varie fonti di dati
Vi afferiscono le istituzioni pubbliche e private deputate alla raccolta, elaborazione e
diffusione di dati di interesse per la collettività
EUROSTAT: organismo UE che ha il compito di armonizzare la raccolta, l’analisi e
la presentazione dei dati ufficiali sulle nazioni aderenti
Statistica descrittiva
si occupa della rappresentazione e della sintesi di caratteri rilevati su un insieme di
unità statistiche
Statistica inferenziale
si occupa di estendere i risultati dell’analisi descrittiva condotta su un campione alla
popolazione da cui questo proviene
Statistica univariata
analizza un carattere alla volta
Statistica bivariata
analizza congiuntamente due caratteri
Statistica multivariata
analizza congiuntamente più caratteri
Qualitativi: le modalità sono categorie, attributi (sesso, stato civile, ragione
sociale,...)
Quantitativi:
discreti : le modalità sono numeri interi (numero di figli, numero di occupati,...)
continui : le modalità sono numeri reali (altezza, peso, capitale sociale,...)
Quando si fissano le modalità di un carattere ed i criteri di appartenenza alle stesse
si costruisce una scala di misura
La scala non è parte del carattere, ma scaturisce dalla sua definizione operativa
terremoti: scala Richter, scala Mercalli..
reddito: euro, dollari, altra valuta..
I rapporti statistici sono:
Rapporti di Composizione sono definiti come:
Rapporti di Densità sono definiti come:
Rapporti di Derivazione trovano largo impiego nella demografia e sono definiti come:
Rapporti di Coesistenza trovano largo impiego nella demografia o spesso tratta di due fenomeni antitetici (import ed export), dei quali interessa valutare l’importanza relativa. A tale fine, possiamo impiegare il rapporto
Rapporti di Durata Possiamo calcolare il rapporto di durata dato da
Consistenza Media =
Flusso Medio =
Rapporti di Ripetizione ovvero il reciproco del rapporto di durata:
Osservazione : ha senso calcolare i rapporti di durata e di ripetizione solo nel caso
di fenomeni sufficientemente stazionari, ovvero che non presentano eccessive
variazioni nel periodo considerato
Numeri Indici Semplici: servono a confrontare le intensità (o frequenze)
di un unico fenomeno in tempi o luoghi diversi
Possiamo valutare come il fenomeno è variato nel tempo calcolando numeri indici a
base fissa e/o a base mobile
Li otteniamo eseguendo il rapporto di ogni singola osservazione xt con un termine
della serie storica xb che viene mantenuto fisso (base fissa):
Essendo numeri puri consentono il confronto tra fenomeni con diversi ordini di
grandezza
L’interpretazione di un Numeri indici a base fissa avviene quindi attraverso la
variazione relativa (tendenziale), a cui è collegato dalla relazione:
ovvero:
I Numeri indici a base mobile Li otteniamo eseguendo il rapporto tra ogni singola
osservazione Xt con il termine Xt-1 del periodo immediatamente precedente, che
quindi cambia ogni volta ( base mobile ):
Essendo numeri puri, consentono di confrontare fenomeni con diversi ordini di
grandezza
Osservazioni:
i NI (bf e bm) sono sempre positivi, anche quando segnalano una diminuzione;
le variazioni (tendenziali e congiunturali) hanno, invece, un segno positivo o
negativo (se diverse da zero).
CAMBIAMENTO DELLA BASE
Abbiamo visto nell’esempio che, se disponiamo di una serie storica di dati,
ricaviamo agevolmente sia i NIbm sia NIbf con basi differenti. Possiamo così
soddisfare le varie esigenze di lettura delle variazioni congiunturali o tendenziali
Spesso, però, non possiamo procedere per questa via perché non disponiamo dei
dati originari. Conosciamo, invece, i NI (bf o bm) o le corrispondenti variazioni
(tendenziali o congiunturali)
In questi casi, possiamo:
cambiare la base dei NIbf
trasformare i NIbf in NIbm e viceversa
ricavando comunque l’informazione che ci interessa
Per esprimere i NIbf di una vecchia base ( vb ) in NIbf di una nuova base ( nb )
utilizziamo i rapporti
Per esprimere i NIbf in Nibm, utilizziamo i rapporti
Numeri Indici Composti: servono a confrontare in tempi o luoghi diversi
un fenomeno che risulta dal concorso di più componenti
Diagramma a bastoncini
Il punto che nel piano cartesiano corrisponde alla generica coppia (Xj ; Nj) o
(Xj ; Fj) è proiettato sull’asse delle ascisse
L’altezza dei bastoncini così ottenuti corrisponde alla frequenza assoluta o relativa
La frequenza di una classe è uguale alla somma delle sue frequenze specifiche
Diagramma a gradini (cumulo)
Dal punto che rappresenta la generica coppia (Xj ; Nj) o (Xj ; Fj) si traccia verso
destra un segmento orizzontale di lunghezza pari a 1
L’altezza di un gradino corrisponde alla frequenza assoluta o relativa
Si ottiene dalla distribuzione cumulata delle frequenze specifiche (assolute o
relative)
L’altezza di un gradino corrisponde quindi alla frequenza specifica (assoluta o
relativa)
Diagramma a gradini (retrocumulo)
Dal punto che rappresenta la generica coppia (Xj ; Nj) o (Xj ; Fj) si traccia verso
sinistra un segmento orizzontale di lunghezza pari a 1
L’altezza di un gradino corrisponde alla frequenza assoluta o relativa
Si ottiene dalla distribuzione retrocumulata delle frequenze specifiche (assolute o
relative)
L’altezza di un gradino corrisponde quindi alla frequenza specifica (assoluta o
relativa)
Frequenze specifiche
Domanda: come possiamo attribuire le frequenze alle singole modalità di ogni
classe?
Se non abbiamo informazioni a priori, introduciamo la ipotesi di equidistribuzione
(uniforme distribuzione)
la frequenza di una classe viene ripartita equamente tra le sue modalità
Otteniamo così le frequenze specifiche :
Frequenze assolute specifiche
Frequenze relative specifiche
La frequenza specifica è una frequenza ipotetica: rappresenta la frequenza
attribuita a ciascuna modalità della classe nell’ ipotesi di equidistribuzione
Di conseguenza, nsj può essere non intera
La frequenza specifica è un rapporto di densità (rapporto tra la frequenza della
classe e la dimensione della stessa)
Se la classi hanno uguale ampiezza, le frequenze (ass. o rel.) sono proporzionali
alle frequenze specifiche (ass. o rel.) Il profilo del grafico non si modifica utilizzando
le une o le altre => trasformazioni di scala
Se le classi hanno diversa ampiezza, per fare confronti è necessario usare le
frequenze specifiche
Se il carattere è continuo la corrispondente distribuzione di frequenze deve
necessariamente essere rappresentata per classi
Come prima, le classi possono essere di uguale o di diversa ampiezza
Analisi e confronti
L’ analisi della forma della distribuzione e il confronto tra distribuzioni rilevate in
situazioni diverse offrono spesso utili informazioni sul fenomeno considerato
In queste analisi sono spesso impiegati i concetti di:
Si impiegano spesso anche degli indici di sintesi che permettono di valutare
numericamente tali aspetti
Si usano in particolare: indici medi
indici di variabilità indici di asimmetria
Una media è un indice impiegato per sintetizzare le diverse modalità di una
distribuzione di frequenze con una sola modalità qualitativa (nel caso di mutabile)
o un solo valore (nel caso di variabile)
Essa fornisce una buona sintesi delle differenti modalità di una distribuzione solo se
le rappresenta adeguatamente
Medie di posizione
Sono individuate solo tramite le frequenze
Si possono quindi determinare anche nel caso di mutabili Le più utilizzate sono
Moda Mediana
Moda: modalità che presenta la frequenza più elevata
La rappresentazione grafica di una distribuzione può evidenziare la presenza di
due mode
La presenza di due mode può suggerire che la popolazione non è composta da
unità omogenee ma da due gruppi distinti
Possiamo determinare la moda ( Mo ) qualunque sia la scala di misura del carattere
La sintesi operata da Mo è ritenuta adeguata quando la sua frequenza rappresenta
almeno il 50% dei casi
Se le modalità sono raggruppate in classi, individuiamo la classe modale tramite le
frequenze specifiche (ass. o rel.)
Mediana: divide in due gruppi di uguale numerosità la successione ordinata delle
modalità
Sia X un carattere quantitativo Si dimostra che
A = Me nel caso N dispari
Quantili o frattili
Se il carattere è quantitativo e la popolazione numerosa si possono calcolare altri
indici di posizione, che sono una generalizzazione del concetto di mediana
Quartili
Sono i 3 valori Q1 Q2 Q3 che dividono la successione
ordinata dei valori in 4 gruppi di uguale numerosità Qs =x(s/4) s=1,2,
Osservazione: Q2 =Me
Decili
Sono i 9 valori D1 D2...D9 che dividono la successione
ordinata dei valori in 10 gruppi di uguale numerosità Ds =x(s/10) s=1,2,K,
Osservazione: D5 =Q2 =Me
Centili (Percentili)
Sono i 99 valori C1 C2...C99 che dividono la successione
ordinata dei valori in 100 gruppi di uguale numerosità Cs =x(s/100) s=1,2,K,
Osservazione:
C25 =Q
C50 =Q2 =Me
C75 =Q
Come abbiamo visto, in una distribuzione di frequenze la moda e la mediana sono
individuate utilizzando solo le frequenze
Se il carattere è quantitativo, possiamo calcolare anche delle medie algebriche
Queste medie si ottengono effettuando operazioni algebriche sui valori che il
carattere assume nella popolazione
Media aritmetica semplice = somma dei valori / numero delle osservazioni
Se la somma a numeratore ha un significato reale
la relazione rappresenta quanta parte del totale spetta ad ogni unità del
denominatore nell’ipotesi che esso sia equamente ripartito
M1 può essere calcolata anche se T non ha significato concreto
Media aritmetica ponderata
È la somma dei valori ponderati con le frequenze assolute divisa per il numero delle
osservazioni
È la somma dei valori ponderate con le
frequenze relative
La media aritmetica ponderata ci dà lo stesso risultato del rapporto tra i dati
aggregati delle due regioni
I pesi da assumere sono i denominatori dei singoli rapporti (così si semplificano!)
Calcolare la media aritmetica semplice è sbagliato (tranne nel caso particolare in
cui i denominatori sono uguali)
Come calcoliamo M1 quando la distribuzione è per classi?
Per rendere operative le espressioni viste in precedenza, è necessario che ogni
classe sia rappresentata da un unico valore
Possono però presentarsi casi differenti, a seconda del tipo di informazioni che
abbiamo
Proprietà associativa
Proprietà associativa di M1 :
La media aritmetica di una variabile osservata su una popolazione suddivisa in p
gruppi è uguale alla media aritmetica ponderata delle medie aritmetiche di gruppo,
con pesi pari alle numerosità dei gruppi
=>
=>
segue che
PROPRIETÀ DELLE TRASFORMAZIONI LINEARI
Se tra i due caratteri quantitativi Y e X sussiste la relazione Y = a +b ⋅ X con a e b
costanti, allora
M 1
( Y ) = a + b ⋅ M 1
Media aritmetica
La media aritmetica può essere dedotta sulla base di considerazioni di invarianza
Secondo Chisini, una media sintetizza i dati in modo adeguato quando mantiene
invariato un aspetto di interesse del fenomeno considerato
Con il metodo di Chisini si possono quindi trovare medie diverse, a seconda degli
obiettivi dell’analisi
Secondo Chisini
sia X il numero tale per cui
risolvendo per X si ottiene che
media aritmetica ponderata secondo chisini
media aritmetica semplice secondo chisini
Media armonica
M-1è il valore che, sostituito alle singole osservazioni, ne lascia invariata la somma
dei reciproci
sia X numero tale per cui
risolvendo si ottiene che
media armonica ponderata
media aritmetica semplice
Media geometrica
M 0 è il valore che, sostituito alle singole osservazioni, ne lascia invariato il prodotto
sia X numero tale per cui
risolvendo si ottiene che
media geometrica ponderata
media geometrica semplice
Criteri per scelta delle medie
usare una media funzionale
accidentali che si compensano
Mo, Me e M
(forma della distribuzione)
I numeri indici composti sintetizzano più componenti di uno stesso fenomeno per
seguirne le variazioni nel tempo (o nello spazio)
Metodo più utilizzato: si sintetizzano i numeri indici semplici dei prezzi p dei singoli
prodotti con una media
Poiché i prodotti non hanno tutti la stessa importanza, è opportuno tenere conto
anche di un sistema di pesi
Utilizzare le quantità q è problematico, perché sono espresse in unità di misura
eterogenee (grammi, litri, unità, ecc.) e non si possono sommare (a denominatore
della media)
Possiamo superare il problema dell’eterogeneità adottando come peso la spesa (o
valore): s = p · q
pit e qi0 il prezzo e la quantità del bene i-esimo al tempo base
pit e qit il prezzo e al tempo t la quantità del bene i-esimo
Possiamo però considerare 4 tipi di valori: due reali:
p 0 ·q 0 e pt·qt due figurativi:
p 0 ·qt e pt·q 0
indice di LASPEYRES = Media rapporti 0 It con pesi costanti al variare di t
indice di PAASCHE = Media rapporti 0 It con pesi variabili aggiornati ad ogni t
Nelle analisi economiche si osserva un aumento delle quantità acquistate per quei
beni i cui prezzi comparativamente si riducono (e viceversa)
Laspeyres tiene fisse le quantità; Paasche le aggiorna
Laspeyres ignora l’aumento delle quantità dei beni i cui prezzi aumentano
relativamente di meno, cioè tende a sovrastimare il tasso di crescita dei prezzi.
Paasche, invece, tende a sottostimarlo.
Per neutralizzare le opposte tendenze dei due indici, I. Fisher ha proposto di
utilizzare la media geometrica dei due indici:
indice di Fisher
Gli indici che abbiamo calcolato sono indici dei prezzi
I NI di grandezze economiche possono essere calcolati, oltre che per i prezzi,
anche per quantità e valori (es: NI della produzione industriale; NI dei valori dei
beni importati ed esportati).
Gli indici dei prezzi possono essere di vario tipo (al consumo, all’ingrosso, alla
produzione, ecc.)
Gli indici dei prezzi al consumo sono molto importanti, perché cercano di misurare
l’inflazione
“ L’inflazione è un processo di aumento continuo e generalizzato del livello dei
prezzi dei beni e servizi destinati al consumo delle famiglie.
Un aumento dell’inflazione corrisponde ad una situazione in cui aumenta la velocità
di crescita dei prezzi.
Una riduzione dell’inflazione si ha quando i prezzi, pur essendo in aumento,
crescono a una velocità minore ”
L’inflazione si misura attraverso la costruzione di un indice dei prezzi al consumo,
uno strumento statistico che misura le variazioni nel tempo dei prezzi di un insieme
di beni e servizi, chiamato paniere, rappresentativo degli effettivi consumi delle
famiglie in un dato periodo
L’Istat produce tre diversi indici dei prezzi al consumo: • per l‘intera collettività
nazionale (NIC)
considera l'Italia come se fosse un’unica grande famiglia di consumatori, all'interno
della quale le abitudini di spesa sono ovviamente molto differenziate.
Per gli organi di governo il NIC rappresenta il parametro di riferimento per la
realizzazione delle politiche economiche;
I fenomeni reali si manifestano in modo diverso nelle unità di una popolazione
Si definisce variabilità l’attitudine di una variabile (carattere quantitativo) ad
assumere valori differenti
In generale è utile associare all’informazione fornita da una media quella di un’altra
misura, che consenta di differenziare le diverse situazioni
Questo compito è affidato agli indici di variabilità Si richiede che questi assumano:
valore 0 solo nel caso di assenza di variabilità valori positivi crescenti al crescere
della variabilità
Gli indici più semplici e maggiormente utilizzati si basano sulle differenze
tra due indici di posizione (intervalli di variazione)
tra i valori e una media (scostamenti medi)
Intervalli di variazione
Indicano l’ampiezza dell’intervallo centrale entro il quale è compresa una certa
frazione della popolazione
Un intervallo centrale lascia la stessa frazione di casi con valori inferiori e superiori
agli estremi dell’intervallo stesso
Il carattere è tanto più variabile quanto più l’intervallo è ampio (a parità di
condizioni: frazione di casi contenuti, unità di misura, ordine di grandezza ...)
I caratteri discreti pongono alcuni problemi poiché l’intervallo (basato su indici di
posizione) può contenere una frazione di casi diversa da quella prefissata
campo di variazione
E’ l’ampiezza dell’intervallo compreso tra i due valori estremi della distribuzione X(N) - X(1)
delle osservazioni
produzione)
Differenza interquartile
E’ l’ampiezza dell’intervallo che ha come estremi il primo e il terzo quartile
50% delle osservazioni
Si può quindi definire anche come:
l’ampiezza dell’intervallo centrale che contiene il 50% delle osservazioni ordinate
Differenza interdecile
E’ l’ampiezza dell’intervallo che ha come estremi il primo e il nono decile
l’80% delle osservazioni
Si può quindi definire anche come:
l’ampiezza dell’intervallo centrale che contiene l’80% delle osservazioni ordinate
Scostamenti medi
Si calcolano sintetizzando con una media algebrica gli scarti assoluti da un indice
medio
Si considerano gli scarti in valore assoluto per evitare possibili bilanciamenti, che
potrebbero far risultare nullo un indice in presenza di variabilità
scostamento medio semplice da Me
scostamento medio ponderato da Me
scostamento medio semplice da M
scostamento medio ponderato da M
scarto quadratico medio semplice
scarto quadratico medio ponderato
La relazione d’ordine
SMe ≤ SM1 ≤ σ
non è necessariamente verificata quando la distribuzione è per classi, perché M1 e
Me sono, in genere, delle approssimazioni dei veri valori