












































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Sintesi di Manuale di statistica
Tipologia: Sintesi del corso
1 / 52
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!













































obbiettivo della statistica è lo studio della popolazione
i può studiare tramite
deve essere uguale a n
la distribuzione di frequenza
Riassunti Statistica
Informazione statistica = carattere statistico + unità statistica
Es: Fatturato = carattere Aziende = unità
I caratteri sono quantitativi (numeri reali o valori ) o qualitativi (non esprimibili numericamente)
Quantitativi = variabili statistiche qualitativi = mutabili
Le variabili si distinguono in continue o discrete
Discrete quelle che assumono valori in un insieme discreto (non posso sempre trovare un valore
tra altri due valori, come il numero di figli o il voto di un esame)
Continue quelle che possono assumere tutti valori in un intervallo continuo o illimitato
relative a un fenomeno di interesse costituisce la popolazione.
La popolazione s
(rilevazione dei dati su tutte le unità statistiche)
(rilevazione solo su alcune unità statistiche).
All’aumentare delle unità statistiche sulle quali viene osservato un carattere diventa sempre più
difficile interpretare quantità crescenti di dati.
di studio conviene utilizzare una
rappresentazione sintetica:
La frequenza assoluta si indica con n i
e sta a significare quante volte un carattere assume una
determinata modalità.
La sommatoria delle frequenze assolute (la popolazione)
k
𝑖
1
2
k
𝑖=
Dopo aver calcolato le frequenze è possibile creare una tabella.
Modalità
m i
Frequenza
n i
m 1
n 1
m 2
n 2
m k
n k
Per rendere più evidenti le caratteristiche del fenomeno
oppure tramite campionamen to
censimento
L’insieme di tutte le informazioni
L’istogramma
possiamo trovare un valore a cui corrisponde la massima frequenza o una classe
(o
Asimmetria negativa = coda a sinistra
Asimmetria positiva = coda a destra
Per costruirlo è necessario calcolare:
= x i
- x i- 1
= f i
i
è
Classi f i
i
h i
x 0
|- x 1
f 1
1
=x 1
h 1
= f 1
1
1
|- x 2
f 2
2
=x 2
h 2
= f 1
1
k- 1
|-x k
f k
k
=x k
h k
= f k
/ h k
La colonna dell’istogramma
delle distribuzioni di frequenza è la presenza o assenza di simmetria.
Nelle distribuzioni
a cui corrisponde la massima densità di frequenza.
se consideriamo le classi).
Quando la
classe modale
e (o della
classe mod.
Se le frequenze decrescono più rapidamente a destra o a sinistra del modale (o della classe
modale) la distribuzione è detta asimmetrica.
Una rappresentazione alternativa alla suddivisione in classi è il diagramma stelo e foglia.
I dati vengono raggruppati nella stessa classe se hanno le cifre iniziali uguali.
Presenta il vantaggio rispetto all’istogramma di conservare i valori all’interno della classe.
I dati (22,23,25,27,31,33,34,43,48) Sono rappresentati dal diagramma stelo e foglia:
foglie.
ossia la differenza tra gli estremi
Questo valore è detto modale
Un aspetto caratterizzante
più alta corrisponde alla classe con densità più alta.
frequenza decresce in modo simmetrico sia a destra che a sinistra del modal
ale) la distribuzione è simmetrica
gni riga è uno stelo
Le informazion i di ciascun dato sono le
e attraverso la distribuzione delle frequenze congiunte
È utile studiare congiuntamente due fenomeni, in questo caso, informazioni sul legame esistente
fra i due caratteri si possono ottener.
La distribuzione delle frequenze congiunte
La
k ℎ
𝑖j
𝑖=1 j=
Per distinguerle dalle frequenze congiunte
carattere B considerati singolarmente sono definite marginali.
Per ciascuna modalità a 1
A o del
delle modalità b j
si ottengono sommando le
e in quanto tale rappresentativo intorno al
della distribuzione.
Sia X una variabile statistica che assume n valori x1, x2, …, x n
, la media aritmetica è data da
𝑛
1 2
𝑛
𝑖
𝑖=
tabella di contingenza.
frequenze congiunte che si trovano sulla riga corrispondente.
somma di tutte le frequenze congiunte è pari a n
La media è un indice di posizione
Analogamente le frequenze marginali del carattere B
del carattere A , la frequenza marginale si ottiene sommando le
, le frequenze delle modalità del carattere
può essere utilmente rappresentata mediante una
frequenze congiunte che si trovano sulla colonna corrispondente
costituisce un valore
quale si distribuiscono le informazioni. È in grado di sintetizzare gli aspetti essenziali della
distribuzione andando a indicar e l’ordine di grandezza dei dati e fornendo informazioni sul centro
2
La media è quel valore che sostituito a ogni osservazione lascia invariata la somma, ossia
La media è quel valore che minimizza la somma dei quadrati degli scarti.
Proprietà 2:
Proprietà 3:
k
𝑖
𝑖
𝑖=
La somma degli scarti 𝑥̅ 𝑖
− 𝑥̅ della media è nulla.
k k k
𝑖
𝑖
𝑖
𝑖
𝑖
𝑖=1 𝑖=1 𝑖=
Proprietà 4:
k k
𝑖
2
𝑖
𝛼
𝑖
2
𝑖
𝑖=1 𝑖=
(dimostrazione sul libro pagina 32)
La mediana è il valore centrale di una distribuzione , ossia quel valore che divide in due parti di
eguale numerosità i dati ordinat i.
Per calcolare la mediana è necessario: ordinare i valori, calcolare la profondità.
La profondità della mediana è uguale a:
Se n è dispari la profondità coincide con un numero intero, e allora la mediana è quel valore che
occupa la posizione data dalla profondità della mediana.
(
𝑛+
)
La mediana gode di tre proprietà.
La mediana è quel valore che minimizza la somma degli scarti in valore assoluto.
Se n
eccesso.
Esempio:
i allora la profondità è un numero non intero, di conseguenza la mediana è la
della mediana presa per intero e arrotondata per
(25)
(26)
La mediana è data dalla semisomma del venticinquesimo e del ventiseiesimo valore (disposti in
modo ordinato).
Proprietà 1:
Sia Y una trasformazione lineare di X, 𝑌 = 𝑎𝑋 + 𝑏. La mediana di Y è la trasformazione lineare
della mediana di X.
Proprietà 2:
Siano 𝑥̅ 1
2
𝑛
− 𝑚𝑒𝑑 gli scarti della mediana, allora il numero degli scarti
Proprietà 3:
𝑛 𝑛
𝑖
𝛼
𝑖
𝑖=1 𝑖=
La terza proprietà della mediana è analoga alla quarta della media.
L’indice ottimale per minimizzare la somma delle distanze (date dagli scarti in valore assoluto) è la
mediana.
la mediana non è sensibile alle osservazioni anomale.
positivi è uguale al numero degli scarti negativi.
La mediana si dice resistente rispetto alla presenza di valori anomali.
dalla profondità
A differenza della media
è par
semisomma dei valori ottenuti
limite inferiore
se si effettua una traslazione
la varianza rimane invariata.
2
√ 𝑠
2
In questo modo abbiamo ottenuto un indice di variabilità espresso mediante la medesima unità di
misura.
Se siamo in possesso delle frequenze relative f i
è possibile calcolare la varianza in modo ancora più
rapido.
k
(2)
𝑖
2
𝑖
𝑖=
2
(2)
2
È possibi
semisomma degli estremi).
e della classe (ottenuto dalla
Sia X una variabile statistica con una media 𝑥̅ e una varianza 𝑠
2
è possibile dimostrare che:
2
2
La disuguaglianza di Chebyshev fornisce un
assume valori intorno a 𝑥̅ , ciò significa che
, ma se aumenta la frequenza con la quale X
della variabile X intorno alla media presenta una maggiore dispersione.
Un’altra proprietà della varianza è che sia 𝑠
2
𝑋
la varianza di una variabile X, la varianza di una
trasformazione lineare 𝑌 = 𝑎𝑋 + 𝑏 è data da:
𝑌
2
2
𝑎𝑋+𝑏
2
2
𝑋
Infatti, dei dati aggiungendo a ciascuna osservazione una quantità 𝑏,
Quando i dati sono raggruppati in classi, non è possibile calcolare l’esatto valore della varianza.
media di semi-ampiezza 𝜀, con frequenza relativa almeno pari a 1 −
𝑠
2
Questa disuguaglianza mostra che una qualsiasi variabile X assume valori in un intorno della
per la frequenza.
questo limite
La varianza è indipendente dalla posizione
varianza diminuisce aumenta Quando la
le ottenere un valore approssimato mediante il valore central
la distribuzione è più concentrata intorno alla sua
media. Se invece la varianza aumenta , si riduce il limite inferiore , di conseguenza la distribuzione
grandezza dei dati
utilizzare il coefficiente di variazione
dividono i dati in quattro parti uguali: Q I quartili 1
Siccome la varianza e lo scarto quadratico medio dipendono dall’unità di misura e dall’ordine di
In questo modo possiamo confrontare fenomeni con un diverso ordine di grandezza.
La differenza interquartile è data da
Un altro indice di variabilità usato è il campo di variazione ( Range
, aggiungendo una costante la media 𝑥̅ passa a 𝑥̅ + 𝑏 gli scarti dalla media non sono
. La varianza definita come la media degli scarti della media al quadrato, e quindi in
funzione degli scarti, rimane la stessa.
La varianza è invece sensibile a cambiamenti della scala.
Se si altera l’unità di misura dei dati moltiplicandoli per una costante non nulla 𝑎 la varianza risulta
moltiplicata di conseguenza.
, quando un avariabile assume soltanto valori positivi, può essere conveniente
La differenza interquartile misura la variabilità del 50% dei dati che si trovano al centro della
si lascia a sinistra il 25% dei dati, poi abbiamo la
mediana che divide la distribuzione in due parti uguali, e infine Q 3
che lascia alla sua sinistra il 75%
delle osservazioni.
Per calcolare i quartili, dopo aver ordinato i dati, è necessario calcolarne la profondità.
Un modo comodo per calcolarli è quello di trovare la mediana dallo 0% al 50% delle osservazioni
1
) e una seconda mediana dal 50% al 100% (Q 3
3
1
Fornisce indicazioni sulla variabilità della metà centrale dei dati (più è alto e più i dati sono
dispersi)
Questo valore è
(𝑛)
(1)
dato dalla differenza tra la massima e la minima osservazione.
distribuz ione
modificati
Quindi
Allora l’insieme 𝑺 di tutti i possibili risultati è definito come lo spazio
si definiscono con 𝜔 1
2
I grafici a torta consentono di visualizzare come la totalità di un fenomeno si ripartisce , in
In alternativa a questo grafico possiamo utilizzare un grafico a barre suddivise ch e mette in
Un grafico a dispersione è
Per quanto concerne la rappresentazione grafica, particolare rilievo, hanno i grafici a barre , a
I grafici a barre consentono di rappresentare con efficacia l’intensità con la quale un fenomeno
si manifesta rispetto alle altre unità statistiche.
, tra le sue componenti.
che consente di visualizzare due o
più fenomeni che si sono evoluti nel tempo ma attraverso barre adiacenti tra loro; cioè due o più
barre forniscono informazioni per due o più fenomeni.
i. Un
, nel quale ciascun punto rappresenta i valori di due variabili rilevanti sulla stessa unità
statistica.
a partire
Molte decisioni sono prese in condizioni di incertezza.
Il calcolo delle probabilità si può definire come “la logica del possibile o dell’incerto”
Il calcolo delle probabilità considera il problema di “misurare il grado di possibilità di una
proposizione” ovvero di assegnare alla proposizione una probabilità.
La nostra proposizione di interesse per il calcolo delle probabilità prende il nome di eventi casuali
o aleatori.
del mondo reale per il quale vi è più
manifestazione è associato uno stato di
I possibili risultati di un esperimento casuale
un esperimento casuale.
𝑛
i possibili risultati di
1
2
𝑛
torta e a dispersione.
campionario.
quantitativo
esperimento casuale o prova qualsiasi fenomeno Si definisce
Se i punti si dispongono in maniera casuale allora non c’è un ’associazione fra la due variabili
in alto a destra,allora il grafico ci suggerisce un’ associazione positiva
Se i punti si dispongono in modo crescente dall’angolo in basso a sinistra verso l’angolo
bivariati
valori di due variabil
Un’ altra rappresentazione grafica è il grafico a barre multiple
evidenza i mutamenti che un fenomeno subisce nel tempo o in diverse aree geografiche
percentuale
un grafico che utilizza le coordinate cartesiane per rappresentare i
grafico a dispersione è uno strumento sintetico p er rappresentare dati
di un risultato possibile e pertanto l’esito è certo.
Un esperimento casuale è un fenomeno alla cui
incertezza.
campionario 𝑆
. In particolar e, i sottoinsiemi di 𝑺 costituiti da singoli elementi
casuale. Gli eventi casuali possono essere rappresentati come sottoinsiemi dello spazio
evento impossibile
si verifica quando A e B si verificano contemporaneamente
oppure contemporaneamente A e B.
La negazione
o è possibile immaginare di ripetere innumerevoli volte l’esperimento casual
utile al fine di visualizzare gli eventi è il diagramma di Venn
prendono il nome di
eventi elementari.
La definizione frequentistica
frequenza relativa di A al divergere del numero di replicazioni dell’esperimento.
(improprio) lo stesso spazio campionario, allora 𝑆 prende il
sottoinsieme
un (∅)
Uno strumento molto.
Vi sono tre operazioni che
L’intersezione A ∩ B
intersezione
L’unione A ∪ B è
oppure a entrambi. Pertanto, l’
, pertanto l’evento
che appartengono soltanto ad A oppure soltanto a B
𝐴̅ ,dato un evento A in 𝑆, si indica con 𝐴̅ l’insieme complementare di A rispetto ad 𝑆.
Esso rappresenta quindi l’evento che si verifica quando A non si verifica.
Due eventi A e B contenuti in 𝑆, si dicono incompatibili se non possono verificarsi
A e B non hanno elementi in comune e la loro intersezione
è l’evento impossibile
Una formula utile per esprimere un evento A:
Questa equazione mostra come è possibile esprimere A come l’unione tra due eventi
incompatibili.
Si hanno due principali definizioni.
A livello teoric
Ogni volta è possibile numero k
i.
e.
il numero n
per il numero di replicazioni fatte. Possiamo quindi ottenere la frequenza relativa k/n che può
essere rappresentata in un piano cartesiano.
Secondo la definizione frequentistica
Un evento casuale è una proposizione non ambigua formulabile intorno a un esperimento
negazione.
intersezione, union
sipossono compiere utilizzando gli eventi: e e
contemporaneamente. In questo caso
la probabilità dell’evento A è il valore a cui converge la
per quante volte l’evento si è realizzato e
individuare il
eventi ripetibil
si applica ai così detti
unione si verifica quando si verifica soltanto A oppure soltanto B
costituita dagli elementi di 𝑆
è costituita dagli elementi comuni sia ad A che a B
prende il nome di
Se si considera un sottoinsieme che non contiene alcun elemento di 𝑆 , allora tale
nome di evento certo
Se si considera come sottoinsieme
l’informazione relativa al verificarsi di A non modifica la valutazione della probabilità
Se B è indipendente da A allora anche A è indipendente da B.
p.
Siano A e B due eventi contenuti in 𝑆 e si supponga di disporre dell’informazione che B si è
verificato. La probabilità condizionata di A ,
Quando si calcola questa probabilità
Dall’equazione precedente è possibile ricavare:
𝑃
( 𝐴̅ ∩𝐵
)
𝑃(𝐴̅ | 𝐵)
d
assume quindi il
È importante distinguere quando parliamo di probabilità.
È possibile con l’ausilio della probabilità condizionata calcolare la probabilità di un evento A nel
seguente modo
Si considerino due eventi A e B contenuti in 𝑆 e tali che 𝑃(𝐴̅ ) > 0 e 𝑃(𝐵) > 0.
L’evento B è indipendente da A se
La probabilità condizionata di B dato A coincide con la probabilità non condizionata di B.
Pertanto,
di B.
ruolo di evento certo e rappresenta il nuovo insieme dei possibili risultati dell’esperimento
deve essere vero ,
(B)
l’evento condizionante
Ci sono circostanze in cui il verificarsi di un determinato evento modifica la valutazione della
robabilità di un altro evento, si parla perciò di probabilità condizionata
dato che si è verificato l’evento B , è data a
il tipo di estrazione
Si distingue tra estrazione in blocco (o senza rimessa) e con rimessa.
Quando l’estrazione avviene il blocco vi è dipendenza fra le prove e per il calcolo delle
probabilità è richiesto l’uso della probabilità condizionata
si distingue fra probabilità a priori ossia la probabilità
prima che un’informazio ne aggiuntiva sia disponibile, e probabilità a posteriori
𝑃(𝐵)
Si noti che la somma delle probabilità a posteriori è 1.
Il teorema di
Nel teorema di Beyes
di interesse
attribuita a un evento
ossia
P(A|B) è data da
𝑃(𝐴̅ ∩𝐵)
. Allora la probabilità a posteriori di A
Ora andando a sostituire al numeratore 𝑃
otteniamo:
Andando a sostituire al denominatore 𝑃(𝐵) = 𝑃(𝐴̅ )𝑃(𝐵 | 𝐴̅ ) + 𝑃(𝐴̅ )𝑃(𝐵 | 𝐴̅ ) otteniamo:
Considerate 𝑃(𝐵 | 𝐴̅ ) e 𝑃(𝐵 | 𝐴̅ ) verosimiglianze allora questa formula consente di calcolare le
probabilità a posteriori a partire dalle probabilità a priori e dalle verosimiglianze.
I concetti introdotti fino a questo punto possono essere utilizzati per studiare situazioni nelle quali
siamo interessati a due diversi caratteri statistici che possono essere osservati congiuntamente
come risultato di un’unica rilevazione.
Siano M e L due diversi caratteri statistici, relativi a un medesimo fenomeno oggetto di studio, che
assumono rispettivamente le modalità 𝑚 1
2,
k
e 𝑙 1
2
ℎ
Si consideri un esperimento casuale i cui possibili risultati sono costituiti dalle coppie di modalità
𝑖
j
). Lo spazio campionario di questo esperimento è
1
1
2
2
k
ℎ
Mentre 𝐸 11
1
1
kℎ
k
ℎ
)} sono gli eventi elementari associati ai possibili
risultati dell’esperimento.
evento qualora si
da A Se però supponiamo che si sia verificato B dipendente
Considerando due eventi A e B la probabilità a priori di A è P(A)
la probabilità aggiornata in funzione della nuova informazione
rendano disponibili informazioni aggiuntive relative al verificarsi di un evento a esso collegato
Beyes fornisce una rego la per aggiornare la probabilità di un
necessariamente biunivoca.
probabilità che la variabile X assuma un valore al massimo uguale a x.
Questa è una variabile che
casuale.
La corrispondenza tra i risultati di un esperimento e i valori di una variabile casuale non è
In generale,
Le variabili casuali si distinguono in discrete e continue.
Una variabile casuale discreta è definita quando è nota la sua funzione di probabilità ossia
l’insieme dei valori che essa può assumere con le rispettive probabilità.
Le probabilità 𝑝 𝑖
hanno le seguenti proprietà:
𝑖
𝑖
𝑖
Sia X una variabile casuale continua, allora a X è associata una funzione di densità.
La funzione di densità è così definita:
𝑏
𝑎
Una caratteristica interessante delle variabili casuali continue è che
assumono in un determinato istante è 0.
Cioè la probabilità che queste assumano un determinato valore x è data dall’area sottesa di f(x) su
Sia X una variabile casuale (discreta o continua),
un intervallo di lunghezza nulla.
assume valori numerici dipendenti dal risultato di un esperimento
la probabilità che esse
la sua funzione di ripartizione F(x) esprime la
della variabile casuale possono corrispondere più risultati dell’esperimento
a ogni elemento di 𝑆deve corrispondere un solo valore, ma inversamente, a un valore
non superiori a 𝑥̅.
il valore della funzione di ripartizione nel punto x è dato
dei valori 𝑥̅ 𝑖
Questa funzione è definita per ogni valore reale di x, è una funzione non decrescente e assume
valori nell’intervallo [0,1].
Nel caso delle variabili casuali discrete
𝑖
𝑥̅ 𝑖
≤𝑥̅
Graficamente è una funzione a gradini, dove sono presenti dei salti in corrispondenza di
1
2
𝑖
, … di ampiezza uguale alle probabilità 𝑝 𝑖
Nel caso di variabili casuali continue il valore della funzione di ripartizione in x è dato dalla misura
dell’area sottesa alla funzione di densità fino al punto x.
Se la variabile casuale è continua, la funzione di ripartizione è continua e varia fra zero e uno.
Il
casuale X.
e che
Nel caso di variabili casuali discrete il valore atteso è:
𝑖
𝑖
𝑖
Può essere interpretato come
Gode della seguente proprietà:
Se 𝒈(𝑿) = 𝒂𝑿 + 𝒃 allora 𝑬[𝒀] = 𝒂𝑬[𝑿] + 𝒃
La varianza è la media dei quadrati degli scarti. Per le variabili casuali discrete la varianza è data
da:
dalla somma di tutte le probabilità 𝑝 𝑖
diventa infinitamente grande.
valori assunti dalla variabile casuale e le altezze dei salti sono le probabilità corrispondenti
fornisce informazioni sulla posizione della variabile
il valore cui converge la media dei valori osservati in X quando N
Il valore atteso è la media della variabile casuale
è un indice di posizion
valore atteso
punti di discontinuità corrispondono ai