Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Probabilità e Statistica: Esercizi e Quiz, Sintesi del corso di Statistica

Sintesi di Manuale di statistica

Tipologia: Sintesi del corso

2023/2024

In vendita dal 24/06/2024

US-Summery
US-Summery 🇮🇹

4.1

(22)

937 documenti

1 / 52

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
D. Piccolo,
Manuale di statistica
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34

Anteprima parziale del testo

Scarica Probabilità e Statistica: Esercizi e Quiz e più Sintesi del corso in PDF di Statistica solo su Docsity!

D. Piccolo,

Manuale di statistica

obbiettivo della statistica è lo studio della popolazione

i può studiare tramite

deve essere uguale a n

la distribuzione di frequenza

Riassunti Statistica

Distribuzioni di frequenza

Informazione statistica e rilevazione dei dati

Informazione statistica = carattere statistico + unità statistica

Es: Fatturato = carattere Aziende = unità

I caratteri sono quantitativi (numeri reali o valori ) o qualitativi (non esprimibili numericamente)

Quantitativi = variabili statistiche qualitativi = mutabili

Le variabili si distinguono in continue o discrete

Discrete quelle che assumono valori in un insieme discreto (non posso sempre trovare un valore

tra altri due valori, come il numero di figli o il voto di un esame)

Continue quelle che possono assumere tutti valori in un intervallo continuo o illimitato

relative a un fenomeno di interesse costituisce la popolazione.

L’

La popolazione s

(rilevazione dei dati su tutte le unità statistiche)

(rilevazione solo su alcune unità statistiche).

Distribuzioni di frequenza

All’aumentare delle unità statistiche sulle quali viene osservato un carattere diventa sempre più

difficile interpretare quantità crescenti di dati.

di studio conviene utilizzare una

rappresentazione sintetica:

La frequenza assoluta si indica con n i

e sta a significare quante volte un carattere assume una

determinata modalità.

La sommatoria delle frequenze assolute (la popolazione)

k

𝑖

1

2

k

𝑖=

Dopo aver calcolato le frequenze è possibile creare una tabella.

Modalità

m i

Frequenza

n i

m 1

n 1

m 2

n 2

m k

n k

Per rendere più evidenti le caratteristiche del fenomeno

oppure tramite campionamen to

censimento

L’insieme di tutte le informazioni

L’istogramma

possiamo trovare un valore a cui corrisponde la massima frequenza o una classe

(o

Asimmetria negativa = coda a sinistra

Asimmetria positiva = coda a destra

Per costruirlo è necessario calcolare:

  1. L’ ampiezza A i

= x i

- x i- 1

  1. L’ altezza o densità h i

= f i

/A

i

  1. Il grafico dei rettangoli adiacenti aventi come basi le classi e come altezze le densità h i

è

Classi f i

A

i

h i

x 0

|- x 1

f 1

A

1

=x 1

  • x 0

h 1

= f 1

/A

1

X

1

|- x 2

f 2

A

2

=x 2

  • x 1

h 2

= f 1

/A

1

X

k- 1

|-x k

f k

A

k

=x k

  • x k- 1

h k

= f k

/ h k

Distribuzioni simmetriche e asimmetriche

La colonna dell’istogramma

delle distribuzioni di frequenza è la presenza o assenza di simmetria.

Nelle distribuzioni

a cui corrisponde la massima densità di frequenza.

se consideriamo le classi).

Quando la

classe modale

e (o della

classe mod.

Se le frequenze decrescono più rapidamente a destra o a sinistra del modale (o della classe

modale) la distribuzione è detta asimmetrica.

Diagramma stelo e foglia

Una rappresentazione alternativa alla suddivisione in classi è il diagramma stelo e foglia.

I dati vengono raggruppati nella stessa classe se hanno le cifre iniziali uguali.

O.

Presenta il vantaggio rispetto all’istogramma di conservare i valori all’interno della classe.

I dati (22,23,25,27,31,33,34,43,48) Sono rappresentati dal diagramma stelo e foglia:

foglie.

ossia la differenza tra gli estremi

Questo valore è detto modale

Un aspetto caratterizzante

più alta corrisponde alla classe con densità più alta.

frequenza decresce in modo simmetrico sia a destra che a sinistra del modal

ale) la distribuzione è simmetrica

gni riga è uno stelo

Le informazion i di ciascun dato sono le

e attraverso la distribuzione delle frequenze congiunte

Distribuzione congiunta di due caratteri

È utile studiare congiuntamente due fenomeni, in questo caso, informazioni sul legame esistente

fra i due caratteri si possono ottener.

La distribuzione delle frequenze congiunte

La

k ℎ

𝑖j

𝑖=1 j=

Per distinguerle dalle frequenze congiunte

carattere B considerati singolarmente sono definite marginali.

Per ciascuna modalità a 1

A o del

Indici di posizione

La media

delle modalità b j

si ottengono sommando le

e in quanto tale rappresentativo intorno al

della distribuzione.

Sia X una variabile statistica che assume n valori x1, x2, …, x n

, la media aritmetica è data da

𝑛

1 2

𝑛

𝑖

𝑖=

tabella di contingenza.

frequenze congiunte che si trovano sulla riga corrispondente.

somma di tutte le frequenze congiunte è pari a n

La media è un indice di posizione

Analogamente le frequenze marginali del carattere B

del carattere A , la frequenza marginale si ottiene sommando le

, le frequenze delle modalità del carattere

può essere utilmente rappresentata mediante una

frequenze congiunte che si trovano sulla colonna corrispondente

costituisce un valore

quale si distribuiscono le informazioni. È in grado di sintetizzare gli aspetti essenziali della

distribuzione andando a indicar e l’ordine di grandezza dei dati e fornendo informazioni sul centro

2

La media è quel valore che sostituito a ogni osservazione lascia invariata la somma, ossia

La media è quel valore che minimizza la somma dei quadrati degli scarti.

Proprietà 2:

Proprietà 3:

k

𝑖

𝑖

𝑖=

La somma degli scarti 𝑥̅ 𝑖

− 𝑥̅ della media è nulla.

k k k

𝑖

𝑖

𝑖

𝑖

𝑖

𝑖=1 𝑖=1 𝑖=

Proprietà 4:

k k

𝑖

2

𝑖

𝛼

𝑖

2

𝑖

La mediana

𝑖=1 𝑖=

(dimostrazione sul libro pagina 32)

La mediana è il valore centrale di una distribuzione , ossia quel valore che divide in due parti di

eguale numerosità i dati ordinat i.

Per calcolare la mediana è necessario: ordinare i valori, calcolare la profondità.

La profondità della mediana è uguale a:

Se n è dispari la profondità coincide con un numero intero, e allora la mediana è quel valore che

occupa la posizione data dalla profondità della mediana.

(

𝑛+

)

La mediana gode di tre proprietà.

La mediana è quel valore che minimizza la somma degli scarti in valore assoluto.

Se n

eccesso.

Esempio:

i allora la profondità è un numero non intero, di conseguenza la mediana è la

della mediana presa per intero e arrotondata per

(25)

(26)

La mediana è data dalla semisomma del venticinquesimo e del ventiseiesimo valore (disposti in

modo ordinato).

Proprietà della mediana

Proprietà 1:

Sia Y una trasformazione lineare di X, 𝑌 = 𝑎𝑋 + 𝑏. La mediana di Y è la trasformazione lineare

della mediana di X.

Proprietà 2:

Siano 𝑥̅ 1

2

𝑛

− 𝑚𝑒𝑑 gli scarti della mediana, allora il numero degli scarti

Proprietà 3:

𝑛 𝑛

𝑖

𝛼

𝑖

𝑖=1 𝑖=

La terza proprietà della mediana è analoga alla quarta della media.

L’indice ottimale per minimizzare la somma delle distanze (date dagli scarti in valore assoluto) è la

mediana.

la mediana non è sensibile alle osservazioni anomale.

positivi è uguale al numero degli scarti negativi.

La mediana si dice resistente rispetto alla presenza di valori anomali.

dalla profondità

A differenza della media

è par

semisomma dei valori ottenuti

limite inferiore

se si effettua una traslazione

la varianza rimane invariata.

2

√ 𝑠

2

In questo modo abbiamo ottenuto un indice di variabilità espresso mediante la medesima unità di

misura.

Se siamo in possesso delle frequenze relative f i

è possibile calcolare la varianza in modo ancora più

rapido.

k

(2)

𝑖

2

𝑖

𝑖=

2

(2)

2

È possibi

semisomma degli estremi).

e della classe (ottenuto dalla

Disuguaglianza di Chebyshev

Sia X una variabile statistica con una media 𝑥̅ e una varianza 𝑠

2

è possibile dimostrare che:

2

2

La disuguaglianza di Chebyshev fornisce un

assume valori intorno a 𝑥̅ , ciò significa che

, ma se aumenta la frequenza con la quale X

della variabile X intorno alla media presenta una maggiore dispersione.

Un’altra proprietà della varianza è che sia 𝑠

2

𝑋

la varianza di una variabile X, la varianza di una

trasformazione lineare 𝑌 = 𝑎𝑋 + 𝑏 è data da:

𝑌

2

2

𝑎𝑋+𝑏

2

2

𝑋

Infatti, dei dati aggiungendo a ciascuna osservazione una quantità 𝑏,

Quando i dati sono raggruppati in classi, non è possibile calcolare l’esatto valore della varianza.

media di semi-ampiezza 𝜀, con frequenza relativa almeno pari a 1 −

𝑠

2

Questa disuguaglianza mostra che una qualsiasi variabile X assume valori in un intorno della

per la frequenza.

questo limite

La varianza è indipendente dalla posizione

varianza diminuisce aumenta Quando la

le ottenere un valore approssimato mediante il valore central

la distribuzione è più concentrata intorno alla sua

media. Se invece la varianza aumenta , si riduce il limite inferiore , di conseguenza la distribuzione

grandezza dei dati

utilizzare il coefficiente di variazione

dividono i dati in quattro parti uguali: Q I quartili 1

Siccome la varianza e lo scarto quadratico medio dipendono dall’unità di misura e dall’ordine di

In questo modo possiamo confrontare fenomeni con un diverso ordine di grandezza.

La differenza interquartile è data da

Un altro indice di variabilità usato è il campo di variazione ( Range

, aggiungendo una costante la media 𝑥̅ passa a 𝑥̅ + 𝑏 gli scarti dalla media non sono

. La varianza definita come la media degli scarti della media al quadrato, e quindi in

funzione degli scarti, rimane la stessa.

La varianza è invece sensibile a cambiamenti della scala.

Se si altera l’unità di misura dei dati moltiplicandoli per una costante non nulla 𝑎 la varianza risulta

moltiplicata di conseguenza.

, quando un avariabile assume soltanto valori positivi, può essere conveniente

Differenza interquartile

La differenza interquartile misura la variabilità del 50% dei dati che si trovano al centro della

si lascia a sinistra il 25% dei dati, poi abbiamo la

mediana che divide la distribuzione in due parti uguali, e infine Q 3

che lascia alla sua sinistra il 75%

delle osservazioni.

Per calcolare i quartili, dopo aver ordinato i dati, è necessario calcolarne la profondità.

Un modo comodo per calcolarli è quello di trovare la mediana dallo 0% al 50% delle osservazioni

(Q

1

) e una seconda mediana dal 50% al 100% (Q 3

3

1

Fornisce indicazioni sulla variabilità della metà centrale dei dati (più è alto e più i dati sono

dispersi)

Questo valore è

(𝑛)

(1)

dato dalla differenza tra la massima e la minima osservazione.

distribuz ione

modificati

Quindi

Allora l’insieme 𝑺 di tutti i possibili risultati è definito come lo spazio

si definiscono con 𝜔 1

2

I grafici a torta consentono di visualizzare come la totalità di un fenomeno si ripartisce , in

In alternativa a questo grafico possiamo utilizzare un grafico a barre suddivise ch e mette in

Un grafico a dispersione è

Per quanto concerne la rappresentazione grafica, particolare rilievo, hanno i grafici a barre , a

I grafici a barre consentono di rappresentare con efficacia l’intensità con la quale un fenomeno

si manifesta rispetto alle altre unità statistiche.

, tra le sue componenti.

che consente di visualizzare due o

più fenomeni che si sono evoluti nel tempo ma attraverso barre adiacenti tra loro; cioè due o più

barre forniscono informazioni per due o più fenomeni.

i. Un

, nel quale ciascun punto rappresenta i valori di due variabili rilevanti sulla stessa unità

statistica.

a partire

Probabilità

Introduzione

Molte decisioni sono prese in condizioni di incertezza.

Il calcolo delle probabilità si può definire come “la logica del possibile o dell’incerto”

Il calcolo delle probabilità considera il problema di “misurare il grado di possibilità di una

proposizione” ovvero di assegnare alla proposizione una probabilità.

Esperimento casuale ed eventi

La nostra proposizione di interesse per il calcolo delle probabilità prende il nome di eventi casuali

o aleatori.

del mondo reale per il quale vi è più

manifestazione è associato uno stato di

I possibili risultati di un esperimento casuale

un esperimento casuale.

𝑛

i possibili risultati di

1

2

𝑛

torta e a dispersione.

campionario.

quantitativo

esperimento casuale o prova qualsiasi fenomeno Si definisce

Se i punti si dispongono in maniera casuale allora non c’è un ’associazione fra la due variabili

in alto a destra,allora il grafico ci suggerisce un’ associazione positiva

Se i punti si dispongono in modo crescente dall’angolo in basso a sinistra verso l’angolo

bivariati

valori di due variabil

Un’ altra rappresentazione grafica è il grafico a barre multiple

evidenza i mutamenti che un fenomeno subisce nel tempo o in diverse aree geografiche

percentuale

un grafico che utilizza le coordinate cartesiane per rappresentare i

grafico a dispersione è uno strumento sintetico p er rappresentare dati

di un risultato possibile e pertanto l’esito è certo.

Un esperimento casuale è un fenomeno alla cui

incertezza.

campionario 𝑆

. In particolar e, i sottoinsiemi di 𝑺 costituiti da singoli elementi

casuale. Gli eventi casuali possono essere rappresentati come sottoinsiemi dello spazio

evento impossibile

si verifica quando A e B si verificano contemporaneamente

oppure contemporaneamente A e B.

La negazione

o è possibile immaginare di ripetere innumerevoli volte l’esperimento casual

utile al fine di visualizzare gli eventi è il diagramma di Venn

prendono il nome di

eventi elementari.

La definizione frequentistica

frequenza relativa di A al divergere del numero di replicazioni dell’esperimento.

(improprio) lo stesso spazio campionario, allora 𝑆 prende il

sottoinsieme

un (∅)

Uno strumento molto.

Vi sono tre operazioni che

L’intersezione A ∩ B

intersezione

L’unione A ∪ B è

oppure a entrambi. Pertanto, l’

, pertanto l’evento

che appartengono soltanto ad A oppure soltanto a B

𝐴̅ ,dato un evento A in 𝑆, si indica con 𝐴̅ l’insieme complementare di A rispetto ad 𝑆.

Esso rappresenta quindi l’evento che si verifica quando A non si verifica.

Due eventi A e B contenuti in 𝑆, si dicono incompatibili se non possono verificarsi

A e B non hanno elementi in comune e la loro intersezione

è l’evento impossibile

Una formula utile per esprimere un evento A:

Questa equazione mostra come è possibile esprimere A come l’unione tra due eventi

incompatibili.

La probabilità

Si hanno due principali definizioni.

A livello teoric

Ogni volta è possibile numero k

i.

e.

il numero n

per il numero di replicazioni fatte. Possiamo quindi ottenere la frequenza relativa k/n che può

essere rappresentata in un piano cartesiano.

Secondo la definizione frequentistica

Un evento casuale è una proposizione non ambigua formulabile intorno a un esperimento

negazione.

intersezione, union

sipossono compiere utilizzando gli eventi: e e

contemporaneamente. In questo caso

la probabilità dell’evento A è il valore a cui converge la

per quante volte l’evento si è realizzato e

individuare il

eventi ripetibil

si applica ai così detti

unione si verifica quando si verifica soltanto A oppure soltanto B

costituita dagli elementi di 𝑆

è costituita dagli elementi comuni sia ad A che a B

prende il nome di

Se si considera un sottoinsieme che non contiene alcun elemento di 𝑆 , allora tale

nome di evento certo

Se si considera come sottoinsieme

l’informazione relativa al verificarsi di A non modifica la valutazione della probabilità

Se B è indipendente da A allora anche A è indipendente da B.

P(𝐴̅ ) =

Probabilità condizionata

p.

Siano A e B due eventi contenuti in 𝑆 e si supponga di disporre dell’informazione che B si è

verificato. La probabilità condizionata di A ,

Quando si calcola questa probabilità

Dall’equazione precedente è possibile ricavare:

  1. 𝑃(𝐴̅ ∩ 𝐵) = 𝑃(𝐵) 𝑃(𝐴̅ | 𝐵) oppure 𝑃(𝐴̅ ∩ 𝐵) = 𝑃(𝐴̅ )𝑃(𝐵 | 𝐴̅ )

𝑃

( 𝐴̅ ∩𝐵

)

𝑃(𝐴̅ | 𝐵)

d

assume quindi il

È importante distinguere quando parliamo di probabilità.

È possibile con l’ausilio della probabilità condizionata calcolare la probabilità di un evento A nel

seguente modo

Eventi indipendenti

Si considerino due eventi A e B contenuti in 𝑆 e tali che 𝑃(𝐴̅ ) > 0 e 𝑃(𝐵) > 0.

L’evento B è indipendente da A se

La probabilità condizionata di B dato A coincide con la probabilità non condizionata di B.

Pertanto,

di B.

ruolo di evento certo e rappresenta il nuovo insieme dei possibili risultati dell’esperimento

deve essere vero ,

(B)

l’evento condizionante

Ci sono circostanze in cui il verificarsi di un determinato evento modifica la valutazione della

robabilità di un altro evento, si parla perciò di probabilità condizionata

dato che si è verificato l’evento B , è data a

il tipo di estrazione

Si distingue tra estrazione in blocco (o senza rimessa) e con rimessa.

Quando l’estrazione avviene il blocco vi è dipendenza fra le prove e per il calcolo delle

probabilità è richiesto l’uso della probabilità condizionata

si distingue fra probabilità a priori ossia la probabilità

prima che un’informazio ne aggiuntiva sia disponibile, e probabilità a posteriori

𝑃(𝐵)

Si noti che la somma delle probabilità a posteriori è 1.

Teorema di Beyes

Il teorema di

Nel teorema di Beyes

di interesse

attribuita a un evento

ossia

P(A|B) è data da

𝑃(𝐴̅ ∩𝐵)

. Allora la probabilità a posteriori di A

Ora andando a sostituire al numeratore 𝑃

otteniamo:

Andando a sostituire al denominatore 𝑃(𝐵) = 𝑃(𝐴̅ )𝑃(𝐵 | 𝐴̅ ) + 𝑃(𝐴̅ )𝑃(𝐵 | 𝐴̅ ) otteniamo:

Considerate 𝑃(𝐵 | 𝐴̅ ) e 𝑃(𝐵 | 𝐴̅ ) verosimiglianze allora questa formula consente di calcolare le

probabilità a posteriori a partire dalle probabilità a priori e dalle verosimiglianze.

Probabilità congiunte

I concetti introdotti fino a questo punto possono essere utilizzati per studiare situazioni nelle quali

siamo interessati a due diversi caratteri statistici che possono essere osservati congiuntamente

come risultato di un’unica rilevazione.

Siano M e L due diversi caratteri statistici, relativi a un medesimo fenomeno oggetto di studio, che

assumono rispettivamente le modalità 𝑚 1

2,

k

e 𝑙 1

2

Si consideri un esperimento casuale i cui possibili risultati sono costituiti dalle coppie di modalità

𝑖

j

). Lo spazio campionario di questo esperimento è

1

1

2

2

k

Mentre 𝐸 11

1

1

kℎ

k

)} sono gli eventi elementari associati ai possibili

risultati dell’esperimento.

evento qualora si

da A Se però supponiamo che si sia verificato B dipendente

Considerando due eventi A e B la probabilità a priori di A è P(A)

la probabilità aggiornata in funzione della nuova informazione

rendano disponibili informazioni aggiuntive relative al verificarsi di un evento a esso collegato

Beyes fornisce una rego la per aggiornare la probabilità di un

necessariamente biunivoca.

probabilità che la variabile X assuma un valore al massimo uguale a x.

Questa è una variabile che

casuale.

La corrispondenza tra i risultati di un esperimento e i valori di una variabile casuale non è

In generale,

Le variabili casuali si distinguono in discrete e continue.

Variabili casuali discrete

Una variabile casuale discreta è definita quando è nota la sua funzione di probabilità ossia

l’insieme dei valori che essa può assumere con le rispettive probabilità.

Le probabilità 𝑝 𝑖

hanno le seguenti proprietà:

𝑖

𝑖

𝑖

Variabili casuali continue

Sia X una variabile casuale continua, allora a X è associata una funzione di densità.

La funzione di densità è così definita:

𝑏

𝑎

Una caratteristica interessante delle variabili casuali continue è che

assumono in un determinato istante è 0.

Cioè la probabilità che queste assumano un determinato valore x è data dall’area sottesa di f(x) su

Funzione di ripartizione

Sia X una variabile casuale (discreta o continua),

un intervallo di lunghezza nulla.

assume valori numerici dipendenti dal risultato di un esperimento

la probabilità che esse

la sua funzione di ripartizione F(x) esprime la

della variabile casuale possono corrispondere più risultati dell’esperimento

a ogni elemento di 𝑆deve corrispondere un solo valore, ma inversamente, a un valore

non superiori a 𝑥̅.

il valore della funzione di ripartizione nel punto x è dato

dei valori 𝑥̅ 𝑖

Questa funzione è definita per ogni valore reale di x, è una funzione non decrescente e assume

valori nell’intervallo [0,1].

Nel caso delle variabili casuali discrete

𝑖

𝑥̅ 𝑖

≤𝑥̅

Graficamente è una funzione a gradini, dove sono presenti dei salti in corrispondenza di

1

2

𝑖

, … di ampiezza uguale alle probabilità 𝑝 𝑖

. I

Nel caso di variabili casuali continue il valore della funzione di ripartizione in x è dato dalla misura

dell’area sottesa alla funzione di densità fino al punto x.

Se la variabile casuale è continua, la funzione di ripartizione è continua e varia fra zero e uno.

Valore atteso

Il

casuale X.

e che

Nel caso di variabili casuali discrete il valore atteso è:

𝜇 = 𝐸[𝑋] = ∑ 𝑥̅

𝑖

𝑖

𝑖

Può essere interpretato come

Gode della seguente proprietà:

Se 𝒈(𝑿) = 𝒂𝑿 + 𝒃 allora 𝑬[𝒀] = 𝒂𝑬[𝑿] + 𝒃

Varianza

La varianza è la media dei quadrati degli scarti. Per le variabili casuali discrete la varianza è data

da:

dalla somma di tutte le probabilità 𝑝 𝑖

diventa infinitamente grande.

valori assunti dalla variabile casuale e le altezze dei salti sono le probabilità corrispondenti

fornisce informazioni sulla posizione della variabile

il valore cui converge la media dei valori osservati in X quando N

Il valore atteso è la media della variabile casuale

è un indice di posizion

valore atteso

punti di discontinuità corrispondono ai