Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Appunti sulle variabili, Sbobinature di Statistica

Appunti completi sulle variabili, ideali per la prelazione dell’esame; comprendono sia il libro di testo “introduzione alla statistica” di Anna Clara Monti sia gli appunti delle lezioni.

Tipologia: Sbobinature

2022/2023

In vendita dal 28/06/2024

myriam-distilo
myriam-distilo 🇮🇹

10 documenti

1 / 25

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
VARIABILI CASUALI
In molte situazioni gli eventi, a partire da quelli elementari, hanno un’interpretazione di natura
numerica. In tali circostanze è utile introdurre la nozione di variabile casuale o variabile aleatoria, la
quale stabilisce una corrispondenza tra i risultati dell’esperimento e i numeri reali.
Dato uno spazio campione S, una variabile casuale è una funzione che associa a ogni possibile evento
elementare in S un numero reale. (una variabile casuale può associare a eventi elementari diversi lo
stesso numero reale -> corrispondenza non necessariamente biunivoca)
Per convenzione le variabili casuali si indicano con la lettera maiuscola, mentre i valori che esse
assumono si indicano con la lettera minuscola.
ESEMPIO: lancio di un dado e osservazione del numero di puntini sulla faccia superiore
S = {1, 2, 3, 4, 5, 6}
Eventi elementari: E1 = {1}, E2 = {2}, E3 = {3}, …, E6 = {6}
P(1) = P(2) = P(3) = P(4) = P(5) = P(6) = 1/6
Se il dado dà sulla faccia superiore il risultato 1, 2 o 3, allora si ricevono 10 euro; se il dado dà sulla
faccia superiore il risultato 4 allora non si riceve nulla; se il dado dà sulla faccia superiore il risultato
5 o 6 allora si danno 5 euro.
In questo esperimento la variabile casuale X
esprime il numero di puntini risultati nel lancio del
dado. Essa assume valore x1=1 quando si verifica
E1, assume valore x2=2 quando si verifica E2, e
così via fino al valore x6=6 che si ha quando si
verifica E6.
Il guadagno, ossia la conseguenza numerica, può essere quindi uguale a -5, 0, 10, e può essere
considerato una funzione del lancio del dado.
Con quale probabilità il guadagno è uguale a -5?
Prob (guadagno uguale a -5)
= prob (il dado come risultato 5 o 6)
= P (5) + P (6) = 2/6
Con quale probabilità il guadagno è uguale a 10?
P (1) + P (2) + P (3) = 3/6
Con quale probabilità il guadagno è nullo?
P (4) = 1/6
RISULATO
PROB
CONSEGUENZA
NUMERICA
1
1/6
10
2
1/6
10
3
1/6
10
4
1/6
0
5
1/6
-5
6
1/6
-5
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19

Anteprima parziale del testo

Scarica Appunti sulle variabili e più Sbobinature in PDF di Statistica solo su Docsity!

VARIABILI CASUALI

In molte situazioni gli eventi, a partire da quelli elementari, hanno un’interpretazione di natura

numerica. In tali circostanze è utile introdurre la nozione di variabile casuale o variabile aleatoria, la

quale stabilisce una corrispondenza tra i risultati dell’esperimento e i numeri reali.

Dato uno spazio campione S, una variabile casuale è una funzione che associa a ogni possibile evento

elementare in S un numero reale. (una variabile casuale può associare a eventi elementari diversi lo

stesso numero reale - > corrispondenza non necessariamente biunivoca)

Per convenzione le variabili casuali si indicano con la lettera maiuscola, mentre i valori che esse

assumono si indicano con la lettera minuscola.

ESEMPIO: lancio di un dado e osservazione del numero di puntini sulla faccia superiore

S = {1, 2, 3, 4, 5, 6}

Eventi elementari: E 1

= {1}, E

2

= { 2 }, E

3

= { 3 }, …, E

6

P(1) = P(2) = P(3) = P(4) = P(5) = P(6) = 1/

Se il dado dà sulla faccia superiore il risultato 1, 2 o 3, allora si ricevono 10 euro; se il dado dà sulla

faccia superiore il risultato 4 allora non si riceve nulla; se il dado dà sulla faccia superiore il risultato

5 o 6 allora si danno 5 euro.

In questo esperimento la variabile casuale X

esprime il numero di puntini risultati nel lancio del

dado. Essa assume valore x 1

=1 quando si verifica

E

1

, assume valore x 2

= 2 quando si verifica E 2

, e

così via fino al valore x 6

= 6 che si ha quando si

verifica E 6

Il guadagno, ossia la conseguenza numerica, può essere quindi uguale a - 5, 0, 10, e può essere

considerato una funzione del lancio del dado.

Con quale probabilità il guadagno è uguale a - 5?

Prob (guadagno uguale a - 5)

= prob (il dado dà come risultato 5 o 6)

= P (5) + P (6) = 2/

Con quale probabilità il guadagno è uguale a 10?

P ( 1 ) + P ( 2 ) + P ( 3 ) = 3 /

Con quale probabilità il guadagno è nullo?

P ( 4 ) = 1 /

RISULATO PROB CONSEGUENZA

NUMERICA

Da ciò si evince che:

considerato lo spazio campione S= {e1, e2, e3, e4, e5, e6} e una variabile casuale X, la probabilità che

X assuma il valore x i

, ossia P (X = x i

), è uguale alla somma delle probabilità degli eventi elementari

per cui la variabile casuale assume il valore x i

Le variabili casuali si distinguono in discrete e continue.

Una variabile casuale è discreta se assume un numero finito {x 1

, x 2

, …, x n

} o infinito numerabile

{x 1

, x 2

, …, x i

, …} di valori. La distribuzione di probabilità di una variabile casuale discreta è data

dall’insieme di valori che la variabile casuale può assumere ciascuno con la sua rispettiva

probabilità.

Le probabilità P i

, ciascuna uguale a P i

= P (X = x i

), hanno due

proprietà:

• P

i

≥ 0, per qualunque i;

𝑖

𝑛

𝑖= 1

Una variabile casuale è continua se assume tutti valori che costituiscono un’infinità continua

(tipicamente valori che formano una semiretta o l’intera retta reale).

In questo caso a X è associata una funzione di densità ( di probabilità ) 𝑓

tale che la probabilità

P (a ≤ X ≤ b), ossia la probabilità con cui una certa una variabile casuale continua X assuma un

determinato valore x in un dato intervallo (a, b), è data dalla misura dell’area sottesa a 𝑓

sull’intervallo (a, b):

P (a ≤ X ≤ b) = ∫

𝑏

𝑎

L’integrale rappresenta infatti la somma nel continuo.

La funzione di densità ha due proprietà:

≥ 0, per qualunque x;

+∞

−∞

= 1 (poiché la variabile casuale X assume sicuramente valori per qualunque

numero reale.)

Una caratteristica delle variabili casuali continue è che la probabilità che assumano un determinato

valore x è nulla, ossia P(X = x) = 0; infatti la probabilità che assumano un singolo valore x è data

dall’area sottesa a 𝑓

su un intervallo di lunghezza nulla, e, di conseguenza, tale area vale 0.

X (valori che X

può assumere)

Probabilità

x 1

P

1

x 2

P

2

x n

P

n

FUNZIONE DI RIPARTIZIONE

Consideriamo una variabile aleatoria X (discreta o continua), la funzione di ripartizione F(x) esprime

la probabilità che X assuma un valore al massimo pari a x:

𝐹(𝑥) = P (X ≤ x)

Essa è definita per ogni valore reale di x.

PROPRIETÀ

Essendo una probabilità, la funzione di ripartizione assume valori nell’intervallo

[

]

0 ≤ F(x) ≤ 1, per qualsiasi x reale.

È una funzione monotona non decrescente, pertanto se x 0

< x 1

si ha F(x 0

) ≤ F(x 1

lim

𝑥→−∞

𝐹(𝑥) = P (X ≤ x) = 0

lim

𝑥→+∞

𝐹(𝑥) = P (X ≤ x) = 1

In caso di variabili casuali discrete, il valore della funzione di ripartizione nel punto x è dato dalla

somma di tutte le probabilità P i

dei valori x i

, che la variabile X assume, < x (probabilità cumulate).

𝑖

𝑥

𝑖

<𝑥

  • La funzione di ripartizione rappresenta la probabilità che compete alla semiretta (−∞, 𝑥

]

; essa

dipende quindi dall’estremo superiore di tale insieme e può quindi essere letta come “funzione di

x”.

ESEMPIO

𝑖

𝑖

𝑖

𝑖

x i

P

i

La funzione di ripartizione delle variabili casuali discrete si rappresenta graficamente come una

funzione a gradini, con dei salti in corrispondenza di x 1

, x 2

, …, x i

, …, di ampiezza uguale alla

probabilità P i

. La funzione di ripartizione è invece costante per valori di x compresi tra x i- 1

e x i

Nel caso di variabili casuali continue invece, il valore della funzione di ripartizione in x è dato dalla

misura dell’area sottesa alla funzione di densità fino al punto x:

𝑥

−∞

Si tratta quindi di una funzione continua che varia tra 0 e 1.

  • La probabilità che una variabile casuale X, discreta o continua, assuma valori in un intervallo (𝑎, 𝑏]

può essere calcolata come differenza tra il valore che la funzione di ripartizione assume

nell’estremo superiore dell’intervallo e quello che assume nell’estremo inferiore, cioè:

P (a ≤ X ≤ b) = 𝐹

Data una variabile casuale continua X con funzione di densità 𝑓

, il suo valore atteso è definito

come:

E

[

]

= μ = ∫

+∞

−∞

ESEMPIO

Calcoliamo E

[

]

+∞

−∞

0

−∞

1

0

+∞

1

1

0

[

𝑥

2

2

] (da 0 a 1 )

1

2

VARIANZA

Nella statistica descrittiva la dispersione di un insieme di dati rispetto alla media è misurata dalla

varianza, ossia dalla media dei quadrati degli scarti dalla media aritmetica; lo stesso approccio è

utilizzato nel calcolo delle probabilità per misurare la dispersione di una variabile casuale rispetto al

suo valore atteso.

Sia X una variabile casuale con media μ, la varianza, indicata con Var (X) oppure σ

2

, è data dal valore

atteso del quadrato degli scarti di X dalla sua media:

Var (X) = σ

2

= E

[

2

]

Essa è appunto un indice di dispersione di X intorno alla media.

(al posto delle frequenze relative si utilizzano le probabilità, che come le prime sono numeri sempre

compresi tra 0 e 1 la cui somma è sempre 1, mentre al posto della media aritmetica vi è il valore atteso)

Per le variabili casuali discrete la varianza è data da:

Var (X) = σ

2

𝑖

2

𝑖 𝑖

In caso di variabili casuali continue, con funzione di densità 𝑓

, la varianza è data da:

Var (X) = σ

2

2

+∞

−∞

La radice quadrata della varianza, ossia σ = √

σ 2 , è lo scarto quadratico medio di X, che solitamente

risulta un indice di variabilità più conveniente da utilizzare perché è espresso nella stessa unità di

misura di X

PROPRIETÀ

σ

2

σ

2

= 0 solo se la variabile è “costante”, ossia se assume un unico valore con probabilità 1.

La varianza è anche uguale alla differenza tra il valore atteso del quadrato e il quadrato del valore

atteso, ossia Var (X) = σ

2

= E[X

2

] – μ

2

  • dimostrazione

La disuguaglianza di Chebyshev, per una qualsiasi variabile casuale X, afferma che

P (|X – μ| < ԑ) ≥ 1 –

𝜎

2

ԑ

2

per qualunque ԑ > 0

ossia che la probabilità che la variabile casuale X assuma valori intorno al suo valore atteso, entro

un certo intervallo di semi-ampiezza ԑ, è almeno pari a 1 –

𝜎

2

ԑ

2

Vale anche che

P (|X – μ| > ԑ) ≤ 1 –

𝜎

2

ԑ

2

ossia la probabilità che la variabile casuale X devii dal suo valore atteso, di un certo valore

maggiore di ԑ, ma al massimo pari a 1 –

𝜎

2

ԑ

2

VARIABILI CASUALI DOPPIE O BIVARIATE

Quando l’interesse riguarda le due caratteristiche che si manifestano congiuntamente sulla stessa unità

statistica, un’adeguata rappresentazione dell’esperimento può essere ottenuta mediante una variabile

casuale doppia o bivariata.

ESEMPIO: lancio del dado e osservazione del numero di puntini sulla faccia superiore.

S = {1, 2, 3, 4, 5, 6}

P(1) = P(2) = P(3) = P(4) = P(5) = P(6) = 1/

  • Gioco 1. Se il risultato è un numero di puntini pari chi lancia dà 1 € all’individuo A; se il risultato

è un numero di puntini dispari, chi lancia riceve 1 € dall’individuo A.

  • Gioco 2. Se il risultato è un numero di puntini da 1 a 3 chi lancia riceve 1 € dall’individuo B; se il

risultato è un numero di puntini da 4 a 6 chi lancia non dà né riceve nulla.

Indichiamo con X la quantità di euro che chi lancia riceve dall’individuo A, e indichiamo con Y la

quantità di euro che chi lancia riceve dall’individuo B:

RISULTATI PROBABILITÀ X Y

Dunque, dato un esperimento casuale (in questo caso il lancio del dado) una variabile casuale doppia

o bivariata (X, Y) è definita associando ad ogni risultato dell’esperimento una coppia di numeri reali

(x, y).

Le variabili X e Y che costituiscono la variabile casuale doppia (X, Y) sono definite marginali. Inoltre,

se entrambe le variabili marginali sono discrete, ossia assumono un numero finito o infinito numerabile

di valori, la variabile casuale doppia è anch’essa discreta, mentre se entrambe le variabili marginali

sono continue, ossia assumono un’infinità continua di valori, si ha una variabile casuale doppia

continua (solo raramente si incontrano variabili casuali doppie delle quali una componente è discreta

e l’altra è continua).

PROBABILITÀ CONIUNTE E MARGINALI

Sia (X, Y) una variabile casuale doppia discreta e si supponga, per semplicità, che sia X sia Y assumano

un numero finito di valori; poiché X assume valori x 1

, x 2

, …, x k

e Y assume valori y 1

, y 2

, …, y h

, la

variabile casuale doppia (X, Y) assume valore (x i

, y j

) quando si verificano contemporaneamente gli

eventi X = x i

e Y = y j.

A ogni coppia di valori (x i

, y j

), per i = 1…k e j = 1…h, è inoltre associata a una probabilità congiunta :

P

ij

= P[

𝑖

𝑗

)]

ossia P (X, Y) = P (X = x i

, Y = y j

ESEMPIO (precedente)

P (X = - 1 , Y = 0 ) = 2/

P (X = 1 , Y = 1 ) = 2/

P (X = 1 , Y = 0 ) = 1/

Le probabilità congiunte soddisfano due condizioni:

P

ij

≥ 0, per i = 1…k e j = 1…h (in coerenza con il primo postulato della probabilità).

𝑖𝑗

𝑗= 1

𝑘

𝑖= 1

= 1; infatti, le coppie di valori (x i

, y j

) sono eventi necessari, quindi che la variabile

casuale (X, Y) assuma una qualsiasi coppia di questi valori è l’evento certo, e sono incompatibili,

quindi soltanto una coppia di valori (x i

, y j

) può verificarsi, e, pertanto, la somma delle loro

probabilità deve essere 1.

Come si è detto X, detta variabile casuale marginale, assume valori x 1

, x 2

, …, x k

, dunque, l’evento

X=x i

si verifica quando si verifica la coppia di valori (x i

, y 1

) oppure la coppia (x i

, y 2

) oppure la coppia

(x i

, y 3

), …, oppure la coppia (x i

, y h

). Trattandosi di eventi incompatibili, la probabilità marginale

P(X=x i

) è data da:

P (X = x i

) = P

[(

𝑖

1

]

+ ⋯ + P

[(

𝑖

]

oppure P (X = x i

, Y = y 1

) + P (X = x i

, Y = y 2

) + … + P (X = x i

, Y = y h

Questo è anche uguale a: P i

+ P

i

+ … + P

ih

= P

i*

𝑖𝑗

𝑗= 1

Analogamente la probabilità marginale P (X = y j

) = Pj* =

𝑖𝑗

𝑘

𝑖= 1

Anche le probabilità marginali soddisfano due condizioni:

Pi* ≥ 0, per i = 1…k, e Pj* ≥ 0, per j = 1…h (in coerenza con il primo postulato della probabilità).

𝑖

𝑗

𝑗= 1

𝑘

𝑖= 1

= 1 , ossia la loro somma è pari a 1.

PROBABILITÀ CONDIZIONATA

Anche in questo caso il valore assunto da una delle due variabili influenza la probabilità con la quale

l’altra variabile assume i diversi valori; si parla quindi di probabilità condizionata.

In generale la probabilità condizionata di X dato Y = y j

, ossia X|Y = y j

, è data da:

P (X = x i

| Y = y j

𝑃[(𝑋= 𝑥

𝑖

)∩(𝑌= 𝑦

𝑗

)]

𝑃(𝑌= 𝑦

𝑗

)

𝑃

𝑖𝑗

𝑃

∗𝑗

per i = 1 … k

è quindi uguale al rapporto tra la probabilità congiunta e la probabilità marginale dell’evento

condizionante, ossia del valore rispetto a cui si condiziona.

Analogamente la probabilità condizionata di Y dato X = x i

, ossia Y|X = x i

, è data da:

P (Y = y j

| X = x i

𝑃[(𝑋= 𝑥

𝑖

)∩(𝑌= 𝑦

𝑗

)]

𝑃(𝑋= 𝑥

𝑖

)

𝑃

𝑖𝑗

𝑃

𝑖∗

per j = 1 … h

le probabilità condizionate non sono mai negative e la loro somma è sempre pari a 1.

In generale una distribuzione di probabilità condizionata di X dato Y = y j

, ad esempio, si costruisce

elencando i valori di x (x 1

, x 2

, …, x k

) ciascuno con la rispettiva probabilità condizionata dato Y = y j

Si noti che a variare è solo la probabilità di x, mentre il valore rispetto al quale x è condizionato viene

fissato.

ESEMPIO (precedente): distribuzione di probabilità condizionata di Y dato X = 0

Y P(Y|X=0)

Anche per le distribuzioni condizionate è possibile calcolare il valore atteso e la varianza.

Il valore atteso condizionato della variabile casuale Y dato X = x i

è uguale a:

E [Y | X = x i

] =

𝑗

𝑗= 1

P(Y = 𝑦

𝑗

| X = 𝑥

𝑖

𝑗

𝑗= 1

𝑃

𝑖𝑗

𝑃

𝑖∗

Il valore atteso condizionato della variabile casuale X dato Y = y j

è uguale a:

E [X | Y = y j

] =

𝑖

𝑘

𝑖= 1

P

X = 𝑥

𝑖

Y = 𝑦

𝑗

𝑖

𝑘

𝑖= 1

𝑃

𝑖𝑗

𝑃

∗𝑗

ESEMPIO (precedente)

E [Y | X = x i

] = 1* P(Y = 1 | X = 0 ) + 2* P(Y = 2 | X = 0 ) + 3* P(Y = 3 | X = 0 )

Il valore atteso di una distribuzione condizionata di Y dato X = 0, in questo caso, è uguale alla

somma dei valori di Y ciascuno moltiplicato per la sua probabilità condizionata a X = 0.

La varianza condizionata della variabile casuale Y dato X = x i

è uguale a:

Var (Y | X = x i

𝑗

− E [Y | X = 𝑥

𝑖

])

ℎ 2

𝑗= 1

P(Y = 𝑦

𝑗

| X = 𝑥

𝑖

𝑗

− E [Y | X = 𝑥

𝑖

])

ℎ 2

𝑗= 1

𝑃

𝑖𝑗

𝑃

𝑖∗

La varianza condizionata della variabile casuale X dato Y = y j

è uguale a:

Var (X | Y = y j

𝑖

− E [X | Y = 𝑦

𝑗

])

𝑘 2

𝑖= 1

P

X = 𝑥

𝑖

Y = 𝑦

𝑗

𝑖

− E [X | Y = 𝑦

𝑗

])

2

𝑘

𝑖= 1

𝑃

𝑖𝑗

𝑃

∗𝑗

INDIPENDENZA DELLE COMPONENTI DI UNA VARIABILE CASUALE DOPPIA

Date due variabili casuali X e Y, componenti di una variabile casuale doppia (X, Y), queste si

definiscono indipendenti se la probabilità congiunta è uguale al prodotto delle probabilità marginali di

X e Y; dunque se X assume valori x 1

, x 2

, …, x k

e Y assume valori y 1

, y 2

, …, y h

, e se

P

ij

= P

X = 𝑥

𝑖

| Y = 𝑦

𝑗

), P

i*

= P(X = x i

) e P *j

= P (Y = y j

), X e Y sono indipendenti se:

P

ij

= P

i*

* P

*j

per qualunque i e j

In termini di probabilità condizionata affermare che X e Y sono indipendenti significa che la probabilità

condizionata di X dato Y = y j

è uguale alla probabilità marginale di X, così come la probabilità

condizionata di Y dato X = x i

è uguale alla probabilità marginale di Y:

P (X = x i

| Y = y j

𝑃

[ (𝑋= 𝑥

𝑖

)∩(𝑌= 𝑦

𝑗

)

]

𝑃(𝑌= 𝑦

𝑗

)

  • essendo X e Y indipendenti tale probabilità diventa

P (X = x i

| Y = y j

𝑃

( 𝑋= 𝑥

𝑖

) 𝑃(𝑌= 𝑦

𝑗

)

𝑃(𝑌= 𝑦

𝑗

)

= P (X = x

i

Date due variabili casuali X e Y, la covarianza fra le trasformazioni lineari a X + b e c Y + d è

data da:

Cov(aX+b, cY+d) = acCov(X, Y)

Si noti che b e d non compaiono più poiché non hanno alcuna influenza.

Se X e Y sono indipendenti la covarianza è nulla. + dimostrazione

Disuguaglianza di Cauchy-Schwarz (individua il campo di variazione della covarianza):

  • σ

x

y

xy

x

y

Ciò significa che la covarianza tra due variabili casuali X e Y è al massimo uguale al prodotto degli

scarti quadratici medi.

COEFFICIENTE DI CORRELAZIONE

Un indice dell’intensità del legame lineare tra due variabili X e Y è il coefficiente di correlazione,

indicato con ρ xy

oppure con Corr(X, Y); esso è dato dal rapporto tra la covarianza e il prodotto degli

scarti quadratici medi delle due variabili:

Corr(X, Y) = ρ xy

𝜎

𝑥𝑦

𝜎

𝑥

𝜎

𝑦

PRORIETÀ

Il coefficiente di correlazione ha sempre lo stesso segno della covarianza.

Se il coefficiente di correlazione è maggiore di zero, ρ xy

0, significa che quando una delle due

variabili tende a crescere tende a crescere anche l’altra e viceversa; le due variabili si muovono

quindi nella stessa direzione. Al contrario se il coefficiente di correlazione è minore di zero, ρ xy

0, significa che le due variabili si muovono in direzioni opposte, quindi se una cresce l’altra tende

a decrescere e viceversa.

Il coefficiente di correlazione assume valori nell’intervallo

[

]

  • 1 ≤ ρ xy

questa proprietà ha un’immediata conseguenza della disuguaglianza di Cauchy-Schwarz.

ρ xy

è uguale a - 1 (quindi è minimo) quando è minima la covarianza:

ρ xy

𝑚𝑖𝑛𝑖𝑚𝑜 𝑑𝑒𝑙𝑙𝑎 𝑐𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎

𝜎

𝑥

𝜎

𝑦

xy

−𝜎

𝑥

𝜎

𝑦

𝜎

𝑥

𝜎

𝑦

ρ xy

è uguale a 1 (quindi è massimo) quando è massima la covarianza:

ρ xy

𝑚𝑎𝑠𝑠𝑖𝑚𝑜 𝑑𝑒𝑙𝑙𝑎 𝑐𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎

𝜎

𝑥

𝜎

𝑦

xy

𝜎

𝑥

𝜎

𝑦

𝜎

𝑥

𝜎

𝑦

Il valore assoluto del coefficiente di correlazione è uguale 1, |ρ xy

| = 1, quando tra la X e la Y

esiste un perfetto legame lineare:

Y=aX + b - > |ρ xy

Ciò significa che |ρ xy

| = 1 solo quando una delle due variabili casuali è funzione lineare crescente

dell’altra e viceversa; allo stesso modo è uguale a |ρ xy

| = - 1 solo quando una delle due variabili

casuali è funzione lineare decrescente dell’altra e viceversa. In altri termini quanto più il valore di

ρ xy

è prossimo 1 o a - 1 tanto più la distribuzione doppia si concentra intorno ad una retta.

L’inclinazione della retta, positiva o negativa, è indicata dal segno di ρ xy

. Viceversa quanto più ρ xy

si avvicina allo 0 , tanto più è debole l’intensità del legame lineare; quando ρ xy

= 0 non vi è il legame

lineare.

Se le variabili X e Y sono indipendenti, la covarianza tra X e Y vale zero, ossia σ xy

= 0, e di

conseguenza anche il coefficiente di correlazione è nullo, ossia ρ xy

= 0. Il viceversa tuttavia è falso,

ossia se ρ xy

= 0 non necessariamente X e Y sono indipendenti; può infatti accadere che ρ xy

sia nullo

e X e Y abbiano un legame di tipo non lineare.

Il coefficiente di correlazione è invariante , a meno del segno, rispetto alle trasformazioni lineari,

cioè:

Corr(aX + b, cY + d) = ± ρ xy

Il segno è + se ac > , mentre il segno è – se ac < 0.

ESEMPIO - > X e Y non sono indipendenti

X\Y 1 2 3

𝑥

= 10.13 + 20.34 + 3*0.53 = 2.40 σ x

𝑦

= 10.17 + 20.33 + 3*0.40 = 2.33 σ y

𝑥𝑦

Cov(X, Y) = 5.34 * (2.40*2.33) = 0.

ρ xy

CASI SPECIALI

  1. Se a 1

= a 2

= … = a n

= a (coefficienti tutti uguali)

[

1

1

2

2

𝑛

𝑛

]

1

2

𝑛

1

1

2

2

𝑛

𝑛

2

1

2

2

2

𝑛

2

  1. Se a 1

= a 2

= … = a n

= a, μ 1

= μ 2

= … = μ n

= μ e 𝜎

1

2

2

2

𝑛

2

2

(tutte le variabili casuali

hanno lo stesso valore atteso e la stessa varianza)

𝐸[𝑎

1

1

2

2

𝑛

𝑛

] = 𝑎(𝜇 + 𝜇 + ⋯ + 𝜇) - > n volte = 𝑎𝑛𝜇

1

1

2

2

𝑛

𝑛

2

2

2

2

  • n volte = 𝑎

2

2

Se in aggiunta a = 1

𝐸[𝑎

1

1

2

2

𝑛

𝑛

] = 𝑛𝜇

1

1

2

2

𝑛

𝑛

2

MODELLI PER VARIABILI CASUALI DISCRETE

VARIABILE CASUALE DI BERNOULLI

Si consideri un esperimento dicotomico con due soli risultati possibili del tipo “successo” o

“insuccesso” e sia π la probabilità di successo , dove 0 ≤ π ≤ 1. La variabile casuale di Bernoulli X

assume valore 1 quando si verifica un successo e 0 quando si verifica un insuccesso, di conseguenza

la sua distribuzione di probabilità dipende dal parametro π, e sarà:

P(X = 0) = 1-π, P(X = 1) = π

In forma compatta la probabilità della variabile X si può scrivere come:

𝑥

1 −𝑥

con x = 0 oppure x = 1

Per indicare una variabile casuale di Bernoulli si utilizza la notazione X ~ Ber(π).

Il valore atteso della variabile casuale di Bernoulli coincide con la probabilità di successo π, infatti:

[

)]

= 01-π + 1π = 0 + π

La varianza invece è data da:

[(

2

)]

[

]

2

2

= π(1-π)

[(

2

)]

2

2

∗ 𝜋 = π

VARIABILE CASUALE DI BINOMIALE

Si consideri un esperimento dicotomico e si supponga di eseguire n prove indipendenti, in modo tale

che la probabilità di successo sia costante e pari a π. La variabile casuale X che descrive il numero di

successi nelle n prove ha una distribuzione binomiale indicata con X ~ B(n, π), dove n e π sono definiti

parametri.

La variabile casuale binomiale è una variabile casuale discreta che assume valori interni tra 0 e n, con

probabilità:

𝑥

𝑛−𝑥

𝑥

𝑛−𝑥

Per definizione 0! = 1

P(X=1) = (

𝑛

1

1

𝑛− 1

𝑛− 1

P(X= 0 ) = (

𝑛

0

0

𝑛− 0

𝑛

𝑛