Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Distribuzioni di Probabilità e Variabili Aleatorie Continue - Statistica D-L, Appunti di Statistica

Variabili aleatorie e distribuzioni aleatorie continue

Tipologia: Appunti

2017/2018

Caricato il 26/06/2018

leonardo-izzo
leonardo-izzo 🇮🇹

4.6

(7)

28 documenti

1 / 16

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Statistica D-L
Corso di Laurea in Economia Aziendale
Corso di Laurea in Economia e Commercio
Università di Firenze
a.a. 2017-18
Bruno Bertaccini
Emanuela Dreassi
Capitolo 6
Distribuzioni di Probabilità e
Variabili Aleatorie Continue
1 2
Distribuzioni di probabilità continue
Una variabile aleatoria continua è una variabile che può
assumere qualunque valore in un intervallo
spessore di un oggetto
tempo necessario per completare un lavoro
temperatura di una soluzione
altezza di una persona
Queste variabili possono potenzialmente assumere
qualunque valore
Strumento di misura di precisione finita l’insieme dei
possibili valori è finito
Es. X= lunghezza di un cilindro
Se il metro misura fino ai centimetri (…, 19 cm, 20 cm, …)
Se il metro misura fino ai millimetri (…, 19.8 cm, 19.9 cm,
20.0 cm, 20.1 cm, 20.2 cm,…)
3
Funzione di densità di probabilità
Supponiamo di assegnare una probabilità piccola quanto si
vuole, ma non nulla, ad ognuno dei punti di un insieme con
la cardinalità del continuo (es. l’intervallo [0,1] dei numeri
reali)
la somma delle probabilità sarebbe infinita e quindi non potrebbe
soddisfare il requisito di essere pari a 1 per l’evento certo
Soluzione: assegnare la probabilità agli intervalli
Come? Con una funzione di densità di probabilità f ( )
()()
b
a
Pa X b f xdx
4
La probabilità come area
abx
f(x)
L’area ombreggiata sottesa alla curva è la
probabilità che X assuma valori fra ae b
La probabilità di un singolo valore è zero:
()
()
()
()
PX
P
b
b
b
a
aX
PXa
XabP




()0PX x
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Anteprima parziale del testo

Scarica Distribuzioni di Probabilità e Variabili Aleatorie Continue - Statistica D-L e più Appunti in PDF di Statistica solo su Docsity!

Statistica D-L

Corso di Laurea in Economia AziendaleCorso di Laurea in Economia e Commercio

Università di Firenzea.a. 2017-

Bruno BertacciniEmanuela Dreassi

Capitolo 6

Distribuzioni di Probabilità eVariabili Aleatorie Continue

1

2

Distribuzioni di probabilità continue ^ Una variabile aleatoria continua è una variabile che puòassumere qualunque valore in un intervallo^ ^ spessore di un oggetto^ ^ tempo necessario per completare un lavoro^ ^ temperatura di una soluzione^ ^ altezza di una persona ^ Queste variabili possono potenzialmente assumerequalunque valore ^ Strumento di misura di precisione finita

^ l’insieme dei

possibili valori è finito^ ^ Es. X= lunghezza di un cilindro^ ^ Se il metro misura fino ai centimetri

^ (…, 19 cm, 20 cm, …)

^ Se il metro misura fino ai millimetri

^ (…, 19.8 cm, 19.9 cm,

20.0 cm, 20.1 cm, 20.2 cm,…)

3

Funzione di densità di probabilità ^ Supponiamo di assegnare una probabilità piccola quanto sivuole, ma non nulla, ad ognuno dei punti di un insieme conla cardinalità del continuo (es. l’intervallo [0,1] dei numerireali)^ ^ la somma delle probabilità sarebbe infinita e quindi non potrebbesoddisfare il requisito di essere pari a 1 per l’evento certo ^ Soluzione: assegnare la probabilità agli intervalli ^ Come? Con una

funzione di densità di probabilità

f^ ( )

(^
)^
b ( ) a
P a^
X^ b^
f^ x dx
^ 

^ 

4

La probabilità come area

a^ b^

x

L’area ombreggiata sottesa alla curva è laprobabilità che X assuma valori fra f(x)

a^ e^ b

La probabilità di un singolo valore è zero:

(^
(^
(^

(^

)

P^
X
P
b b b

Xa a a X P Xa b P ^

^ 
^
^ 
^

^  ^  (^

)^0 P X^

x  

5

Proprietà della funzione di densità^ La^ funzione di densità di probabilità

,^ f ( x ), di una

variabile aleatoria X ha le seguenti proprietà:1. f ( x )^ ^

0 per qualunque numero reale

x

2.^ L’area sottesa alla funzione di densità di probabilità

f ( x )

su tutto l’asse dei reali vale 1:

( )^

 f^ x dx 

Si chiama

supporto della v.a. X

il sottoinsieme dei reali

per cui la densità è positiva

(^ gli integrali possono essere

calcolati sul solo supporto senza alterare il risultato)

Funzione di densità: esempi^ Distribuzionenormale^ Supporto: (

,^ )

Distribuzioneuniforme Supporto:

[ a , b ]

Distribuzioneesponenziale Supporto: (

,^ )

7

La funzione di ripartizione ^ La^ Funzione di ripartizione

(o^ Cumulata

), F(x^0

), di una

variabile aleatoria continua X esprime la probabilità che Xnon superi il valore x

0

0

0

0

(^ )^

(^

)^ x ( )

F x^

P X^

x^

f^ x dx 

^

^

^  area sottesa allafunzione di densità f ( x ) fino al valore

x^0

x^ o^

Funzione di ripartizione e probabilità La probabilità corrispondente ad unqualunque intervallo può esseresempre espressa in termini dellafunzione cumulata

F ( ) ^ P( a < X

b ) =^ F (

b ) F ( a ) ^ P( Xb

) =^ F ( b ) ^ P( X>a

) = 1^ P(

Xa ) = 1

F ( a )

[ricordiamo che in una v.a. continua <equivale a

^ per cui con

F ( ) si calcolano le probabilità per tutti i tipi di intervallo]

F ( b )= area da

^ a^ b F ( a )= area da

^ a^ a

13

La distribuzione Uniforme /1 ^ La^ distribuzione continua Uniforme

è la distribuzione di

probabilità che assegna la

stessa probabilità

a tutti gli

intervalli di stessa ampiezza

a^

x b

f(x)^

L’area totale sottesaalla funzione di densitàdella distribuzioneuniforme è uguale a 1

se a 0 x^ b b^ a f^ x

altrove ^

^ 
^  

La distribuzione Uniforme /2 Funzione di densità di probabilità

Funzione di ripartizione^0

se ( )^

se^ [ ,

]

x^ a se x^ a F x^

x^ a b b^ a

x b  ^ 

^ ^

Distribuzione Uniforme nell’intervallo [

a , b ]

2 (^2

) 12 b^ a ^

 

a^ b^2

^

Media^ 

Varianza

15

La distribuzione Uniforme /

Esempio: Distribuzione di probabilitàuniforme nell’intervallo [2, 6]:^2

x

f(x)

(^642) (^2) b 2 aμ

  

2)-^ 1.333 12 ( a)-(bσ 12

2 2 2

  

1 ( )^

0.^

per 2^

f^ x^

x

^
^
^ 

DistribuzioneNormale

17

La distribuzione Normale /1 ^ E’ la distribuzione più usata perché^ ^ descrive bene molti fenomeni^ ^ ha proprietà matematiche convenienti^ ^ il

teorema limite centrale

afferma che asintoticamente (= al

crescere del numero di osservazioni) la distribuzione della mediacampionaria tende ad una Normale, qualunque sia la distribuzionedi probabilità delle osservazioni

È stata proposta da F.Gauss (1809), che lautilizzò per primo nellostudio degli errori dimisurazione relativi allatraiettoria dei corpi celesti(per questo è chiamataanche^ gaussiana

)^

La distribuzione Normale /2 ^ ‘Forma campanulare’ ^ Simmetrica ^ Media, Mediana e Moda

coincidono La^ tendenza centrale

è determinata dal parametro μ (media)La^ variabilità

è determinata dal parametro σ (deviazione std)La variabile aleatoria ha un campo divariazione teoricamente infinito:da^  ^ a +^ 

Media= Mediana= Moda

x

f(x)

σ μ

19

La distribuzione Normale /3  Famiglia parametrica di distribuzioni continue su supporto(^ ,^

^ La famiglia Normale è caratterizzata dai due parametri

(^2) e  ad es.

N (-8.1, 2.3) e

N (-8.1, 2.4) sono membri

distinti, ma

N (-8.1, -2.3) non è un membro ^ Per ogni coppia (

(^2)  , ) la funzione di densità della

Normale è

(^22) 1 (^

) (^22) 1 ( )^

2

x

f^ x^

e

 

^

 ^ ^

 ^

 ^

2

(^ ,^
)^
[0,^

    

^ 

2

~^ (

,^

X^

N^  

e^ ^ 2.71828 π^ ^ 3.

La forma della distribuzione Normale

x

f(x)

 Cambiando

^ la distribuzione si spostaverso sinistra o destra

Cambiando

^ aumenta o diminuisce la dispersione

Nella distribuzione Normale la media e la varianza sono due parametridistinti^ 

la varianza non dipende dalla media, come invece accade per molte distribuzioni (es. la binomiale)

Come calcolare le probabilità? /2 ^ Dato che non esiste una formula per la funzione diripartizione è necessario ricorrere ad una^ approssimazione numerica ^ Prima vediamo il calcolo tramite approssimazionenumerica per la Normale Standard (ovvero il membro dellafamiglia con media 0 e dev.std. 1)

^ uso delle tavole

^ Poi affrontiamo il problema per una Normale generica(ovvero con media e dev.std. qualunque)

^ la soluzione si

basa sulla

standardizzazione

(si tratta di riformulare il

problema in termini di Normale Standard)

25

La Normale Standard ^ La^ Normale standard

Z, il membro con media 0 e

varianza 1, funge da “rappresentante” della famiglia  funzione di densità:  funzione di ripartizione:

(^22)

( )^
x 2
x^
e
^

2 0

2 0

(^ )^

x^ x^2 x^

 e dx 

 ^

^ 

~^ (0,1) Z N

z

f(z)

Approssimazione numerica dell’area^ L’area sottesa alla curva in (

,^ a ] è approssimata dall’area totale dei rettangoli

(con rettangoli più stretti si ottiene un’approssimazione migliore)

27

La tavola della Normale Standard /1 ^ La tavola della Normale standard data nel libro (Tavola1 dell’Appendice) fornisce i valori della funzione diripartizione della distribuzione normale ottenuti tramiteapprossimazione numerica ^ Per un dato valore

a^ di Z, la tavola fornisce F(

a )

(l’area sottesa alla curva da meno infinito al valore

a ) z a 0

( )^
(^ )

F a^

P Z^

a ^

29

La tavola della Normale Standard

/2^ Z

^ La tavola 1 dell’Appendice^ Esempio:P(Z < 2.00) =.

fornisce la probabilità F(

a ) per

qualunque valore

a^ tra^^0

e^ 3.

P(Z < 3.99) è quasi 1

^ la tavola riporta 1. Per un valore più grande di 3.99 la probabilità è ancora più vicinaa 1^ ^ la tavola non riporta il valoreEs. P(Z < 5.22) si approssima con il valore 1

31

La tavola della Normale Standard /3 ^ Per

valori negativi di Z

, usiamo il fatto che la distribuzione

è simmetrica per trovare la probabilità desiderata:

z 0 -2.

Esempio:P(Z < -2.00) = 1 – 0.

z 0 2. .

.0228.

.

In simboli

( z )=

( z )

Standardizzazione ^ Data una qualunque v.a. X con media

e deviazioneX^

standard

, si definisce standardizzata la v.a. ZX^ ^ Per costruzione, si ha

= 0 eZ^

= 1 (si dimostra usandoZ^

le proprietà delle trasformazioni lineari di v.a.)  La trasformazione inversa è  Caso speciale: Se X

^ N(

(^2) ,), allora ZXX

^ N(0,1)

X X X^  Z ^ ^ X^

X

X^

Z

^

^

37 Z 0.

Esempio coda sinistra: P(X < 8.6)

F(0.12) = 0.

Tavola della distribuzioneNormale standard

= P(Z < 0.12) 0.
P(X < 8.6)

0.^ 0.^ 0.^

0.^

0. 0.20.3…

Esempio coda destra: P(X > 8.6) ^ Adesso calcoliamo P(X > 8.6)…

Z 0 0. Z 0.

0

1.^
P(X > 8.6) = P(Z > 0.12) = 1 - P(Z ≤ 0.12)

39

Problemi diretti e inversi ^ Problema diretto: dato un valore di

z^ determinare la

probabilità cumulata

( z ) [in termini geometrici: dato un

punto^

z^ sulle ascisse determinare l’area sottesa alla densità

^ alla sinistra di

z ]

^ Problema inverso: dato un valore

p^ della probabilità

cumulata, determinare il valore

z^ corrispondente, cioè p^

zp

tale che

( z^ ) = p

p^ [in termini geometrici: determinare il punto^

z^ per il quale alla sua sinistra l’area sottesa alla p^ densità

^ è pari ad un certo valore specificato] ^ Finora abbiamo visto solo problemi diretti, adessoconsideriamo alcuni problemi inversi

Problema inverso Passi per trovare il valore di x corrispondente ad una dataprobabilità:1.^ Trovare il valore di Z corrispondente alla probabilità data2.^ Convertire nelle unità di X usando l’inversa dellastandardizzazione, cioè:

X^

Z

^

^

41

Problema inverso: esempio /1 Esempio: ^ Assumiamo che in un certa località la temperatura minimaX abbia una distribuzione Normale con media 8 C° edeviazione std 5 C°. ^ Adesso troviamo il valore di X tale che l’80% dei valorisiano al di sottoL’80% delletemperature èinferiore a ___ C°

?^

X ?8.

Z ? 0

Problema inverso: esempio /

^ 80% di area a sinistracorrisponde al valore Z di0.

Tavola della Funzione diRipartizione Normale

1. Trova il valore di Z corrispondente alla probabilità data
.20^ X

?8.

Z 0.84 0

…^ 0.

… … 0.^

0.

43

Problema inverso: esempio /

8 5( 0.84)

x^

z ^  ^

^ 

^

Perciò 80% dei valori di una distribuzione Normale con media 8 edeviazione std 5 sono inferiori a 12.

L’80% delletemperature èinferiore a 12.2 C°

2. Converti in unità di X:

Scala e unità di misura ^ Quando il problema è di tipo inverso si parte dalla Normalestandard per ottenere il valore z desiderato^ ^ z è in scala standard

^ non ha unità di misura

^ Poi si applica la trasformazione inversa dellastandardizzazione,che reintroduce la media

e la deviazione standard X^

 X

originali^ ^ x è nella scala originale (kg, cm, secondi, C°,…)

X^

X x^

z

^

^

49

Valutazione dell’ipotesi di normalità /2 ^ Alcuni modi per confrontare la distribuzione osservata conla Normale sono:^ ^ Costruzione di

grafici

per analizzare la forma della

distribuzione (boxplot, istogramma)  Calcolo delle

misure di sintesi

e confronto fra le

caratteristiche dei dati e le proprietà teoriche delladistribuzione Normale (la verifica principale consiste nelcalcolare media, mediana e moda dei dati e valutare se sonoapprossimativamente uguali)  Verifica della

regola empirica

, calcolando la proporzione di

osservazioni che si discostano dalla media per più di 1 volta,2 volte, 3 volte la deviazione std e confrontando taliproporzioni con le corrispondenti probabilità normali, cioè68%, 95%, 99%

Valutazione dell’ipotesi di normalità /3^ ^ Asimmetria^ ^

I dati possono avere una natura fortemente asimmetrica: in talcaso la distribuzione osservata ha media e mediana moltodiverse  Code pesanti  I dati possono presentare valori estremi (= lontani dalla media)molto più frequentemente di quanto previsto dalla Normale: in talcaso la proporzione di valori al di fuori degli intervalli del tipo

^ +

La distribuzione Normale può essere inadeguata per varimotivi. Due motivi frequenti sono:^ k^ ^ è sostanzialmente più elevata delle corrispondenti probabilitànormali

51

Valutazione dell’ipotesi di normalità /4 Due avvertenze finali: ^ La distribuzione Normale ha come supporto l’intero assedei numeri reali e quindi assegna probabilità non nulleanche a intervalli di valori negativi, es. [-3.2, 0]^ ^ Molti fenomeni analizzati ammettono solo valori positivi, es. tempo,lunghezza, costo. In tali situazioni la Normale può essere adeguatase l’intervallo

^ + 3^

(che dovrebbe contenere quasi tutte le osservazioni) è tutto su valori positivi, es. [2.3, 8.2]  In generale, quando le osservazioni a disposizione sonopoche (diciamo meno di 20) è molto difficile stabile se unacerta distribuzione di probabilità è adeguata o menoperché eventuali forti discrepanze tra ciò che si osserva eciò che prescrive il modello potrebbero esseresemplicemente frutto del caso

Approssimare laBinomiale con la

Normale

53

Approssimare la Binomiale con la Normale /1 ^ Ricorda la distribuzione binomiale:^ ^ n

prove indipendenti  probabilità di successo in ogni prova =

p

^ Valore atteso e varianza: ^ Quando

n^ è grande il calcolo delle probabilità cumulate è complesso: es.XB( n =50,

p )^ ^

P(X25) = P(X=0) + P(X=1) + … + P(X=25)

(^ ) E X^

np 

^ 

2

(^ )^

(^

Var X

np^

p

54

Approssimare la Binomiale con la Normale /2^ ^ Quando

np (1 –^

p ) > 9 la Normale è una buonaapprossimazione per labinomiale

(^

)^ (

)^

(^

) a^ np

P^

a^ P

a

Z^

n^

p

Y^

P^

p

X^

^

 

^ 

^



^



^

In tal caso la f. di ripartizione della v.a.

X^  B (

n ,^ p )^ è

molto simile a quella della v.a.

Y^  N (

np ,^ np

(1- p ))

55

Approssimare la Binomiale con la Normale /3 ^ 40% dei cittadini sono favorevoli all’operato del sindaco.Qual è la probabilità che, in un campione di n = 200, ilnumero di favorevoli sia compreso tra 76 e 80 (ovvero lapercentuale di favorevoli sia compresa tra 38% e 40%)?^ ^ E(

X ) =^ μ^ =

np^ = 200(0.40) = 80 ^ Var( X

(^2) ) = σ = np (1 –^

p ) = 200(0.40)(1 – 0.40) = 48 ( notare:

np (1 –^

p ) = 48 > 9 )^76

(^
80)^
( 0.^
(0)^
P^
X^
P^
Z
P^
Z
F^
^ F
^
^ ^
^
^ 
^
^
^ ^
^ 
^
^ 
^
^

Combinazionelineare di

k^ variabili

aleatorie (discrete o

continue)

56

61

Esempio /1 ^ Due mansioni devono essere eseguite dallo stessolavoratore.^ ^ X = minuti per completare mansione 1; μ

= 20, σX

= 5X

^ Y = minuti per completare mansione 2; μ

= 30, σY

= 8Y

^ X e Y sono distribuite normalmente e sono indipendenti  Quali sono la media e la deviazione std del temponecessario per completare entrambe le mansioni? Qual èla distribuzione?

Esempio /2^ ^

X = minuti per completare mansione 1; μ

= 20, σX^

= 5X^

^ Y = minuti per completare mansione 2; μ

= 30, σY^

= 8Y^

^ Calcolare media e deviazione std del tempo

W=X+Y

necessario per

completare entrambe le mansioni  Siccome X e Y sono indipendenti, Cov(X,Y) = 0, perciò  La deviazione std è  La distribuzione di

W^ è

20 30

50

W^

X^ Y ^ ^  ^

^ 

2

2 2

2

2

2 (

,^ )^

(5)^

(8)^

89

W^

X^ Y

Cov X Y

^

^  ^

^

^

^

89 9. ^ ^ W

 ~^ (50,89) W N

63

Combinazioni lineari di variabili aleatorie

(in GENERALE)

^ Una combinazione lineare di n variabili aleatorieX, X,.. .,X^12

con medie n

μ,^ μ,...^12

μ e varianze n^

(^2) σ,^ σ 12 2 ,.. .,^ σn

2

^ La media di W è ^ La varianza di W è ^ Se le variabili sono distribuite normalmente allora anche lacombinazione lineare W è distribuita normalmente

1 1

...^

n^ n

W^

a^ b X

b X

^ 

^ ^1

1 [^ ]^

...

W^

n^ n

E W^

a^ b

b

^

^ 

^ 

1 2

2 2

2 2

2 2 1

2 2 (^ )^

...^

2

(^ ,^

)

W^

n^ n^

i^ j^

i^ j

Var W^

b^

b^

b^

b b Cov X

X

^

^

^

^

^ ^

^ 

Combinazioni lineari di variabili aleatorie

(in GENERALE)

^ Quindi particolarizzandoE considerando se le variabili, a coppie, sono indipendenti omeno (quindi la covarianza si annulla) si riottengono tutte leformule viste primaIn particolare da questa formula generale, potrei trovareanche le formule di media e varianza non per unacombinazione lineare di variabili ma per la trasformata di unavariabile

,^ ,...,^1

n a^ b^

b