Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Probabilità: Interpretazione e Modelli Probabilistici, Appunti di Statistica Per L'impresa

Una panoramica approfondita sui concetti fondamentali della probabilità, inclusi l'interpretazione classica, le regole elementari, la probabilità condizionata e l'indipendenza statistica. Vengono inoltre presentati modelli probabilistici per variabili aleatorie discrete e continue, come la distribuzione normale o gaussiana. Il documento copre inoltre argomenti avanzati come la funzione di ripartizione, la standardizzazione di variabili aleatorie normali e il concetto di vettore aleatorio bidimensionale con le relative distribuzioni di probabilità congiunte e condizionate. Questo materiale rappresenta una risorsa preziosa per studenti universitari che studiano corsi di probabilità e statistica, fornendo una solida base teorica e numerosi esempi applicativi.

Tipologia: Appunti

2020/2021

Caricato il 23/05/2024

federica-guala-2
federica-guala-2 🇮🇹

2 documenti

1 / 40

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Lezione del 9/03/2021
RELAZIONI LINEARI
Prosecuzione di quello che abbiamo visto fin ora dell’associazione di tipo lineare tra due
variabili x y che abbiamo visto nei precedenti video attraverso il calcolo della covarianza e
dell’indice di correlazione lineare insieme al diagramma di dispersione.
adesso ci domandiamo quale sia la migliore relazione di tipo lineare: quindi la migliore
espressione analitica della retta migliore (dovremmo definire cosa si intende per migliore)
che lega le due variabili y e x
OBBIETTIVO: determinare l’espressione analitica della “migliore” retta che rappresenta la
relazione tra y e x.
Utile per il calcolo delle previsioni di y per un dato valore di x
“epsilon”
yi = 0 + 1*xi + iespressione analitica che definisce la relazione lineare tra y e x
parte parte
strutturale di errore
(si chiama strutturale perché contiene l’espressione che successivamente, una volta che i
numeri 0 e 1 saranno calcolati ci fornisce lo scheletro e la struttura sulla base della quale
saremmo in grado di calcolare le previsioni)
Questa relazione lineare prevede che la variabile di risposta sia in parte modellata attraverso
un’espressione strutturale e tutto quello che la variabile x non è in grado di spiegare di y
compone la parte di errore.
Come trovare 0, 1 e i da delle osservazioni campionarie?
yi = previsione ottenuta attraverso il modello che stiamo considerando con la relazione
lineare ipotizzata per l’osservazione i-esima. Valore calcolato sulla base dell’osservazione
lineare che abbiamo stimato. yi = b0 + b1*xi
yi diverso da yi
yi = valore osservato per la variabile y in corrispondenza dell’osservazione i-esima.
(contiene l’informazione su y che non è possibile
spiegare attraverso la variabile x)
Non sono
noti e
dobbiamo
stimarli sulla
base di un
campione di
osservazioni
OBBIETIVO: indentificare qual è la retta
migliore che chiaramente sarà una
retta che passe nel mezzo della nuvola
dei punti, non sarà ne una retta che
passa o sopra o sotto e neanche una
retta che procederà in senso opposto
rispetto alla direzione dei punti che
stimo considerando, sarà sicuramente
una retta che passa all’interno della
nuvola dei punti che stiamo
analizzando
Le differenze che abbiamo tra il valore osservato per la
variabile di risposta e il valore previsto si chiama
RESIDUO
ei=residuo per l’osservazione i-esima.
Il residuo di una relazione lineare per una certa
osservazione corrisponde ad una differenza tra il
valore osservato e il valore previsto per quella
osservazione:
yi – yi = errore di previsione commesso dal modello
per l’osservazione i-esima
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28

Anteprima parziale del testo

Scarica Probabilità: Interpretazione e Modelli Probabilistici e più Appunti in PDF di Statistica Per L'impresa solo su Docsity!

Lezione del 9/03/ RELAZIONI LINEARI Prosecuzione di quello che abbiamo visto fin ora dell’associazione di tipo lineare tra due variabili x y che abbiamo visto nei precedenti video attraverso il calcolo della covarianza e dell’indice di correlazione lineare insieme al diagramma di dispersione.  adesso ci domandiamo quale sia la migliore relazione di tipo lineare: quindi la migliore espressione analitica della retta migliore (dovremmo definire cosa si intende per migliore) che lega le due variabili y e x  OBBIETTIVO: determinare l’espressione analitica della “migliore” retta che rappresenta la relazione tra y e x. Utile per il calcolo delle previsioni di y per un dato valore di x “epsilon”

yi =  0 +  1 *xi + i espressione analitica che definisce la relazione lineare tra y e x

parte parte strutturale di errore (si chiama strutturale perché contiene l’espressione che successivamente, una volta che i

numeri  0 e  1 saranno calcolati ci fornisce lo scheletro e la struttura sulla base della quale

saremmo in grado di calcolare le previsioni) Questa relazione lineare prevede che la variabile di risposta sia in parte modellata attraverso un’espressione strutturale e tutto quello che la variabile x non è in grado di spiegare di y compone la parte di errore.

Come trovare  0 ,  1 e i da delle osservazioni campionarie?

yi = previsione ottenuta attraverso il modello che stiamo considerando con la relazione lineare ipotizzata per l’osservazione i-esima. Valore calcolato sulla base dell’osservazione

lineare che abbiamo stimato. yi = b 0 + b 1 *xi

yi diverso da yi yi = valore osservato per la variabile y in corrispondenza dell’osservazione i-esima. (contiene l’informazione su y che non è possibile spiegare attraverso la variabile x) Non sono noti e dobbiamo stimarli sulla base di un campione di osservazioni OBBIETIVO: indentificare qual è la retta migliore che chiaramente sarà una retta che passe nel mezzo della nuvola dei punti, non sarà ne una retta che passa o sopra o sotto e neanche una retta che procederà in senso opposto rispetto alla direzione dei punti che stimo considerando, sarà sicuramente una retta che passa all’interno della nuvola dei punti che stiamo analizzando Le differenze che abbiamo tra il valore osservato per la variabile di risposta e il valore previsto si chiama RESIDUO ei=residuo per l’osservazione i-esima. Il residuo di una relazione lineare per una certa osservazione corrisponde ad una differenza tra il valore osservato e il valore previsto per quella osservazione: yi – yi = errore di previsione commesso dal modello per l’osservazione i-esima

I valori dei due coefficienti b 0 e b 1 sono ottenuti attraverso il metodo dei minimi quadrati  i valori di b 0 e b 1 ottimali corrispondono a quei valori che rendono minima la somma dei residui al quadrato

b 0 = intercetta stimata ( 0 intercetta di partenza)

b 1 = inclinazione stimata ( 1 inclinazione di partenza)

Secondo il metodo dei minimi quadrati, i valori ottimali di b 0 e b 1 sono quelli che rendono minima la somma dei residui al quadrato:

STIME DI  0 e  1 DEI MINIMI QUADRATI

b 1 = sx,y/sx

2 (covarianza campionaria diviso per varianza campionaria di x)

b 0 = y - b 1 * x (media di y – il b 1 appena calcolato che moltiplica la media di x)

il b 1 è un numero che in modo indiretto è legato all’indice di correlazione lineare, legato in modo diretto alla covarianza. Infatti, b 1 si può riscrivere utilizzando l’indice di correlazione lineare in modo da esplicitare che tipo di relazione c’è tra b 1 e l’indice di correlazione lineare

stesso. La relazione è la seguente: rx,y*( sy/sx) b 1 è definito come covarianza campionaria

diviso varianza campionaria di x o equivalentemente si può calcolare come indice di correlazione lineare campionario che moltiplica deviazione standard campionaria di y diviso per deviazione standard campionaria di x. Questa seconda formula permette di evidenziare l’unità di misura dell’indice di inclinazione stimato b 1 che è il rapporto tra le unità di misura della variabile y e della variabile x. Questo perché l’indice di correlazione lineare non ha unità di misura, è un numero adimensionale, mentre le unità di misura della deviazione standard di y e di x dono le stesse unità di misura delle corrispondenti variabili, per cui b 1 ha come unità di misura l’unità di misura di y diviso per l’unità di misura di x. Inoltre, questa formula permette di evidenziare la relazione diretta che c’è tra l’indice di correlazione lineare e l’inclinazione della migliore retta dei minimi quadrati. Questa relazione è diretta: gli indici di correlazione lineare positivi daranno origine a indici di b 1 positivi, invece quelli negativi daranno origine a indici negativi. Allo stesso modo se l’indice di correlazione lineare tra due variabili è uguale a 0 anche b 1 (l’inclinazione dei minimi quadrati) sarà uguale a 0. Questo indica che b 1 non è altro che la stessa informazione fornita dall’indice di correlazione lineare che però tiene conto del diverso ruolo che adesso giocano le variabili y e x. Mentre nell’indice di correlazione lineare il ruolo delle due variabili è indistinto, nel caso di b 1 e b 0 non è più vero, se noi calcoliamo la relazione lineare tra x e y o l relazione lineare tra y e x otteniamo dei valori per b 1 e b 0 che sono completamente diversi. Per cui le relazioni lineari richiedono di utilizzare un ordine ben specifico. L’unità di misura di b 0 è data dall’unità di misura di y. STARE ATTENTI CHE DAVANTI A b 1 C’È UN SEGNO NEGATIVO QUINDI SE b 1 È NEGATIVO BISOGNA METTERE + E SE È POSITIVO BISOGNA LASCIARE IL -. Una volta che abbiamo calcolato i valori di b 1 e b 0 è possibile utilizzarli per calcolare delle previsioni per Y Esempio (continue) Y = “€spent” X = “#items” n = 1 x = 3 items y = 40€ sxy = 79.6429 (items *€) Funzione obbiettivo che si vuole minimizzare nell’ambito dei minimi quadrati. Il metodo dei minimi quadrati richiede che i valori ottimali di b 0 e b 1 siano determinati andando a minimizzare la somma dei residui al quadrato cioè minimizzare una quantità che sintetizza gli errori di previsione commessi dal modello in corrispondenza di tutte le osservazioni. Il fatto di prendere al 2 è necessario perché alcuni residui sono positivi e alcuni sono negativi, se noi sommassimo residui positivi e negativi questi si compenserebbero e non riusciremmo a trovare una risposta che abbia un senso applicativo.

relazione continuerà ad essere dello stesso tipo oppure cambierà. Quindi è molto rischioso fare delle previsioni (in questo caso chiamate estrapolazioni ) in scenari che sono molto diversi da scenari che sono stati inclusi nel campione stesso. PER CONCLUDERE: a prima previsione è una ^revisione affidabile perché è calcolata in corrispondenza del valore del numero di articoli incluso nel range viceversa la seconda previsione per il secondo potenziale nuovo cliente non è una previsione affidabile perché è calcolata in corrispondenza di un numero di articoli che cade molto al di fuori dal range che noi abbiamo osservato.

2° parte del corso: CALCOLO DELLE PROBABILITÀ

  1. INTRODUZIONE E CONCETTI DI BASE (esperimento aleatorio, evento, misura di probabilità)
  2. VARIABILI ALEATORIE (definizione, distribuzione di probabilità, valore atteso, varianza, …)
  3. DISTRIBUZIONI DI PROBABILITÀ “NOTEVOLI”  DISTRIBUZIONE: BERNOULLIANA, BINOMIALE, NORMALE (o GAUSSIANA)
  4. INTRODUZIONE E CONCETTI DI BASE DEL CALCOLO DELLA PROBABILITÀ 1° CONCETTO: ESPERIMENTO ALEATORIO Attività o procedura che può produrre uno di una serie di possibili risultati, ma a priori non è possibile stabilire quale di questi risultati si verificherà. Esempi:
  • lancio di una moneta 2 esiti possibili.
  • lancio di un dado a 6 facce 6 esiti possibili.
  • programma di investimenti pubblici o privati. Nel momento in cui si decide di effettuare questo programma di investimenti non si può prevedere esattamente come si evolverà e come si concretizzerà questo programma di investimenti, nel senso che non si riesce a prevedere a priori esattamente quale sarà il risultato e il ritorno economico di questo programma di investimenti però si può fare una lista dei possibili esiti che questo programma di investimenti può dare origine e eventualmente dare a questi esiti una valutazione probabilistica.
  • il voto dell’esame di statistica, si può fare un elenco dei possibili risultati e eventualmente fare una valutazione delle probabilità che si verifichi uno o l’altro di questi esiti. 2° CONCETTO: EVENTI ELEMENTARI Possibili esiti di un esperimento aleatorio, si indicano con  (“omega minuscolo”) L’insieme di tutti gli eventi elementari viene chiamato SPAZIO CAMPIONARIO (o SPAZIO DEGLI EVENTI ELEMENTARI, O SPAZIO DEI RISULTATI) 3° CONCETTO: SPAZIO CAMPIONARIO (o SPAZIO DEGLI EVENTI ELEMENTARI, O SPAZIO DEI RISULTATI)
  • Insieme di tutti gli elementi elementari di un esperimento aleatorio
  • si indica con  (“omega maiuscolo”), a volte indicato anche con S Esempio:
  • si consideri un esperimento aleatorio che consiste nel lancio di due monete, ognuna delle quali può produrre gli esiti:  testa (T)  croce (C)

 1 = (T, T)

 2 = (T, C)

 3 = (C, T)

 4 = (C, C)

4° CONCETTO: EVENTI

Sottoinsieme di eventi elementari di uno spazio campionario, si indicano con lettere maiuscole (A, B, …) Esempio: (continua)

  • esperimento: lancio di due monete
  • A = “almeno una testa =  1 ,  2 , 3,  4
  • si dice che un evento A si è verificato (cioè è vero) se l’esperimento aleatorio ha prodotto un esito/ evento elementare   A
  • EVENTO IMPOSSIBILE: quell’evento a cui non corrisponde nessun elemento elementare, ovvero l’evento impossibile è rappresentato dell’insieme vuoto   (insieme vuoto è un sottoinsieme di qualsiasi insieme)
  • EVENTO CERTO: l’evento che è rappresentato de tutti gli eventi elementari  (intero spazio campionario)
  • OPERAZIONI SU EVENTI  INTERSEZIONE -> dati due eventi A e B dello spazio campionario , la loro intersezione, AB, è l’insieme degli eventi elementari che appartengono ad entrambi gli eventi DIAGRAMMA DI VENN AB
  • la definizione di intersezione si può estendere al caso di più di due eventi: dati K eventi: E 1 , E 2 , …, Ek. La loro intersezione corrisponde all’insieme degli eventi elementari che appartengono simultaneamente a tutti gli eventi E 1 , E 2 , …, Ek.
  • è possibile che l’intersezione di due o più eventi sia vuota ( evento impossibile)  in questo caso i K eventi si dicono MUTUALMENTE ESCLUSIVI (o DISGIUNTI A COPPIE) Ei  Ej = per ogni i  j, con i, j = 1, 2, …, k Ad esempio, per k = 3, gli eventi E 1 , E 2 , E 3 sono mutualmente esclusivi se:

A B

E 2

E 1

E 3

 EVENTO COMPLEMENTARE

Dato un evento A , l’evento complementare di A l’insieme degli eventi elementari che non appartengono ad A

  • si indica con A o Ac^ A AB AB Esempi
  1. siano A e B due eventi. Allora (AB) e (AcB) sono:
  • disgiunti
  • la loro unione corrisponde a B, cioè (AB)  (AcB) = B
  1. siano A e B due eventi. Allora A e (AcB) sono disgiunti e la loro unione è AB, cioè A (AcB) = AB A
  2. dati k eventi E 1 , E 2 , …, Ek che formano una partizione di  e preso un altro evento A qualsiasi. Allora gli eventi (A E 1 ), (A E 2 ), …, (A Ek) Sono:
  • disgiunti a coppie
  • la loro unione corrisponde ad A, cioè (A E 1 )  (A E 2 )  … (A Ek) = A 5° CONCETTO: PROBABILITÀ Interpretazione del concetto di probabilità  INTERPRETAZIONE CLASSICA -> probabilità di un evento secondo l’interpretazione classica corrisponde al rapporto tra il numero di risultati dell’esperimento che risultano essere favorevoli all’evento e il numero di risultati possibili dell’esperimento. Secondo l’interpretazione CLASSICA gli esiti di un esperimento si considerano “equiprobabili” (tutti aventi la stessa probabilità di verificarsi)  INTERPRETAZIONE FREQUANTISTA Se ripetendo un esperimento aleatorio n volte un certo evento A viene osservato k volte, allora secondo l’interpretazione frequentista la probabilità che si verifichi A: P (A) = lim k/n

A B

E 1 E 5

E 3 A

E 4

E 2

E 6

h -> 

A

 A B

A B

(A E 4 )

(A E 6 )

(A E 5 )

(A E 3 )

 INTERPRETAZIONE SOGGETTIVA O SOGGETTIVISTA

La probabilità di un certo evento A, P(A)= p, corrisponde al prezzo p che un individuo sarebbe disposto a pagare o a ricevere per entrare in una scommessa che prevede di riscuotere o pagare un importo monetario unitario se A si verifica e nulla se A non si verifica -> ha dato origine a quella parte della statistica detta statistica ba yesiana  DEFINIZIONE ASSIOMATICA DI PROBABILITÀ Sia  lo spazio campionario di un esperimento aleatorio. Si dice misura di probabilità o semplicemente probabilità una qualsiasi funzione P definita per ogni possibile evento A tale che: (1) 0  P(A)  1 (2) P () = 1  evento certo (3) presi A 1 , A 2 , A 3 … infiniti eventi disgiunti a coppie, allora  la probabilità che l’unione di questi eventi (eventi un numero infinito) corrisponda alla somma delle probabilità di ognuno degli eventi  ADDITTIVITÀ COMPLETA  REGOLE ELEMENTARI DELLA PROBABILITÀ -> evento complementare Sia A un evento con probabilità P (A), allora P (Ac) = 1 - P(A) -> regola della somma Siano A e B due eventi qualsiasi, allora P (AB) = P (A) + P(B) - P(AB)

  • P(AB) perché altrimenti conteremmo due volte la probabilità che si verifichino contemporaneamente i due eventi AB Se AB =   P(AB) = P () = 1- P ()  =  Esempio
  • esperimentolancio dado a 6 facce
  • A = “risultato pari” = 2,4,
  • B = “risultato  4” = 4,5,
  • AB = 4,
  • AB = 2,4,5, P (A) = (interpretazione classica) = # casi favorevoli ad A/ # casi possibili = 3/6 = ½ P (B) = 3/6 = ½ P (AB) = 2/6 = 1/ P (AB) =  approccio 1  4/6 = 2/  approccio 2 (regola della somma) P (A) + P (B) – P (AB) = ½ + ½ - 1/3 = 2/ 6° CONCETTO: PROBABILITÀ CONDIZIONATA P (U Ai) =  P (Ai)  A B  A B  i = 1  i = 1  A 0 P (A) 1 AB

AB

P (A 5 ) = 0.

Inoltre P (DA 1 ) = 0. P (DA 2 ) = 0. P (DA 3 ) = 0. P (DA 4 ) = 0. P (D A 5 ) = 0. Quindi, per il teorema delle probabilità totali si ottiene direttamente P (D) =  P (Ai) * P (D Ai) = 0.100.05 + 0.220.02+…+0.19*0.08  0. 7° CONCETTO: INDIPENDENZA STATISTICA DI DUE EVENETI Dati due eventi A e B qualsiasi, sapere che questi sono “indipendenti” implica che: P (B A) = P (B) e P (AB) = P (A) Ma in questo caso ciò implica che P (AB) = P (A) * P (B A) = P (A) * P (B) Ed equivalentemente: P (AB) = P (B) * P (A B) = P (B) * P (A)

  • due eventi A e B qualsiasi si dicono statisticamente indipendenti se e solo se: P (AB) = P (A) * P (B)
  • più in generale, gli eventi E 1 , E 2 , …, Ek sono (statisticamente) mutualmente indipendenti se e solo se: P (E 1 E 2  …Ek) = P (E 1 ) * P (E 2 ) * … * P (Ek) Esempio Tre fotocellule hanno ciascuna probabilità ¼ di guastarsi. Se la prima fotocellula si guasta la probabilità che la seconda si guasti si raddoppia. Se si guastano le prima due, la probabilità che la terza si guasti si dimezza. Siano E 1 , E 2 , E 3 gli eventi che la prima, la seconda, la terza fotocellula si guastano. Si verificano se gli eventi E 1 e E 2 sono statisticamente indipendenti P (E 1 ) = P (E 2 ) = P (E 3 ) = ¼ P (E 2 E 1 ) = 2 * ¼ = ½ P (E 3 E 1 E 2 ) = ½ * ¼ = 1/ P (E 1 E 2 ) = P (E 1 ) * P (E 2 )? P (E 1 E 2 ) = (regola delle probabilità composte) = P (E 1 ) * P (E 2 E 1 ) = ¼ * ½ =1/ P (E 1 ) * P (E 2 ) = ¼ * ¼ = 1/ poiché P (E 1 E 2 ) = 1/8  P (E 1 ) * P (E 2 ) = 1/  E 1 e E 2 non sono statisticamente indipendenti
  1. VARIABILI ALEATORIE
  • una variabile aleatoria X è una funzione che associa ad ogni evento elementare  che appartiene allo spazio campionario un valore reale, ovvero X :   5 I=

La variabile aleatoria di X è una funzione che prende ognuno di questi eventi elementari e associa ad ognuno di questi eventi elementari un valore sull’asse reale. ATTENZIONE A NON CONFONDERE VARIABILE ALEATORIA CON IL CONCETTO DI MISURA DI PROBABILITÀ. La misura di probabilità (come visto nelle lezioni precedenti) è una funzione di insieme nel senso che ad ogni sottoinsieme di omega associa un numero tra 0 e 1 e non associa quindi ad ognuno degli eventi elementari un numero reale. Esempio esperimento aleatorio: lancio di 2 dadi (regolari) a 6 facce. spazio campionario:  (i, j), i, j = 1, 2, …, 6 si consideri la variabile aleatoria X = “somma dei punteggi ottenuti”  X ((i, j)) = i + j, (i, j)   Quindi l’insieme dei possibili valori che la variabile aleatoria X può assumere è RX= 2,3,4,…, RX  SUPPORTO della variabile aleatoria X Altre possibili variabili aleatori che potremmo definire sono:

  • Y ((i, j)) = i
  • Z ((i, j)) = j
  • W ((i, j)) =i - j
  • ecc.… Preso un generico intervallo (a, b  , vogliamo calcolare la probabilità con cui X  (a, b => questa probabilità è necessariamente collegata alla misura di probabilità P definita sugli eventi di , ovvero al particolare evento    : a  X ()  b Esempio (continua) Qual è la probabilità con cui X = 7? Questa probabilità equivale alla probabilità dell’evento (i, j)   : X (i, j) = 7 = (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1) Per tanto PX (7) = P (A) = 6/36 = 1/ P (7) la probabilità che la variabile aleatoria assuma il valore 7  distribuzione di probabilità di X P (A) misura di probabilità definita sugli eventi di  Dato un sottoinsieme B  , dato un esperimento aleatorio con spazio campionario  sui cui eventi è stata definita la misura di probabilità P, si definisce distribuzione (di probabilità) della variabile aleatoria X la funzione PX tale per cui vale: PX = P (XB) = P (   : X () B) Le VARIABILI ALEATORIE sono distinte in  DISCRETE  CONTINUE Una variabile aleatoria è detta DISCRETA se il numero di valori distinti che può assumere (RX) è finito o infinito numerabile.

Esempio Esperimento: lancio di 4 monete regolari  = (T, T, T, T), (T, T, T, C), …, (C, C, C, C) Con = 2^4 = 16 Essendo le monete regolari, gli eventi elementari sono equiprobabili, ovvero P () = 1/16, si consideri la variabile aleatoria X = “numero di teste osservate”. Quindi, il supporto di X è RX =  0, 1, 2, 3, 4 1/16 x = 0 4/16 = 1/4 x = 1 6/16 = 3/8 x = 2 p (x) = 4/16 = 1/4 x = 3 1/16 x = 4 0 altrove La funzione di ripartizione è data da: 0 x  0 1/16 0  x  1 1/16 + 4/16 (1/4) 1  x  2 F (x) = 1/16 + ¼ + 6/16 (3/8) 2  x  3 1/16 + ¼ + 3/8 + 4/16 (¼) 3  x  4 1 x  1 La funzione di ripartizione è utile per calcolare probabilità relative alla variabile aleatoria X, in particolare: Pr (a  X  b) = F (b) – F (a) Sia X una variabile aleatoria discreta con funzione di probabilità p (x):

  1. valore atteso  (o speranza matematica, o media) è la quantità  = E (X) =  xi * p(xi) E (X) ->expected value Esempio (continua)  = E (X) = (0 * 1/16) + (11/4) + (23/8) + (4*1/16) = 2 PROPRIETÀ DEL VALORE ATTESO
  2. IL VALORE ATTESO È UN OPERATORE LINEARE, ovvero, data una variabile aleatoria discreta X con valore atteso E(X), si consideri una sua trasformazione lineare Y = aX + b. Allora: Y = E (Y) = aE(X) + b = a*Y + b
  3. MOMENTI => data una variabile aleatoria X con funzione di probabilità p (x), il suo momento di ordina k (k) è definito come k = E (Xk) =  xi k* p(xi) Si noti che se k = 1, si ottiene il valore attuale di X, cioè

xi  RX xi  RX

 1 = E (X^1 ) = 

Un altro momento utile per le variabili aleatorie è il momento di ordine 2, ovvero:  2 = E (X^2 ) =  xi 2 * p(xi)

  1. VARIANZA DI UNA VARIABILE ALEATORIA ^2 = var (X) = E (X - )^2  =  (xi - )^2 * p(xi) Esempio (continua) ^2 = var (X) = E (X - )^2  = (0 – 2)^2 * 1/16 + (1 – 2)^2 *1/4+ (2 – 2)^2 * 3/8 + (3 – 2)^2 * ¼ + (4 – 2)^2 * 1/16 = 1 PROPRIETÀ DELLA VARIANZA
    1. ^2 = var (X) = E (X - )^2  = E (X^2 ) – E (X)^2 E (X^2 ) -> momento secondo E (X)^2 -> il momento primo elevato alla seconda
  2. la varianza NON È un operatore lineare: Sia X una variabile aleatoria discreta con varianza ^2 x e sia Y = a*X +b una sua trasformazione lineare allora: c ^2 y = var (Y) = E (Y - y)^2  = a^2 *var (X) = a^2 *^2 X La varianza di una trasformazione lineare di X non è la trasformazione lineare della varianza ma si ottiene per la varianza di X che moltiplica il quadrato del coefficiente a, il b sparisce. Quindi le costanti additive come b nella nostra definizione spariscono nel calcolo della varianza. IL VALORE ATTESO È UN OPERATORE LINEARE. IL VALORE ATTESO DI UNA TRASFORMAZIONE LINEARE È LA TRASFORMAZIONE LINEARE DEL VALORE ATTESO, NEL CASO DELLA VARIANZA QUESTA COSA NON È VERA, LA VARINAZA NON È UN OPERATORE LINEARE, LA VARIANZA DI UNA TRASFORMAZIONE LINEARE NON È LA TRASFORMAZIONE LINEARE DELLA VARIANZA MA VALE QUESTA FORMULA: = E (Y - y)^2  = a^2 *var (X) = a^2 *^2 X
  3. DEVIAZIONE STANDARD  = ^2 =  var (X) Presentiamo ora 2 modelli di probabilità per variabili aleatorie discrete 1. variabile aleatoria di Bernoulli xi  RX xi  RX

notiamo che per ognuna della 4 fatture possiamo modellare la probabilità che siano non corrette attraverso un modello di Bernoulli. In particolare, definiamo X 1 =”la prima fattura estratta non è corretta” X 2 =”la seconda fattura estratta non è corretta” X 3 =”la terza fattura estratta non è corretta” X 4 =”la quarta fattura estratta non è corretta” Segue quindi: lezione del 23/03/ X 1  Ber (p = 0.10) X 2  Ber (p = 0.10) X 3  Ber (p = 0.10) X 4  Ber (p = 0.10) Inoltre, è ragionevole assumere che le 4 variabili aleatorie bernoulliane siano tra loro indipendenti. L’esempio però richiede di calcolare la probabilità che su 4 fatture, 2 risultino non corrette. Pertanto, è necessario considerare una nuova variabile aleatoria X definita come: X = “numero di fatture non corrette su 4 estratte a caso” Si noti che il supporto di X è dato da: RX = 0, 1, 2, 3, 4 Quindi, è richiesto di calcolare Pr (X = 2) Scenari X 1 X 2 X 3 X 4 PROB.

  1. 1 1 0 0 pp(1-p) *(1-p)
  2. 1 0 1 0 p*(1-p) p(1-p)
  3. 1 0 0 1 p*(1-p) *(1-p) *p
  4. 0 1 1 0 (1-p) pp*(1-p)
  5. 0 1 0 1 (1-p) p(1-p) *p
  6. 0 0 1 1 (1-p) (1-p) * p p Pr (X = 2) = 6p^2 * (1-p)^2  Numero di “modi” con cui è possibile osservare 2 fatture non corrette sulle 4 estratte Una variabile aleatoria discreta X si dice binomiale se rappresenta il numero di successi ottenuti in n prove bernoulliane indipendenti. Il supporto di una variabile aleatoria binomiale è RX = 0, 1, 2, …, n La funzione di probabilità di una variabile aleatoria è data da: p(x) = 1 = successi 0 = insuccessi 6p^2 * (1-p)^2

dove è un numero che indica il numero di COMBINAZIONI con cui si possono estrarre x oggetti da n disponibili, e si calcola come: Con n! = 123n Esempio (continua) Pr (X = 2) = p (2) =

  • se X è una variabile aleatoria binomiale, indicata con: X  binom (n, p)  “distribuito come”  = E (X) = np ^2 = var (X) = np(1-p) Esempio (continua) X  binom (n = 4, p = 0.10)  = E (X) = np = 4*0.10 = 0. n! = x! (n -x) Quindi la funzione di probabilità della variabile binomiale X è data da: p (x) =
  1. valore atteso  = E (X) = x * f (x) dx  se Y = aX + b -> E (Y) = aE(X) + b
  2. momenti  = E (Xk) = xk^ * f (x) dx Ad esempio, il momento 2° è dato da  = E (X^2 ) = x^2 * f (x) dx
  3. varianza ^2 = E (X - )^2  = xk^ * (x - )^2 * f (x) dx Anche in questo caso la varianza anche in questo caso vale che: ^2 = E (X - )^2  = E (X^2 ) - E(X)^2  se Y = a*X + b => var (Y) = a^2 * var (X)
  4. deviazione standard  = ^2 Modelli probabilistici per variabili aleatorie continue -> distribuzione normale o gaussiana Una variabile aleatoria X continua si dice essere distribuita come una distribuzione normale con valore atteso  e varianza ^2 se la sua funzione di densità è data da: f(x) = 1/ 2 ^2 = e −( tμ )^2 2 σ^2 3.14 2. Una variabile aleatoria continua X con distribuzione nominale con valore atteso  e varianza ^2 si indica spesso con: X  N (, ^2 ) E (X) =  Var (x) = E (X - )^2  = ^2
  •  k = 1, 2, …
  •  x  R  -> “distribuito come”
  • a campana
  • simmetrica attorno alla media della distribuzione 
  •  = mediana = moda
  •  -  e  +  dipendono dal valore di  e dal valore della deviazione standard
  •  -  e  +  ci evidenziano come  misuri la variabilità, la dispersione

Lezione del 29/03/ La funzione di ripartizione di una variabile aleatoria X  N (, ^2 ) è data da: (x) = Pr (X  x) =  f (t) dt f(x) = 1/ 2 ^2 * (^) e −( tμ )^2 2 σ^2 dt Data una variabile aleatoria normale con media  e varianza ^2 ovvero X  N (, ^2 ) Si consideri la seguente trasformazione di X -> standardizzazione x

  •  x  R F (x) = alla probabilità con cui la mia normale assume dei valori che sono  di quel x riportato sull’asse orizzontale. Man mano che x* si sposta verso destra la probabilità di osservare valori che sono  di un numero che cresce a mano a mano che ci spostiamo verso destra sull’asse orizzontale, questa probabilità si avvicina sempre di più a 1.