
































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Una panoramica approfondita sui concetti fondamentali della probabilità, inclusi l'interpretazione classica, le regole elementari, la probabilità condizionata e l'indipendenza statistica. Vengono inoltre presentati modelli probabilistici per variabili aleatorie discrete e continue, come la distribuzione normale o gaussiana. Il documento copre inoltre argomenti avanzati come la funzione di ripartizione, la standardizzazione di variabili aleatorie normali e il concetto di vettore aleatorio bidimensionale con le relative distribuzioni di probabilità congiunte e condizionate. Questo materiale rappresenta una risorsa preziosa per studenti universitari che studiano corsi di probabilità e statistica, fornendo una solida base teorica e numerosi esempi applicativi.
Tipologia: Appunti
1 / 40
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!

































Lezione del 9/03/ RELAZIONI LINEARI Prosecuzione di quello che abbiamo visto fin ora dell’associazione di tipo lineare tra due variabili x y che abbiamo visto nei precedenti video attraverso il calcolo della covarianza e dell’indice di correlazione lineare insieme al diagramma di dispersione. adesso ci domandiamo quale sia la migliore relazione di tipo lineare: quindi la migliore espressione analitica della retta migliore (dovremmo definire cosa si intende per migliore) che lega le due variabili y e x OBBIETTIVO: determinare l’espressione analitica della “migliore” retta che rappresenta la relazione tra y e x. Utile per il calcolo delle previsioni di y per un dato valore di x “epsilon”
parte parte strutturale di errore (si chiama strutturale perché contiene l’espressione che successivamente, una volta che i
saremmo in grado di calcolare le previsioni) Questa relazione lineare prevede che la variabile di risposta sia in parte modellata attraverso un’espressione strutturale e tutto quello che la variabile x non è in grado di spiegare di y compone la parte di errore.
yi = previsione ottenuta attraverso il modello che stiamo considerando con la relazione lineare ipotizzata per l’osservazione i-esima. Valore calcolato sulla base dell’osservazione
yi diverso da yi yi = valore osservato per la variabile y in corrispondenza dell’osservazione i-esima. (contiene l’informazione su y che non è possibile spiegare attraverso la variabile x) Non sono noti e dobbiamo stimarli sulla base di un campione di osservazioni OBBIETIVO: indentificare qual è la retta migliore che chiaramente sarà una retta che passe nel mezzo della nuvola dei punti, non sarà ne una retta che passa o sopra o sotto e neanche una retta che procederà in senso opposto rispetto alla direzione dei punti che stimo considerando, sarà sicuramente una retta che passa all’interno della nuvola dei punti che stiamo analizzando Le differenze che abbiamo tra il valore osservato per la variabile di risposta e il valore previsto si chiama RESIDUO ei=residuo per l’osservazione i-esima. Il residuo di una relazione lineare per una certa osservazione corrisponde ad una differenza tra il valore osservato e il valore previsto per quella osservazione: yi – yi = errore di previsione commesso dal modello per l’osservazione i-esima
I valori dei due coefficienti b 0 e b 1 sono ottenuti attraverso il metodo dei minimi quadrati i valori di b 0 e b 1 ottimali corrispondono a quei valori che rendono minima la somma dei residui al quadrato
Secondo il metodo dei minimi quadrati, i valori ottimali di b 0 e b 1 sono quelli che rendono minima la somma dei residui al quadrato:
2 (covarianza campionaria diviso per varianza campionaria di x)
il b 1 è un numero che in modo indiretto è legato all’indice di correlazione lineare, legato in modo diretto alla covarianza. Infatti, b 1 si può riscrivere utilizzando l’indice di correlazione lineare in modo da esplicitare che tipo di relazione c’è tra b 1 e l’indice di correlazione lineare
diviso varianza campionaria di x o equivalentemente si può calcolare come indice di correlazione lineare campionario che moltiplica deviazione standard campionaria di y diviso per deviazione standard campionaria di x. Questa seconda formula permette di evidenziare l’unità di misura dell’indice di inclinazione stimato b 1 che è il rapporto tra le unità di misura della variabile y e della variabile x. Questo perché l’indice di correlazione lineare non ha unità di misura, è un numero adimensionale, mentre le unità di misura della deviazione standard di y e di x dono le stesse unità di misura delle corrispondenti variabili, per cui b 1 ha come unità di misura l’unità di misura di y diviso per l’unità di misura di x. Inoltre, questa formula permette di evidenziare la relazione diretta che c’è tra l’indice di correlazione lineare e l’inclinazione della migliore retta dei minimi quadrati. Questa relazione è diretta: gli indici di correlazione lineare positivi daranno origine a indici di b 1 positivi, invece quelli negativi daranno origine a indici negativi. Allo stesso modo se l’indice di correlazione lineare tra due variabili è uguale a 0 anche b 1 (l’inclinazione dei minimi quadrati) sarà uguale a 0. Questo indica che b 1 non è altro che la stessa informazione fornita dall’indice di correlazione lineare che però tiene conto del diverso ruolo che adesso giocano le variabili y e x. Mentre nell’indice di correlazione lineare il ruolo delle due variabili è indistinto, nel caso di b 1 e b 0 non è più vero, se noi calcoliamo la relazione lineare tra x e y o l relazione lineare tra y e x otteniamo dei valori per b 1 e b 0 che sono completamente diversi. Per cui le relazioni lineari richiedono di utilizzare un ordine ben specifico. L’unità di misura di b 0 è data dall’unità di misura di y. STARE ATTENTI CHE DAVANTI A b 1 C’È UN SEGNO NEGATIVO QUINDI SE b 1 È NEGATIVO BISOGNA METTERE + E SE È POSITIVO BISOGNA LASCIARE IL -. Una volta che abbiamo calcolato i valori di b 1 e b 0 è possibile utilizzarli per calcolare delle previsioni per Y Esempio (continue) Y = “€spent” X = “#items” n = 1 x = 3 items y = 40€ sxy = 79.6429 (items *€) Funzione obbiettivo che si vuole minimizzare nell’ambito dei minimi quadrati. Il metodo dei minimi quadrati richiede che i valori ottimali di b 0 e b 1 siano determinati andando a minimizzare la somma dei residui al quadrato cioè minimizzare una quantità che sintetizza gli errori di previsione commessi dal modello in corrispondenza di tutte le osservazioni. Il fatto di prendere al 2 è necessario perché alcuni residui sono positivi e alcuni sono negativi, se noi sommassimo residui positivi e negativi questi si compenserebbero e non riusciremmo a trovare una risposta che abbia un senso applicativo.
relazione continuerà ad essere dello stesso tipo oppure cambierà. Quindi è molto rischioso fare delle previsioni (in questo caso chiamate estrapolazioni ) in scenari che sono molto diversi da scenari che sono stati inclusi nel campione stesso. PER CONCLUDERE: a prima previsione è una ^revisione affidabile perché è calcolata in corrispondenza del valore del numero di articoli incluso nel range viceversa la seconda previsione per il secondo potenziale nuovo cliente non è una previsione affidabile perché è calcolata in corrispondenza di un numero di articoli che cade molto al di fuori dal range che noi abbiamo osservato.
Sottoinsieme di eventi elementari di uno spazio campionario, si indicano con lettere maiuscole (A, B, …) Esempio: (continua)
Dato un evento A , l’evento complementare di A l’insieme degli eventi elementari che non appartengono ad A
h ->
La probabilità di un certo evento A, P(A)= p, corrisponde al prezzo p che un individuo sarebbe disposto a pagare o a ricevere per entrare in una scommessa che prevede di riscuotere o pagare un importo monetario unitario se A si verifica e nulla se A non si verifica -> ha dato origine a quella parte della statistica detta statistica ba yesiana DEFINIZIONE ASSIOMATICA DI PROBABILITÀ Sia lo spazio campionario di un esperimento aleatorio. Si dice misura di probabilità o semplicemente probabilità una qualsiasi funzione P definita per ogni possibile evento A tale che: (1) 0 P(A) 1 (2) P () = 1 evento certo (3) presi A 1 , A 2 , A 3 … infiniti eventi disgiunti a coppie, allora la probabilità che l’unione di questi eventi (eventi un numero infinito) corrisponda alla somma delle probabilità di ognuno degli eventi ADDITTIVITÀ COMPLETA REGOLE ELEMENTARI DELLA PROBABILITÀ -> evento complementare Sia A un evento con probabilità P (A), allora P (Ac) = 1 - P(A) -> regola della somma Siano A e B due eventi qualsiasi, allora P (AB) = P (A) + P(B) - P(AB)
Inoltre P (DA 1 ) = 0. P (DA 2 ) = 0. P (DA 3 ) = 0. P (DA 4 ) = 0. P (D A 5 ) = 0. Quindi, per il teorema delle probabilità totali si ottiene direttamente P (D) = P (Ai) * P (D Ai) = 0.100.05 + 0.220.02+…+0.19*0.08 0. 7° CONCETTO: INDIPENDENZA STATISTICA DI DUE EVENETI Dati due eventi A e B qualsiasi, sapere che questi sono “indipendenti” implica che: P (B A) = P (B) e P (AB) = P (A) Ma in questo caso ciò implica che P (AB) = P (A) * P (B A) = P (A) * P (B) Ed equivalentemente: P (AB) = P (B) * P (A B) = P (B) * P (A)
La variabile aleatoria di X è una funzione che prende ognuno di questi eventi elementari e associa ad ognuno di questi eventi elementari un valore sull’asse reale. ATTENZIONE A NON CONFONDERE VARIABILE ALEATORIA CON IL CONCETTO DI MISURA DI PROBABILITÀ. La misura di probabilità (come visto nelle lezioni precedenti) è una funzione di insieme nel senso che ad ogni sottoinsieme di omega associa un numero tra 0 e 1 e non associa quindi ad ognuno degli eventi elementari un numero reale. Esempio esperimento aleatorio: lancio di 2 dadi (regolari) a 6 facce. spazio campionario: (i, j), i, j = 1, 2, …, 6 si consideri la variabile aleatoria X = “somma dei punteggi ottenuti” X ((i, j)) = i + j, (i, j) Quindi l’insieme dei possibili valori che la variabile aleatoria X può assumere è RX= 2,3,4,…, RX SUPPORTO della variabile aleatoria X Altre possibili variabili aleatori che potremmo definire sono:
Esempio Esperimento: lancio di 4 monete regolari = (T, T, T, T), (T, T, T, C), …, (C, C, C, C) Con = 2^4 = 16 Essendo le monete regolari, gli eventi elementari sono equiprobabili, ovvero P () = 1/16, si consideri la variabile aleatoria X = “numero di teste osservate”. Quindi, il supporto di X è RX = 0, 1, 2, 3, 4 1/16 x = 0 4/16 = 1/4 x = 1 6/16 = 3/8 x = 2 p (x) = 4/16 = 1/4 x = 3 1/16 x = 4 0 altrove La funzione di ripartizione è data da: 0 x 0 1/16 0 x 1 1/16 + 4/16 (1/4) 1 x 2 F (x) = 1/16 + ¼ + 6/16 (3/8) 2 x 3 1/16 + ¼ + 3/8 + 4/16 (¼) 3 x 4 1 x 1 La funzione di ripartizione è utile per calcolare probabilità relative alla variabile aleatoria X, in particolare: Pr (a X b) = F (b) – F (a) Sia X una variabile aleatoria discreta con funzione di probabilità p (x):
xi RX xi RX
Un altro momento utile per le variabili aleatorie è il momento di ordine 2, ovvero: 2 = E (X^2 ) = xi 2 * p(xi)
notiamo che per ognuna della 4 fatture possiamo modellare la probabilità che siano non corrette attraverso un modello di Bernoulli. In particolare, definiamo X 1 =”la prima fattura estratta non è corretta” X 2 =”la seconda fattura estratta non è corretta” X 3 =”la terza fattura estratta non è corretta” X 4 =”la quarta fattura estratta non è corretta” Segue quindi: lezione del 23/03/ X 1 Ber (p = 0.10) X 2 Ber (p = 0.10) X 3 Ber (p = 0.10) X 4 Ber (p = 0.10) Inoltre, è ragionevole assumere che le 4 variabili aleatorie bernoulliane siano tra loro indipendenti. L’esempio però richiede di calcolare la probabilità che su 4 fatture, 2 risultino non corrette. Pertanto, è necessario considerare una nuova variabile aleatoria X definita come: X = “numero di fatture non corrette su 4 estratte a caso” Si noti che il supporto di X è dato da: RX = 0, 1, 2, 3, 4 Quindi, è richiesto di calcolare Pr (X = 2) Scenari X 1 X 2 X 3 X 4 PROB.
dove è un numero che indica il numero di COMBINAZIONI con cui si possono estrarre x oggetti da n disponibili, e si calcola come: Con n! = 123…n Esempio (continua) Pr (X = 2) = p (2) =
Lezione del 29/03/ La funzione di ripartizione di una variabile aleatoria X N (, ^2 ) è data da: (x) = Pr (X x) = f (t) dt f(x) = 1/ 2 ^2 * (^) e −( t − μ )^2 2 σ^2 dt Data una variabile aleatoria normale con media e varianza ^2 ovvero X N (, ^2 ) Si consideri la seguente trasformazione di X -> standardizzazione x