





















































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
appunti del corso di statistica inferenziale del Prof. Mineo
Tipologia: Sintesi del corso
Caricato il 27/03/2021
4.5
(2)2 documenti
1 / 61
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!






















































CALCOLO DELLA PROBABILITA’. Cap. 1 La probabilità è da intendere una branca assolutamente della matematica, è la cosiddetta matematica dell'incerto e anche lo sviluppo dei concetti di calcolo delle probabilità fanno sì che questa disciplina sia all'interno del grande calderone che costituisce la matematica. È diverso il modo di procedere della matematica e della statistica soprattutto dell'inferenza statistica, per quanto riguarda lo sviluppo e il ragionamento che si segue per la matematica è un ragionamento di tipo deduttivo, mentre per l’inferenza statistica il ragionamento invece è diverso, abbiamo bisogno di trarre informazioni da un'intera popolazione e questo non lo si può fare su un campione. Quindi dal punto di vista del ragionamento matematica e statistica seguono ragionamenti completamente diversi, in generale questo fa sì che non si possa fare entrare la statistica all'interno della matematica, è vero che però la statistica utilizza per sviluppare i propri metodi tecniche proprie della matematica ma è diverso l'obiettivo per il diverso tipo di ragionamento. Possiamo definire il calcolo delle probabilità utilizzando alcuni concetti:
1. L’esperimento Casuale o Aleatorio , ossia come un qualsiasi esperimento il cui esito non può essere previsto con certezza, come ad es.: -i giochi di sorte (come il lancio di una moneta, l'estrazione di un numero al lotto, l'estrazione di un numero alla roulette), - gli esperimenti di laboratorio (come il test di durata di uno pneumatico, la somministrazione di un principio attivo ad una cavia) - misurazioni fisiche (come la temperatura minima di domani in una certa stazione meteorologica) - fenomeni economici e sociali (come il numero di computer prodotti da un'impresa del settore, il PIL italiano fra 5 anni o il ROE di un'impresa nel prossimo esercizio) in generale tutte le prove, operazioni, attività o fenomeni il cui esito non è prevedibile con certezza. 2. Dato un esperimento casuale, è detto evento elementare uno dei possibili esiti dell’esperimento stesso. 3. Dato un esperimento aleatorio, si dice spazio campionario , l’insieme S di tutti i possibili risultati, esaustivi e mutualmente esclusivi dell’esperimento stesso, tali possibili risultati sono detti punti campionari o eventi elementari. Es. lanciando una moneta S = (T; C), se l'esperimento aleatorio viene ripetuto k volte, lo spazio campionario complessivo è dato dal prodotto cartesiano S x S x S… x S k volte. Oppure ad es. lanciando due volte una moneta lo spazio campionario complessivo è (T,C) x (T,C) i cui punti campionari sono TT; TC;CT;CC. Lo spazio campionario può essere: - A cardinalità finita, lo spazio campionario sarà un insieme costituito da un numero finito di eventi elementari; - cardinalità infinita numerabile, in quanto, l’insieme di tutti i possibili risultati dell’esperimento casuale è un insieme costituito da un numero infinito di elementi, numerabile, in quanto, gli elementi possono essere messi in corrispondenza con gli elementi dell’insieme degli Interi non negativi (i quali coincidono con i Naturali comprensivi dello zero); - cardinalità infinita non numerabile , in quanto, l’insieme di tutti i possibili risultati dell’esperimento casuale è un insieme costituito da un numero infinito di elementi, non numerabile, in quanto non è possibile associare gli elementi del suddetto insieme con gli elementi dell’insieme degli Interi non negativi. 4. Dato uno spazio campionario S, un evento è un sottoinsieme di S costituito quindi da uno o più punti campionari, a parte il caso dell’evento impossibile (insieme vuoto Ø). Un evento E si verifica (si realizza) quando il risultato dell’esperimento casuale è un qualsiasi punto campionario di E, mentre in caso contrario E non si verifica. Diagramma di Venn. Con diagramma di Venn, si intende una rappresentazione grafica di tipo qualitativo dove all’interno vi è la rappresentazione dello spazio campionario di tutti i possibili eventi che si possono verificare a partire da un esperimento aleatorio, rappresentando all’interno del rettangolo i possibili eventi come se fossero degli insiemi: La logica delle proporzioni, cioè come si combinano gli eventi tra di loro per produrre nuovi eventi, corrisponde alle operazioni sugli insiemi come quelli di unione ed intersezione.
Tipi di Eventi. Due o più eventi si dicono disgiunti o incompatibili o mutuamente esclusivi quando la realizzazione di uno esclude la realizzazione dell’altro (due eventi elementari sono sempre incompatibili), per eventi incompatibili si intendono 2 eventi che in generale non hanno nulla in comune, cioè quando non hanno punti campionari comuni, ad es. nell’estrazione di una carta A = (picche) e B = (fiori) sono incompatibili. Due o più eventi si dicono collettivamente esaustivi quando almeno uno di loro si verifica sicuramente, tali eventi possono formare una partizione quando sono contemporaneamente disgiunti e collettivamente esaustivi, come ad es. nell’estrazione di una carta A = (picche), B = (fiori), C = (quadri) e D = (cuori) formano una partizione. Evento complementare. S i definisce complementare di E, tutti gli eventi complementari che non appartengono a E, quindi tutto ciò che all’esterno di E. In generale quindi possiamo dire che il complementare di un evento E è rappresentato dall’insieme di tutti gli altri elementi dello
Es. Nel lancio di un dado, posto E ={numero pari} si ha E’ ={numero dispari} Un generico evento E ed il suo complementare, costituiscono una partizione dello spazio campionario, questo perché E e il suo complementare E’ non hanno eventi in comune e quindi sono incompatibili, sono mutuamente esclusivi tra di loro. Però se si considera E insieme al suo complementare, abbiamo tutto lo spazio campionario S. Unione e intersezione. Le operazioni di unione e intersezione producono nuovi eventi, un’unione di eventi si verifica quando generano contemporaneamente un unico evento, quindi produce un nuovo evento che si verifica quando almeno uno degli eventi uniti si verifica, ed è indicata dalla simbologia C = A ∪ B , la lettura logica: “o” vale a dire, che l’evento C si realizza quando si realizza A oppure B. Un’ intersezione di eventi si verifica quando abbiamo la creazione di un evento mediante l’intersezione di 2 eventi di A e B, cioè quando vi è una zona comune. Produce un nuovo evento che è vero quando tutti gli eventi in considerazione si verificano contemporaneamente, è indicata dalla simbologia D = A ∩ B con lettura logica: “e”, ovvero, l’evento D si realizza quando si realizza A e B. Eventi disgiunti, eventi esaustivi. Utilizzando a questo punto la nozione di unione e intersezione due eventi A e B sono:
- Disgiunti (incompatibili) se non hanno parti in comune, quindi se la loro intersezione è l’insieme vuoto, cioè non contiene alcun evento A∩B= ∅ e quindi l’evento è impossibile; - Collettivamente esaustivi quando formano l’intero spazio campionario, quindi, 2 eventi A e B sono collettivamente esaustivi quando la loro unione da tutto lo spazio S A U B = S PROBABILITA’. Cap. 1. Una volta definiti questi eventi, che di fatto sono eventi aleatori, occorre costituire una misura che determini il grado di incertezza con cui si possa realizzare un evento, questa misura è quella che possiamo definire con il termine Probabilità. La probabilità quindi, ci sta ad indicare qual è il grado di incertezza con cui si può manifestare un evento, che per convenzione da un punto di vista matematico, si definisce come una misura che possiamo esprimere in quantità numeriche, che però può assumere valori che siano compresi tra 0 e 1 , dove con 0 si indica la probabilità che quell’evento non potrà realizzarsi, il cosiddetto evento impossibile, mentre con 1 associamo quell’evento che sicuramente si verificherà, definito come evento certo. Questi sono casi estremi in cui si verificano tali eventi, nella scala che va da 0 a 1 esistono tutta una serie di eventi che possono misurare un grado di incertezza nel verificarsi più o meno grande, e quindi tanto più alta è la probabilità e tanto più sto ritenendo che possa verificarsi quell’evento, ma solo se l’evento è pari a uno siamo sicuri che quell’evento si verifichi. Quindi, tanto più ci si avvicini a 1 nella scala di probabilità, tanto più sarà elevata la possibilità che si verifichi che l’evento sia certo. Dunque, la probabilità di un evento P(A) non può che essere un numero compreso tra i valori 0 e 1, dove P(A) è un numero non un insieme.
esca sempre testa, cioè la frequenza relativa osservata di T è 1. Chiaramente 1 è molto lontano da 0.5, tuttavia se n è molto piccolo l’evidenza empirica contro il modello ipotizzato è comunque debole. Infatti, se il modello ipotizzato è vero, la probabilità di osservare n teste su n lanci è 1/2n e quindi, ad es., è 1/4 per n=2, 1/16 per n=4, 1/256 per n=8. Definizione Assiomatica della probabilità e conseguenze. In questo contesto, possiamo definire la probabilità da un punto di vista matematico, come una funzione d’insieme
- La probabilità di un qualunque evento deve essere maggiore-uguale a 0; - La probabilità associata all’intero spazio campionario deve essere = 1, cioè quello spazio che contiene tutti gli eventi possibili, gli eventi elementari che si possono verificare, dove al di fuori di esso non si può realizzare quell’evento, e che quindi possiamo definire la probabilità associata all’evento certo deve essere pari a 1; - Il terzo assioma ci dice che, se considero in generale un certo numero di eventi, A1 A2 ecc., e considero la probabilità dell’unione degli eventi, tale unione è data dalla somma dei singoli eventi purché tutti gli eventi siano a due a due incompatibili tra di loro. Quindi, in generale l’unione di ogni singolo evento (insieme) è dato dalla somma di eventi purché siano a due a due incompatibili. Da questi assiomi, seguono tutta una serie di conseguenze degli assiomi: Regole della probabilità. Altre possibili conseguenze che possono derivare dagli assiomi, sono i seguenti: a) se consideriamo l’evento A, e consideriamo il suo complementare che potremmo chiamare non A, cioè gli eventi complementari non sono contenuti in A, entrambi costituiscono una partizione dell’intero spazio campionario S. ricordando questo, si può ottenere quella che è La regola dell’evento complementare , per
b) Altra regola da considerare, è la cosiddetta Regola della somma (o additiva) , dove la probabilità di unione di 2 eventi generici è data da: viene considerata l’area comune degli insiemi, e quindi sottrarla. c) Se A e B sono incompatibili P( A∩B) = P ( ∅ ) = 0 e quindi l’espressione sarà P(A U B) = P(A) + P(B)
Probabilità congiunte. Con probabilità congiunta di 2 eventi, in generale si intende la probabilità di A∩B, in particolare, se abbiamo 2 eventi A e B, e consideriamo i complementari di ciascuno di questi 2 eventi, avremo la probabilità dell’intersezione degli eventi corrispondenti della tabella di entrata. Da notare che la somma di queste probabilità in tabella, è
perché la probabilità di A intersezione B + la probabilità di A intersezione del complementare B, corrisponde all’unione di due eventi che sarebbe la probabilità del complementare di A, la somma ne costituisce le probabilità marginali. La somma delle probabilità marginali congiunte per due eventi A e B sarà: Calcolo Combinatorio. Facciamo ricorso al calcolo combinatorio in vista del fatto che talvolta è difficile contare i casi perché sono molti e non è pratico elencarli tutti uno ad uno, quindi la soluzione potrebbe essere, usare il calcolo combinatorio. Il calcolo combinatorio è il termine che denota tradizionalmente la branca della matematica che studia i modi per raggruppare e/o ordinare secondo date regole gli elementi di un insieme finito di oggetti, quindi, possiamo dire che il calcolo combinatorio studia i raggruppamenti che si possono ottenere con un dato numero n di oggetti disposti su un dato numero K di posti, i raggruppamenti si possono formare con ripetizioni oppure senza, se viene considerato l’ordine o meno. In particolare abbiamo:
**- Combinazioni;
dove la probabilità e associata a ciascuna modalità di frequenza relativa che possiamo ottenere rapportando A/S, B/S e C/S. bisogna dire che non sono dati affidabili perché la stima non ha una costanza nel tempo, quindi è probabile che le preferenze siano cambiate, per questo non sono affidabili, il più grande problema della definizione frequentista della probabilità. Considerando invece, una tabella a doppia entrata, in particolare si considerano 2 variabili qualitative sconnesse, e quindi, nel caso in cui gli eventi di interesse siano relativi a due o più caratteristiche, la situazione è rappresentata da una distribuzione multipla di frequenza (doppia, se le caratteristiche sono solo 2) (200/300 = 0.20) Ora, supponiamo di essere interessati alla probabilità dell’evento C che l’unione di acquisto pianificato o acquisto effettivo si: Dove, abbiamo 2 modi per calcolare P(C) = P(A) U P(B) <-- (1) <-- (2) Supponendo invece quale sia la probabilità che il consumatore che ha pianificato l’acquisto lo abbia poi effettuato, possiamo far ricorso alla probabilità condizionata , e quindi: 200 / 250 = 0. Dato che siamo partiti dagli stessi dati, in questo caso il risultato rimane invariato. Nell’ipotesi in cui invece, ci si chieda qual è la probabilità di A (acquisto pianificato) dato che B (acquisto effettivo): Adesso, per verificare se A e B siano indipendenti o no, consideriamo se: Dall’esempio possiamo verificare che A e B non sono indipendenti. PROBABILITA’ MARGINALE. Dato uno spazio campionario S, e si supponga di avere una partizionare di B1, B2,... , Bk , e dato un evento A di cui si conoscono le probabilità delle intersezioni con gli elementi della partizione, la probabilità di A è
P(A) = P(A ∩ S) = ma dato che abbiamo presupposto che la partizione sia B allora: P(A ∩ (B1 ∪ B2 ∪... ∪ Bk)) = che per la proprietà distributiva, che lega intersezione e unione anche tra gli insiemi che P(A ∩ (B1 ∪ B2 ∪... ∪ Bk))= è uguale a = P((A ∩ B1) ∪ (A ∩ B2) ∪... ∪ (A ∩ Bk)). In base al terzo assioma delle probabilità, la probabilità dell’unione di questi eventi le possiamo scrivere come la somma delle probabilità dei singoli eventi, quindi: Da notare che A ∩ B1 e A ∩ B2 non hanno intersezione come, cosa che per definizione possiamo considerali come eventi incompatibili. Questo metodo si chiama marginalizzazione ed è proprio quello che si usa nelle tabelle doppie per calcolare le frequenze marginali. In base alla formula marginale ottenuta P(A) = P(A ∩ B1) + P(A ∩ B2) +... + P(A ∩ Bk), applicando la regola moltiplicativa otterremo: Quindi, la probabilità di A la possiamo esprime come la somma di tutte le probabilità, che possiamo definire come probabilità totali. Dove quindi, abbiamo la combinazione attraverso il prodotto, della probabilità condizionate di A dato uno degli eventi che costituiscono la partizione dello spazio campionario, moltiplicata la probabilità marginale di quell’evento, che contribuisce alla partizione dello spazio campionario S. Dunque, La probabilità di A si ottiene come media pesata delle probabilità di A dato Bi , con pesi pari alle probabilità di Bi. Tali pesi hanno caratteristiche tali che la loro somma deve da 1, perché la probabilità P(B1) + P(B2) + … P(Bk), la possiamo considerare come l’unione di tutti questi eventi che costituisce S, e che per il secondo assioma delle probabilità è 1. Teorema di Bayes. La formula delle probabilità totali corrisponde a un ragionamento per scenari a delle ipotesi, la formula di Bayes si lega molto a questo tipo di ipotesi. Usualmente l’evento Bi è identificato con una ipotesi (scenario) la cui realizzazione modifica la probabilità di versificarsi dell’evento A. Il teorema di Bayes trova fondamento sull’idea di invertire la logica illustrata, dato che abbiamo delle informazioni aggiuntive, ottenute dal verificarsi o meno dell’evento A , come cambia la probabilità che sia vera l’ipotesi Bi? Se consideriamo gli eventi Bi come delle ipotesi relative ad uno specifico fatto, la formula di Bayes si può interpretare come il modo in cui le valutazioni iniziali sulle ipotesi fatte prima dell’esperimento (cioè P ( Bi )) si debbano modificare una volta che si conosca l’esito dell’esperimento. La formula in questione è: Dove, con P(Bi) indichiamo delle probabilità definite a priori, ossia probabilità che assegniamo a ciascun evento prima che si realizzi la nuova evidenza empirica, cioè il nuovo fatto, chiamiamo invece P(Bi|A) quelle che possiamo definire a posteriori. Ma perché a priori o posteriori, il tutto dipende dall’evento A, perché prima che si realizzi l’evento A, fissiamo delle probabilità per gli stati di natura per l’evento Bi, quindi a priori fissiamo queste probabilità. Dopo ci chiediamo come sono cambiate le probabilità degli stati di natura Bi dato che sappiamo che si è verificato l’evento A dette per l’appunto probabilità a posteriori. Le probabilità condizionate presenti nella formula costituiscono che la probabilità che si realizzi A dato che ipotizziamo che si realizzi il primo stato di natura Bi e cosi via, A è il fatto nuovo, quindi per tale motivo P(A|B1..) vengono chiamate verosimiglianze , cioè quello che ci dice l’evidenza, cioè quello che può sembrare verosimile in base all’evidenza. VARIABILI CASUALI. Cap. 1. Variabili casuali. Una variabile casuale o variabile aleatoria rappresenta un possibile valore numerico prodotto dall’esperimento aleatorio, ma in realtà da un punto di vista più formale, possiamo vedere la variabile casuale come una funzione matematica, in particolare sappiamo che, fissato un esperimento aleatorio dove sono legati diversi elementi elementari, dove in generale possiamo legare attraverso una funzione matematica appunto, tutto lo spazio campionario a un insieme numerico. Cioè è come se venisse associato a un evento elementare relativo a un determinato esperimento aleatorio un numero, e questa funzione si chiama variabile casuale. In generale però, una variabile aleatoria trattandosi di una funzione matematica, conterrà tutti i possibili valori che può assumere la variabile casuale, e che possiamo definire supporto della variabile casuale, e quindi, il supporto della variabile casuale è l’insieme di tutti i valori che può assumere questa variabile casuale.
valori negativi, proprio perché le probabilità non possono assumere valori negativi. Allora, una generica funzione deve necessariamente soddisfare queste due proprietà: In particolare, la prima ci dice che, se consideriamo la probabilità che la variabile casuale X assuma un generico valore x, che possiamo riscrivere come p(x), necessariamente dovrà restituire un valore > uguale a 0 , in base al primo assioma delle probabilità, la quale ci diceva che la probabilità di un generico evento aleatorio, qualunque sia l’evento che stiamo considerando, deve essere > uguale a 0. La seconda ci dice che, le singole proprietà devono sommare uguali a 1, e questo si ricollega agli altri due assiomi, dove il secondo assioma ci dice la probabilità dell’evento certo è pari a 1, mentre il terzo assioma ci diceva che, se abbiamo degli eventi compatibili, la proprietà degli eventi è la somma delle probabilità dei singoli eventi, in questo caso, stiamo considerando tutti i valori in corrispondenza del supporto. Funzione di ripartizione. Possiamo definire anche quella che viene definita funzione di ripartizione , in generale, tale funzione si può definire qualunque sia il tipo di variabile casuale che stiamo considerando, cioè possiamo definirla sia per le variabili continue che per variabili discrete. La funzione di ripartizione, indicata con F(x0), esprime la probabilità che X non superi il valore x0 cioè, la funzione di ripartizione, è la probabilità che X assuma valori minori- uguali a x0. Nel caso specifico di una variabile discreta, allora: cioè corrisponde alla sommatoria per tutti i valori possibili di x minori-uguali allo specifico x0. Sintesi delle distribuzioni. Quando abbiamo una variabile casuale, possiamo utilizzare dei valori di sintesi, in particolare:
- Abbiamo indici di posizione, dove troviamo il valore atteso che costituisce la media dei valori che assume la variabile casuale; - Indici di variabilità, di cui troviamo la varianza o deviazione standard, che va a misurare la dispersione della variabile casuale. Il valore atteso di una variabile discreta è la media dei possibili valori che assume la nostra variabile, pesati con le rispettive probabilità. Dove, il valore atteso è dato dalla sommatoria dei prodotti di ciascun valore a supporto della variabile casuale per la corrispondente probabilità, per tutti i possibili valori di x del supporto. Il valore, atteso possiede delle caratteristiche: - È uno scalare , cioè una riduzione di dimensione, vale a dire che noi passiamo da una dimensione che assumeva diversi valori, ad un unico valore che è il valore atteso; - È una costante, cioè non può assumere dei valori casuali, quindi non è aleatorio; - È l’equivalente certo di una somma aleatoria. La varianza invece, può essere definita come il valore atteso degli scarti di ciascun valore della variabile casuale, dal proprio valore atteso scarti presi al quadrato: La deviazione standard (o scarto quadratico medio) Rappresenta il qualche modo la dispersione intorno alla media, quindi nel contesto di variabile casuale è un sintomo di incertezza, cioè quando abbiamo una variabile casuale a cui è legata una deviazione standard
grande, cioè se consideriamo il valore atteso di quella variabile casuale come media che possiamo aspettarci ad es. dopo un certo numero di lanci, quella media risulta poco affidabile se la deviazione standard è grande. Mentre se la deviazione standard è piccola, quel valore atteso di quella variabile casuale, significa che può essere considerato come valore affidabile come valore rappresentativo di quella variabile casuale. Considerando invece di avere una variabile discreta indicata con X e una nuova variabile casuale indicata con Y che è funzione però della vecchia variabile X, con g(.) una qualsiasi funzione matematica: il valore atteso di Y lo possiamo calcolare in funzione di X, in particolare, il valore atteso di Y sarà pari al valore atteso g valutata in X. Il valore atteso con argomento g(X) è uguale alla sommatoria esteso a tutti i valori che può assumere la variabile casuale x di g(x) per p(x), dove p(x) sono le probabilità associate a ciascuno dei valori che può assumere la variabile casuale x. Variabile aleatoria degenere. Per variabile aleatoria degenere intendiamo una variabile casuale che può assumere un unico valore, quindi se può assumere un unico valore può farlo con certezza, cioè a quell’unico valore sarà associata la probabilità 1. Per una variabile aleatoria degenera se assume valore a allora il valore atteso sarà 0. E(a) = a Var(a) = 0 Supponendo di avere una variabile aleatoria che viene moltiplicata per una costante b, il valore atteso risulta moltiplicato per b e la varianza per b^2, quello che abbiamo un cambiamento di scala: Combinazione lineare di variabile aleatoria.
indichiamo con Y la nuova variabile casuale che otteniamo trasformando la x utilizzando a + bx, allora la media e la varianza di y sono: Mentre la deviazione standard di Y sarà allora: Sono le stesse proprietà che valgono per media, varianza e deviazione standard calcolati su un insieme di dati. Famiglie parametriche di variabili casuali. Una famiglia parametrica di variabili aleatorie (detta anche modello probabilistico) è una collezione di funzioni di probabilità dipendenti da un parametro dove questo parametro lo consideriamo come un vettore, dove si intende un insieme ordinato di valori. Quindi, la famiglia parametrica è una collezione di funzioni di probabilità indicata con P(X = x) che sono le probabilità in corrispondenza dei valori che può assumere la variabile casuale X all’interno del supporto, ma ora dipendono da
grande. (vedi formula).
valore all’interno di theta grande, ma si suppone però di averlo fissato questo valore, e quindi che sia noto per poter valutare questa probabilità , e per valutare queste probabilità, metteremo uno specifico valore di x che può variare all’interno del supporto.
come il prodotto delle singole probabilità:
- Prove identiche: dove la probabilità di successo rimanga la stessa in tutte le medesime prove. Cioè in
diversi tra di loro: I requisiti di indipendenza e prove identiche sono soddisfatti quando ad es. si lancia ripetutamente una moneta oppure quando si effettuano estrazioni da un’urna con reintroduzione, perché il risultato di ciascuna estrazione non dipenderà da quello che è successo prima né quello che accadrà dopo, e in ogni caso la probabilità di estrarre la pallina di colore bianco quando la ributtiamo dentro, le probabilità sono identiche. Ma se uno di questi due requisiti
particolare:
- Il requisito di indipedenza è violato quando la probabilità di successo in una prova dipende dal risultato delle altre, e questo succede per es. quando si effettuano estrazioni da un’urna senza reintroduzione, perché ogni volta cambierà la composizione dell’urna e quindi anche il numero totale delle palline al suo interno, cosi come i colori delle palline si ridurranno in maniera non proporzionale, e quindi cambieranno anche le rispettive probabilità. Il fatto che abbia probabilità diverse tra un’estrazione e l’altra, questo fa sì che le prove che stiamo considerando non sono indipendenti. - Il requisito di prove identiche è violato quando la probabilità di successo cambia nel tempo, ad es. perché le prove sono effettuate da un soggetto che capisce che in quell’urna ci siano palline più fredde rispetto ad altre. Distribuzione Binomiale. Una volta definita la variabile binomiale, possiamo definire la funzione di distribuzione di probabilità per una variabile casuale binomiale, ovvero P(X = k) dove sta ad indicare che su n prove che stiamo considerando si sono verificati esattamente k successi, invece n – k ne determina invece gli insuccessi. La probabilità di avere successo è pari a p, e rimane costante per tutte le prive considerate, mentre la probabilità di avere un insuccesso sarà il suo complementare 1-p. Per le ipotesi fatte, la probabilità che k prove siano successi e le rimanenti n- k insuccessi è data da Supponendo che: La probabilità di avere successo o insuccesso è dato dalle singole probabilità. Cambiando la posizione dei successi (mescolando gli 0 e 1) si ottengono altre sequenze con esattamente gli stessi k successi, ognuna delle quali ha la stessa probabilità quindi non conta l’ordine con cui si moltiplicano questi valori perché alla fine avremo sempre quel risultato, per via anche della proprietà commutativa. Da notare che se n e k non sono piccoli comincia ad essere più complicato contare tutte le possibili sequenze che contengono esattamente k successi, in questo caso, tutte le sequenze le possiamo determinare con il numero combinatorio A questo punto quindi, tutte le possibili sequenze che si possono verificare sono n sopra k, e la probabilità che si verifichi una sola di queste sequenze è noi quindi dobbiamo considerare la probabilità di ottenere k successi su n prove a prescindere da qualunque esso sia l’ordine con cui abbiamo osservato i successi e gli insuccessi. Ciascuno di queste sequenze, se considerate come un evento casuale, sono eventi incompatibili perché non è possibile avere contemporaneamente 2 sequenze n sopra K, noi dobbiamo considerare la probabilità assuma valore X, cioè la probabilità di avere k successi sulle n prove, dobbiamo considerare la probabilità che si verifichi la prima sequenza unita alla probabilità che si verifichi la seconda sequenza e così via fino alla sequenza n sopra k, questo ci
darà la probabilità di X = k, ma sappiamo che dal terzo assioma di probabilità che l’unione di eventi incompatibili è dato dalla somma delle probabilità dei singoli eventi, e dato che la somma di uscita di una singola sequenza è la cui somma è esattamente n sopra k volte, quindi Questa è quella che possiamo definire come la funzione di distribuzione della variabile casuale binomiale, dove n apparterrà all’insieme dei numeri naturali, k apparterrà all’insieme delle variabili di supporto e p sarà lo spazio parametrico appartenente all’intervallo 0, 1. Graficamente la forma della distribuzione binomiale dipende dai valori di p e n, in particolare: Assumendo che abbiamo parametri n = 5 e p = 0.1 dove la distribuzione binomiale assumerà forma di forte asimmetria positiva, mentre se consideriamo n = 5 e p = 0.5 ne segue che la distribuzione binomiale è simmetrica. In particolare avremo che una generica distribuzione binomiale è sempre asimmetrica, tranne nel caso in cui p è esattamente uguale a 0.5. Distribuzione binomiale, media e varianza. Media e varianza possono essere calcolate applicando le rispettive formule, anche se il calcolo non è immediato, abbiamo dunque che:
- E (X) = n p risulta quindi a n volte della variabile casuale di Bernoulli, il valore atteso quindi è pari a n volte la media della singola variabile di Bernoulli; - Var (X) = n p (1-p) è pari dunque a n volte la varianza della singola variabile di Benoulli. Proporzione di successi. Con la variabile casuale binomiale sappiamo che è la somma delle variabili casuali Bernoulliane indipendenti, supponendo adesso di considerare la proporzione di successi, cioè non vogliamo sapere con esattezza quanti sono stati i successi, ma qual è la proporzione di successi su numero totale di prove, come ad es. considerare la proporzione di successo pari allo 0.4. Questo rapporto tra il numero di successi sul numero di prove, possiamo considerarla come la media aritmetica di tutti i valori assunti dalle variabili casuali Bernoulliane che compongono la variabile casuale binomiale.
campionaria di successi dove le n prove possono essere interpretate come un campione da una più ampia popolazione.
una distribuzione B(n, p) mentre il denominatore n è una costante. La proporzione di successi è una variabile aleatoria con supporto S = (0, 1/n, 2/n…1) costituito da n + 1 elementi. Supponendo che la probabilità della proporzione di successi sia minore uguale a c dove è compreso tra valori 0 e 1: Mentre il valore atteso e la varianza derivano dalla binomiale:
Dove, le costanti che dobbiamo fissare sono N, S, n e fissare queste tre quantità, saremo in grado di capire se X = x, e il valore massimo del supporto sarà il minimo tra quante palline si estraggono ad es. ovvero quanto è grande la dimensione di n, e quanti successi abbiamo all’interno dell’urna S. cioè il massimo che possiamo ottenere è il minimo tra n e s. Possiamo adesso determinare il valore atteso e la varianza di questa distribuzione ipergeometrica, dove denotando con p la proporzione di successi nella popolazione, otteremo che p = S/N cioè il rapporto fra il numero di successi S e il numero totale della popolazione N, allora si ha che il valore atteso della variabile casuale ipergeometrica è dato da n p, quindi E(X) = np mentre la varianza è dato da è una quantità compresa tra 0 e 1 Possiamo conlcudere dunque che a parità di p e n, la varianza della variabie casuale ipergeometrica è più piccola della varianza della variabile casuale binomiale, che possiamo chiamare fattore di riduzione della varianza , e osservando: notiamo che è se mettiamo soltanto N grande al denominatore, l’approsimazione è accettabile, e che quindi sono approssitavimante uguali. Dove la frazione di campionamento n/N se piccola, ovvero < 5% la contrazione della varianza è trascurabile, cioè si può ignorare l’effetto del campionamento in blocco. La distribuzione di Poisson. Il supporto della variabile casuale di Poisson è l’intero numero dei naturali, dove X può assumere un qualunque
Distribuzioni di probabilità congiunte. Per definire una distribuzione di probabilità congiunta dobbiamo considerare 2 variabili casuali che sono in qualche modo legate tra di loro, variabili indicate genericamente con X e Y con x i valori che può assumere X, e y i valori che può assumere Y. Si tratta quindi di una funzione a due variabili che possiamo genericamente incare con: Le distribuzioni di probabilità marginali riguardano una delle due variabili ignorando l’altra: e si calcolano sommando le probabilità congiunte rispetto all’altra variabile Distribuzioni condizionate. Le distribuzioni di probabilità condizionate della variabile aleatoria Y esprimono le probabilità di Y condizionatamente ad uno specifico valore x di x: E si calcola dividendo la probabilità congiunta per la probabilità marginale di X: in modo simile si definisce e si calcola la distribuzione di probabilità marginale di X da Y = y Indipendenza. Supponendo di avere 2 variabili aleatorie X e Y, esse saranno indipendenti se e solo se la loro distribuzione di probabilità congiunta è uguale al prodotto delle loro distribuzioni di probabilità marginali: per tutte le possibili coppie di x e y. Questo concetto lo possiamo estende con K variabili casuali, e sono indipendenti se e solo se Covarianza. La covarianza di due variabili aleatorie X e Y, è il valore atteso del prodotto degli scarti dei rispettivi valori attesi:
Mentre per variabili aleatorie discrete l’espressione è Dove un’espressione equivalente è: Covarianza e indipendenza. La covarianza tra due variabili casuali misura la forza della relazione lineare tra due variabili aleatorie, cioè la covarianza può assumere valori sia positivi che negativi, e quando assume valore 0, allora significa che tra le 2 variabili coinvolte X e Y non esiste alcuna dipendenza di tipo lineare. Se due variabili aleatorie sono indipendenti, non esiste alcuna relazione, né di tipo lineare né di altro tipo, dunque la loro covarianza è nulla, e se la covarianza è nulla non è detto che le variabili siano indipendenti. Correlazione. A partire dalla covarianza si può definire l’indice di correlazione tra due variabili aleatorie X e Y ché è data dal rapporto tra la covarianza X e Y e il prodotto degli scarti quadratici medi delle singole variabili casuali. È possibile dimostrare che, la covarianza pur potendo valori sia positivi che negativi, si può dimostrare che può raggiungere un limite massimo e un limite minimo tra i valori che può assumere, in particolare, il massimo che può assumere la covarianza è il prodotto dei scarti quadratici medi delle due variabili, mentre il valore minimo è sempre il prodotto della deviazione standard delle variabili X e Y però con un segno negativo davanti. Questo fa sì che Rho è una quantità che può assumere valori compresi tra -1 e 1.
non c’è relazione lineare tra X e Y.
positiva tra X e Y, dove tanto più grande è il valore di Rho, tanto più grande dobbiamo supporre che sia la dipendenza lineare tra X e Y. In particolare, cosa significa avere un Rho positivo, significa che quando X assume valori alti, allora anche Y probabilmente anche assumerà valori alti, e viceversa, con X valori bassi Y valori bassi, se poi Rho raggiunge il suo massimo (+1), allora ci sarà una perfetta dipendenza lineare positiva tra le due variabili X e Y, viceversa avremo una perfetta dipendenza lineare negativa con Rho -1. Combinazioni lineari: esempio. Es. valutazione di un portafoglio titoli composto da:
- a azioni del titolo A X = quotazione del titolo A - b azioni del titolo B Y = quotazione del titolo B W = quotazione del portafoglio titoli La quotazione W del portafoglio è data dalla combinazione lineare W = a X + b Y Il valore atteso Per quanto riguarda la varianza in questo caso dobbiamo anche considerare la correlazione che esiste tra X e Y in particolare, bisogna aggiungere gli scarti quadratici di A e B, il doppio prodotto delle due costanti a e b per la
Adesso bisogna capire se, X e Y sono indipendenti. Dal punto di vista del valore atteso non cambia nulla, ma cambia qualcosa sulla varianza, perché se ipotizziamo che X e Y sono 2 variabili indipendenti la covarianza tra X e Y è pari a 0, e di conseguenza allora 2 a b Cov(X, Y) sarà 0, e quindi in questo caso la varianza non avrà la cov. Abbiamo poi casi speciali in cui:
la probabilità. Dunque, in generale data una variabile casuale continua X la probabilità che ICS sia compresa tra un qualunque intervallo di estremi A B, questa probabilità e fari all’integrale tra A e B della funzione di densità di probabilità e f(x) legata alla variabile casuale X per dx. Proprietà della funzione di densità. La funzione di probabilità f(x), di una variabile aleatoria X deve avere le seguenti proprietà: -f(x) ≥ 0 per qualunque numero reale x; -l’area sottesa alla funzione di densità di probabilità f(x) su tutto l’asse dei reali vale 1, quindi: Da un punto di vista geometrico un’integrale definito rappresenta l’area sotto la funzione f(x). Si chiama supporto della v.a. X il sottoinsieme dei reali per cui la densità è positiva, e che in pratica costituisce sempre i valori che la variabile casuale X può assumere. La funzione di ripartizione. Definiamo a che cosa è uguale la funzione di ripartizione (o cumulata), nel caso in cui X è una variabile casuale continua. in generale: Dove, F(x0) di una variabile aleatoria continua X esprime la probabilità che X non superi il valore x0. Da un punto di vista grafico sarebbe l’aera sottesa alla funzione di densità
Ora, una qualunque probabilità intervallare relativa a una variabile casuale continua può essere espressa sempre attraverso i valori della funzione di ripartizione. In particolare, supponendo per es che si voglia calcolare la probabilità che X sia compreso tra A e B, da un punto di vista grafico costituirà l’area in blu. Da un punto di vista geometrico, lo possiamo rappresentare come tutta l’aera che va da meno infinito fino al punto B e sottrarre poi l’area che va da meno infinito fino al punto A. Da un punto di vista probabilistico, per definizione la probabilità che X sia ≤ a B è il valore della funzione di ripartizione calcolato in B Volendo invece calcolare che la probabilità che X sia maggiore di A, esso
Relazione tra funzione di densità e f. di ripartizione. Se abbiamo una variabile casuale continua, possiamo definire il valore della funzione di ripartizione a partire se conosciamo il valore di funzione di densità di probabilità, ed in particolare, se conosciamo l’espressione della
Supponiamo adesso di conoscere la funzione di ripartizione e di voler calcolare la corrispondente funzione di densità, quello che possiamo fare è utilizzare l’operazione inversa da un punto di vista matematico dell’integrale, che sostanzialmente è la derivata, quindi se Quantili. Quantile p inferiore: P(X > xp) = p
Quantile superiore: P(X < xp) = p Valori attesi di v.a. continue. Possiamo chiederci se ho X variabile casuale continua, come posso calcolare in questo caso il valore atteso e la varianza di questa variabile casuale continua, abbiamo visto che il valore atteso lo possiamo indicare come E(X), e la
valore atteso, ma in generale se X è una variabile casuale continua, come possiamo esprimere il valore atteso?. Quando passiamo a una variabile casuale continua, praticamente nel continuo le sommatorie diventano integrali e quindi quella che era una sommatoria diventa l'integrale di xf(x)dx, dove il prodotto f(x)dx rappresenta la probabilità che x assuma valori all'interno dell'intervallino di ampiezza dx, con la sommatoria che diventa un integrale. Quindi la definizione di valore atteso di X per una variabile casuale continua diventa integrale tra - infinito e + infinito xf(x)dx La varianza invece che al solito possiamo indicare sempre con sigma quadro applichiamo la definizione di valore
posso scrivere come: Trasformazione lineare di una v.a. Che cosa succede alla trasformazione lineare di una variabile aleatoria continua? non succede assolutamente nulla di diverso rispetto a quello che avveniva per le variabili casuali discrete, cioè se si considera la nuova variabile casuale
valore atteso di X, e con Sigma quadro la varianza di X, allora avremo che il valore atteso: mentre per quanto riguarda la varianza di W
− ∞
− ∞
− ∞
− ∞
− ∞
− ∞
− ∞
2
2
− ∞
2
2
2
Verranno trattati questi temi (alcuni già fatti)