
















































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Una panoramica introduttiva al calcolo delle probabilità, definendo concetti fondamentali come eventi, spazio campionario e probabilità. Esplora gli assiomi di kolmogorov e le loro implicazioni, illustrando come calcolare la probabilità di eventi complessi. Include esempi pratici come il lancio di un dado e l'estrazione di unità da una popolazione, fornendo una solida base per comprendere i principi del calcolo delle probabilità.
Tipologia: Appunti
1 / 56
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!

















































Proposizioni incerte
e piovuto”, “Napoleonee morto a S. Elena”, ecc.un evento. ESEMPIO: Nel lancio di un dado (ben bilanciato) la faccia contrassegnata dal numero 5 (i.e. E = “esce il numero 5”) si presenta con probabilità P(E) = 1/6. Nota: La probabilità deve essere un numero compreso fra 0 e 1, visto che in un dado non truccato ciascuna faccia ha la stessa probabilità di uscire di tutte le altre è ragionevole assegnare probabilità 1/6 ad ogni risultato. Definizioni di base (concetti primitivi)
Classi di eventi Abbiamo capito che un evento è caratterizzato dal fatto che: Può verificarsi o non verificarsi (essere vero o falso) Prima di condurre l’esperimento non sappiamo dire con certezza se si verificherà o no Dopo l’esperimento è sicuramente vero o falso (verificato o non verificato) Vediamo alcuni esempi di eventi associati al seguente esperimento: lancio di un dado a sei facce, i cui eventi elementari sono {1}, {2}, {3}, {4}, {5}, {6}. Nel seguito, indichiamo con x il risultato dell’esperimento. Eventi certi A = {x ≤ 6}, B = {x è pari o dispari} La probabilità di un evento certo è 1 (es., se A è un evento certo si ha P(A) = 1). Nota: Ω è il simbolo comunemente usato per indicare l’evento certo Eventi impossibili A = {x > 6}, B = {x è multiplo di 7} La probabilità di un evento impossibile è 0. Nota: ∅ è il simbolo comunemente usato per indicare l’evento impossibile Eventi incompatibili (disgiunti) A = {x ≤ 2}, B = {x è multiplo di 3} gli eventi elementari che compongono A sono diversi da quelli che compongono B (perciò, se si verifica A per forza non può verificarsi B). Nota: gli eventi elementari sono fra loro incompatibili. Eventi compatibili (congiunti) A = {x è pari}, B = {x ≤ 3} alcuni degli eventi elementari che fanno parte di A appartengono anche a B (perciò, se si verifica A ciò non esclude che possa verificarsi B). Eventi complementari A = {x è pari}, B = {x è dispari} gli eventi elementari si “distribuiscono” fra A e B: quindi, o si verifica A o si verifica B; A è la negazione di B. Dati gli eventi A = {x pari}, B = {x ≤ 3}, definiamo i seguenti due eventi: Evento unione A∪B = {x pari “oppure” x ≤ 3} = {1,2,3,4,6} In altre parole, chiedersi la probabilità dell’evento A ∪ B significa chiedersi la probabilità che si verifichi A oppure B, ovvero che almeno uno fra A e B si verifichi. Evento intersezione A∩B = {x pari “e” x ≤ 3 } = {2} In altre parole, chiedersi la probabilità dell’evento A ∩ B significa chiedersi la probabilità che si verifichino entrambi gli eventi A e B. Ricorda nell’esempio 8.2.3 la prova consiste nell’estrazione con remissione di 4 palline dall’urna (senza considerare l’ordine di estrazione). B = la quaterna estratta non contiene palline nere B ̄= la quaterna estratta contiene almeno una pallina nera Nota: Negare l’evento B, secondo cui la quaterna non contiene palline nere, significa specificare un nuovo evento indicato, con B ̄, secondo cui la quaterna non è vero che non contiene palline nere, perciò contiene almeno una pallina nera. Continuazione esempio 8.2.3: intersezione B = la quaterna estratta non contiene palline nere C = la quaterna estratta contiene almeno 2 palline bianche B∩C= la quaterna estratta non contiene palline nere e contiene almeno due bianche. Nota: l’evento è verificato se la quaterna non contiene palline nere e al tempo stesso contiene almeno due bianche
Le operazioni fondamentali “spiegate a parole”
La probabilità è una funzione Ricapitolando: a una generica prova è associato uno spazio campionario Ω e a esso una collezione di eventi E = {E1,E2,...,Ep} la cui struttura matematica è quella di un σ-algebra (chiusura rispetto a negazione, unione e intersezione). def : La probabilità è una funzione che associa a ogni evento Ei ∈ E un numero reale. P : E → [0, 1] Gli assiomi della probabilità (assiomi di Kolmogorov) Ogni funzione di probabilità P deve soddisfare le seguenti proprietà:
Nota: In altre parole, se B ⊂ A l’evento B implica l’evento A
Osservazioni riguardo l’esempio del rischio di insolvenza
andare significa “al ripetersi dell’operazione di campionamento tante volte”.
aleatorio (tutte le n prove svolte nelle stesse condizioni) Bisogna ammettere che l’ottimalità delle proprietà dei metodi statistici inferenziali frequentisti sono di fatto basate su una condizione ipotetica. Esempio: applicazione della definizione frequentista coi dati Rainfall Riconsideriamo l’esempio delle precipitazioni piovose annue a Nevada City. Definiamo l’evento: A = anno prossimo sarà arido. Chiamiamo x il valore delle precipitazioni in pollici, definiamo l’evento di interesse come A={x ≤40} Nota: vogliamo calcolare la probabilità di un evento incerto, perché riferito ad un anno che non è stato ancora osservato. Calcoliamo (ovvero stimiamo) P(A) sulla base delle osservazioni nel campione di n = 106 osservazioni annue (dal 1873 al 1978). La stima che proponiamo per P(A) è la frequenza empirica degli anni in cui x ≤ 40 sul collettivo delle 106 osservazioni: P(A)= nA/n = 27/106 =0. Le ipotesi sottostanti a questa operazione sono le seguenti:
Definizione soggettivista Esiste una concezione alternativa, detta soggettivista della probabilità, in cui
Nota: la condizione di coerenza impone che l’individuo valuti la probabilità di eventi in modo da non subire una perdita certa: es. se uno“punta” p=2/3 su E e p=2/3s u E ̄, allora va a pagare 4/3 e riscuote al massimo 1 (sia nel caso che si verifichi E che nel caso che si verifichi E ̄), quindi ha una perdita certa di 1/ (individuo non coerente!).
Probabilità condizionate def : La probabilità condizionata di A dato B è definita come P(A|B) = P(A ∩ B) / P(B) Nota: occorre che P(B) sia maggiore di 0. Analogamente, la probabilità condizionata di B dato A è P(B|A) = P(A ∩ B) / P (A) Vediamo come si giunge a questa formula con degli esempi considerando la prova molto semplice del lancio di un dado. Esempio: lancio di un dado Consideriamo gli eventi:
Variabile casuale (o variabile aleatoria) Ricapitoliamo: Ad un esperimento è possibile associare l’insieme degli eventi elementari ωi ∈ Ω e la classe di tutti gli eventi E = {E1,E2,...,Ep} costituita da tutti i possibili sottoinsiemi di Ω. Invece che gli eventi direttamente, è più semplice trattare con numeri. Associamo delle quantità numeriche agli eventi casuali, definendo delle funzioni che chiamiamo variabili casuali. Una variabile casuale Y è una variabile che può prendere 2 o più valori diversi, in base all’esito di una prova aleatoria. Ripetendo la prova n volte ottengo un campione di n osservazioni della variabile Y : ad esempio: scelgo a caso n persone (soggetti o unità statistiche) da una data popolazione e per ognuna di esse osservo il valore della variabile aleatoria Y (carattere) def : Una variabile casuale (v.c.) X è una funzione definita sullo spazio campionario Ω che associa ad ogni risultato elementare ωi un unico numero reale, X:Ω→R Nota: matematicamente questa definizione non è molto generale ed è accettabile solo se Ω è discreto. Ci concentreremo in un primo momento sulle variabili casuali “discrete”, trattando successivamente l’estensione a quelle “continue”. Il nostro obiettivo è imparare a derivare le distribuzioni di probabilità di variabili casuali. Rappresentazione grafica di una v.c. Figura: Per ogni evento elementare di Ω vi è un solo valore di X. Definizione di v.c. discreta def : X é una v.c. discreta se assume un numero finito (o un’infinità numerabile) di valori x1, x2, ..., xk con probabilità P(X = x1),P(X = x2),...,P(X = xk) L’elenco P(X = x1),P(X = x2),...,P(X = xk) forma la cosiddetta distribuzione di probabilità, che soddisfa gli assiomi:
P(X =xi ∪X =xj)=P(xi)+P(xj) (dato che xi e xj sono valori che corrispondono ad “eventi elementari”, per cui sono incompatibili, cioè non possono verificarsi contemporaneamente: P (X = xi ∩ X = xj ) = 0) Esempio: lancio di due dadi Lanciamo due dadi, definiamo la v.c. X =somma dei punteggi. I valori che X può assumere sono i numeri interi fra 2 e 12. Costruiamo la distribuzione di probabilità Utilizzando l’esempio del lancio di due dadi, definiamo la distribuzione di probabilità della variabile X =somma dei punteggi.
Funzione di probabilità di una v.c. discreta def : La funzione di probabilità di una v.c. discreta associa a ognuno dei possibili valori xi la corrispondente probabilità P(X =xi). Figura: Rappresentazione grafica della distribuzione di probabilità della variabile X =somma dei punteggi nell’esempio del lancio di due dadi. La forma della distribuzione è simmetrica in questo caso. Nota : una v.c. discreta è completamente nota se sono noti i valori che questa può assumere e le corrispondenti probabilità (quindi se è nota la distribuzione di probabilità). Esperimento Bernoulliano e Binomiale Un esperimento Bernoulliano è una prova aleatoria che ha due possibili esiti: successo o fallimento. Consideriamo la variabile aleatoria Bernoulliana W Lo spazio campionario è ΩW = {0, 1}. Un esperimento Binomiale consiste nel ripetere n prove Bernoulliane e contare il numero di successi: si assume che le n prove sono tutte uguali (cioè ripeto sempre lo stesso esperimento) e i risultati delle prove sono indipendenti fra loro. Consideriamo la variabile casuale Binomiale X = numero di successi in n prove, lo spazio campionario è ΩX = {0,1,2,...,n}. Notazione L’esempio della prova Bernoulliana ci fa capire che per definire una v.c. devo specificare le probabilità di tutti i possibili valori che la v.c. Può assumere. Queste probabilità possono essere definite da formule matematiche (in seguito vedremo alcune funzioni di probabilità molto usate nella pratica). Terminologia:
Dalle v.c. discrete alle v.c. continue Le v.c. discrete per definizione possono assumere valori numerabili, magari un infinito numero di valori (però tali che li posso contare). Vedremo in seguito esempi di v.c. discrete quali la Bernoulli e la Binomiale. Si usano per modellare fenomeni le cui osservazioni sono espresse in forma di conteggio (es. numero di individui aventi una certa caratteristica), oppure valori binari (es. presenza o assenza di una certa caratteristica). Le v.c. continue invece possono assumere un numero infinito di valori nell’asse dei numeri reali (e non li posso contare perché fra un numero ed un altro ce ne sono infiniti). Vedremo in seguito alcune v.c. continue molto usate in statistica, quali la Normale (o Gaussiana). Si usano per modellare fenomeni le cui osservazioni sono espresse in una scala di misura infinitamente precisa (millimetri, microsecondi, ecc). Funzione di densità di una v.c. continua Supponiamo di avere una v.c. continua che prende valori su tutto l’asse reale (R). Per definire una v.c. continua è necessario introdurre una funzione di densità di probabilità che permetta di assegnare valori di probabilità a tutti i possibili intervalli di R. def : Una variabile casuale Y è continua se esiste una funzione f (y ) tale che Nota : L’area sottesa alla funzione f (y ) nell’intervallo [a, b] è la probabilità che la v.c. assuma valori all’interno di [a, b] Il concetto di integrale Def : l’integrale è un operatore matematico che, nel caso di una funzione di una sola variabile, associa alla funzione l’area sottesa dal suo grafico entro un dato intervallo [a, b] nel dominio. Proprietà della p.d.f. di una v.c. continua f (y ) è una p.d.f. valida se gode delle seguenti due proprietà:
Funzione di ripartizione di una v.c. continua La probabilità di eventi del tipo P(Y ≤ b) può essere calcolata utilizzando la funzione di ripartizione di una v.c. continua.
Visualizziamo la proprietà P(X > b) = 1 − F(b) Area grigia: P(X > b) = 1 − F(b) Sintesi della distribuzione di una v.c. discreta La distribuzione di probabilità di una v.c. discreta può essere trattata alla stregua di una distribuzione di frequenza per cui è possibile effettuarne una sintesi attraverso il calcolo di alcuni indici numerici, in analogia a medie, indici di variabilità, ecc... Nella parte di statistica descrittiva abbiamo visto la media aritmetica e la varianza come due valori che descrivono la distribuzione di frequenza di un carattere quantitativo. Allo stesso modo, la distribuzione di probabilità di una v.c. sarà caratterizzata da parametri, es. la media (o valore atteso) e la varianza. Valore atteso e varianza v.c. discreta Il valore atteso di X si indica con E(X) e viene anche chiamato semplicemente media di X def : Nel caso X sia una v.c. discreta con Ω = {x1, x2, ..., xK }, abbiamo le seguenti definizioni:
Valore atteso e varianza di una v.c. continua Abbiamo visto che valore atteso di una v.c. discreta è la somma pesata dei valori xi , con pesi pari alle probabilità P(xi ). Quando X è una v.c. continua occorre modificare la definizione opportunamente. Se X prende valori xi ∈ R, la probabilità dei singoli xi è pari a 0, mentre la probabilità associata ad un qualsiasi intervallo di R è non nulla. Ne segue che valore atteso e varianza si possono calcolare con gli integrali, def : allo stesso modo otteniamo la varianza, Nota : in sostanza, la somma pesata presente nelle definizioni di valore atteso e varianza per le v.c. discrete è sostituita dall’operazione integrale
Distribuzione Uniforme discreta def : Una v.c. Uniforme discreta, indicata con X ∼ Ud(a,s), è una v.c. che assume con uguale probabilità tutti i valori interi compresi in un certo intervallo. Sia a il valore più piccolo e s il numero di valori che X può assumere, la funzione di probabilità uniforme è, P ( x ) = 1/s per x = a, a + 1, ..., a + s − 1 Figura : Funzione di probabilità di una v.c. Ud(1,8) Distribuzione di Bernoulli def : Consideriamo una prova bernoulliana dove l’evento A è il cosiddetto “successo”. Allora Y può prendere solo i valori 1 (successo) con prob. π e 0 (insuccesso) con prob. 1 − π, 1 se A si verifica (successo) Y = 0 se A non si verifica (fallimento)
Cosa abbiamo imparato finora Abbiamo imparato a rispondere a domande del tipo: supponendo di conoscere la proporzione di individui di una popolazione che possiede una certa caratteristica di interesse (prob. di successo π)
Una scoperta statistica Nel 1733, il matematico de Moivre osserva che la distribuzione di probabilità Binomiale converge, al crescere del numero delle prove, ad una distribuzione di probabilità continua di forma “campanulare” di cui riesce a derivare la formula. Inoltre notò la convergenza avviene indipendentemente dal valore di π. Consideriamo ad esempio: