Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Introduzione al Calcolo delle Probabilità: Eventi, Assiomi e Applicazioni, Appunti di Statistica

Una panoramica introduttiva al calcolo delle probabilità, definendo concetti fondamentali come eventi, spazio campionario e probabilità. Esplora gli assiomi di kolmogorov e le loro implicazioni, illustrando come calcolare la probabilità di eventi complessi. Include esempi pratici come il lancio di un dado e l'estrazione di unità da una popolazione, fornendo una solida base per comprendere i principi del calcolo delle probabilità.

Tipologia: Appunti

2021/2022

Caricato il 01/03/2025

giulia-cavalieri-doro
giulia-cavalieri-doro 🇮🇹

3 documenti

1 / 56

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Proposizioni incerte
- Esistono proposizioni di cui possiamo dire con certezza se siano vere o false. Es: “Ieri a Rimini `e
piovuto”, “Napoleone `e morto a S. Elena”, ecc.!
- Esistono poi proposizioni incerte di cui ora non sappiamo dire se siano vere o false e la cui verità
dipende dall’accadimento di un certo fatto. Dopo l’accadimento anche queste proposizioni
diventeranno certamente vere o false.!
Es: “il giorno di Natale a Rimini nevicherà”, “lanciando un dado a sei facce ottengo 6”, “La
crescita del PIL nel 2020 supererà il 3%”.!
- Le proposizioni aette da incertezza le chiameremo eventi. La probabilità rappresenta una
misura della certezza/incertezza di proposizioni di questo tipo.
Esistono proposizioni incerte la cui verità non è mai accertabile e che in questa sede non ci
interessano. Es: “La squadra A avrebbe vinto se l’arbitro avesse dato il rigore al primo minuto”.!
La probabilità e la scienza
Il concetto di probabilità ha avuto un enorme impatto sulla scienza. La legge scientifica consiste
nell’individuazione di regolarità nel comportamento apparentemente caotico della natura.!
Leggi deterministiche:
“se accade A, allora necessariamente accade B”.!
Paradigma della scienza classica e della rappresentazione positivista delle proposizioni
scientifiche.!
Leggi probabilistiche:
“se accade A, allora possono accadere B1,B2,...,BK con probabilità p1, p2, ..., pK .!
Paradigma non deterministico, tipico della scienze sociali e in molti casi anche delle scienze
biologiche e naturali!
Esempio: malattie dei fumatori !
Concetti primitivi: prova, evento, probabilità
-In una data prova, l’evento E si verifica con probabilità P(E). !
-La probabilità è un numero compreso fra 0 e 1 che misura il grado di incertezza sul verificarsi di
un evento.!
ESEMPIO: Nel lancio di un dado (ben bilanciato) la faccia contrassegnata dal numero 5 (i.e. E =
“esce il numero 5”) si presenta con probabilità P(E) = 1/6.!
Nota: La probabilità deve essere un numero compreso fra 0 e 1, visto che in un dado non truccato
ciascuna faccia ha la stessa probabilità di uscire di tutte le altre è ragionevole assegnare
probabilità 1/6 ad ogni risultato.!
Definizioni di base (concetti primitivi)
prova: esperimento che ha due o più possibili risultati (o esiti), in cui vi è un certo grado di
incertezza su quale di questi risultati si presenterà. Viene anche detto esperimento aleatorio.!
evento elementare: uno dei possibili risultati dell’esperimento; si indica con ωi .!
spazio degli eventi: l’insieme di tutti gli eventi elementari; si indica con Ω.!
evento (non elementare): chiamiamo in generale evento ogni sottoinsieme di Ω, ovvero ogni
possibile aggregazione di eventi elementari; si indica con le lettere maiuscole dell’alfabeto, e.g.
A, B, ecc.!
Nota: un evento è vero se si verifica almeno uno degli eventi elementari che lo compone!
Esempio di prova: lancio dado a sei facce!
eventi elementari sono: 1: è uscita la faccia 1, 2: è uscita la faccia 2, 3: è uscita la faccia 3, 4: è
uscita la faccia 4, 5: è uscita la faccia 5, 6: è uscita la faccia 6!
spazio degli eventi:Ω={1,2,3,4,5,6}!
esempi di eventi:!
esce un numero pari, ovvero l’insieme degli eventi elementari {2, 4, 6}!
esce un numero minore di 5, ovvero l’insieme degli eventi elementari {1, 2, 3, 4}!
esce il numero 6, ovvero l’evento corrisponde all’evento elementare {6}!
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38

Anteprima parziale del testo

Scarica Introduzione al Calcolo delle Probabilità: Eventi, Assiomi e Applicazioni e più Appunti in PDF di Statistica solo su Docsity!

Proposizioni incerte

  • Esistono proposizioni di cui possiamo dire con certezza se siano vere o false. Es: “Ieri a Rimini e piovuto”, “Napoleonee morto a S. Elena”, ecc.
  • Esistono poi proposizioni incerte di cui ora non sappiamo dire se siano vere o false e la cui verità dipende dall’accadimento di un certo fatto. Dopo l’accadimento anche queste proposizioni diventeranno certamente vere o false. Es: “il giorno di Natale a Rimini nevicherà”, “lanciando un dado a sei facce ottengo 6”, “La crescita del PIL nel 2020 supererà il 3%”.
  • Le proposizioni affette da incertezza le chiameremo eventi. La probabilità rappresenta una misura della certezza/incertezza di proposizioni di questo tipo. Esistono proposizioni incerte la cui verità non è mai accertabile e che in questa sede non ci interessano. Es: “La squadra A avrebbe vinto se l’arbitro avesse dato il rigore al primo minuto”. La probabilità e la scienza Il concetto di probabilità ha avuto un enorme impatto sulla scienza. La legge scientifica consiste nell’individuazione di regolarità nel comportamento apparentemente caotico della natura. Leggi deterministiche: “se accade A, allora necessariamente accade B”. Paradigma della scienza classica e della rappresentazione positivista delle proposizioni scientifiche. Leggi probabilistiche: “se accade A, allora possono accadere B1,B2,...,BK con probabilità p1, p2, ..., pK. Paradigma non deterministico, tipico della scienze sociali e in molti casi anche delle scienze biologiche e naturali Esempio : malattie dei fumatori Concetti primitivi: prova, evento, probabilità

- In una data prova, l’evento E si verifica con probabilità P(E).

- La probabilità è un numero compreso fra 0 e 1 che misura il grado di incertezza sul verificarsi di

un evento. ESEMPIO: Nel lancio di un dado (ben bilanciato) la faccia contrassegnata dal numero 5 (i.e. E = “esce il numero 5”) si presenta con probabilità P(E) = 1/6. Nota: La probabilità deve essere un numero compreso fra 0 e 1, visto che in un dado non truccato ciascuna faccia ha la stessa probabilità di uscire di tutte le altre è ragionevole assegnare probabilità 1/6 ad ogni risultato. Definizioni di base (concetti primitivi)

  • prova : esperimento che ha due o più possibili risultati (o esiti), in cui vi è un certo grado di incertezza su quale di questi risultati si presenterà. Viene anche detto esperimento aleatorio.
  • evento elementare: uno dei possibili risultati dell’esperimento; si indica con ωi.
  • spazio degli eventi : l’insieme di tutti gli eventi elementari; si indica con Ω.
  • evento (non elementare) : chiamiamo in generale evento ogni sottoinsieme di Ω, ovvero ogni possibile aggregazione di eventi elementari; si indica con le lettere maiuscole dell’alfabeto, e.g. A, B, ecc. Nota: un evento è vero se si verifica almeno uno degli eventi elementari che lo compone Esempio di prova: lancio dado a sei facce eventi elementari sono: 1: è uscita la faccia 1, 2: è uscita la faccia 2, 3: è uscita la faccia 3, 4: è uscita la faccia 4, 5: è uscita la faccia 5, 6: è uscita la faccia 6 spazio degli eventi:Ω={1,2,3,4,5,6} esempi di eventi: esce un numero pari, ovvero l’insieme degli eventi elementari {2, 4, 6} esce un numero minore di 5, ovvero l’insieme degli eventi elementari {1, 2, 3, 4} esce il numero 6, ovvero l’evento corrisponde all’evento elementare {6}

Classi di eventi Abbiamo capito che un evento è caratterizzato dal fatto che: Può verificarsi o non verificarsi (essere vero o falso) Prima di condurre l’esperimento non sappiamo dire con certezza se si verificherà o no Dopo l’esperimento è sicuramente vero o falso (verificato o non verificato) Vediamo alcuni esempi di eventi associati al seguente esperimento: lancio di un dado a sei facce, i cui eventi elementari sono {1}, {2}, {3}, {4}, {5}, {6}. Nel seguito, indichiamo con x il risultato dell’esperimento. Eventi certi A = {x ≤ 6}, B = {x è pari o dispari} La probabilità di un evento certo è 1 (es., se A è un evento certo si ha P(A) = 1). Nota: Ω è il simbolo comunemente usato per indicare l’evento certo Eventi impossibili A = {x > 6}, B = {x è multiplo di 7} La probabilità di un evento impossibile è 0. Nota: ∅ è il simbolo comunemente usato per indicare l’evento impossibile Eventi incompatibili (disgiunti) A = {x ≤ 2}, B = {x è multiplo di 3} gli eventi elementari che compongono A sono diversi da quelli che compongono B (perciò, se si verifica A per forza non può verificarsi B). Nota: gli eventi elementari sono fra loro incompatibili. Eventi compatibili (congiunti) A = {x è pari}, B = {x ≤ 3} alcuni degli eventi elementari che fanno parte di A appartengono anche a B (perciò, se si verifica A ciò non esclude che possa verificarsi B). Eventi complementari A = {x è pari}, B = {x è dispari} gli eventi elementari si “distribuiscono” fra A e B: quindi, o si verifica A o si verifica B; A è la negazione di B. Dati gli eventi A = {x pari}, B = {x ≤ 3}, definiamo i seguenti due eventi: Evento unione A∪B = {x pari “oppure” x ≤ 3} = {1,2,3,4,6} In altre parole, chiedersi la probabilità dell’evento A ∪ B significa chiedersi la probabilità che si verifichi A oppure B, ovvero che almeno uno fra A e B si verifichi. Evento intersezione A∩B = {x pari “e” x ≤ 3 } = {2} In altre parole, chiedersi la probabilità dell’evento A ∩ B significa chiedersi la probabilità che si verifichino entrambi gli eventi A e B. Ricorda nell’esempio 8.2.3 la prova consiste nell’estrazione con remissione di 4 palline dall’urna (senza considerare l’ordine di estrazione). B = la quaterna estratta non contiene palline nere B ̄= la quaterna estratta contiene almeno una pallina nera Nota: Negare l’evento B, secondo cui la quaterna non contiene palline nere, significa specificare un nuovo evento indicato, con B ̄, secondo cui la quaterna non è vero che non contiene palline nere, perciò contiene almeno una pallina nera. Continuazione esempio 8.2.3: intersezione B = la quaterna estratta non contiene palline nere C = la quaterna estratta contiene almeno 2 palline bianche B∩C= la quaterna estratta non contiene palline nere e contiene almeno due bianche. Nota: l’evento è verificato se la quaterna non contiene palline nere e al tempo stesso contiene almeno due bianche

Le operazioni fondamentali “spiegate a parole”

  • negazione di un evento A, ossia A ̄: “l’evento A non si verifica”, ovvero “si verifica tutto tranne A”
  • intersezione tra due eventi AeB ,ossia A∩B: “tutti e due gli eventi A e B si verificano contemporaneamente”
  • unione tra due eventi A e B, ossia A ∪ B: “almeno uno degli eventi A e B si verifica”. Nota: l’unione in realtà non `e fondamentale, visto che A ∪ B = A ̄∩ B ̄. Le operazione fondamentali rappresentate graficamente Approfondimento sul concetto di evento impossibile ed evento certo L’evento impossibile è l’evento che non può mai verificarsi, dunque può essere definito come l’intersezione fra un qualsiasi evento A e la sua negazione: A ∩ A ̄= ∅ L’evento certo è l’evento che si verifica sempre in quanto comprende tutti i possibili risultati dell’esperimento. Dunque può essere definito come la negazione dell’evento impossibile: ∅ ̄= Ω Esempio: Collezione di eventi e spazio campionario Consideriamo la prova consistente nel lanciare una moneta due volte, per cui Ω = {TT , TC , CT , CC } (dove C indica l’esito croce e T l’esito testa). La collezione degli eventi E, data da tutti i sottoinsiemi di Ω, è composta dai seguenti eventi (sono 24 = 16): {TT},{TC},{CT},{CC}, {TT,TC},{TT,CT},{TT,CC}, {TC,CT},{TC,CC},{CT,CC}, {TT,TC,CT},{TT,TC,CC},{TT,CT,CC}, {TC,CT,CC}, {TT,TC,CT,CC},∅ | {z } Ω

Teoria del calcolo delle probabilità: gli assiomi (o postulati) della

probabilità; le diverse interpretazioni del concetto di probabilità

La probabilità è una funzione Ricapitolando: a una generica prova è associato uno spazio campionario Ω e a esso una collezione di eventi E = {E1,E2,...,Ep} la cui struttura matematica è quella di un σ-algebra (chiusura rispetto a negazione, unione e intersezione). def : La probabilità è una funzione che associa a ogni evento Ei ∈ E un numero reale. P : E → [0, 1] Gli assiomi della probabilità (assiomi di Kolmogorov) Ogni funzione di probabilità P deve soddisfare le seguenti proprietà:

  1. positività : P(A) ≥ 0
  2. certezza : P(Ω) = 1
  3. unione : A∩B =∅ P(A∪B) = P(A)+P(B). Nota: A ∩ B = ∅ equivale a dire che A e B sono eventi incompatibili (disgiunti). Gli assiomi sono coerenti con la nozione di frequenza Gli assiomi formalizzano delle idee intuitive ed evidenti per tutti, vengono assunti veri “per definizione”, perciò non devono essere dimostrati. Da dove deriva la loro evidenza? Dalla nozione di frequenza relativa di un evento, come numero di volte che l’evento si verifica in n prove:
  • la frequenza relativa di un evento è non negativa (il che è coerente con l’assioma 1);
  • se l’evento si presenta in tutte le n prove (e ciò si verifica necessariamente se l’evento è certo) la rispettiva frequenza relativa è pari a n/n = 1 (assioma 2);
  • se gli eventi A e B non si sono mai verificati contemporaneamente nelle n prove (eventi disgiunti) allora la frequenza dell’evento A ∪ B è uguale a (nA + nB )/n ovvero alla somma delle probabilità degli eventi A e B, nA /n + nB /n (assioma 3) Una proprietà importante derivata dagli assiomi Dato l’evento E si ha P(E) = P(Ω) − P(E ̄) = 1−P(E ̄) Un’altra proprietà importante derivata dagli assiomi In una prova, dati due eventi qualsiasi A e B, si ha P(A ∪ B) = P(A) + P(B) − P(A ∩ B) Altre proprietà derivate dagli assiomi

- 0 ≤ P(A) ≤ 1

- P(∅) =

- B⊂A P(B) < P(A)

Nota: In altre parole, se B ⊂ A l’evento B implica l’evento A

  • P(B)=1 P(B∩A)=P(A)
  • P(B)=0 P(B∪A)=P(A) Perché è importante la teoria assiomatica? Perché una volta definite la probabilità degli eventi elementari ωi ∈ Ω (rispettando gli assiomi 1 e 2) posso utilizzare l’assioma 3 (e le proprietà derivate dagli assiomi) per calcolare la probabilità di qualsiasi elemento (evento) appartenente all’algebra degli eventi E.
  • rispettare gli assiomi 1 e 2 significa “scegliere” un valore di probabilità > 0 per ogni evento elementare di Ω, di modo che la somma delle probabilità degli eventi elementari faccia 1. Per un dato esperimento (quindi per un dato spazio campionario Ω) è possibile definire la funzione P (che soddisfa i tre assiomi) in più modi

Osservazioni riguardo l’esempio del rischio di insolvenza

  • se conosciamo altre informazioni oltre a quella sulla solvibilità del cliente, come, ad es., il suo profilo anagrafico, sociale ed economico, possiamo “affinare” la determinazione della probabilità di insolvenza facendola dipendere dal profilo (consideriamo sottoprove relative a gruppi di clienti con un certo profilo e calcoliamo le frequenze di clienti insolventi in ogni gruppo).
  • La frequenza è la manifestazione empirica di una sottostante probabilità teorica che regola il meccanismo di incertezza riguardo alla solvibilità dei clienti (come se la probabilità di un evento fosse l’idea platonica di incertezza di un evento e la frequenza osservata fosse la sua copia).
  • Le probabilità degli eventi vengono determinate, ovvero stimate , sulla base delle frequenze osservate nelle prove ripetute. Principio del campionamento ripetuto La base della statistica inferenziale frequentista è il principio del campionamento ripetuto.

- Tali procedure inferenziali hanno proprietà che risultano “a lungo andare” ottimali, dove a lungo

andare significa “al ripetersi dell’operazione di campionamento tante volte”.

- Un campione casuale di n osservazioni raccoglie gli esiti di n prove ripetute di un fenomeno

aleatorio (tutte le n prove svolte nelle stesse condizioni) Bisogna ammettere che l’ottimalità delle proprietà dei metodi statistici inferenziali frequentisti sono di fatto basate su una condizione ipotetica. Esempio: applicazione della definizione frequentista coi dati Rainfall Riconsideriamo l’esempio delle precipitazioni piovose annue a Nevada City. Definiamo l’evento: A = anno prossimo sarà arido. Chiamiamo x il valore delle precipitazioni in pollici, definiamo l’evento di interesse come A={x ≤40} Nota: vogliamo calcolare la probabilità di un evento incerto, perché riferito ad un anno che non è stato ancora osservato. Calcoliamo (ovvero stimiamo) P(A) sulla base delle osservazioni nel campione di n = 106 osservazioni annue (dal 1873 al 1978). La stima che proponiamo per P(A) è la frequenza empirica degli anni in cui x ≤ 40 sul collettivo delle 106 osservazioni: P(A)= nA/n = 27/106 =0. Le ipotesi sottostanti a questa operazione sono le seguenti:

  1. prove ripetute nelle stesse condizioni: Ciò significa che le 106 prove a disposizione sono realizzazioni di un processo omogeneo, ovvero non ci sono state “variazioni climatiche” nel corso dei 106 anni, quindi ogni anno ha la stessa identica probabilità di risultare arido (per quanto questa probabilità sia ignota).
  2. le 106 prove sono un collettivo sufficientemente grande da permettere una stima “affidabile” della probabilità in questione. Difficoltà della definizione frequentista Non sempre le ipotesi suddette sono verificate nella realtà. Ecco due contro-esempi:
  • qual é la probabilità che la squadra X vinca il prossimo campionato? Non è ragionevole stimare questa probabilità attraverso la frequenza: num. campionati vinti dalla squadra X num. totale campionati disputati dalla squadra X visto che ogni campionato rappresenta una “prova” svolta sotto condizioni diverse da tutte le altre
  • qual è la probabilità che la prossima sonda si distrugga atterrando su Marte? Disponiamo di un numero molto esiguo di lanci di sonde su Marte per cui la stima di questa probabilità attraverso la frequenza non `e affidabile.

Definizione soggettivista Esiste una concezione alternativa, detta soggettivista della probabilità, in cui

  • la probabilità di un evento E `e la misura del grado di fiducia che una persona “coerente” attribuisce al verificarsi di E in base alle informazioni in suo possesso (a priori). La concezione frequentista può essere vista come caso particolare della concezione soggettivista:
  • se disponiamo di prove ripetute è ragionevole basare il proprio grado di fiducia sulle frequenze ottenute dall’analisi di queste prove Principio di coerenza nell’assegnare i gradi di fiducia, di modo che i tre assiomi della teoria assiomatica siano validi. Scommessa equa La coerenza con la teoria assiomatica è garantita dal meccanismo della scommessa equa, secondo cui: “la probabilità di un evento E è il prezzo p compreso fra 0 a 1 che ritengo equo pagare per avere indietro:” 1 se E si verifica 0 se E non si verifica La condizione di equità vuol dire che l’individuo è disposto indifferentemente a

- pagare p e ricevere 1 solo se E si verifica

- ricevere p e pagare 1 solo se E si verifica

Nota: la condizione di coerenza impone che l’individuo valuti la probabilità di eventi in modo da non subire una perdita certa: es. se uno“punta” p=2/3 su E e p=2/3s u E ̄, allora va a pagare 4/3 e riscuote al massimo 1 (sia nel caso che si verifichi E che nel caso che si verifichi E ̄), quindi ha una perdita certa di 1/ (individuo non coerente!).

Probabilità condizionate; indipendenza fra eventi

Probabilità condizionate def : La probabilità condizionata di A dato B è definita come P(A|B) = P(A ∩ B) / P(B) Nota: occorre che P(B) sia maggiore di 0. Analogamente, la probabilità condizionata di B dato A è P(B|A) = P(A ∩ B) / P (A) Vediamo come si giunge a questa formula con degli esempi considerando la prova molto semplice del lancio di un dado. Esempio: lancio di un dado Consideriamo gli eventi:

  • A: esce il numero 2
  • B: esce un numero pari Esercizio: Calcola la probabilità di A condizionata all’evento B. Nota: quello che ci viene richiesto è calcolare la probabilità che esca 2 (evento A) dando per certo che è uscito un numero pari (evento B). Procedimento intuitivo (basato sulla def. classica) Siccome sappiamo con certezza che si è verificato B, lo spazio campionario si riduce ai soli eventi elementari che realizzano l’evento B, quindi i casi possibili sono tre: Ω∗ ={2,4,6} Nota: Condizionarsi a B significa che B diventa l’evento certo L’evento A (esce il numero 2) è verificato solo in uno dei tre casi possibili, per cui P(A|B) = 1/

Variabili causali e distribuzioni di probabilità.

Variabile casuale (o variabile aleatoria) Ricapitoliamo: Ad un esperimento è possibile associare l’insieme degli eventi elementari ωi ∈ Ω e la classe di tutti gli eventi E = {E1,E2,...,Ep} costituita da tutti i possibili sottoinsiemi di Ω. Invece che gli eventi direttamente, è più semplice trattare con numeri. Associamo delle quantità numeriche agli eventi casuali, definendo delle funzioni che chiamiamo variabili casuali. Una variabile casuale Y è una variabile che può prendere 2 o più valori diversi, in base all’esito di una prova aleatoria. Ripetendo la prova n volte ottengo un campione di n osservazioni della variabile Y : ad esempio: scelgo a caso n persone (soggetti o unità statistiche) da una data popolazione e per ognuna di esse osservo il valore della variabile aleatoria Y (carattere) def : Una variabile casuale (v.c.) X è una funzione definita sullo spazio campionario Ω che associa ad ogni risultato elementare ωi un unico numero reale, X:Ω→R Nota: matematicamente questa definizione non è molto generale ed è accettabile solo se Ω è discreto. Ci concentreremo in un primo momento sulle variabili casuali “discrete”, trattando successivamente l’estensione a quelle “continue”. Il nostro obiettivo è imparare a derivare le distribuzioni di probabilità di variabili casuali. Rappresentazione grafica di una v.c. Figura: Per ogni evento elementare di Ω vi è un solo valore di X. Definizione di v.c. discreta def : X é una v.c. discreta se assume un numero finito (o un’infinità numerabile) di valori x1, x2, ..., xk con probabilità P(X = x1),P(X = x2),...,P(X = xk) L’elenco P(X = x1),P(X = x2),...,P(X = xk) forma la cosiddetta distribuzione di probabilità, che soddisfa gli assiomi:

- P(xi)≥0; (per semplicità , abbreviamo P(X=xi) conP (xi))

- = P(xi) = 1

- la probabilità che la variabile X assuma valore xi oppure xj è

P(X =xi ∪X =xj)=P(xi)+P(xj) (dato che xi e xj sono valori che corrispondono ad “eventi elementari”, per cui sono incompatibili, cioè non possono verificarsi contemporaneamente: P (X = xi ∩ X = xj ) = 0) Esempio: lancio di due dadi Lanciamo due dadi, definiamo la v.c. X =somma dei punteggi. I valori che X può assumere sono i numeri interi fra 2 e 12. Costruiamo la distribuzione di probabilità Utilizzando l’esempio del lancio di due dadi, definiamo la distribuzione di probabilità della variabile X =somma dei punteggi.

Funzione di probabilità di una v.c. discreta def : La funzione di probabilità di una v.c. discreta associa a ognuno dei possibili valori xi la corrispondente probabilità P(X =xi). Figura: Rappresentazione grafica della distribuzione di probabilità della variabile X =somma dei punteggi nell’esempio del lancio di due dadi. La forma della distribuzione è simmetrica in questo caso. Nota : una v.c. discreta è completamente nota se sono noti i valori che questa può assumere e le corrispondenti probabilità (quindi se è nota la distribuzione di probabilità). Esperimento Bernoulliano e Binomiale Un esperimento Bernoulliano è una prova aleatoria che ha due possibili esiti: successo o fallimento. Consideriamo la variabile aleatoria Bernoulliana W Lo spazio campionario è ΩW = {0, 1}. Un esperimento Binomiale consiste nel ripetere n prove Bernoulliane e contare il numero di successi: si assume che le n prove sono tutte uguali (cioè ripeto sempre lo stesso esperimento) e i risultati delle prove sono indipendenti fra loro. Consideriamo la variabile casuale Binomiale X = numero di successi in n prove, lo spazio campionario è ΩX = {0,1,2,...,n}. Notazione L’esempio della prova Bernoulliana ci fa capire che per definire una v.c. devo specificare le probabilità di tutti i possibili valori che la v.c. Può assumere. Queste probabilità possono essere definite da formule matematiche (in seguito vedremo alcune funzioni di probabilità molto usate nella pratica). Terminologia:

  • Abbiamo definito la variabile casuale come una funzione che associa ad ogni evento elementare un valore numerico, e la funzione di probabilità come una funzione che assegna ad ogni valore della v.c. un valore fra 0 e 1. Pertanto, dire che l’esito del lancio di un dado è una v.c. uniforme è equivalente a dire: all’esperimento “lancio di un dado” `e associata una distribuzione di probabilità uniforme

Dalle v.c. discrete alle v.c. continue Le v.c. discrete per definizione possono assumere valori numerabili, magari un infinito numero di valori (però tali che li posso contare). Vedremo in seguito esempi di v.c. discrete quali la Bernoulli e la Binomiale. Si usano per modellare fenomeni le cui osservazioni sono espresse in forma di conteggio (es. numero di individui aventi una certa caratteristica), oppure valori binari (es. presenza o assenza di una certa caratteristica). Le v.c. continue invece possono assumere un numero infinito di valori nell’asse dei numeri reali (e non li posso contare perché fra un numero ed un altro ce ne sono infiniti). Vedremo in seguito alcune v.c. continue molto usate in statistica, quali la Normale (o Gaussiana). Si usano per modellare fenomeni le cui osservazioni sono espresse in una scala di misura infinitamente precisa (millimetri, microsecondi, ecc). Funzione di densità di una v.c. continua Supponiamo di avere una v.c. continua che prende valori su tutto l’asse reale (R). Per definire una v.c. continua è necessario introdurre una funzione di densità di probabilità che permetta di assegnare valori di probabilità a tutti i possibili intervalli di R. def : Una variabile casuale Y è continua se esiste una funzione f (y ) tale che Nota : L’area sottesa alla funzione f (y ) nell’intervallo [a, b] è la probabilità che la v.c. assuma valori all’interno di [a, b] Il concetto di integrale Def : l’integrale è un operatore matematico che, nel caso di una funzione di una sola variabile, associa alla funzione l’area sottesa dal suo grafico entro un dato intervallo [a, b] nel dominio. Proprietà della p.d.f. di una v.c. continua f (y ) è una p.d.f. valida se gode delle seguenti due proprietà:

  • non negativa: f(y) ≥ 0
  • integra a 1: Nota : È possibile assegnare probabilità solo ad intervalli di R, non a singoli valori reali. Infatti: Pr (a ≤ Y ≤ b) = Pr (a < Y < b). In altre parole, la probabilità di un singolo risultato (cioè un certo numero reale) è 0.

Funzione di ripartizione di una v.c. continua La probabilità di eventi del tipo P(Y ≤ b) può essere calcolata utilizzando la funzione di ripartizione di una v.c. continua.

  • La probabilità Pr (Y ≤ b), ovvero F(b), è misurata dall’area sottesa dalla curva di densità nell’intervallo (−∞, b) Visualizziamo la funzione di ripartizione: due esempi Figura : Mettiamo a confronto le funzioni di densità (sinistra) associate a due diverse v.c. continue e le rispettive funzioni di ripartizione (destra). La f. di ripartizione va da 0 a 1, ed è sempre non decrescente perché all’aumentare di x aumenta la massa di probabilità cumulata.

Visualizziamo la proprietà P(X > b) = 1 − F(b) Area grigia: P(X > b) = 1 − F(b) Sintesi della distribuzione di una v.c. discreta La distribuzione di probabilità di una v.c. discreta può essere trattata alla stregua di una distribuzione di frequenza per cui è possibile effettuarne una sintesi attraverso il calcolo di alcuni indici numerici, in analogia a medie, indici di variabilità, ecc... Nella parte di statistica descrittiva abbiamo visto la media aritmetica e la varianza come due valori che descrivono la distribuzione di frequenza di un carattere quantitativo. Allo stesso modo, la distribuzione di probabilità di una v.c. sarà caratterizzata da parametri, es. la media (o valore atteso) e la varianza. Valore atteso e varianza v.c. discreta Il valore atteso di X si indica con E(X) e viene anche chiamato semplicemente media di X def : Nel caso X sia una v.c. discreta con Ω = {x1, x2, ..., xK }, abbiamo le seguenti definizioni:

  • il valore atteso è dato dalla somma pesata:
  • la varianza è la somma pesata di una trasformazione di X:
  • la deviazione standard è la radice quadrata della varianza: La varianza: formula alternativa Nota : la varianza di X é il valore atteso di (X − E (X )) : V(X) = E[(X−E(X)) ] = E(X )−[E(X)] La varianza non è mai negativa, infatti:
  • è uguale a 0 se la v.c. X assume probabilità 1 in corrispondenza di un solo valore e probabilità 0 altrove;
  • è maggiore di 0 se vi è dispersione dei valori di X attorno alla sua media;
  • è tanto più elevata quanto più alta la dispersione dei valori di X attorno alla media

Valore atteso e varianza di una v.c. continua Abbiamo visto che valore atteso di una v.c. discreta è la somma pesata dei valori xi , con pesi pari alle probabilità P(xi ). Quando X è una v.c. continua occorre modificare la definizione opportunamente. Se X prende valori xi ∈ R, la probabilità dei singoli xi è pari a 0, mentre la probabilità associata ad un qualsiasi intervallo di R è non nulla. Ne segue che valore atteso e varianza si possono calcolare con gli integrali, def : allo stesso modo otteniamo la varianza, Nota : in sostanza, la somma pesata presente nelle definizioni di valore atteso e varianza per le v.c. discrete è sostituita dall’operazione integrale

Distribuzioni discrete: Uniforme, Bernoulli, Binomiale.

Distribuzione Uniforme discreta def : Una v.c. Uniforme discreta, indicata con X ∼ Ud(a,s), è una v.c. che assume con uguale probabilità tutti i valori interi compresi in un certo intervallo. Sia a il valore più piccolo e s il numero di valori che X può assumere, la funzione di probabilità uniforme è, P ( x ) = 1/s per x = a, a + 1, ..., a + s − 1 Figura : Funzione di probabilità di una v.c. Ud(1,8) Distribuzione di Bernoulli def : Consideriamo una prova bernoulliana dove l’evento A è il cosiddetto “successo”. Allora Y può prendere solo i valori 1 (successo) con prob. π e 0 (insuccesso) con prob. 1 − π, 1 se A si verifica (successo) Y = 0 se A non si verifica (fallimento)

  • si dice che Y è distribuita come una Bernoulli di parametro π Y ∼ Bernoulli(π)
  • E(Y) =1·P(1) + 0·P(0) = 1·π + 0·(1−π) = π
  • Var(Y) = (1 ·P(1) + 0 ·P(0)) − π = (1 π + 0 ·(1−π)) − π =π− π = π (1−π)

Cosa abbiamo imparato finora Abbiamo imparato a rispondere a domande del tipo: supponendo di conoscere la proporzione di individui di una popolazione che possiede una certa caratteristica di interesse (prob. di successo π)

  • qual è la probabilità che su n individui scelti a caso x abbiano la caratteristica di interesse? Sugli n estratti, quanti me ne devo aspettare con la caratteristica d’interesse? Più avanti risponderemo a domande di tipo inferenziale: tipicamente non conosco la proporzione di individui in popolazione con la caratteristica d’interesse in popolazione (ovvero π: proporzione di “successi” nell’intera popolazione), supponiamo che nel campione di n individui abbia osservato x successi (x/n indica la proporzione di successi osservata in un campione).
  • è ragionevole dire che π è uguale alla proporzione campionaria x/n?
  • come misurare il margine di errore associato a x/n, di modo che possa fornire un intervallo di valori che con buona probabilità comprenda il parametro di popolazione π?
  • se πˆ = 0.52, posso concludere che π > 0.5?

Distribuzione Normale, Normale Standard

Una scoperta statistica Nel 1733, il matematico de Moivre osserva che la distribuzione di probabilità Binomiale converge, al crescere del numero delle prove, ad una distribuzione di probabilità continua di forma “campanulare” di cui riesce a derivare la formula. Inoltre notò la convergenza avviene indipendentemente dal valore di π. Consideriamo ad esempio:

  • Binomiale(n,0.5) per n = 10, n = 30, n = 100
  • Binomiale(n,0.1) per n = 10, n = 30, n = 100 In entrambe i casi osserviamo che al divergere di n, il diagramma a barre della distribuzione di probabilità assume il profilo a campana (simmetrico rispetto all’asse del massimo, due flessi, asintoti dati dall’asse x). Binomiale diventa simmetrica al crescere di n Binomiale diventa simm. al crescere di n n = 10; π = 0.5 n = 30; π = 0.