




























































































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Una serie di esercizi e quiz sulla probabilità e statistica, coprendo argomenti come la distribuzione binomiale, la distribuzione di poisson e la distribuzione gaussiana. Gli esercizi sono progettati per aiutare gli studenti a comprendere i concetti chiave e le applicazioni pratiche di questi concetti.
Tipologia: Schemi e mappe concettuali
1 / 118
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!





























































































Nota Statistica , Versione 1
In fisica sperimentale noi facciamo esperimenti per misurare determinate grandezze fisiche ( viscosita di un liquido, radioattivita naturale in una determinata zona, misure di sezioni d’urto in fisica subnucleare, ecc). E noto che queste misure sonosempre affette da errori: il valore della misura none prevedibile. Noi diciamo che la misura di una grandezza fisica e una variabile casuale. Talvolta le misure sperimentali servono a verificare relazioni tra grandezze fisiche , relazioni ipotizzate o fornite dalla teoria fisica. Ad esempio la legge fon- damentale del decadimento radioattivoe :
N = N 0 exp(−λt)
dove N e il numero (grande) di nuclei radiattivi al tempo t e N 0e il numero di nuclei radioattivi al generico istante iniziale t=0. Noi possiamo esprimere la quantita misurata N come espressione matematica della proprieta da misurare λ (costante di decadimento dei nuclei considerati). In questo modo possiamo confrontare le misure con un modello teorico. Noi possiamo scegliere tra due ipotesi (per esempio segnale - rumore) (o even- tualmente tra piu ipotesi) e stimare l’errore che facciamo a scegliere una o l’altra ipotesi. Le operazioni di misura devono essere chiaramente specificate (unita di misura, scale , approssimazioni, procedimenti di misura , ecc ). Dalle misure fatte noi vogliamo estrarre informazioni sulla grandezza o relazione che stiamo studiando. Mi sono riferito a misure in Fisica ma ovviamnete le misure possono essere le piu svariate ( in chimica, biologia, medicina, ecc). La statisticae un ramo della matematica applicata. Tecniche statistiche per estrarre informazioni da dati sperimentali sono diventate di base praticamnete in ogni settore dell’attivita umana. Il controllo di qualita di un determinato prodotto e fatto su basi statistiche analizzando campioni di questo prodotto, prima di fare un investimento una societa controlla l’andamento delle vendite , la possibilit`a di espansione del mercato, i risultati preliminari in una elezione si fanno considerando campioni di persone che hanno votato, etc. Le tecniche di analisi statistica sono numerose ed il loro utilizzo dipende dalle discipline e settori di applicazione. Noi introdurremo alcune tecniche statistiche di analisi dati comunemente usate in Fisica e che sono di generale applicazione in moltissimi altri campi.
La statistica si occupa dei procedimenti scientifici che permettono, fatta una serie di misure, di ordinare , presentare ed analizzare i dati, estraendone l’informazione.
La statistica descrittiva riguarda la classificazione e la sintesi delle informazioni relative ad un determinato campione di dati oggetto di studio. Dato un campione di misure, posso dare il grafico di una quantita caratteristica del campione, calco- lare media, varianza , correlazioni tra le variabili, ecc. In modo conciso vengono sintetizzati i dati con pochi numeri o grafici. La statistica inferenziale utilizza il campione di dati per fare previsioni di tipo probabilistico sulla popolazione da cui il campionee stato estratto. Nella teoria e pratica delle misure , la statistica inferen- ziale e senza dubbio quella di maggiore interesse. Le aree prindipali dell’inferenza statistica sono due : la stima di parametri e la verifica di ipotesi. L’inferenza puo essere induttiva o deduttiva
Due esperimenti diversi che misurano la stessa quantita fisica avranno misu- re diverse ( ed in generale un numero diverso di misure). Nel caso piu ele- mentare un esperimento misura una certa grandezza fisica 100 volte , un altro esperimento misura la stessa grandezza 1000 volte. Entrambi gli esperimenti misurano quella grandezza fisica a partire da un numero finito di misure. Echiaro che, solo considerando gli errori statistici, la misura piu precisa e quella basata su un numero maggiore di misure. La misura piu precisa sarebbe quella basata su un numero infinito di misure. La totalita degli elementi che sono oggetto della nostra indagine statisticae detta popolazione. I due esperimenti considerati nel nostro esempio rappresentano due campioni della stessa popolazione. Popolazione puo essere ad esempio l’intera produzione di chip di una industria elettronica in un determinato periodo. Per controllare se il prodottoe stato realizzato con le richieste caratteristiche facciamo un controllo su un campione di chip prodotti. I risultati ottenuti dall’analisi di questo campione vengono attribuiti all’intera produzione (la popolazione). Quindi per esempio una certa produzione non viene immessa nel mercato se il controllo di qualita sul campione non mostra i requisiti minimi di qualita richiesti. Osserviamo che l’analisi statistica sull’intera popolazione e general- mente impossibile o poco pratica. Si pensi ad esempio al controllo di qualita di un prodotto che spesso e distruttivo o all’analisi di indagini su un campione per decidere cosa applicare alla popolazione o quali decisioni prendere o alla analisi di misure sperimentali che possono essere di numero infinito. Questo procedimento di passaggio dal particolare al generalee noto come inferenza induttiva. La generalizzazione non e mai assolutamente certa. Pero l’analisi statistica permette di fare delle inferenze induttive e di misurare il loro grado di incertezza. Il campione deve essere casuale ( vedremo dopo cosa significa) .
Esempio: lancio una moneta due volte. Spazio degli eventi : TT, CT, TC,CC (l’ordine testa (T) , croce (C) conta!). Evento in cui la testa appare almeno una volta :
a di un evento composto si puo ottenere come somma delle probabilita di tutti gli eventi semplici che lo costituiscono come si puo dedurre dal postulato 3. Questo e particolarmente semplice quando si ha un numero finito di eventi semplici, tutti con eguale probabilita. Per esempio qual e la probabilita che si abbia un numero pari lanciando un dado ? Il numero di eventi semplici possibili e n(S)= 6. L’evento favorevole A si rializza con A = {2,4,6 }. Il numero di casi favorevolie n(A)= 3. Quindi la probabilita di avere un numero parie : P(A) = n(A)/n(S) = 0.5. In queste situazioni e centrale il concetto di combinazioni. Consideriamo n oggetti (tutti distinguibili , cioe diversi ). Supponiamo che si trovino in una scatola. Estraiamo dalla scatola r di questi oggetti, uno alla volta (senza rimetterli nella scatola)(Combinazioni senza ripetizione di n oggetti di classe r ). In quanti modi diversi riusciamo a fare questo?nr = n(n − 1)(n − 2) · · · (n − r + 1) =
n! (n − r)!
= Dn,r
Questo perch`e la prima volta si sceglie su n oggetti, la seconda volta si sceglie su (n-1) oggetti e cosi via. Qui :
k! ≡ k(k − 1)(k − 2) · · · 1 0! ≡ 1
Si chiamano disposizioni senza ripetizione di n oggetti di classe r. Queste disposizioni differiscono tra di loro sia perche contengono oggetti differenti sia perche stesi oggetti si susseguono in ordine diverso. In quanti modi diversi e possibile estrarre r oggetti dagli n che si trovano nella scatola? Vuol dire che prendiamo gli stessi oggetti indipendentemente dall’ordine in cui sono presi. Per avere questo numero devo dividere Dn,r per il numero delle permutazioni degli r oggetti , cioe per r! Questo numero `e detto coefficiente binomiale e si indica con
(n k
Il numero di volte in cui e possibile pigliare gli stessi r oggettie r!. Infatti alla prima presa prendi uno qualsiasi degli r oggetti; alla seconda presa, uno qualsiasi dei rimanenti r-1 ,ecc. Il coefficiente binomiale `e il rapporto tra il numero nr diviso il numero r!, quindi:
n r
Dn,r r!
n! (n − r)!r!
Il nome deriva dal fatto che :
(x + y)n^ =
∑^ n
r=
n r
xn−ryr
Il numero di combinazioni di 3 oggetti di classe 2 `e
2
3 · 2 2 = 3 Con un mazzo di carte di bridge (52 carte) il numero di possibili mani `e
13
La probabilita di 5 quadri, 5 picche, 2 cuori e un fiorie :
( 13 5
5
2
1
13
a Condizionale : Siano A e B due eventi di S e supponiamo che P(B) sia 6 = 0. Definiamo probabilita condizionale P(A | B), la probabilita che si avveri A supponendo avvenuto B (diciamo probabilita P di A dato B) come :I due eventi A e B si dicono statisticamente (o stocasticamente) indipendenti se P(A ∩ B) = P(A) · P(B). Se A e B sono eventi indipendenti, allora P(A | B) = P(A) e P(B | A) = P(B). Se lancio una moneta ed ho testa, il lancio di un’altra moneta ha un risultato (testa o croce ) che non dipende dal risultato del lancio della prima moneta. La nozione di indipendenza di due eventi si generalizza a quella di piu eventi mutuamente indipendenti. La nozione di indipendenza degli eventi ha un ruolo importante nella teoria della probabilita e nelle sue applicazioni. Esempio: Un dado viene lanciato due volte. Nell’ipotesi che si sappia che il punteggio totale dei due lanci e 6, quale la probabilit`a che il punteggio del primo lancio sia 3? Diciamo evento A “punteggio totale uguale a 6” ed evento B “ punteggio primo lancio uguale a 3”. Allora si hanno 36 possibili eventi, n(S)= 36 e
cioe anche :
Questo importante risultato, che lega le due probabilita condizionali,e noto come teorema di Bayes. Questo teorema costituisce la base della “ Statistica Bayesiana ”
P (B) = P (∪i(B ∩ Ai)) =
i
P (B ∩ Ai) =
i
P (B | Ai)P (Ai)
Questo risultato e noto come legge della probabilita totale
Consideriamo 3 contenitori B 1 ,B 2 e B 3 , il primo contenente due monete d’oro, il secondo contenente una moneta d’oro ed una d’argento , il terzo contenente due monete d’argento. Scegliamo un contenitore a caso e prendiamo una moneta. Sia una moneta d’oro. Ci chiediamo qual e la probabilita che la seconda moneta dello stesso contenitore sia ancora d’oro. Sia A l’evento (presa di una moneta d’oro dal contenitore ), si tratta di calcolare la probabilita condizionale P (B 1 | A), cioe che io scelga il contenitore B 1 con la condizione di trovare ancora una moneta d‘oro. Le probabilit`a condizionali P (A | Bi) di prendere una moneta d’oro dai contenitori Bi sono date da :
Avendo scelto a caso uno dei tre contenitori allora :
Applicando il teorema di Bayes abbiamo :
j=1 P^ (A^ |^ Bj^ )P^ (Bj^ )
P (π | segnale) =
P (segnale | π) · P (π) P (segnale | π)P (π) + P (segnale | K)P (K)
In questo caso la probabilita che sia un Ke 0.7 % Se il contatore non d`a segnale, allora :
P (K | nessunsegnale) =
P (nessunsegnale | K) · P (K) P (nessunsegnale | π)P (π) + P (nessunsegnale | K)P (K)
Il teorema di Bayes , che e una semplice conseguenza delle regole del calcolo delle probabilita, ha interpretazioni che sono profondamente diverse tra loro e che vedremo tra un attimo.
Qualunque quantita che soddisfa i tre assiomi della teoria assiomatica della proba- bilita puo essere interpretata come una probabilita. Infatti esistono due interpre- tazioni della probabilita che sono comunemente usate, che sono diverse tra di loro e che vanno tenute ben separate. Una prima interpretazione della probabilita e data in termini di frequenza relativa. Faccio n volte un esperimento e supponiamo che un certo evento A si verifichi m volte. Allora quando n tende all’infinito il rapporto m/n tende ad un numero che definiamo P(A) di A. Questa interpretazione frequentista della prob- abilita e quella adottata piu spesso( in particolare dalle scienze sperimentali). La statistica che fa uso di questa definizione di probabilita e detta statistica frequen- tista ( o classica). Qui si presuppone di poter effettuare piu volte l’esperimento ( cioe la misura di una certa grandezza fisica). Ad esempio se lancio un dado dico che la probabilita che venga un 3 sia 1/6. Voglio dire che se lancio il dado un numero elevato n di volte e conto il numero m di volte in cui appare il 3, il rapporto m/n =1/6. Il risultato e intuitivo in quanto tutte e sei le facce del dado sono equiprobabili ( il dadoe supposto “ non manipolato”).
tistica bayesiana. E‘ innegabile che la statistica bayesiana in diverse circostanze e superiore alla statistica frequentista e vi sono studi volti a fondere le due statis- tiche in una sola. I risultati di questi sforzi pero non sono ancora soffisfacenti. I contrasti tra le due correnti sono molto forti. Noi riteniamo che le due statistiche rispondano ad esigenze diverse e siano da ritenersi percio complementari : di volta in volta sceglieremo quella che risponde meglio alle nostre necessita. Le due statistiche comunque vanno tenute ben sepa- rate e deve essere chiaramente indicata la statistica usatanelle applicazioni. Come vedremo i risultati possono talvolta variare molto a seconda del tipo di statistica usata. Quando non specificato diversamente, la statistica utilizzata ( da noi ) sar`a quella frequentista.
Una variabile e detta casuale ( o aleatoria ) se assume un valore reale distinto per ogni elemento dello spazio campione. Una variabile casuale puo essere discreta o continua. E detta discreta se pu`` o assumere un insieme numerabile di numeri reali con certe probabilita. Se l’insieme dei valori che la variabile casuale puo assumere e continuo, la variabile casualee detta continua. E possibile che la variabile casualesia una combinazione di questi due tipi. Quando parliamo di variabile, pensiamo a tutti i possibili valori che puo as- sumere. Quando parliamo di variabile casuale noi pensiamo a tutti i possibili valori che la variabile assume ed inoltre alla distribuzione della probabilit`a in ac- cordo alla quale la variabile assume tutti i valori.
Per vedere come sono distribuiti i numeri che ottengo uso un istogramma. Riporto sull asse x il valore della variabile per intervalli (bin) usualmente di pari larghezza. Per ogni bin riporto sull asse y il numero di volte che quel valore viene trovato nel campione considerato. Se lancio una monetina mi aspetto che la probabilita che venga testa o croce debba essere la stessa (0.5). Invece che lanciare una monetina posso usare una sequenza di numeri casuali ( per esempio da 0 a 100 con un programma sul com- puter) e poi dico croce se il numero ottenutoe compreso tra 0 e 49 mentre dico testa se il numero `e compreso tra 50 e 99. Con questa tecnica posso generare un
campione casuale. Se il programma fosse sbagliato e non desse numeri casuali op- pure se lancio veramente la monetina e questa per qualche motivo preferisce testa a croce , il campione non sarebbe casuale e l’inferenza statistica che farei sarebbe sbagliata. Considerazioni analoghe valgono in generale.
a di Probabilita. FunzioneLa nostra variabile casuale (misura di un qualche processo) assume valori diversi con diverse probabilita. Noi vogliamo vedere come caratterizzare la distribuzione delle probabilita‘. Per semplicita noi consideriamo variabili casuali continue. La generalizzazione di quanto esposto al caso di variabili casuali disctrete `e abbastanza semplice.
a di Probabilitaa che la variabile ca- suale (la misura ) x sia minore di x 0. Quindi F(-∞)=0 e F(+∞) =1. La probabilita che la variabile x sia conpresa tra x e x +dx `e :P (x ∈ [x, x + dx]) = F (x + dx) − F (x)
Definiamo funzione densita di probabilita (p.d.f.) la funzione :
f (x) =
dF dx
Quindi
P (x ∈ [x, x + dx]) = F (x + dx) − F (x) = f (x)dx
Ovviamente : (^) ∫ (^) +∞
−∞
f (x)dx = 1
Se la variabile casuale assume valori discreti l’integrale si trasforma in una sommatoria.
e caratterizzata da due variabili casuali continue x e y, allora la probabilita che la nostra misura abbia x compreso tra x e x+dx e y compresa tra y e y+dy `e data da :A. FUNZIONE DISTRIBUZIONE CUMULATIVP (x ∈ [x, x + dx], y ∈ [y, y + dy]) = f (x, y)dxdy
f(x,y) e detta funzione densita di probabilit`a congiunta. Integrando f(x,y) su tutti i possibili valori di x e y si ottiene 1 (condizione di normaliz- zazione). Nota la p.d.f. congiunta f(x,y) possiamo essere interessati alla p.d.f. della variabile x indipendentemente dal valore assunto della variabile y. Questa p.d.f. si ottierne integrando ( sommando ) sulla variabile y :
fx(x) =
−∞
f (x, y)dy
fx(x) e detta p.d.f. marginale per x. In modo analogo si definisce la p.d.f. marginale per y fy(y). Esempio dello “scatter plot” con proiezioni sugli assi. Calcolare la probabilita che y sia compreso tra y e y+dy per qualunque valore di x (evento B), con la condizione che x sia contenuto in x , x+dx con qualunque y (evento A) :
f (x, y)dxdy fx(x)dx
la p.d.f. condizionale h(y | x) che si verifichi y dato x `e cosi definita :
h(y | x) =
f (x, y) fx(x)
∫ f^ (x, y) f (x, y′)dy′
In modo analogo si definisce la p.d.f condizionale g(x | y) che si verifichi y dato x. Si verifica facilmente che :
g(x | y) =
h(y | x)fx(x) fy(y)
che e il teorema di Bayes. Se il valore di una variabile non dipende dal valore assunto dall’altra variabile, allora le due variabili si dicono (statisticamente ) indipendenti. In questo caso f(x,y) = f(x) f(y). In questo caso la p.d.f. marginale di xe semplicemente f(x). Esempio: Supponiamo che f (x, y) = 32 (x^2 + y^2 ) per 0 < x < 1,0 < y < 1 e 0 altrove. Calcolare la probabilit`a che la variabile x assuma un valore compreso
A. FUNZIONE DISTRIBUZIONE CUMULATIV(x^2 + y^2 ) 6 =
x^2
y^2
Le cose dette si generalizzano facilmente al caso di misura caratterizzata da n variabili casuali.
Un altro modo di caratterizzare la distribuzione delle probabilita di una variabile casuale xe dato dalla sua funxione di distribuzione cumulativa (c.d.f.) F(x) cosi definita :
F (x) =
∫ (^) x
−∞
f (u)du
dove f(x) e la p.d.f. F(x) rappresenta la probabilita che la variabile casuale assuma un valore minore od uguale ad x. la c.d.f. F(x) assume valori crescenti da o ad 1. Se la funzione F(x) e strettamente crescente, allora vie una corrispondenza uno ad uno tra il valore della variabile casuale x e il valore assunto dalla c.d.f F(x). In questo caso la funzione F(x) pu`o essere invertita. Si definisce punto α ( o anche “ quantile di ordine α ”) xα il valore della variabile x per il quale si ha :
F (xα) = α
con 0 ≤ α ≤ 1. Il quantile non `e altro che l’inverso della distribuzione cumula- tiva.
xα = F −^1 (α)
Il quantile piu usatoe la mediana che `e il quantile corrispondente ad α=0.5 :
∫ (^) mediana
−∞
f (x)dx
Un terzo modo di di rappresentare la distribuzione di una variabile casuale e dato dalla funzione caratteristica (ch.f.) φ. Questae la trasformata di Fourier della p.d.f.. Supponiamo di avere una sola variabile casuale continua , allora
φ(t) =
−∞
eitxf (x)dx
Qui vale una proprieta importantissima e cioe che vale una corrispondenza biunivoca tra p.d.f. e ch.f., cosicche la conoscenza che si ha con unae del tutto equivalente alla conoscenza che si ha con l’altra. Naturalmente :
f (x) =
2 π
−∞
e−ixtφ(t)dt
Molto spesso e piu comodo utilizzare la ch.f. Ovvia generalizzazione al caso di misure che comportano pi`u variabili casuali.
Una funzione di una variabile casuale e essa stessa una variabile casuale. Supponi- amo di avere una variabile casuale X che assume valori continui x con p.d.f. f(x). Supponiamo che Y =φ(X) sia una funzione continua di x. Allora quale la p.d.f. g(y) della variabile casuale Y? Noi abbiamo che :
P (Y < y) = P (φ(X) < y)
Se la funzione φ `e una funzione crescente, allora possiamo scrivere che :
P (Y < y) = P [X < φ−^1 (y)]
Notiamo che x = φ−^1 (y) , essendo φ−^1 la funzione inversa di φ. Indicando con G(y) ed F(x) le c.d.f. delle variabili casuali Y ed X, allora la relazione precedente possiamo riscriverla cosi:
G(y) = F [φ−^1 (y)]
Differenziando entrambi i membri rispetto ad y, otteniamo:
g(y) = f [φ−^1 (y)] ·
dφ−^1 dy Se la funzione φ `e una funzione decrescente, allora avremo che :
P (Y < y) = P [X > φ−^1 (y)]
che possiamo riscrivere cosi:
G(y) = 1 − F [φ−^1 (y)]
Differenziando entrambi i membri rispetto ad y, abbiamo: