


















Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
formule di statistica dell’università degli studi di torino
Tipologia: Schemi e mappe concettuali
1 / 26
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!



















1 𝑁 𝑖= 1 𝑁 ∑ 𝑥𝑖 MEDIA ARITMETICA CAMPIONARIA 𝑥 = 1 𝑛 𝑖= 1 𝑛 ∑ 𝑥𝑖𝑓𝑖 MEDIA PONDERATA Dati i pesi wi > 0 associati ai dati xi definiamo la media ponderata
𝑖= 1 𝑛 ∑ 𝑥𝑖𝑤𝑖 𝑖= 1 𝑛 ∑ 𝑤𝑖
𝑥 1 𝑤 1 +...+𝑥𝑛𝑤𝑛 𝑤 1 +...+𝑤𝑛 MEDIA GEOMETRICA = dove 𝑖= 1 𝑛 ∑ 𝑥𝑖 𝑖= 1 𝑛 ∑ 𝑥 𝑀𝑔 = ( 𝑖= 1 𝑛 ∏ 𝑥𝑖) 1 𝑛 𝑖= 1 𝑛 ∏ 𝑥𝑖 = 𝑥 1 · 𝑥 2 ·... · 𝑥𝑛 (applicazioni tipiche riguardano i tassi di crescita e tassi di interesse composti) 𝑖= 1 𝑛 ∏ ( 1 + 𝑟 𝑖
𝑖= 1 𝑛 ∏ ( 1 + 𝑟) MEDIA ARMONICA
𝑎
𝑛 𝑖= 1 𝑛 ∑ (^1) 𝑥 𝑖 (applicazioni tipiche sono il calcolo della velocità media ). MEDIANA 1 ) dati aggregati x 1 , …, xn La mediana è il valore centrale nei dati ordinati 2 ) dati raggruppati La mediana è la prima modalità la cui frequenza cumulata supera 0. 5 MODA è la modalità con frequenza più alta Se ho variabile raccolta in classi (incluse le continue), definiamo CLASSE MODALE la classe con massima densità di frequenza. MISURE DI VARIABILITÀ range, varianza, scarto quadratico medio, coefficiente di variazione PERCENTILE Si definisce k-esimo PERCENTILE l’osservazione di posizione nei dati ordinati. 𝑘 100 (𝑛^ +^1 ) Lascia alla sua sinistra il k% dei dati e alla sua destra l’ ( 100 - k)%
DI = Q 3 - Q 1 la differenza tra il 1 ° e il 3 ° quartile. VARIANZA σ 2 = 1 𝑛− 1 𝑖= 1 𝑛 ∑ (𝑥𝑖 − 𝑥) 2 VARIANZA CAMPIONARIA σ 2 = 1 𝑛− 1 𝑖= 1 𝑛 ∑ (𝑥𝑖 − 𝑥) 2 𝑛𝑖 = 𝑖= 1 𝑛 ∑ (𝑥𝑖 − 𝑥) 2 𝑓𝑖 La quantità 𝑥( 2 )è anche detta “ momento secondo campionario " SCARTO QUADRATICO MEDIO/DEVIAZIONE STANDARD σ = σ 2 = 1 𝑁 𝑖= 1 𝑛 ∑ (𝑥𝑖 − 𝑥) 2 SQM CAMPIONARIO 𝑆 = 𝑆 2 = 1 𝑛− 1 𝑖= 1 𝑛 ∑ (𝑥𝑖 − 𝑥) 2 Se ho dati aggregati in modalità Se ho i dati raccolti in classi 𝑆 2 = 𝑛 𝑛− 1 𝑖= 1 𝑛 ∑ (^) (𝑥 (^) 𝑖 − 𝑥) 2 𝑓𝑖 𝑆 2 = 1 𝑛− 1 𝑖= 1 𝑘 ∑ (^) (𝑚 (^) 𝑖 − 𝑥) 2 𝑛𝑖 COEFFICIENTE DI VARIAZIONE 𝐶𝑉 = campionario: σ | μ | 𝐶𝑉^ =^ σ | 𝑥 | DESCRIZIONE GRAFICA E NUMERICA DELLA FORMA DI UNA DISTRIBUZIONE Per popolazioni di piccole dimensioni uso la disuguaglianza di Chebyshev Per popolazioni di grandi dimensioni uso la regola empirica DISUGUAGLIANZA DI CHEBYSHEV Data una popolazione con media μ e SQM σ, per ogni valore di k > 1 , la percentuale di unità statistiche che appartengono all’intervallo (μ − 𝑘σ, μ + 𝑘σ), è almeno pari a (≥ 𝑑𝑖) 1 − 1 ( (^) 𝑘^2 )
la percentuale di unità con valore nell'intervallo (μ − 𝑘σ, μ + 𝑘σ)è
a
=>^ - E # · - ~ - = - -
la direzione della relazione lineare tra le variabili (xi, yi) i valori delle unità statistiche e μ le rispettive medie. 𝑥 , μ 𝑦 σ𝑥𝑦 = 𝐶𝑜𝑣(𝑥, 𝑦) = 1 𝑁 𝑖=𝑖 𝑁 ∑ (^) (𝑥 (^) 𝑖 − μ𝑖) (𝑦 (^) 𝑖 − μ𝑖) COVARIANZA CAMPIONARIA è data da 𝑆𝑥𝑦 = (divido per n- 1 e non per n) 1 𝑛− 1 𝑖=𝑖 𝑛 ∑ (^) (𝑥 (^) 𝑖 − 𝑥) (𝑦 (^) 𝑖 − 𝑦) 1 ) Se 𝑆𝑥𝑦 > 0 ⇒Associazione positiva tra X e Y 2 ) Se 𝑆𝑥𝑦 < 0 ⇒Associazione negativa tra X e Y 3 ) Se 𝑆 no associazione tra X e Y 𝑥𝑦
𝑥 2 = 𝑛 𝑛− 1 (^ 1 𝑛 𝑖=𝑖 𝑛 ∑ 𝑥 𝑖
2 ) COEFFICIENTE DI CORRELAZIONE LINEARE
concentra intorno ad una retta) DATI BIVARIATI AGGREGATI Se ho dati raggruppati:
·g
-^ - & a D (^) -
𝑖= 1 𝑘 ∑ 𝑥 𝑖
𝑖 𝑥 𝑦 = (^1) 𝑢 𝑗= 1 ℎ ∑ 𝑦 𝑗
𝑗 𝑦 𝑆𝑥 2 = 1 𝑛− 1 𝑖= 1 𝑘 ∑ (𝑥 𝑖
2 𝑛 𝑖 𝑥 𝑆𝑦 2 = 1 𝑛− 1 𝑗= 1 ℎ ∑ (𝑦 𝑖
2 𝑛 𝑗 𝑥 𝑆 𝑥𝑦
1 𝑛− 1 ( 𝑖= 1 𝑘 ∑ 𝑗= 1 ℎ ∑ 𝑥 𝑖
𝑖
𝑖𝑗
Dato campione bivariato su (X,Y) vogliamo approssimare la relazione tra X e Y con una retta. 𝑦 = β 0 + β 1 𝑥 β 0 , β 1 Є𝑅 devo scegliere tra infinite rette possibili. Il criterio di scelta è detto dei MINIMI QUADRATI (RESIDUI) 𝑦 = 𝑏 è la candidata, per dati valori di 0
1
0
1 𝑦 è il valore che la retta attribuisce ad Y se X = x ERRORE o RESIDUO 𝑒 𝑖
𝑖
𝑖
𝑖
0
1
𝑖 associato alla previsione che la retta candidata fornisce dato xi vorremmo minimizzare la somma dei residui (gli errori di previsione) ma (analogamente a quanto visto per la media campionaria) dovremmo neutralizzare i segni delle ei Dunque prendo i quadrati dei residui : 𝑖= 1 𝑛 ∑ 𝑒𝑖 2 = 𝑖= 1 𝑛 ∑ (𝑦𝑖 − 𝑏 0 − 𝑏 1 𝑥𝑖) 2 e minimizzo questa quantità RETTA DI REGRESSIONE LINEARE La retta di regressione lineare 𝑦 = 𝑏 0 + 𝑏 1 𝑥ottenuta col metodo dei minimi quadrati residui 𝑏 1
𝑆𝑥𝑦 𝑆𝑥^2
0
1
𝑆𝑋𝑌 𝑆𝑋^2 𝑏 0 = 𝑦 − 𝑏 1 𝑥 Posso usare la retta a fini di previsione/estrapolazione (es. che Y mi aspetto per X = 12 )
&
olo &
al #^ &
& m (^) =-^5
Sia S lo spazio campionario composto dagli elementi elementari Oi, si definisce probabilità una funzione con argomento 𝐴 ⊂ 𝑆, indicata con P(A) che soddisfa 3 assiomi : A. 1 ) 0 ≤ 𝑃(𝐴) ≤ 1 la probabilità è sempre compresa tra 0 e 1 A. 2 ) 𝑃(𝐴) = 𝑃( la probabilità di un evento è data dalla somma delle 𝑖:𝑂𝑖∈𝐴
𝑖:𝑂𝑖∈𝐴
probabilità degli eventi che lo compongono A. 3 ) 𝑃(𝑆) = 1 la probabilità dell’evento certo è 1 Sia 𝑆 = 𝑂 formato da eventi elementari ugualmente possibili, sia con 1
{ (^) 𝑛}
cardinalità NA, allora 𝑃(𝑂 e 𝑖
1 𝑁 ∀𝑖^ =^1 ,...,^ 𝑁^ 𝑃(𝐴)^ =^ 𝑁𝐴 𝑁 Per S qualsiasi, siano E 1 , …, Ek eventi collettivamente esaustivi. Allora 𝑃( 𝑖= 1 𝑘 ⋃ 𝐸𝑖) = 1 PROPRIETA’ UNIONE E INTERSEZIONE 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵) PROBABILITÀ CONDIZIONATA 𝑃(𝐴|𝐵) = 𝑃(𝐴∩𝐵) 𝑃(𝐵) => 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵|𝐴) = 𝑃(𝐵)𝑃(𝐴|𝐵) EVENTI INDIPENDENTI
𝑖
--^ - o - & g a - d &
&
D -
& &
(versione semplificata con 𝐴 ) 1
{ 2 }
𝑐 { } 𝑃(𝐴|𝐵) = 𝑃(𝐴)𝑃(𝐵|𝐴) 𝑃(𝐵) TEOREMA DI BAYES - VERSIONE GENERALE Sia A 1 ,...,Ak una partizione di S. Dato B 𝑃(𝐴 𝑖
𝑃(𝐴𝑖)𝑃(𝐵|𝐴𝑖) ℎ= 1 𝑘 ∑ 𝑃(𝐴ℎ)𝑃(𝐵|𝐴ℎ)
𝑖
Si definisce f.d.r. di X la funzione 𝐹: 𝑅→ [ 0 , 1 ]tale che per ogni x є R esprime la probabilità che X non superi il valore x , cioè 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) Nel caso di una v.a. discreta avremo 𝐹(𝑥) = 𝑖:𝑥𝑖≤𝑥
la f.d.r. F(x) e la funzione di probabilità p(x) forniscono le stesse informazioni sulla distribuzione di X, cioè da una posso ricavare l’altra e viceversa. 𝑃(𝑋 ∈ (𝑎, 𝑏]) = 𝑖:𝑥𝑖∈(𝑎,𝑏]
𝑖= 1 𝑘 ∑ 𝑥 𝑖
𝑖
d VI d
= (^) -
!
PROVE BERNOULLIANE: esperimento che consiste in n prove dall'esito successo/insuccesso ripetute in maniera indipendente e con uguale probabilità di success o Una v.a. x ha distr. di Bernoulli di parametro 0 ≤ 𝑝 ≤ 1 (probabilità di successo), in base x~Bernoulli (p), se 𝑃(𝑋 = 𝑥) = 𝑝 𝑥 ( 1 − 𝑝) 1 −𝑥 , 𝑥 = 0 , 1 𝐸(𝑋) = 1 𝑝 𝑉𝑎𝑟(𝑋)^ =^ 1 −𝑝 𝑝^2 𝑃(𝑋 ≤ 𝑥) = 1 − ( 1 − 𝑝) 𝑥 , 𝑥 = 1 , 2 ,... DISTRIBUZIONE BINOMIALE (ESTRAZIONE CON REIMMISSIONE) Una v.a. X ha distribuzione binomiale di parametri 𝑛 ≥ 1 (n di prove) e 0 ≤ 𝑝 ≤ 1 𝑋~𝑏𝑖𝑛𝑜𝑚(𝑛, 𝑝) se ha distribuzione 𝑃(𝑋 = 𝑥) = 𝐶𝑥 𝑛 𝑝 𝑥 ( 1 − 𝑝) 𝑛−𝑥 , 𝑥 = 0 , 1 ,..., 𝑛 La distribuzione di Bernoulli è il caso particolare n= 1 𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖(𝑝) = 𝑏𝑖𝑛𝑜𝑚(𝑛 = 1 , 𝑝) 𝐸(𝑋) = 𝑛𝑝 𝑉𝑎𝑟(𝑋) = 𝑛𝑝( 1 − 𝑝) DISTRIBUZIONE IPERGEOMETRICA (ESTRAZIONE SENZA REIMMISSIONE) Una v.a. X ha distribuzione ipergeometrica di parametri 𝑁, 𝑆, 𝑛(𝑆 ≤ 𝑁, 𝑛 ≤ 𝑁), 𝑋~𝐼𝑝𝑒𝑟𝑔𝑒𝑜𝑚(𝑁, 𝑆, 𝑛) S → n di elementi da estrarre che equivalgono a successo N → n di elementi tra cui scegliere n → n di estrazioni 𝐸(𝑋) = 𝑛 𝑆 𝑁 𝑉𝑎𝑟(𝑋) = 𝑛 𝑆 𝑁 (^1 −^ 𝑆 𝑁 )^ 𝑁−𝑛 𝑁− 1 →^ 𝑓𝑎𝑡𝑡𝑜𝑟𝑒^ 𝑐𝑜𝑟𝑟𝑒𝑡𝑡𝑖𝑣𝑜^ ≤^1 DISTRIBUZIONE GEOMETRICA Consideriamo una successione potenzialmente infinita di prove bernoulliane (indipendenza e uguale probabilità di successo tra le prove) Sia X=n di prove necessarie per osservare il primo successo Una v.a. X ha distribuzione geometrica di parametro 0 ≤ 𝑝 ≤ 1 (𝑝𝑟𝑜𝑏 𝑑𝑖 𝑠𝑢𝑐𝑐𝑒𝑠𝑠𝑜), 𝑋~𝑔𝑒𝑜𝑚(𝑃), se 𝑃(𝑋 = 𝑥) = ( 1 − 𝑝) 𝑥− 1 𝑝, 𝑥 = 1 , 2 ,... 1 − 𝑝 1 − 𝑝 2 −... − 𝑝𝑥 = ( 1 − 𝑝) 𝑥 1 − 𝑃(𝑋 ≤ 𝑥) = ( 1 − 𝑝) 𝑥 funzione di ripartizione di 𝑋~𝑔𝑒𝑜𝑚(𝑝) 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = 1 − ( 1 − 𝑝) 𝑥 𝑝↓ ⇒ 𝐸(𝑥)↑ 𝐸(𝑋) = 1 𝑝 𝑉𝑎𝑟(𝑋)^ =^ 1 −𝑝 𝑝^2
~ (^) & - -D & - ·
&-
𝑋~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(λ) parametro λ > 0 → TASSO → numero medio di eventi 𝑃(𝑋 = 𝑥) = 𝑒−λλ𝑥 𝑥! 𝑥^ =^0 ,^1 ,^2 ,... 𝐸(𝑋) = λ 𝑉𝑎𝑟(𝑥) = λ DISTRIBUZIONE CONGIUNTA DI VARIABILI ALEATORIE DISCRETE Per studiare la relazione tra due variabili aleatorie è necessario costruire un modello probabilistico che descriva la realizzazione congiunta di queste variabili. PROBABILITÀ CONGIUNTA (𝑥, 𝑦) → 𝑃(𝑋 = 𝑥, 𝑌 = 𝑦) = 𝑃( {𝑋 = 𝑥} ∩ {𝑌 = 𝑦}) INDIPENDENZA DI V.A. DISCRETE Due eventi A e B sono indipendenti quando 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵) In maniera analoga, definiamo due v.a. discrete X e Y indipendenti quando 𝑃(𝑋 = 𝑥, 𝑌 = 𝑦) = 𝑃(𝑋 = 𝑥)𝑃(𝑌 = 𝑦) prob congiunta prodotto prob marginali 𝑃 ({ 𝑋 = 𝑥} ∪ {𝑌 = 𝑦}) = 𝑃( {𝑋 = 𝑥})𝑃( {𝑌 = 𝑦}) dalla definizione di probabilità condizionata 𝑃(𝑌 = 𝑦|𝑋 = 𝑥) = 𝑃(𝑋=𝑥,𝑌=𝑦) 𝑃(𝑋=𝑥) =^ 𝑃(𝑌^ =^ 𝑦)
𝑦
Se X e Y sono indipendenti , la covarianza è nulla. 𝐸(𝑋𝑌) = 𝐸(𝑋)𝐸(𝑌) 𝐶𝑜𝑣(𝑋, 𝑌) = 𝐸(𝑋𝑌) − 𝐸(𝑋)𝐸(𝑌) = 0 Tuttavia, Cov(X,Y)= 0 non implica che X e Y siano indipendenti. In generale, per 𝑐 ≠ 𝑜 𝐶𝑜𝑣(𝑋, 𝑐𝑌) = 𝑐 𝐶𝑜𝑣(𝑋, 𝑌) ≠ 𝐶𝑜𝑣(𝑋, 𝑌)
g
N & - -
Per definizione della funzione di ripartizione 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = 𝑃(− ∞ ≤ 𝑋 ≤ 𝑥) = −∞ 𝑥 ∫ 𝑓(𝑢)𝑑𝑢 cioè F(x) è la PRIMITIVA di f(x) Di conseguenza f(x) è la derivata di F(x) 𝑓(𝑥) = 𝐹'(𝑥) ESEMPIO (distanza dal centro) L’inclusione o meno è irrilevante, cioè 𝑃(𝑎 < 𝑋 < 𝑏) = 𝑃(𝑎 < 𝑋 ≤ 𝑏) = 𝑃(𝑎 ≤ 𝑋 < 𝑏) = 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) dato che 𝑃(𝑋 = 𝑥) = 0 per ogni x nel caso di v.a. continue
--
Pur non essendo F(x) una probabilità, essa è proporzionale alla probabilità che X assuma valori vicini a x, cioè 𝑃(𝑥 < 𝑋 ≤ 𝑥 + ℎ) = 𝑥 𝑥+ℎ ∫ 𝑓(𝑢)𝑑𝑢 ≈ ℎ𝑓(𝑥) quindi maggiore f(x), maggiore la probabilità che X assuma valori vicini a x. ESEMPIO (distanza dal centro) 𝑓(𝑥 1 ) < 𝑓(𝑥 2 ) ⇒ x 2 è più probabile di x 1 , nel senso che è maggiore la probabilità che la distanza dal centro sia attorno a x 2 piuttosto che a x 1 Sia X una v.a. continua con funzione di densità f(x) 𝐸(𝑋) = → baricentro della distribuzione , cioè il punto dell'asse orizzontale che −∞ +∞ ∫ 𝑥𝑓(𝑥)𝑑(𝑥) mantiene in equilibrio l'area sottesa al grafico (caso discreto: 𝐸(𝑋) = 𝑥 1 𝑝(𝑥 1 ) + 𝑥 2 𝑝(𝑥 2 ) = ) 𝑖= 1 ∞ ∑ 𝑥𝑖𝑝(𝑥𝑖) ESEMPIO (distanza dal centro)
al -^ -^ - & &
la densità è costante e uguale all’inverso dell’ampiezza dell’intervallo delle possibili realizzazioni di X. Di seguito indichiamo con a la realizzazione minima ( 0 nell’esempio) e con b la realizzazione massima ( 2 nell’esempio). DISTRIBUZIONE UNIFORME Una v.a. X ha distribuzione uniforme sull’intervallo (a,b), a < b, 𝑋~𝑈𝑛𝑖𝑓(𝑎, 𝑏) se ha funzione di densità generalizzando la formula ricavata nell’esempio precedente abbiamo E
-- (
-- DERIVO : A
In generale 𝑋~𝑈𝑛𝑖𝑡(𝑎, 𝑏)ha valore atteso 𝐸(𝑋) = 𝑎+𝑏 2 DISTRIBUZIONE ESPONENZIALE Questa distribuzione si adatta a tempi di attesa che non hanno un limite superiore Sia N il numero di eventi che si verificano in un intervallo di tempo di ampiezza unitaria. Supponendo che le condizioni della distribuzione di Poisson siano verificate, allora 𝑁~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(λ) Con funzione di probabilità 𝑃(𝑁 = 𝑛) = 𝑒−λλ𝑛 𝑛! ,^ 𝑛^ =^0 ,^1 ,... Segue che il numero di eventi in un intervallo di ampiezza T indicato da 𝑁, avrà anch’esso 1 distribuzione di Poisson. 𝑁𝑡~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(λ𝑡) 𝑃(𝑁𝑡 = 𝑛) = 𝑒−λ𝑡(λ𝑡)𝑛 𝑛! 𝑛^ =^0 ,^1 ,... λ ↑⇒ 𝐸(𝑋) ↓ 𝐸(𝑋) = 1 λ 𝑉𝑎𝑟(𝑋)^ =^ 1 λ^2 𝑃(𝑋 > 𝑥 + 𝑠|𝑋 > 𝑠) = 𝑃(𝑋 > 𝑥) La probabilità che una telefonata duri ulteriori x minuti sapendo che è già durata s minuti è uguale alla probabilità che la telefonata duri più di x minuti, proprietà detta di “ perdita di memoria” LEGAME TRA DISTRIBUZIONE ESPONENZIALE (tempo di attesa) E DISTRIBUZIONE DI POISSON (n eventi in un intervallo di tempo) Sia Nt Il numero di eventi che si verificano in un intervallo di tempo di ampiezza t, ad esempio ( 0 ,t), e sia X il tempo di attesa tra due eventi successivi Se 𝑁 con tasso unitario, allora 𝑡 ~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(λ𝑡) λ 𝑋~𝐸𝑥𝑝(λ) 𝐸(𝑋) = 1 λ =^ 1 𝐸(𝑁 1 ) → 𝑛 𝑒𝑣𝑒𝑛𝑡𝑖 𝑖𝑛 ( 0 , 1 ) Maggiore il numero medio di eventi che si verificano nell'intervallo ( 0 , 1 ), minore il tempo di attesa medio del primo evento. DISTRIBUZIONE NORMALE Si adatta a variabili i cui valori attorno alla media sono più probabili di valori via via più lontani. La funzione di densità ha cioè un' unica moda (valore massimo) in corrispondenza del valore atteso ed cresce in maniera simmetrica mano a mano che ci allontaniamo dal valore atteso. 𝑓(μ − 𝑥) = 𝑓(μ + 𝑥) distribuzione simmetrica rispetto aμ Una v.a. ha distribuzione normale di “media” μ e “varianza” σ , 2 > 0 𝑋~𝑁(μ, σ se ha funzione di densità 2 ) 𝐹(𝑥) = 1 2 Πσ^2
1 2 Πσ^2
1 2 σ^2 (𝑥 − μ) 2 { }
A
Sia 𝑋∼𝑏𝑖𝑛𝑜𝑚(𝑛, 𝑝) 𝑃(𝑋 = 𝑥) = 𝐶 𝑥 𝑛 𝑝 𝑥 ( 1 − 𝑝) 𝑛−𝑥 𝑥 = 0 , 1 ,..., 𝑛 𝐸(𝑋) = 𝑛𝑝 𝑉𝑎𝑟(𝑋) = 𝑛𝑝( 1 − 𝑝) Quando n è grande il calcolo di P(X=x) è difficile perché coinvolge fattoriali di interi molto grandi CAMPIONAMENTO E DISTRIBUZIONI CAMPIONARIE Supponiamo di essere interessati a studiare la distribuzione di una variabile (consumo di carburante) relativa a una determinata popolazione (modello di auto). Utilizziamo un CAMPIONE, cioè un sottoinsieme estratto dalla popolazione. Consideriamo il campionamento aleatorio : le unità vengono estratte con uguale probabilità dalla popolazione (senza reimmissione). 𝐸(𝑋) = μ LA MEDIA (VALORE ATTESO) DELLA MEDIA CAMPIONARIA E’ UGUALE ALLA MEDIA DELLA POPOLAZIONE 𝐸𝑠𝑡𝑟𝑎𝑧𝑖𝑜𝑛𝑒 𝑠𝑒𝑛𝑧𝑎 𝑟𝑒𝑖𝑚𝑚𝑖𝑠𝑠𝑖𝑜𝑛𝑒 ≃ 𝐸𝑠𝑡𝑟𝑎𝑧𝑖𝑜𝑛𝑒 𝑐𝑜𝑛 𝑟𝑒𝑖𝑚𝑚𝑖𝑠𝑠𝑖𝑜𝑛𝑒 𝑋 1 ,..., 𝑋𝑛~ iid = indipendenti e identicamente distribuite 𝑖𝑖𝑑 𝐹(𝑥) 𝑉𝑎𝑟(𝑋) = σ^2 𝑛 𝑛 ↑⇒ 𝑉𝑎𝑟(𝑋) ↓ TEOREMA DEL LIMITE CENTRALE A prescindere dalla distribuzione della popolazione, la media campionaria è approssimativamente distribuita come una normale di media μ (media popolazione) e varianza purché l’ampiezza n σ^2 𝑛 del campione sia sufficientemente grande 𝑛 ≥ 30. Sia 𝑋 1 ,..., 𝑋𝑛~ media e varianza 𝑖𝑖𝑑 𝐹(𝑥) μ σ 2 𝑛 ∞ lim → (𝑋𝑛−μ) σ/ 𝑛 = ϕ(𝑧) = 𝑃 (𝑍 ≤ 𝑧) dove 𝑧𝑛 = 𝑋𝑛−μ σ/ 𝑛 quindi 𝑃(𝑧 𝑛
La distribuzione di zn è approssimata dalla distribuzione normale standard 𝑃(𝑋 𝑛
𝑛 ≤ 𝑥−μ σ/ 𝑛 ) ≃ Φ( 𝑥−μ σ/ 𝑛
𝑋𝑛 è approssimativamente distribuita come normale di media μ e varianza σ^2 𝑛 in maniera analoga 𝑋 1 +... + 𝑋𝑛 ≈ 𝑁(𝑛μ, 𝑛σ 2 ) PROPORZIONE CAMPIONARIA Siamo interessati al possesso o meno da parte degli individui di una popolazione di una determinata caratteristica. Sia p, 0 Per fare INFERENZA (trarre conclusioni su F(x) da ciò che abbiamo osservato nel campione) su p, estraiamo un campione dalla popolazione e, per ogni individuo, prendiamo nota se possiede o meno tale caratteristica. 𝑝 = 𝑝𝑟𝑜𝑝𝑜𝑟𝑧𝑖𝑜𝑛𝑒 𝑛𝑒𝑙 𝑐𝑎𝑚𝑝𝑖𝑜𝑛𝑒 𝑑𝑖 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑖 𝑐ℎ𝑒 𝑝𝑜𝑠𝑠𝑖𝑒𝑑𝑜𝑛𝑜 𝑡𝑎𝑙𝑒 𝑐𝑎𝑟𝑎𝑡𝑡𝑒𝑟𝑖𝑠𝑡𝑖𝑐𝑎 𝑝 (proporzione campionaria) la utilizzeremo per fare inferenza su p, proporzione della popolazione Deriviamo il campione come 𝑋 1 ,..., 𝑋𝑛 ∼ 𝑖𝑖𝑑 𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖(𝑝) cioè per l’i-esimo individuo del campione osserviamo 𝑥 1 +... + 𝑥𝑛 = 𝑛 𝑑𝑖 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑖 𝑛𝑒𝑙 𝑐𝑎𝑚𝑝𝑖𝑜𝑛𝑒 𝑐𝑜𝑛 𝑙𝑎 𝑐𝑎𝑟𝑎𝑡𝑡𝑒𝑟𝑖𝑠𝑡𝑖𝑐𝑎 𝑝 = 1 𝑛 (𝑥^1 +...^ +^ 𝑥𝑛) cioè la proporzione campionaria interpretata come media campionaria relativa a una popolazione “Bernoulliana”. Consideriamo 𝑝come realizzazione di una v.a. 𝑃 proporzione campionaria 𝐸(𝑝) = 𝑝 𝑉𝑎𝑟(𝑝) = 𝑝( 1 −𝑝) 𝑛 utilizzeremo il teorema del limite centrale a patto che l’ampiezza campionaria sia sufficientemente grande 𝑛 ≥ 30 e𝑛𝑝( 1 − 𝑝) > 𝑞 standardizzazione della proporzione campionaria 𝑧𝑛(𝑃 ≤ 𝑝) = 𝑃(𝑧𝑛 ≤ 𝑝−𝑝 𝑝( 1 −𝑝)/𝑛 ≈ ϕ 𝑝−𝑝 ( (^) 𝑝( 1 −𝑝)/𝑛) DISTRIBUZIONE DELLA VARIANZA CAMPIONARIA Si consideri un campione aleatorio estratto da una popolazione di media μ e varianzaσ 2 𝑋 1 ,..., 𝑋𝑛~ 𝑖𝑖𝑑 𝐹(𝑥) Se indichiamo 𝑋 la varianza della popolazione 𝑛
𝑉𝑎𝑟(𝑋) = σ 2 = 𝐸( (𝑋 − μ) 2 ) se estraiamo un campione, allora questa formula suggerisce di stimare σ attraverso la media 2 aritmetica di (^) (𝑋 (^) 𝑖 − μ) cioè 2 , 𝑖 = 1 ,..., 𝑛 1 𝑛 (^ (𝑋^1 −^ μ) 2