Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


formule di statistica, Schemi e mappe concettuali di Statistica

formule di statistica dell’università degli studi di torino

Tipologia: Schemi e mappe concettuali

2024/2025

Caricato il 18/06/2026

ygg5k6wdnc
ygg5k6wdnc 🇮🇹

2 documenti

1 / 26

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
MISURE DI TENDENZA CENTRALE
MEDIA ARITMETICA
𝑢= 1
𝑁𝑖=1
𝑁
𝑥𝑖
MEDIA ARITMETICA CAMPIONARIA
𝑥=1𝑛𝑖=1
𝑛
𝑥𝑖𝑓𝑖
MEDIA PONDERATA
Dati i pesi wi> 0 associati ai dati xidefiniamo la media ponderata
𝑥= 𝑖=1
𝑛
𝑥𝑖𝑤𝑖
𝑖=1
𝑛
𝑤𝑖=𝑥1𝑤1+...+𝑥𝑛𝑤𝑛
𝑤1+...+𝑤𝑛
MEDIA GEOMETRICA
= dove
𝑖=1
𝑛
𝑥𝑖𝑖=1
𝑛
𝑥 𝑀𝑔=(𝑖=1
𝑛
𝑥𝑖)1𝑛𝑖=1
𝑛
𝑥𝑖=𝑥1·𝑥2·...·𝑥𝑛
(applicazioni tipiche riguardano i tassi di crescita e tassi di interesse composti)
𝑖=1
𝑛
(1+𝑟𝑖)=𝑖=1
𝑛
(1+𝑟)
MEDIA ARMONICA
𝑀𝑎=𝑛
𝑖=1
𝑛
1
𝑥𝑖
(applicazioni tipiche sono il calcolo della velocità media).
MEDIANA
1) dati aggregati x1, …, xn
La mediana è il valore centrale nei dati ordinati
2) dati raggruppati
La mediana è la prima modalità la cui frequenza cumulata supera 0.5
MODA
è la modalità con frequenza più alta
Se ho variabile raccolta in classi (incluse le continue), definiamo CLASSE MODALE la
classe con massima densità di frequenza.
MISURE DI VARIABILITÀ
range, varianza, scarto quadratico medio, coefficiente di variazione
PERCENTILE
Si definisce k-esimo PERCENTILE l’osservazione di posizione nei dati ordinati.
𝑘
100 (𝑛+1)
Lascia alla sua sinistra il k% dei dati e alla sua destra l’(100-k)%
- il 50° percentile è la mediana ( QUARTILE)
- il 25% e il 75% percentile sono detti e QUARTILE indicati con Q1e Q3
CAMPO DI VARIAZIONE
La differenza tra il massimo e il minimo dei valori osservati:
𝑅=𝑚𝑎𝑥 𝑥𝑖𝑚𝑖𝑛 𝑥𝑖 = 𝑥(𝑛)𝑥(1)
i
af
g
d
d
·
f
f
-----
-
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a

Anteprima parziale del testo

Scarica formule di statistica e più Schemi e mappe concettuali in PDF di Statistica solo su Docsity!

MISURE DI TENDENZA CENTRALE

MEDIA ARITMETICA

1 𝑁 𝑖= 1 𝑁 ∑ 𝑥𝑖 MEDIA ARITMETICA CAMPIONARIA 𝑥 = 1 𝑛 𝑖= 1 𝑛 ∑ 𝑥𝑖𝑓𝑖 MEDIA PONDERATA Dati i pesi wi > 0 associati ai dati xi definiamo la media ponderata

𝑖= 1 𝑛 ∑ 𝑥𝑖𝑤𝑖 𝑖= 1 𝑛 ∑ 𝑤𝑖

𝑥 1 𝑤 1 +...+𝑥𝑛𝑤𝑛 𝑤 1 +...+𝑤𝑛 MEDIA GEOMETRICA = dove 𝑖= 1 𝑛 ∑ 𝑥𝑖 𝑖= 1 𝑛 ∑ 𝑥 𝑀𝑔 = ( 𝑖= 1 𝑛 ∏ 𝑥𝑖) 1 𝑛 𝑖= 1 𝑛 ∏ 𝑥𝑖 = 𝑥 1 · 𝑥 2 ·... · 𝑥𝑛 (applicazioni tipiche riguardano i tassi di crescita e tassi di interesse composti) 𝑖= 1 𝑛 ∏ ( 1 + 𝑟 𝑖

𝑖= 1 𝑛 ∏ ( 1 + 𝑟) MEDIA ARMONICA

𝑎

𝑛 𝑖= 1 𝑛 ∑ (^1) 𝑥 𝑖 (applicazioni tipiche sono il calcolo della velocità media ). MEDIANA 1 ) dati aggregati x 1 , …, xn La mediana è il valore centrale nei dati ordinati 2 ) dati raggruppati La mediana è la prima modalità la cui frequenza cumulata supera 0. 5 MODA è la modalità con frequenza più alta Se ho variabile raccolta in classi (incluse le continue), definiamo CLASSE MODALE la classe con massima densità di frequenza. MISURE DI VARIABILITÀ range, varianza, scarto quadratico medio, coefficiente di variazione PERCENTILE Si definisce k-esimo PERCENTILE l’osservazione di posizione nei dati ordinati. 𝑘 100 (𝑛^ +^1 ) Lascia alla sua sinistra il k% dei dati e alla sua destra l’ ( 100 - k)%

  • il 50 ° percentile è la mediana ( 2 ° QUARTILE )
  • il 25 % e il 75 % percentile sono detti 1 ° e 3 ° QUARTILE indicati con Q 1 e Q 3 CAMPO DI VARIAZIONE La differenza tra il massimo e il minimo dei valori osservati: 𝑅 = 𝑚𝑎𝑥 𝑥𝑖 − 𝑚𝑖𝑛 𝑥𝑖 = 𝑥(𝑛) − 𝑥( 1 ) i af g d d · f f

DIFFERENZA/RANGE INTERQUARTILE

DI = Q 3 - Q 1 la differenza tra il 1 ° e il 3 ° quartile. VARIANZA σ 2 = 1 𝑛− 1 𝑖= 1 𝑛 ∑ (𝑥𝑖 − 𝑥) 2 VARIANZA CAMPIONARIA σ 2 = 1 𝑛− 1 𝑖= 1 𝑛 ∑ (𝑥𝑖 − 𝑥) 2 𝑛𝑖 = 𝑖= 1 𝑛 ∑ (𝑥𝑖 − 𝑥) 2 𝑓𝑖 La quantità 𝑥( 2 )è anche detta “ momento secondo campionario " SCARTO QUADRATICO MEDIO/DEVIAZIONE STANDARD σ = σ 2 = 1 𝑁 𝑖= 1 𝑛 ∑ (𝑥𝑖 − 𝑥) 2 SQM CAMPIONARIO 𝑆 = 𝑆 2 = 1 𝑛− 1 𝑖= 1 𝑛 ∑ (𝑥𝑖 − 𝑥) 2 Se ho dati aggregati in modalità Se ho i dati raccolti in classi 𝑆 2 = 𝑛 𝑛− 1 𝑖= 1 𝑛 ∑ (^) (𝑥 (^) 𝑖 − 𝑥) 2 𝑓𝑖 𝑆 2 = 1 𝑛− 1 𝑖= 1 𝑘 ∑ (^) (𝑚 (^) 𝑖 − 𝑥) 2 𝑛𝑖 COEFFICIENTE DI VARIAZIONE 𝐶𝑉 = campionario: σ | μ | 𝐶𝑉^ =^ σ | 𝑥 | DESCRIZIONE GRAFICA E NUMERICA DELLA FORMA DI UNA DISTRIBUZIONE Per popolazioni di piccole dimensioni uso la disuguaglianza di Chebyshev Per popolazioni di grandi dimensioni uso la regola empirica DISUGUAGLIANZA DI CHEBYSHEV Data una popolazione con media μ e SQM σ, per ogni valore di k > 1 , la percentuale di unità statistiche che appartengono all’intervallo (μ − 𝑘σ, μ + 𝑘σ), è almeno pari a (≥ 𝑑𝑖) 1 − 1 ( (^) 𝑘^2 )

REGOLA EMPIRICA

la percentuale di unità con valore nell'intervallo (μ − 𝑘σ, μ + 𝑘σ)è

  • circa il 68 % per k= 1
  • circa il 95 % per k= 2
  • circa il 99. 7 % per k= 3 SIMMETRIA DELLE DISTRIBUZIONI Dal punto di vista qualitativo, una distribuzione è
  • SIMMETRICA, se le osservazioni si dispongono in modo regolare intorno al centro
  • ASIMMETRICA POSITIVA, se ha una coda a destra più pronunciata 𝑚𝑜𝑑𝑎 < 𝑚𝑒𝑑 < 𝑥
  • ASIMMETRICA NEGATIVA, se ha una coda a sinistra più pronunciata 𝑚𝑜𝑑𝑎 > 𝑚𝑒𝑑 > 𝑥

=

/ (^) &

g

a

    • =

=>^ - E # · - ~ - = - -

FORZA E DIREZIONE DELLA RELAZIONE LINEARE TRA DUE VARIABILI

COVARIANZA

la direzione della relazione lineare tra le variabili (xi, yi) i valori delle unità statistiche e μ le rispettive medie. 𝑥 , μ 𝑦 σ𝑥𝑦 = 𝐶𝑜𝑣(𝑥, 𝑦) = 1 𝑁 𝑖=𝑖 𝑁 ∑ (^) (𝑥 (^) 𝑖 − μ𝑖) (𝑦 (^) 𝑖 − μ𝑖) COVARIANZA CAMPIONARIA è data da 𝑆𝑥𝑦 = (divido per n- 1 e non per n) 1 𝑛− 1 𝑖=𝑖 𝑛 ∑ (^) (𝑥 (^) 𝑖 − 𝑥) (𝑦 (^) 𝑖 − 𝑦) 1 ) Se 𝑆𝑥𝑦 > 0 ⇒Associazione positiva tra X e Y 2 ) Se 𝑆𝑥𝑦 < 0 ⇒Associazione negativa tra X e Y 3 ) Se 𝑆 no associazione tra X e Y 𝑥𝑦

FORMULA RIDOTTA PER LA VARIANZA CAMPIONARIA

𝑥 2 = 𝑛 𝑛− 1 (^ 1 𝑛 𝑖=𝑖 𝑛 ∑ 𝑥 𝑖

2 ) COEFFICIENTE DI CORRELAZIONE LINEARE

  • della popolazione: (rho) ρ𝑋𝑌 = σ𝑋𝑌 σ𝑋·σ𝑌^ =^ 𝑐𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑝𝑜𝑝𝑜𝑙𝑎𝑧𝑖𝑜𝑛𝑒 𝑆𝑄𝑀 𝑝𝑜𝑝𝑜𝑙𝑎𝑧𝑖𝑜𝑛𝑒
  • campionario: 𝑟𝑋𝑌 = 𝑆𝑋𝑌 𝑆𝑋·𝑆𝑌^ =^ 𝑐𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑐𝑎𝑚𝑝𝑖𝑜𝑛𝑎𝑟𝑖𝑎 𝑆𝑄𝑀 𝑐𝑎𝑚𝑝𝑖𝑜𝑛𝑎𝑟𝑖𝑜
  • (^) |𝑟 (^) 𝑋𝑌| < 0. 3 𝑙𝑒𝑔𝑎𝑚𝑒 𝑑𝑒𝑏𝑜𝑙𝑒
  • (^) |𝑟 (^) 𝑋𝑌| < 0. 8 𝑙𝑒𝑔𝑎𝑚𝑒 𝑓𝑜𝑟𝑡𝑒
  • 𝑟 (la nuvola di punti nel diagramma di dispersione si | (^) 𝑋𝑌|

concentra intorno ad una retta) DATI BIVARIATI AGGREGATI Se ho dati raggruppati:

  • k modalità di X con frequenze assolute ui^ x^ i = 1 , 2 , …, k
  • h modalità di Y con frequenze uj^ y^ i = 1 , 2 , …, h FREQUENZE MARGINALI di X 𝑢𝑖 (sommo lungo la linea i-esima) 𝑥 = 𝑦= 1 ℎ ∑ 𝑢𝑖𝑗 es 𝑢𝑖 𝑥 = 𝑦= 1 3 ∑ 𝑢𝑖𝑗 = 𝑢 11 + 𝑢 12 + 𝑢 13 = 0 + 2 + 1 = 3 𝑢𝑖 𝑦 = 𝑦= 1 2 ∑ 𝑢𝑖𝑗 = 𝑢 11 + 𝑢 12 = 0 + 1 = 1 Ho dunque le due distribuzioni marginali, da cui posso determinare i valori di sintesi marginali:

·g

-^ -

-^ - & a D (^) -

--

  • (^) - -

i

𝑖= 1 𝑘 ∑ 𝑥 𝑖

𝑖 𝑥 𝑦 = (^1) 𝑢 𝑗= 1 ℎ ∑ 𝑦 𝑗

𝑗 𝑦 𝑆𝑥 2 = 1 𝑛− 1 𝑖= 1 𝑘 ∑ (𝑥 𝑖

2 𝑛 𝑖 𝑥 𝑆𝑦 2 = 1 𝑛− 1 𝑗= 1 ℎ ∑ (𝑦 𝑖

2 𝑛 𝑗 𝑥 𝑆 𝑥𝑦

1 𝑛− 1 ( 𝑖= 1 𝑘 ∑ 𝑗= 1 ℎ ∑ 𝑥 𝑖

𝑖

𝑖𝑗

RELAZIONI LINEARI

Dato campione bivariato su (X,Y) vogliamo approssimare la relazione tra X e Y con una retta. 𝑦 = β 0 + β 1 𝑥 β 0 , β 1 Є𝑅 devo scegliere tra infinite rette possibili. Il criterio di scelta è detto dei MINIMI QUADRATI (RESIDUI) 𝑦 = 𝑏 è la candidata, per dati valori di 0

1

0

1 𝑦 è il valore che la retta attribuisce ad Y se X = x ERRORE o RESIDUO 𝑒 𝑖

𝑖

𝑖

𝑖

0

1

𝑖 associato alla previsione che la retta candidata fornisce dato xi vorremmo minimizzare la somma dei residui (gli errori di previsione) ma (analogamente a quanto visto per la media campionaria) dovremmo neutralizzare i segni delle ei Dunque prendo i quadrati dei residui : 𝑖= 1 𝑛 ∑ 𝑒𝑖 2 = 𝑖= 1 𝑛 ∑ (𝑦𝑖 − 𝑏 0 − 𝑏 1 𝑥𝑖) 2 e minimizzo questa quantità RETTA DI REGRESSIONE LINEARE La retta di regressione lineare 𝑦 = 𝑏 0 + 𝑏 1 𝑥ottenuta col metodo dei minimi quadrati residui 𝑏 1

𝑆𝑥𝑦 𝑆𝑥^2

0

1

  • b 0 dà l’ordinata all’origine (x= 0 )
  • b 1 è variazione attesa per Y se X varia di una unità 𝑏 1

𝑆𝑋𝑌 𝑆𝑋^2 𝑏 0 = 𝑦 − 𝑏 1 𝑥 Posso usare la retta a fini di previsione/estrapolazione (es. che Y mi aspetto per X = 12 )

  • & - - T -

&

  • & I

olo &

N

al #^ &

& m (^) =-^5

ASSIOMI PROBABILITÀ

Sia S lo spazio campionario composto dagli elementi elementari Oi, si definisce probabilità una funzione con argomento 𝐴 ⊂ 𝑆, indicata con P(A) che soddisfa 3 assiomi : A. 1 ) 0 ≤ 𝑃(𝐴) ≤ 1 la probabilità è sempre compresa tra 0 e 1 A. 2 ) 𝑃(𝐴) = 𝑃( la probabilità di un evento è data dalla somma delle 𝑖:𝑂𝑖∈𝐴

𝑖:𝑂𝑖∈𝐴

probabilità degli eventi che lo compongono A. 3 ) 𝑃(𝑆) = 1 la probabilità dell’evento certo è 1 Sia 𝑆 = 𝑂 formato da eventi elementari ugualmente possibili, sia con 1

{ (^) 𝑛}

cardinalità NA, allora 𝑃(𝑂 e 𝑖

1 𝑁 ∀𝑖^ =^1 ,...,^ 𝑁^ 𝑃(𝐴)^ =^ 𝑁𝐴 𝑁 Per S qualsiasi, siano E 1 , …, Ek eventi collettivamente esaustivi. Allora 𝑃( 𝑖= 1 𝑘 ⋃ 𝐸𝑖) = 1 PROPRIETA’ UNIONE E INTERSEZIONE 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵) PROBABILITÀ CONDIZIONATA 𝑃(𝐴|𝐵) = 𝑃(𝐴∩𝐵) 𝑃(𝐵) => 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵|𝐴) = 𝑃(𝐵)𝑃(𝐴|𝐵) EVENTI INDIPENDENTI

  • 𝑃(𝐴|𝐵) = 𝑃(𝐴)
  • 𝑃(𝐵|𝐴) = 𝑃(𝐵)
  • 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵) GLI EVENTI INCOMPATIBILI NON SONO MAI INDIPENDENTI Se A e B sono indipendenti, lo sono anche AC^ e B, A e BC, AC^ e BC In generale, k eventi A 1 , A 2 , Ak, si dicono MUTUAMENTE INDIPENDENTI se P(A 1 ∩ A 2 ∩ Ak) = P(A 1 )P(A 2 ) ·… ·P (Ak) cioè𝑃( 𝑖= 1 𝑘 ⋂ 𝐴𝑖) = 𝑖= 1 𝑘 ∏ 𝑃(𝐴𝑖) PROBABILITÀ CONGIUNTE Estendiamo l’analisi al caso bivariato (l’estrazione ha due misurazioni, es età e reddito) Consideriamo due partizioni di S TEOREMA DELLE PROBABILITÀ TOTALI Data una partizione A 1 ,..., Ak di S tale che P(Ai)> 0 per ogni 1 = 1 ,...,k e dato un evento 𝐵 ⊂ 𝑆 qualsiasi si ha 𝑃(𝐵) = 𝑖= 1 𝑘 ∑ 𝑃(𝐴 𝑖

𝑖

  • --

--^ - o - & g a - d &

&

--

D -

& &

TEOREMA DI BAYES

(versione semplificata con 𝐴 ) 1

{ 2 }

𝑐 { } 𝑃(𝐴|𝐵) = 𝑃(𝐴)𝑃(𝐵|𝐴) 𝑃(𝐵) TEOREMA DI BAYES - VERSIONE GENERALE Sia A 1 ,...,Ak una partizione di S. Dato B 𝑃(𝐴 𝑖

𝑃(𝐴𝑖)𝑃(𝐵|𝐴𝑖) ℎ= 1 𝑘 ∑ 𝑃(𝐴ℎ)𝑃(𝐵|𝐴ℎ)

  • B è l’evento osservato
  • P(Ai|B) è la probabilità che sia stato lo “stato di natura” Ai a determinare B VARIABILI ALEATORIE DISCRETE Una V.A. si dice DISCRETA se può assumere un numero finito o al più numerabile di valori, altrimenti si dice CONTINUA. Dato un esperimento con spazio campionario S, si definisce VARIABILE ALEATORIA (viAi) una funzione X che associa ad eventi di S un numero reale , indicato con x. FUNZIONE DI PROBABILITÀ 𝑝(𝑥) = 𝑃(𝑋 = 𝑥) Chiamiamo DISTRIBUZIONE DI PROBABILITÀ di X la collezione dei valori che X può assumere le probabilità ad essi associate. L’insieme dei punti x 1 , x 2 , … di cardinalità al più numerabile tali che p(xi)> 0 è detto SUPPORTO della distribuzione, e p(xi) è detta a volte MASSA di probabilità. Se ci interessa un insieme 𝐴 ⊂ 𝑅, la probabilità associata è data sommando quella dei punti del supporto che appartengono ad A: 𝑃(𝐴) = 𝑖:𝑥𝑖∈𝐴

𝑖

FUNZIONE DI RIPARTIZIONE

Si definisce f.d.r. di X la funzione 𝐹: 𝑅→ [ 0 , 1 ]tale che per ogni x є R esprime la probabilità che X non superi il valore x , cioè 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) Nel caso di una v.a. discreta avremo 𝐹(𝑥) = 𝑖:𝑥𝑖≤𝑥

la f.d.r. F(x) e la funzione di probabilità p(x) forniscono le stesse informazioni sulla distribuzione di X, cioè da una posso ricavare l’altra e viceversa. 𝑃(𝑋 ∈ (𝑎, 𝑏]) = 𝑖:𝑥𝑖∈(𝑎,𝑏]

VALORE ATTESO

𝑖= 1 𝑘 ∑ 𝑥 𝑖

𝑖

d VI d

= (^) -

!

DISTRIBUZIONE DI BERNOULLI

PROVE BERNOULLIANE: esperimento che consiste in n prove dall'esito successo/insuccesso ripetute in maniera indipendente e con uguale probabilità di success o Una v.a. x ha distr. di Bernoulli di parametro 0 ≤ 𝑝 ≤ 1 (probabilità di successo), in base x~Bernoulli (p), se 𝑃(𝑋 = 𝑥) = 𝑝 𝑥 ( 1 − 𝑝) 1 −𝑥 , 𝑥 = 0 , 1 𝐸(𝑋) = 1 𝑝 𝑉𝑎𝑟(𝑋)^ =^ 1 −𝑝 𝑝^2 𝑃(𝑋 ≤ 𝑥) = 1 − ( 1 − 𝑝) 𝑥 , 𝑥 = 1 , 2 ,... DISTRIBUZIONE BINOMIALE (ESTRAZIONE CON REIMMISSIONE) Una v.a. X ha distribuzione binomiale di parametri 𝑛 ≥ 1 (n di prove) e 0 ≤ 𝑝 ≤ 1 𝑋~𝑏𝑖𝑛𝑜𝑚(𝑛, 𝑝) se ha distribuzione 𝑃(𝑋 = 𝑥) = 𝐶𝑥 𝑛 𝑝 𝑥 ( 1 − 𝑝) 𝑛−𝑥 , 𝑥 = 0 , 1 ,..., 𝑛 La distribuzione di Bernoulli è il caso particolare n= 1 𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖(𝑝) = 𝑏𝑖𝑛𝑜𝑚(𝑛 = 1 , 𝑝) 𝐸(𝑋) = 𝑛𝑝 𝑉𝑎𝑟(𝑋) = 𝑛𝑝( 1 − 𝑝) DISTRIBUZIONE IPERGEOMETRICA (ESTRAZIONE SENZA REIMMISSIONE) Una v.a. X ha distribuzione ipergeometrica di parametri 𝑁, 𝑆, 𝑛(𝑆 ≤ 𝑁, 𝑛 ≤ 𝑁), 𝑋~𝐼𝑝𝑒𝑟𝑔𝑒𝑜𝑚(𝑁, 𝑆, 𝑛) S → n di elementi da estrarre che equivalgono a successo N → n di elementi tra cui scegliere n → n di estrazioni 𝐸(𝑋) = 𝑛 𝑆 𝑁 𝑉𝑎𝑟(𝑋) = 𝑛 𝑆 𝑁 (^1 −^ 𝑆 𝑁 )^ 𝑁−𝑛 𝑁− 1 →^ 𝑓𝑎𝑡𝑡𝑜𝑟𝑒^ 𝑐𝑜𝑟𝑟𝑒𝑡𝑡𝑖𝑣𝑜^ ≤^1 DISTRIBUZIONE GEOMETRICA Consideriamo una successione potenzialmente infinita di prove bernoulliane (indipendenza e uguale probabilità di successo tra le prove) Sia X=n di prove necessarie per osservare il primo successo Una v.a. X ha distribuzione geometrica di parametro 0 ≤ 𝑝 ≤ 1 (𝑝𝑟𝑜𝑏 𝑑𝑖 𝑠𝑢𝑐𝑐𝑒𝑠𝑠𝑜), 𝑋~𝑔𝑒𝑜𝑚(𝑃), se 𝑃(𝑋 = 𝑥) = ( 1 − 𝑝) 𝑥− 1 𝑝, 𝑥 = 1 , 2 ,... 1 − 𝑝 1 − 𝑝 2 −... − 𝑝𝑥 = ( 1 − 𝑝) 𝑥 1 − 𝑃(𝑋 ≤ 𝑥) = ( 1 − 𝑝) 𝑥 funzione di ripartizione di 𝑋~𝑔𝑒𝑜𝑚(𝑝) 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = 1 − ( 1 − 𝑝) 𝑥 𝑝↓ ⇒ 𝐸(𝑥)↑ 𝐸(𝑋) = 1 𝑝 𝑉𝑎𝑟(𝑋)^ =^ 1 −𝑝 𝑝^2

~ (^) & - -D & - ·

2

↑ (^) ↑

  • -^ fampione^ vincente)

-Campions

-^ -

&-

DISTRIBUZIONE DI POISSON (INTERVALLO DI TEMPO)

𝑋~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(λ) parametro λ > 0 → TASSO → numero medio di eventi 𝑃(𝑋 = 𝑥) = 𝑒−λλ𝑥 𝑥! 𝑥^ =^0 ,^1 ,^2 ,... 𝐸(𝑋) = λ 𝑉𝑎𝑟(𝑥) = λ DISTRIBUZIONE CONGIUNTA DI VARIABILI ALEATORIE DISCRETE Per studiare la relazione tra due variabili aleatorie è necessario costruire un modello probabilistico che descriva la realizzazione congiunta di queste variabili. PROBABILITÀ CONGIUNTA (𝑥, 𝑦) → 𝑃(𝑋 = 𝑥, 𝑌 = 𝑦) = 𝑃( {𝑋 = 𝑥} ∩ {𝑌 = 𝑦}) INDIPENDENZA DI V.A. DISCRETE Due eventi A e B sono indipendenti quando 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵) In maniera analoga, definiamo due v.a. discrete X e Y indipendenti quando 𝑃(𝑋 = 𝑥, 𝑌 = 𝑦) = 𝑃(𝑋 = 𝑥)𝑃(𝑌 = 𝑦) prob congiunta prodotto prob marginali 𝑃 ({ 𝑋 = 𝑥} ∪ {𝑌 = 𝑦}) = 𝑃( {𝑋 = 𝑥})𝑃( {𝑌 = 𝑦}) dalla definizione di probabilità condizionata 𝑃(𝑌 = 𝑦|𝑋 = 𝑥) = 𝑃(𝑋=𝑥,𝑌=𝑦) 𝑃(𝑋=𝑥) =^ 𝑃(𝑌^ =^ 𝑦)

  • relazione positiva tra X e Y, 𝐸(𝑋 − μ𝑥)(𝑌 − μ𝑦) > 0
  • relazione negativa 𝐸(𝑋 − μ𝑥)(𝑌 − μ𝑦) < 0 𝑉𝑎𝑟(𝑥) = 𝐸(𝑥 2 ) − [𝐸 (𝑥)] 2 = 𝐸(𝑥 2 ) − μ 2 COVARIANZA 𝐶𝑜𝑣(𝑋, 𝑌) = 𝐸(𝑋 − μ𝑥)(𝑌 − μ𝑦) Essa misura il grado di relazione lineare tra X e Y , cioè misura quale sia in media il rapporto di proporzionalità tra le due variabili. 𝐶𝑜𝑣(𝑋, 𝑌) = 𝐸(𝑋𝑌) − 𝐸(𝑋)𝐸(𝑌) dove 𝐸(𝑋𝑌) = 𝑥

𝑦

COVARIANZA DI EVENTI INDIPENDENTI

Se X e Y sono indipendenti , la covarianza è nulla. 𝐸(𝑋𝑌) = 𝐸(𝑋)𝐸(𝑌) 𝐶𝑜𝑣(𝑋, 𝑌) = 𝐸(𝑋𝑌) − 𝐸(𝑋)𝐸(𝑌) = 0 Tuttavia, Cov(X,Y)= 0 non implica che X e Y siano indipendenti. In generale, per 𝑐 ≠ 𝑜 𝐶𝑜𝑣(𝑋, 𝑐𝑌) = 𝑐 𝐶𝑜𝑣(𝑋, 𝑌) ≠ 𝐶𝑜𝑣(𝑋, 𝑌)

  • d & - - & - avvog (^) - -

g

g

F-

N & - -

Per definizione della funzione di ripartizione 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = 𝑃(− ∞ ≤ 𝑋 ≤ 𝑥) = −∞ 𝑥 ∫ 𝑓(𝑢)𝑑𝑢 cioè F(x) è la PRIMITIVA di f(x) Di conseguenza f(x) è la derivata di F(x) 𝑓(𝑥) = 𝐹'(𝑥) ESEMPIO (distanza dal centro) L’inclusione o meno è irrilevante, cioè 𝑃(𝑎 < 𝑋 < 𝑏) = 𝑃(𝑎 < 𝑋 ≤ 𝑏) = 𝑃(𝑎 ≤ 𝑋 < 𝑏) = 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) dato che 𝑃(𝑋 = 𝑥) = 0 per ogni x nel caso di v.a. continue

o

--

Pur non essendo F(x) una probabilità, essa è proporzionale alla probabilità che X assuma valori vicini a x, cioè 𝑃(𝑥 < 𝑋 ≤ 𝑥 + ℎ) = 𝑥 𝑥+ℎ ∫ 𝑓(𝑢)𝑑𝑢 ≈ ℎ𝑓(𝑥) quindi maggiore f(x), maggiore la probabilità che X assuma valori vicini a x. ESEMPIO (distanza dal centro) 𝑓(𝑥 1 ) < 𝑓(𝑥 2 ) ⇒ x 2 è più probabile di x 1 , nel senso che è maggiore la probabilità che la distanza dal centro sia attorno a x 2 piuttosto che a x 1 Sia X una v.a. continua con funzione di densità f(x) 𝐸(𝑋) = → baricentro della distribuzione , cioè il punto dell'asse orizzontale che −∞ +∞ ∫ 𝑥𝑓(𝑥)𝑑(𝑥) mantiene in equilibrio l'area sottesa al grafico (caso discreto: 𝐸(𝑋) = 𝑥 1 𝑝(𝑥 1 ) + 𝑥 2 𝑝(𝑥 2 ) = ) 𝑖= 1 ∞ ∑ 𝑥𝑖𝑝(𝑥𝑖) ESEMPIO (distanza dal centro)

al -^ -^ - & &

la densità è costante e uguale all’inverso dell’ampiezza dell’intervallo delle possibili realizzazioni di X. Di seguito indichiamo con a la realizzazione minima ( 0 nell’esempio) e con b la realizzazione massima ( 2 nell’esempio). DISTRIBUZIONE UNIFORME Una v.a. X ha distribuzione uniforme sull’intervallo (a,b), a < b, 𝑋~𝑈𝑛𝑖𝑓(𝑎, 𝑏) se ha funzione di densità generalizzando la formula ricavata nell’esempio precedente abbiamo E

  • & I

-- (

-- DERIVO : A

In generale 𝑋~𝑈𝑛𝑖𝑡(𝑎, 𝑏)ha valore atteso 𝐸(𝑋) = 𝑎+𝑏 2 DISTRIBUZIONE ESPONENZIALE Questa distribuzione si adatta a tempi di attesa che non hanno un limite superiore Sia N il numero di eventi che si verificano in un intervallo di tempo di ampiezza unitaria. Supponendo che le condizioni della distribuzione di Poisson siano verificate, allora 𝑁~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(λ) Con funzione di probabilità 𝑃(𝑁 = 𝑛) = 𝑒−λλ𝑛 𝑛! ,^ 𝑛^ =^0 ,^1 ,... Segue che il numero di eventi in un intervallo di ampiezza T indicato da 𝑁, avrà anch’esso 1 distribuzione di Poisson. 𝑁𝑡~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(λ𝑡) 𝑃(𝑁𝑡 = 𝑛) = 𝑒−λ𝑡(λ𝑡)𝑛 𝑛! 𝑛^ =^0 ,^1 ,... λ ↑⇒ 𝐸(𝑋) ↓ 𝐸(𝑋) = 1 λ 𝑉𝑎𝑟(𝑋)^ =^ 1 λ^2 𝑃(𝑋 > 𝑥 + 𝑠|𝑋 > 𝑠) = 𝑃(𝑋 > 𝑥) La probabilità che una telefonata duri ulteriori x minuti sapendo che è già durata s minuti è uguale alla probabilità che la telefonata duri più di x minuti, proprietà detta di “ perdita di memoria” LEGAME TRA DISTRIBUZIONE ESPONENZIALE (tempo di attesa) E DISTRIBUZIONE DI POISSON (n eventi in un intervallo di tempo) Sia Nt Il numero di eventi che si verificano in un intervallo di tempo di ampiezza t, ad esempio ( 0 ,t), e sia X il tempo di attesa tra due eventi successivi Se 𝑁 con tasso unitario, allora 𝑡 ~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(λ𝑡) λ 𝑋~𝐸𝑥𝑝(λ) 𝐸(𝑋) = 1 λ =^ 1 𝐸(𝑁 1 ) → 𝑛 𝑒𝑣𝑒𝑛𝑡𝑖 𝑖𝑛 ( 0 , 1 ) Maggiore il numero medio di eventi che si verificano nell'intervallo ( 0 , 1 ), minore il tempo di attesa medio del primo evento. DISTRIBUZIONE NORMALE Si adatta a variabili i cui valori attorno alla media sono più probabili di valori via via più lontani. La funzione di densità ha cioè un' unica moda (valore massimo) in corrispondenza del valore atteso ed cresce in maniera simmetrica mano a mano che ci allontaniamo dal valore atteso. 𝑓(μ − 𝑥) = 𝑓(μ + 𝑥) distribuzione simmetrica rispetto aμ Una v.a. ha distribuzione normale di “media” μ e “varianza” σ , 2 > 0 𝑋~𝑁(μ, σ se ha funzione di densità 2 ) 𝐹(𝑥) = 1 2 Πσ^2

− (^21) σ 2 (𝑥−μ)^2

1 2 Πσ^2

1 2 σ^2 (𝑥 − μ) 2 { }

  • -^ & & af Po

A

  • &
  • (^) & -

&

  • ↑^ &
    • ↑ (^) & ↑ X

APPROSSIMAZIONE NORMALE DELLA DISTRIBUZIONE BINOMIALE

Sia 𝑋∼𝑏𝑖𝑛𝑜𝑚(𝑛, 𝑝) 𝑃(𝑋 = 𝑥) = 𝐶 𝑥 𝑛 𝑝 𝑥 ( 1 − 𝑝) 𝑛−𝑥 𝑥 = 0 , 1 ,..., 𝑛 𝐸(𝑋) = 𝑛𝑝 𝑉𝑎𝑟(𝑋) = 𝑛𝑝( 1 − 𝑝) Quando n è grande il calcolo di P(X=x) è difficile perché coinvolge fattoriali di interi molto grandi CAMPIONAMENTO E DISTRIBUZIONI CAMPIONARIE Supponiamo di essere interessati a studiare la distribuzione di una variabile (consumo di carburante) relativa a una determinata popolazione (modello di auto). Utilizziamo un CAMPIONE, cioè un sottoinsieme estratto dalla popolazione. Consideriamo il campionamento aleatorio : le unità vengono estratte con uguale probabilità dalla popolazione (senza reimmissione). 𝐸(𝑋) = μ LA MEDIA (VALORE ATTESO) DELLA MEDIA CAMPIONARIA E’ UGUALE ALLA MEDIA DELLA POPOLAZIONE 𝐸𝑠𝑡𝑟𝑎𝑧𝑖𝑜𝑛𝑒 𝑠𝑒𝑛𝑧𝑎 𝑟𝑒𝑖𝑚𝑚𝑖𝑠𝑠𝑖𝑜𝑛𝑒 ≃ 𝐸𝑠𝑡𝑟𝑎𝑧𝑖𝑜𝑛𝑒 𝑐𝑜𝑛 𝑟𝑒𝑖𝑚𝑚𝑖𝑠𝑠𝑖𝑜𝑛𝑒 𝑋 1 ,..., 𝑋𝑛~ iid = indipendenti e identicamente distribuite 𝑖𝑖𝑑 𝐹(𝑥) 𝑉𝑎𝑟(𝑋) = σ^2 𝑛 𝑛 ↑⇒ 𝑉𝑎𝑟(𝑋) ↓ TEOREMA DEL LIMITE CENTRALE A prescindere dalla distribuzione della popolazione, la media campionaria è approssimativamente distribuita come una normale di media μ (media popolazione) e varianza purché l’ampiezza n σ^2 𝑛 del campione sia sufficientemente grande 𝑛 ≥ 30. Sia 𝑋 1 ,..., 𝑋𝑛~ media e varianza 𝑖𝑖𝑑 𝐹(𝑥) μ σ 2 𝑛 ∞ lim → (𝑋𝑛−μ) σ/ 𝑛 = ϕ(𝑧) = 𝑃 (𝑍 ≤ 𝑧) dove 𝑧𝑛 = 𝑋𝑛−μ σ/ 𝑛 quindi 𝑃(𝑧 𝑛

La distribuzione di zn è approssimata dalla distribuzione normale standard 𝑃(𝑋 𝑛

𝑛 ≤ 𝑥−μ σ/ 𝑛 ) ≃ Φ( 𝑥−μ σ/ 𝑛

𝑋𝑛 è approssimativamente distribuita come normale di media μ e varianza σ^2 𝑛 in maniera analoga 𝑋 1 +... + 𝑋𝑛 ≈ 𝑁(𝑛μ, 𝑛σ 2 ) PROPORZIONE CAMPIONARIA Siamo interessati al possesso o meno da parte degli individui di una popolazione di una determinata caratteristica. Sia p, 0 Per fare INFERENZA (trarre conclusioni su F(x) da ciò che abbiamo osservato nel campione) su p, estraiamo un campione dalla popolazione e, per ogni individuo, prendiamo nota se possiede o meno tale caratteristica. 𝑝 = 𝑝𝑟𝑜𝑝𝑜𝑟𝑧𝑖𝑜𝑛𝑒 𝑛𝑒𝑙 𝑐𝑎𝑚𝑝𝑖𝑜𝑛𝑒 𝑑𝑖 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑖 𝑐ℎ𝑒 𝑝𝑜𝑠𝑠𝑖𝑒𝑑𝑜𝑛𝑜 𝑡𝑎𝑙𝑒 𝑐𝑎𝑟𝑎𝑡𝑡𝑒𝑟𝑖𝑠𝑡𝑖𝑐𝑎 𝑝 (proporzione campionaria) la utilizzeremo per fare inferenza su p, proporzione della popolazione Deriviamo il campione come 𝑋 1 ,..., 𝑋𝑛 ∼ 𝑖𝑖𝑑 𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖(𝑝) cioè per l’i-esimo individuo del campione osserviamo 𝑥 1 +... + 𝑥𝑛 = 𝑛 𝑑𝑖 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑖 𝑛𝑒𝑙 𝑐𝑎𝑚𝑝𝑖𝑜𝑛𝑒 𝑐𝑜𝑛 𝑙𝑎 𝑐𝑎𝑟𝑎𝑡𝑡𝑒𝑟𝑖𝑠𝑡𝑖𝑐𝑎 𝑝 = 1 𝑛 (𝑥^1 +...^ +^ 𝑥𝑛) cioè la proporzione campionaria interpretata come media campionaria relativa a una popolazione “Bernoulliana”. Consideriamo 𝑝come realizzazione di una v.a. 𝑃 proporzione campionaria 𝐸(𝑝) = 𝑝 𝑉𝑎𝑟(𝑝) = 𝑝( 1 −𝑝) 𝑛 utilizzeremo il teorema del limite centrale a patto che l’ampiezza campionaria sia sufficientemente grande 𝑛 ≥ 30 e𝑛𝑝( 1 − 𝑝) > 𝑞 standardizzazione della proporzione campionaria 𝑧𝑛(𝑃 ≤ 𝑝) = 𝑃(𝑧𝑛 ≤ 𝑝−𝑝 𝑝( 1 −𝑝)/𝑛 ≈ ϕ 𝑝−𝑝 ( (^) 𝑝( 1 −𝑝)/𝑛) DISTRIBUZIONE DELLA VARIANZA CAMPIONARIA Si consideri un campione aleatorio estratto da una popolazione di media μ e varianzaσ 2 𝑋 1 ,..., 𝑋𝑛~ 𝑖𝑖𝑑 𝐹(𝑥) Se indichiamo 𝑋 la varianza della popolazione 𝑛

𝑉𝑎𝑟(𝑋) = σ 2 = 𝐸( (𝑋 − μ) 2 ) se estraiamo un campione, allora questa formula suggerisce di stimare σ attraverso la media 2 aritmetica di (^) (𝑋 (^) 𝑖 − μ) cioè 2 , 𝑖 = 1 ,..., 𝑛 1 𝑛 (^ (𝑋^1 −^ μ) 2

  • 𝑋 2 ( −^ μ) 2 +... + 𝑋 𝑛 ( −^ μ) 2 ) Dato che in generale μ non è nota, sostituisco a μla media campionaria 1 𝑛 (^ (𝑋^1 −^ 𝑋) 2
  • 𝑋 2 ( −^ 𝑋) 2 +... + 𝑋 𝑛 ( −^ 𝑋) 2 ) nella pratica non dividiamo per n, ma per n- 1 Consideriamo cioè la v.a., con distribuzione che dipende da F(x) VARIANZA CAMPIONARIA: 𝑆 2 = 1 𝑛− 1 (𝑋^1 −^ 𝑋) 2 +... + (^) (𝑋 (^) 𝑛 − 𝑋) 2 =