Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Dispensa Statistica Applicata, Dispense di Statistica Applicata

Il file contiene la dispensa del corso di Statistica Applicata. Al suo interno sono presenti gli appunti delle lezioni del corso (riordinati e completi) e sia le eventuali integrazioni con il libro e le slide del corso. Sono inoltre inseriti gli schemi e gli esempi riportati a lezione e note sui temi più importanti ai fini dell'esame.

Tipologia: Dispense

2018/2019

In vendita dal 15/05/2024

.Edoardo.
.Edoardo. 🇮🇹

63 documenti

1 / 26

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Statistica Applicata
SLIDE 01: Introduzione
AREE della statistica:
Statistica Descrittiva: è quella che mira a fare delle sintesi, quello che viene fatto è prendere un
insieme di soggetti ed eettuare una sintesi (e solo quella) della loro altezza: media, moda,
mediana, primo/secondo quartile."
––> SE osservo TUTTA la popolazione = Statistica Descrittiva. "
Esempi: clinica Mangiagalli (mamme che partoriscono da sole); censimenti ISTAT. #
Statistica Probabilistica: studio del meccanismo generatore delle realizzazioni campionarie. "
Vuol dire che noi estraiamo un campione di 10 soggetti, vogliamo capire da un punto di vista
probabilistico come questi 10 soggetti siano stati generati. !
Capire come dato un certo modello, si arriva ad un campione. "
QUI: > Modello ––> Campione #
Statistica Inferenziale: fare inferenza significa cercare di capire un problema generale sulla
base di poco elementi. "
Sulla base di un campione di soggetti si cerca quindi di capire come si comporta un certo
carattere in una data popolazione. "
Come si distribuisce il reddito delle famiglie italiane (= campione obiettivo). !
Un modo è intervistare famiglia per famiglia MA non si può perchè troppo dispendioso di tempo. !
Quello che invece si può (e conviene) fare è prendere un campione di famiglie italiane e su
questo campione studiare le caratteristiche del reddito per cercare poi di capire come si
distribuisce il reddito nell’intera popolazione italiana. !
QUI: > Campione ––> Modello"
Prendere un campione significa prendere un sottogruppo della popolazione che mi permette
di trarre conclusioni, facendo stime, su TUTTA la popolazione. #
Le motivazioni per le quali la Statistica Inferenziale è importante rispetto alla Statistica Descrittiva
sono ( cioè i motivi per i quali non si hanno a disposizione i dati sono):
1. Tempi e costi:
Il censimento si fa ogni 10 anni per ovvi motivi di costo.
Auditel: i dati mi servono subito, non posso considerare un campione troppo ampio.
2. Popolazione infinita o virtuale: "
Esempio: verificare la tossicità di un nuovo farmaco rispetto alla gravità della malattia. #
3. La rilevazione distrugge le unità statistiche: "
Esempio: misurare il grado di friabilità del biscotto (devo rompere e mangiare il biscotto);!
verificare il quantitativo di una cerca sostanza in una pastiglia (la pastiglia dev’essere spezzata
e analizzata). Non posso ovviamente rompere tutti i biscotti o spezzare tutte le pastiglie. #
4. Precisione dei risultati: "
si è dimostrato che le rilevazioni campionarie (incomplete) portano a risultati più precisi di
quelle complete (censimento). Esempio: elezioni in America, più precise con campione ridotto.#
Le indagini campionarie si basano quindi sull’analisi di un campione di riferimento. Bisogna ora
rispondere a: #
a) Il campione va scelto con qualche criterio? SI"
Il campione deve essere Rappresentativo (“come estrarlo?”)!
deve cioè essere un campione CASUALE (o probabilistico). "
Un campione è casuale se, nessuna unità statistica è esclusa a priori dalla procedura di
selezione (cioè se PDI ESTRAZIONE >0 Tutte le unità estratte devono avere probabilità non nulla
di entrare a far parte del campione). Per poterlo fare, dovremo avere una lista della popolazione. !
Con un campione casuale è inoltre possibile quantificare l’errore che si compie nella stima del
parametro di interesse.#
b) Si possono utilizzare gli strumenti della statistica descrittiva per analizzare i dati? NO"
Perchè la Statistica Descrittiva serve solo a fare una sintesi dopo che abbiamo estratto TUTTI
gli elementi da una popolazione. Noi, utilizzando solo un campione, e non l’intera popolazione,
non potremo utilizzarla.#
di 1 26
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a

Anteprima parziale del testo

Scarica Dispensa Statistica Applicata e più Dispense in PDF di Statistica Applicata solo su Docsity!

Statistica Applicata SLIDE 01: Introduzione AREE della statistica: Statistica Descrittiva: è quella che mira a fare delle sintesi, quello che viene fatto è prendere un insieme di soggetti ed effettuare una sintesi (e solo quella) della loro altezza: media, moda, mediana, primo/secondo quartile. ––> SE osservo TUTTA la popolazione = Statistica Descrittiva. Esempi: clinica Mangiagalli (mamme che partoriscono da sole); censimenti ISTAT. Statistica Probabilistica: studio del meccanismo generatore delle realizzazioni campionarie. Vuol dire che noi estraiamo un campione di 10 soggetti, vogliamo capire da un punto di vista probabilistico come questi 10 soggetti siano stati generati. Capire come dato un certo modello, si arriva ad un campione. QUI: > Modello ––> Campione Statistica Inferenziale: fare inferenza significa cercare di capire un problema generale sulla base di poco elementi. Sulla base di un campione di soggetti si cerca quindi di capire come si comporta un certo carattere in una data popolazione. Come si distribuisce il reddito delle famiglie italiane (= campione obiettivo). Un modo è intervistare famiglia per famiglia MA non si può perchè troppo dispendioso di tempo. Quello che invece si può (e conviene) fare è prendere un campione di famiglie italiane e su questo campione studiare le caratteristiche del reddito per cercare poi di capire come si distribuisce il reddito nell’intera popolazione italiana. QUI: > Campione ––> Modello Prendere un campione significa prendere un sottogruppo della popolazione che mi permette di trarre conclusioni, facendo stime, su TUTTA la popolazione. Le motivazioni per le quali la Statistica Inferenziale è importante rispetto alla Statistica Descrittiva sono ( cioè i motivi per i quali non si hanno a disposizione i dati sono):

1. Tempi e costi: - Il censimento si fa ogni 10 anni per ovvi motivi di costo. - Auditel: i dati mi servono subito, non posso considerare un campione troppo ampio. 2. Popolazione infinita o virtuale: Esempio: verificare la tossicità di un nuovo farmaco rispetto alla gravità della malattia. 3. La rilevazione distrugge le unità statistiche: Esempio: misurare il grado di friabilità del biscotto (devo rompere e mangiare il biscotto); verificare il quantitativo di una cerca sostanza in una pastiglia (la pastiglia dev’essere spezzata e analizzata). Non posso ovviamente rompere tutti i biscotti o spezzare tutte le pastiglie. 4. Precisione dei risultati: si è dimostrato che le rilevazioni campionarie (incomplete) portano a risultati più precisi di quelle complete (censimento). Esempio: elezioni in America, più precise con campione ridotto. Le indagini campionarie si basano quindi sull’analisi di un campione di riferimento. Bisogna ora rispondere a:

a) Il campione va scelto con qualche criterio? SI

Il campione deve essere Rappresentativo (“come estrarlo?”) deve cioè essere un campione CASUALE (o probabilistico). Un campione è casuale se, nessuna unità statistica è esclusa a priori dalla procedura di selezione (cioè se PDI ESTRAZIONE >0 Tutte le unità estratte devono avere probabilità non nulla di entrare a far parte del campione). Per poterlo fare, dovremo avere una lista della popolazione. Con un campione casuale è inoltre possibile quantificare l’errore che si compie nella stima del parametro di interesse.

b) Si possono utilizzare gli strumenti della statistica descrittiva per analizzare i dati? NO

Perchè la Statistica Descrittiva serve solo a fare una sintesi dopo che abbiamo estratto TUTTI gli elementi da una popolazione. Noi, utilizzando solo un campione, e non l’intera popolazione, non potremo utilizzarla.

Campionamento NON Casuale: Un campione è NON CASUALE se, la scelta del campione prescinde dai criteri della casualità, quindi le unità sono ottenute in base a scelte prese ex ante. Non si può utilizzare perchè è NON RAPPRESENTATIVO Tra i piani di campionamento NON CASUALE , il più noto è il:

- (^) Campionamento per quote: consiste nel suddividere la popolazione (in analisi) in gruppi sulla base di alcune variabili caratteristiche come l’età, il sesso, la professione. Sono io (analista) che scelgo le persone in un determinato modo. Un esempio sono le statistiche sui sondaggi elettorali: si prende un campione scelto tra quelli della stessa ideologia politica. Alle volte il problema maggiore del campionamento è proprio questo: fare un campionamento per quote e ciò può far sballare il risultato. Campionamento Casuale Semplice (C.C.S): Può essere effettuato: - (^) da variabile casuale: si ipotizza che sul carattere di interesse segua una determinata distribuzione. Ad esempio, una normale. Assumo che il mio dato sia assunto su una variabile normale. (lo faremo per tutto il corso). - (^) da popolazione finita: il numero di unità statistiche che vanno a comporre il campionamento sono un numero finito. Ci sono diverse tecniche di campionamento causale: 1. Campionamento casuale SENZA reinserimento (o in blocco): Binomiale 2. Campionamento casuale CON reinserimento: Ipergeometrica 3. Campionamento a 2 stadi: partizione della popolazione iniziale. Abbiamo: - (^) una popolazione di N individui - (^) suddivisa in k gruppi, ciascuno di di ff erente numerosità: - (^) tale che k∑ (^) j=1Nj= N Il piano di campionamento consiste in 2 stadi: a) selezionare casualmente (in blocco) h gruppi tra i k disponibili. b) da ciascuno degli h gruppi disponibili selezionabili al primo stadio, estrarre, in modo casuale, un certo numero di elementi (tale che n < N ) di unità statistiche in modo tale che h∑ (^) i=1 ni = n 4. Campionamento stratificato: è come il campionamento a 2 stadi, ma non viene e ff ettuata l’estrazione del primo stadio ( a) ). Consiste nell’estrazione casuale, da ciascuno dei k gruppi (strati) in cui è suddivisa la popolazione, di un certo numero n (^) j < Nj di unità statistiche in modo tale che k∑ (^) j=1 nj = n. ––> È utile quando, la variabile di interesse presenta caratteristiche simili all’interno dei gruppi MA caratteristiche molto differenti (eterogenee) tra un gruppo e l’altro. Vogliamo avere una rappresentatività di ogni gruppo per la popolazione????? 5. Campionamento a grappoli: è come il campionamento a 2 stadi, ma non viene e ff ettuata l’estrazione del secondo stadio ( b) ). Consiste nell’estrazione casuale, di h dei k gruppi (grappoli) in cui è suddivisa la popolazione. Poi si esaminano tutte le unità contenute nei grappoli estratti. Il valore di n non può essere prefissato. Suddividiamo la popolazione, estraiamo i gruppi (NON le unità statistiche) e analizziamo TUTTE le unità statistiche dei gruppi estratti. ––> È utile quando, la variabile di interesse presenta caratteristiche di ff erenti all’interno dei gruppi MA caratteristiche molto simili (omogenee) tra un gruppo e l’altro. 6. Campionamento sistematico: N = (100) e n = (25) Bisogna definire: - k^ (il passo di campionamento) ––>^ k = N / n^ =^ (100) / (25) = (4) - ora bisogna scegliere un elemento tra i primi 4^ ( k ) - sceglierò quindi l’elemento 1, 5, 9, …. Cioè ogni mio^ passo di campionamento^ ( k ).

Esempio slide: Lancio di due dadi. Siano A, B, C gli eventi: A = i risultati sono uguali B = il risultato del 1° dado è maggiore del 2° C = il risultato di almeno uno dei due dadi è 6

- (^) Evento A = saranno tutti i possibili eventi elementari in cui il primo lancio è uguale al secondo. - (^) Evento B = contiene tutte le coppie di eventi elementari tali per cui il primo lancio sarà maggiore del secondo (escluderò quindi tutte le coppie in cui il secondo sarà maggiore del primo) - (^) Evento C = vedere slide. nulla più - (^) Evento A U C = scrivo A e ci aggiungo gli eventi di C che non ho già messo in A. L’evento che si ripete due volte (in rosso sulle slide) lo scrivo una volta sola. - (^) Evento A intersecato B = prendere tutti gli elementi che stanno in A e contemporaneamente gli elementi in B (gli elementi in comune). - (^) Evento A intersecato C = (elementi in comune) LA FUNZIONE DI PROBABILITÀ: è una funzione, una legge P che mi permetterà di assegnare una misura ad ogni evento, al verificarsi di quell’evento. Devo seguire 3 passi per definire P(A): A. Assiomi B. Regola per assegnare la probabilità agli eventi elementari C. Regola per il calcolo della probabilità di altri eventi A. Assiomi nel calcolo delle probabilità:

  1. La probabilità è definita SEMPRE maggiore o uguale a zero. Non esistono probabilità negative.
  2. P(Ω) = 1 cioè la probabilità dell’evento certo o la probabilità di tutti gli eventi elementari è sempre uguale a 1. Sopra l’1 non posso andare.
  3. La probabilità dell’unione di eventi A i che sono tra loro disgiunti (che non hanno cioè elementi in comune) si può calcolare facendo la somma delle probabilità di ogni singolo evento. Calcolo la probabilità dell’unione. Questo assioma vale solo per gli elementi disgiunti che non hanno cioè elementi in comune o che la cui intersezione è vuota. Queste regole devono valere sempre, sennò non si parla di probabilità. Dagli assioma derivano i seguenti calcoli: a) Probabilità dell’Unione: P(A U B) = P(A) + P(B) – P(A ∩ B) Dove: P(A ∩ B) = 0 solo se A e B sono disgiunti b) Probabilità della differenza: P(A – B) = P(A) – P(A ∩ B) Dove: P(A ∩ B) = P(B) solo se B ⊂ A c) Probabilità del complementare: P(AC) = 1 – P(A) d) Probailità dell’evento impossibile: P( Ø ) = 0 Dagli assiomi si ricava che: 0 ≤ P(A) ≤ 1

Per definire una probabilità:

  1. Consideriamo gli eventi elementari che, per definizione, sono eventi disgiunti.
  2. Considerando il 3° assioma posso quindi definire la probabilità di un evento generico. SE considero uno spazio Ω finito (con n eventi elementari) SE vi è equiprobabilità (ogni evento elementare ha la stessa probabilità a verificarsi) Si può definire la probabilità come: pi = 1 / n Dove:
  • n : è il numero totale degli eventi che si possono verificare Allora per il terzo assioma:

P(A) = ∑ pi

la somma cioè di tutti gli eventi a cui io sono interessato (già divisi per la probabilità che si verifichino) Posso però non dover passare tutte le volte dal calcolo degli eventi elementari e dal terzo assioma MA posso calcolare la probabilità con la “Formula Classica” (o di Laplace):

P(A) = casi favorevoli (ad A) / casi possibili

Quando Ω è finito potremmo procedere per conteggio semplice. Esistono altri approcci per definire la Probabilità:

1. Approccio Frequentista (non faremo negli esercizi): posso definire la probabilità come il limite della frequenza relativa. P(A) = limN–> NA / N [ limite del rapporto delle frequenze ] Dove: - N il numero di volte che ripeto un esercizio. - NA il numero di volte che un’esperimento da ragione ad A 2. Approccio Soggettivista (Bayesiano) : è basato sulla persona che fa una scommessa. Viene quantificata come la posta P che io sono disposta a scommettere per vincere: - 1 se l’evento si verifica - 0 se l’evento non si verifica Il gioco deve avere le seguenti regole: - La scommesse deve essere coerente (no vincite certo, no perdite certe) - La scommessa deve rispettare gli assiomi (perchè sennò non è una probabilità) IL GIOCO EQUO è tale solo se : non da luogo a perdite o guadagni certi, ovvero se il guadagno medio del giocatore è nullo. (è equo se in medio non guadagno niente. Il guadagno è la vincita meno la posta. Quanto vinco rispetto a quanto ho speso). PROBABILITÀ CONDIZIONATE ed EVENTI DIPENDENTI: Possiamo studiare la dipendenza di un evento come: [ leggere la stanghetta verticale “|” come: “dipende da, condizionato da” ] - A | B^ (A dato B) : cioè il verificarsi dell’evento A^ (evento condizionato)^ , condizionato dal fatto che l’evento B (evento condizionante) si è già verificato. Lo spazio di tutti i possibili eventi non è più Ω ma B. Si ristringe a B. - B | A^ (B dato A) : cioè il verificarsi dell’evento B , condizionato dal fatto che l’evento A si è già verificato. Lo spazio di tutti i possibili eventi non è più Ω ma A. Si ristringe ad A.

Variabile Casuale Discreta: X è una variabile casuale discreta se il suo supporto [ Supp(X) l’insieme dei valori che X assume con Probabilità Positiva) ]. Quindi X è una variabile discreta se assume un numero finito o al più numerabile.

- (^) SE prendo i numeri da 1 a 10, essi sono numerabili ma infiniti (1,1 ; 1,11 ; 1,111 …) - (^) SE prendo i numeri di un dado, essi sono numerabili e finiti (1,2,3,4,5,6) Esempio: (da quello precedente). X può assumere i valori: 0, 1, 2 P(X = 0) = P( {e4} ) = 1/ P(X = 1) = P ( {e2, e3} ) = 2/ P(X = 2) = P ( {e1} ) = 1/ P(X = 3) = Ø ––> Supp (X) = { 0, 1, 2 } <–– questo è un insieme finito. Si ha che la variabile casuale X è una Variabile Casuale Discreta. Esempio: Si lancia una moneta finché non esce testa. Sia X la variabile casuale che descrive il numero di lanci e ff ettuati. Ω = { e1 = T, e2 = CT , e3 = CCT , … } X (e) = { 1, e = e1 } P(e1) = > 0 { 2, e = e2 } { 3, e = e3 } { .. n, e = en } P(en) = > 0 essendo n rappresentativo dei numeri naturali N , essi sono infiniti ma tutti numerabili! Quindi, per definizione, si tratta di una Variabile Casuale Discreta. Definizione di funzione di massa di probabilità: (sempre riferito alle v.c. Discrete) si tratta di una funzione definita in: ƒ: R ––> [ 0, 1 ] ƒ (x) : = P (X = x) [x = è il valore] Proprietà: 1. ƒ(x) ≥ 0 per ogni x € R 2. ƒ(x) = 1 x Supp(X) Definizione di funzione di ripartizione: (sempre riferito alle v.c. Discrete) si tratta di una funzione definita in: F : R ––> [ 0, 1 ] Dove : F (x) : = P (X ≤ x ) - F (x) =^ ∑xk^ €^ Supp (X)^ ƒ (Xk^ ) Definizione di media e varianza: (sempre riferito alle v.c. Discrete) - (^) Media (valore atteso, speranza matematica) : = E [ X ] = ∑x € Supp(X) ƒ(x) - Varianza : = Var [ X ] = ∑ ( X – μ )^2 • ƒ(x) ø^2 = [ ∑ x^2 • ƒ(x) ] – μ^2 = E (X) – [ E (X) ]^2 Esempio: Lanciamo una moneta 3 volte. X sono il numero di teste. Supp(X) = { 0, 1, 2, 3 } Calcoliamo la funzione di massa di probabilità // distribuzione di probabilità: { TTT, TTC, TCT, CTT, TCC, CTC, CCT, CCC } ƒ(0) P (X=0) = 1/ ƒ(1) P (X=1) = 3/ ƒ(2) P (X=2) = 3/ ƒ(3) P (X=3) = 1/ F ( 1.5 ) = ƒ (Xk ) = ƒ(0) + ƒ(1) = 1/8 + 3/8 = 4/ xk Supp(X) , Xk 1. P(X 1.5) = - (^) E [X] = x • ƒ(x) = 0 • ƒ(0) + 1 • ƒ(1) + 2 • ƒ(2) + 3 • ƒ(3) = 3/ - (^) ø^2 = (x – μ )^2 • ƒ(x)=( 0 – 3/2 )^2 • ƒ(0) + ( 1 – 3/2 )^2 • ƒ(1) + ( 2 – 3/2 )^2 • ƒ(2) +( 3 – 3/2 )^2 • ƒ(3) = 3/

Variabile Casuale Uniforme Discreta: X è una variabile casuale uniforme discreta con Supp (X) = { 1, 2, … n } , X ~ U (n) , SE ƒ (x) = {^1 n , x € Supp (X) } { 0 , altrimenti } Esempio: Urna con palline numerate da 1 a n X = n° palline estratte alle prime estrazioni ––> X ~ U (n) P(X=2 ) = 1/n = P (X=5) Per casa: Sia X una variabile uniforme discreta —> X ~ U (n) =>

- E [X] = (n+ 1) / 2 - ø^2 = (n^2 – 1) / 12 Variabile Casuale di Bernoulli: X è detta v.c. di Bernoulli di parametro p (0,1) SE X assume con probabilità positiva i valori 0 o 1: X Ber (p) ƒ(x) = { p , x = 1 { 1 – p , x = 0 { 0 , altrimenti Esempio: lancio di una moneta. Si vince 1 se esce testa, o se croce. X = “vincita del lancio della moneta” ALLORA X Ber (1/2) ––> (se la moneta è regolare). - (^) Proposizione: Sia X Ber (p) , p (0,1) allora E [X] = p ; ø^2 [X] = p (1–p) - (^) DIMOSTRAZIONE: - E [X] =^ x^ •^ ƒ(x) = 0^ •^ (1–p) + 1•^ p =^ p - E [X^2 ] =^ x^2 •^ ƒ(x) = 0^2 •^ (1–p) + 1^2 •^ p = p - ø^2 =^ E [X] – E [X^2 ]= p – p^2 =^ p^ ^ (1–p) Variabile Casuale Binomiale: X è una variabile casuale binomiale di parametri (n , p) n N , p (0,1) ––> X Bin (n,p) , SE ƒ(x) = { nx px^ • (1– p) n–x^ , x supp(x) = {0,1,2,..n } {0 , altrimenti } - Se X^ ^ Bin (1,p) => allora => X^ ^ Bin (p) - X^ ^ Bin (n,p) => X rappresenta il numero di successo in^ n^ prove^ indipendenti, dove i successo di ogni singola prova è pari a p. => X Bin (n,p) E X 1 , Xn , sono indipendenti e ciascuna segue una v.c. di Ber(p) X = X 1 + Xn - (^) Proposizione: Sia X Bin (n,p) allora E[X] = n p ; Ø^2 = n p (1–p) - (^) DIMOSTRAZIONE: siano X 1 , Xn indipendenti e ciascuna segua una Ber (p). Allora - E[X] =^ E [ X 1 + X 2 … , Xn ] = E [X 1 ] + E [X 2 ] + … E[Xn] =^ n ^ p p + p + p - Ø^2 =^ Ø^2 [ X 1 + X 2 … , Xn ] = Ø^2 [X 1 ]^ +^ Ø^2 [X 2 ]^ + … Ø^2 [Xn]^ =^ n^ ^ p^ ^ (1–p) p • (1–p) + p • (1–p) + p • (1–p) Esempio: si lanci una moneta 20 volte e sia 0,3 la probabilità di ottenere testa ad ogni lancio. Calcolare: 1. Prob di avere al più 1 testa: X = “numero di teste in 20 lanci” CIOÈ X Bin (20; 0,3) P (X 1) = P (X = 0 ) + P ( X = 1 ) = (1 – 0,3)^20 + 20 • 0,3 • (1–0,3)^19 = È semplicemente una fottutissima binomiale già parzialmente risolta. 2. Il valore atteso e la varianza del numero di successi: E [X] = 20 • 0,3 = 6 Ø^2 [X] = 20 • 0,3 • 0,7 = 4,

Variabile Casuale Ipergeometrica: Per definirla si può usare un esempio di un’urna contenente: N = n°tot di palline; M = palline di colore bianco; N – M = palline non bianche. Si effettuano n estrazioni senza remissione. ƒ(x) = { (MX) • (N – Mn – x) / (Nn) La v.c. X che indica il numero di successi (il n° di palline bianche estratte) segue una distribuzione ipergeometrica. Di parametri N, M, n. ==> X Ig (N, M, n) È possibile dimostrare che: il valore atteso dalla v.c. stessa:

- E [X] = n^ ^ **_p

  • Ø**^2 **=**^ n•p•^ **(1–p)**^ ****^ **(N – M) / (N –1)** Dove: p = M / N (che indica la proporzione di palline bianche. Esempio: In questa classe ci sono N = 100 studenti. Il numero di studenti alti MENO di 1,70 m è M = 60. Calcolare: 1. La prob. che su n=5 estrazioni, senza reimmissione, si ottengano 3 studenti alti MENO di 1,70 m. 2. Il valore atteso del numero di studenti alti MENO di 1,70 m su n = 5 estrazioni, senza reimmissione. 1. X = “v.c. che indica il numero di studenti alti MENO di 1,70 m estratti su n = 5 estrazioni, senza reimmissione”. **-** X^ ^ Ig ( N = 100; M = 60 ; n = 5) **-** P (X = 3 ) = ƒ(x= 3) = (^603 ) • (^402 ) / (^1005 ) = 2. E [X] = n • M / N = 5 • 60/100 = 5 • 0,6 = 3 **-** Ø^2 = n •^ M / N • (1– M/N) • (N – n) / (N – 1) = 5 • 0,6 • 0,4 • 35/39 = Variabile Casuale (Discreta) Ipergeometrica: X ~ Ig (N, M, n) Che cos’è la v.c. Ipergeometrica? É una variabile casuale, che conta il numero di successi in n prove dipendenti. É caratterizzata da 3 parametri: **- N =**^ numero di palline presenti nell’urna (numerosità della prova) **- M =**^ numero di possibili successi. (se devo estrarre palline bianche, saranno tutte le palline bianche presenti nell’urna). Perché mi interessa saperlo? Perchè, essendo estrazioni senza reimmissione, continuando a togliere palline dall’urna è possibile che io elimini tutti i possibili successi. (devo tener conto che l’urna può esaurirsi o che non abbia più successi da estrarre). **- n =**^ numero di estrazioni ( senza^ reimmissioni) **-** (^) Gli insuccessi si calcolano **(N–M) -_** (^) La percentuale di successo alla prima estrazione si calcola: M/N

Formula: (ho bisogno di: M =successi? ; N =numero tot di palline nell’urna ; k =tentativi)

P(X=k) = (Mk) • (N–Mn–k) / (Nn) Formule per Media e Varianza: (senza stare a calcolare quindi tutte le probabilità ecc.)

μX = M(X) = n•p

Ø^2 X = Var(X) = n•p•(1–p)•[ (N–n)/(N–1) ]

[ (N–n)/(N–1) ] è il fattore di correzione. Perchè si tiene conto che prima o poi l’urna si esaurisca. Anche questa è una Variabile Casuale Discreta. Non posso avere un successo e mezzo.

Variabili Casuali CONTINUE: Se può assumere con P > 0 assume un numero non contabile di valori. Ad esempio in un intervallo (0,1) può assumere infiniti risultati. DEF: una v.c. X si dice continua se esiste una funzione ƒ(.) tale che la funzione di ripartizione di X è data da: F(x) = P(X x) = x ƒ(t) dt tale ƒ(.) di densità di probabilità, indicato con supp(x) = {x R : ƒ(x) > 0 } , per una v.c. risulta che il suo supporto è non numerabile. Esempio: F (a) = a ƒ(x) dx | |> = P(X a) Supp(x) = (– ; + ) In questo specifico esempio. In generale, la funzione di densità ƒ è una funzione che va da ƒ : R ––> R e:

- (^) ƒ(x) 0 , per ogni x R - ∞∫ ƒ(x) dx = 1 perchè sottintende che P(X ≤ + ∞) - E [X] = μ =^ ∞∫ x^ •^ ƒ(x) dx - Ø^2 =^ ∞∫ (x – μ)^2 •^ ƒ(x) dx

VARIABILI CASUALI CONTINUE: In queste v.c. si definiscono da:

- Supporto (o insieme dei valori) è l’insieme dei numeri reali. – ∞ ≤ Xk ≤ + ∞ - Funzione di^ densità :^ è la funzione tramite cui si definisce la probabilità di un generico evento ƒ(X , o strana) ƒ(X , o strana) ≥ 0 Dove: “o strana” rappresenta un parametro. La somma nel continuo (o integrale) da – a + sia uguale ad 1. Questo perchè l’area sottesa dalla funzione di probabilità deve essere uguale ad 1, cioè Ω la probabilità totale. L’area sottesa rappresenta la probabilità totale. (L’area totale = equivale = all’area totale.) Se io spezzetto l’area, quindi, rappresento una partizione dello spazio campionario. I pezzetti di area (sotto la curva) mi danno la probabilità del mio intervallo cercato. Ragioneremo quindi per intervalli. ≈ avremo delle probabilità di intervalli. Perchè? Perchè quanto vale la probabilità in un punto? 0. Quindi calcoleremo solo la probabilità ad intervalli. Posso definire anche per le Variabili Casuali Continue una Funzione di Ripartizione****. É uguale a quelle discrete e a quelle relative (classiche). Qui possono non badare a dove metto l’uguale. In quelle discrete SI.

F(x) = P (X ≤ x)

- Intervallo destro: { X > b }^ P ( X > b) = 1 – F(b) - Intervallo {^ a < X^ ≤^ b }^ P ( a < X^ ≤^ b ) = F(b) – F(a) Qua (e solo qua) possono non badare a dove metto l’uguale nell’intervallo. Data la funzione ƒ(x) = densità di probabilità: ƒ(x) ≥ 0 In questo caso, la Funzione di Ripartizione, mi permette di non utilizzare il calcolo integrale. Se conoscessi tutti i valori delle probabilità degli intervalli sinistri.. Facendo la differenza fra le due aree sottese dalla curva, otterrei esattamente l’area che mi interessa.

Variabile Casuale Normale (o Gaussiana) Def: X è una v.c. normale di parametri μ R e Ø^2 (Ø > 0) se la sua funzione di densità è X N ( μ ; Ø^2 ) = ƒ(x) = 1 / (SQM 2 π ) e – (x – μ)2 / 2•Ø2^ – < x <

- (^) E [X] = μ - (^) Var [X] = Ø^2 - asse delle ascisse è asintoto orizzontale, sinistro e destro per ƒ(x) (cioè limx–> +/- ƒ(x) = 0 ) - ƒ è simmetrica rispetto a μ. - ƒ ha un punto di massimo in μ. - ƒ ha due flessi : μ = – SQM e μ = + SQM In generale, data una qualsiasi v.c. con E [X] = μ e Var [X] = Ø^2 , la variabile: Z = (X – μ) / SQM e tale che E [Z] = 0 , Ø^2 [Z] = 1 In particolare, se X N (μ ; Ø^2 ) => Z = (X – μ) / SQM N (0,1) Variabile Casuale Standardizzata P (Z x __* ) = †0 • (x __* ) Esempio: Sia X N (100,81) Determinare: P ( X 120) e P( X 110) - P ( X^ ^ 120 ) = P ( X – μ^ ) / SQM^ ^ (120 –^ 100) / 9 = P ( Z^ ^ 2,22) = 0, - P ( X^ ^ 110 ) = P ( X –^ μ^ ) / SQM^ ^ (110 – 100) / 9 = P ( Z^ ^ 1,11) = 1 – P ( Z^ ^ 1,11) = 1 – 0,8665 = 0, VARIABILE CASUALE CONTINUA NORMALE (O GAUSSIANA): Partendo da una distribuzione di frequenza, diminuendo l’ampiezza degli intervalli e aumentando la numerosità n , otteniamo una curva detta Normale (o Gaussiana). ƒ(X) = [1 / (SQM • √ 2 π) ] • exp • { – 1/2 • [ (X – μ ) / SQM ] }^2 con: –∞ < μ < +∞ e SQM > 0 e ha le seguenti proprietà analitiche: 1. ƒ(X) ≥ 0 con asse delle X come asintoto orizzontale 2. Simmetrica rispetto a μ 3. Presenta un massimo in X = μ 4. Presenta 2 flessi in X = μ + SQM e X = μ – SQM - SUPPORTO:^ valori di X che vanno da –^ ^ a +^ - SIMMETRICA:^ rispetto a X = μ - UNIMODALE:^ **_μ = Mo = Me

  • PARAMETRI:_**^ la curva NORMALE^ è interamente^ definita dai parametri:
    1. Media Aritmetica = μ SE la M (μ) aumenta, e lo SQM (Ø) resta uguale, la curva trasla vs Destra. (se diminuisce, vs sx)
    2. SQM = Ø SE lo SQM (Ø) aumenta, e la M (μ) resta uguale, la curva si schiaccia e si allarga. (se diminuisce, si alza e si stringe) Qualsiasi siano i parametri μ e Ø, l’AREA sottesa dall’intera curva è = 1 I pezzi di area sottesa alla curva NORMALE rappresenta la PROBABILITÀ degli intervalli. Poiché la curva è simmetrica, l’AREA compresa tra – ∞ e μ è uguale a = 0, quindi, per simmetria, quella compresa tra μ e +∞ sarà anch’essa uguale a = 0, Per calcolare la probabilità di un intervallo bisognerebbe calcolare quindi: P(a X b) = F(b) – F(a) = ∫ba ƒ(x) dx NB: P(X=a) = 0 Cioè la differenza tra le aree: P(a x b) = P(x b) – P(x a) Operativamente dovrei calcolare un integrale molto complesso, ma passo alla variale Z:

VARIABILE CASUALE NORMALE STANDARDIZZATA: X ~ N (M = 0, Var = 1)

con Media (μ) = 0 e Varianza (Ø^2 X) = 1 Z = X – μX ––––– SQMX I risultati della V.C.N. Standardizzata sono riportati sulla Tavola della Normale Standardizzata. Rappresentano le aree della curva in corrispondenza dei diversi valori di Z. La tavola prende in considerazione i valori dell’area tra – e μ Prendo il risultato di Z e vado a cercarlo fra le tavole della Normale. Le prime due cifre del risultato equivarrà ai numeri che compaiono nella colonna di sinistra, mentre l’altra cifra si troverà nella riga di destra. I valori di Z, sulla tavola, arrivano sino allo 3,09 perchè sopra la probabilità tende ad 1 ( Ω ) asintoticamente. (quindi se mi chiedono quanto è la probabilità di un numero superiore al 3 risponderò con 1). Se mi danno la probabilità, faccio il passaggio inverso. Cerco la probabilità all’interno della tavola e osservo a quali valori di Z (per colonna e riga) appartiene. (Per quale valore di z di Z , P(Z<z = 0,975) Oss. sulla Tavola della Normale:

  • Contiene solo valori^ positivi.^ Se voglio trovare un numero negativo, applico il complementare (1^ – …) Come faccio con il –2? Lo trovo sulle tavole? No. Devo passare al complementare. Il valore da cercare sulla tavola è: P(z<2) che ad esempio vale 0,9972.
  • Il valore max è 3.09 e la sua probabilità relativa è 0,999. Quasi tutta l’area (cioè^ ^ Ω^ ) (Se mi chiedono la probabilità di 10? 1)
  • Si può leggere in due modi:
    • Diretto: dato z trovare la F(z)
    • Indiretto: data la F(z) trovare la z Riassumendo:
  1. P (Z ≤ –z ) = 1 – P(Z ≤ z ) = 1 – F(z)
  2. P (Z ≥ z ) = 1 – P(Z ≤ z) = 1 –F(z)
  3. P (Z ≥ –z ) = P(Z≤ z ) = F(z)
  4. P (a ≤ Z ≤ b) = F(b) – F(a)
  5. P (–a ≤ Z ≤ –b) = P (a ≤ Z ≤ b)

Teorema del limite centrale: teorema asintotico, come è distribuita la somma di n variabili, quando la loro somma tende ad infinito. Siano X 1 , … Xn v.c. sono i.i.d :

- i ndipendenti (il risultato dell’una non influenza l’altra. - i denticamente^ d istribuite (cioè le v.c. abbiano tutte la stessa distribuzione. Cioè stessa μ e ø^2 ) Si indichi con Sn : la somma di queste variabili casuali. Sn = Xi ALLORA Sn – (n • μ) / ( n • Ø^2 ) approssimativamente N (0,1) quando n è su ffi cientemente grande. [Si noti che, dividendo per n , numeratore e denominatore, abbiamo: (Sn / n) – μ / ( Ø^2 /n) ] Dove: - (^) (Sn / n): è la media campionaria: X^ - (^) X^ – μ / ( Ø^2 / n) N (0,1) , per n su ffi cientemente grande. Esempio: Siano (X 1 , … Xn) v.c. i.i.d. come una Ber(p) ALLORA Sn = ( Xi ) Bin (n,p) - (^) E [X] = p; - (^) Var [X] = p • (1–p) Segue allora, per il th. del limite centrale che: Sn – n • p / ( n • p • (1–p) ) approx N (0,1) , per n su ffi cientemente grande. è equivalente a X^n – p / ( p • (1–p) / n) N (0,1) , per n su ffi cientemente grande. TEOREMA DEL LIMITE CENTRALE: Ci permette di calcolare la probabilità come una v.c. Normale e non più con la Bin o l’Ig. Devono essere: **_I. e I. D.

  • I_** ndipendenti
    • Stocasticamente Indipendenti - I denticamente^ D istribuite:
    • Se è una Normale, sono tutte Normali
    • Se è una Binomiale, sono tutte Binomiali
    • Se è una Ipergeometrica, sono tutte Ipergeometriche Sia Yn = successione di v.c. Indipendenti con Media = μ e Var = Ø^2 Sia Xn = la loro somma (Xn = Y 1 + Y 2 + … Yn ) con Media = n•μ e Var = n•Ø^2 Il Th del limite centrale stabilisce che: la v.c. Xn , per un numero di prove che tende all’infinito, tende a distribuirsi come una v.c. Normale. Indipendentemente dalle variabili Y di partenza. (Indipendenti e Identicamente Distribuite) per n ––> + Xn ~ N ( n • μ , n • Ø^2 ) La variabile somma di questa variabile si distribuisce come una normale con Media = n μ e Var = n Ø^2 La vedremo applicata alla Binomiale: questo perchè, secondo il Th del limite centrale, converge alla Variabile Normale. (la Bin (n , p) è la somma di v.c. Bin (1 , p) ) Lo vedremo applicato solo quando n è “grande” : n > 30 La Bin (n,p) ––> converge ––> N (np , np•q) Dove: - q : 1 – p - np : Media (μ) Es: Si consideri una v.c. X ~ Bin (100, 0,2), calcolare P(X 60). (Essendo n > 30, si applica il Th del L.C. e si approssima X con una Normale di Media np e varianza np•(1–p) ) X ~ (1000,2 ; 1000,2*(1–0,2) ) => N (20 ; 16) Quindi: P (X≤60) = P (Z≤ 60 – 20 / √16 ) = P (Z ≤ 40/4) = P (Z ≤ 10) = 1

CAMPIONAMENTO:

Campionamento Casuale Semplice (C.C.S): Abbiamo una v.c. che rappresenta la popolazione, con certe caratteristiche. Se ripetessimo, n volte un esperimento casuale, ciò originerebbe n v.c. X 1 , … Xn Al fine di fare inferenza, sulle caratteristiche della popolazione, analizziamo il campione X 1 , … Xn Dove: X 1 , … Xn sono v.c. i.i.d (indipendenti e identicamente distribuite) Avremo:

- Campione Casuale:^ (X 1 , … Xn) - Realizzazione Campionaria:^ (x 1 , … xn) Nel mio spazio campionario Ω , Ω = e1, e2, e3 , en => se prendessi e3 => X 1 (e3), … Xn (e3) => (x 1 , … xn) Esempio: Lancio una moneta. X assume 1 se Testa o Croce: X Ber (p) Per fare inferenza su p, lancio 100 volte la moneta => X 1 , … X 100 sono i.i.d. - (^) indipendenti: l’esito di un lancio non influenza gli altri. - (^) identicamente distribuite: X ≈ Ber (p) , i = 1, … , 100 Esempio: Lancio 3 volte una moneta. Ω = { TTT , TTC , TCT , CTT , TCC , CTC , CCT , CCC } e1 e2 e3 e4 e5 e6 e6 e - X1 v.c. che assume valore: - (^) 1 se il primo elemento del risultato è T - (^) 0 se il primo elemento del risultato è C - X2 v.c. che assume valore: - (^) 1 se il secondo elemento del risultato è T - (^) 0 se il secondo elemento del risultato è C - X3 v.c. che assume valore: - (^) 1 se il terzo elemento del risultato è T - (^) 0 se il terzo elemento del risultato è C X1, X2, X3, i.i.d. Ber (p) Ciascuna colonna restituisce la realizzazione campionaria! p = 0, ƒ x^ (x) = { p^3 = 0,027 , x = 1 { 3 • p^2 • (1–p) = 0,189 , x = 2/ { 3 • p^2 • (1–p) = 0,441 , x = 1/ { (1–p)^3 = 0,343 , x = 0 v.c. \ e TTT TTC TCT CTT TCC CTC CCT CCC X1 (e) 1 1 1 0 1 0 0 0 X2 (e) 1 1 0 1 0 1 0 0 X3 (e) 1 0 1 1 0 0 1 0 X^ (e) 1 2/3 2/3 2/3 1/3 1/3 1/3 0 ƒx^ (x) = P(X^ = x) p^3 p^2 • (1–p) p^2 • (1–p) p^2 • (1–p) p • (1–p)^2 p • (1–p)^2 p • (1–p)^2 (1–p)^3

Esempio: Il Q.I. degli studenti di questi università segue N(175, 47). Qual è la probabilità che un campione di 15 studenti abbia un Q.I. medio compreso tra 173 e 177, X = Q.I. di un o studente X^ = Q.I. medio n = 15 X N (175 , 47) –––> X^ N(175, 47/15) [ 173 – 175 X^ – 175 177,5 – 175 ] X^ = P (173 < X^ < 177,5) = P [ ––––––––– < ––––––––– < –––––––––– ] = [ ( 47/15) ( 47/15) ( 47/15) ] = P ( – 1,13 < Z < 1,41 ) = † (1,41) – †(–1,13) = 0,9207 – (1 – 0,8708) = 0, Esempio: La probabilità che un elettore voti il partito A è P = 0,3. La probabilità che un elettore voti il partito B è 1 – P = 0, Si estrae un campione di 60 elettori. Determinare la probabilità che la proporzione di coloro che nel campione sono a favore di A sia compresa tra 11/60 e 23/60. (X 1 , … Xn) i.i.d. ; Xi Ber (P=0,3) ; i = 1, …, 60 ; n = 60 { 1 , se A X = { => X Ber (P=0,3) { 0 , se B X^ = P^ (proporzione campionaria). E [P^] = P = 0, Var [P^] = = [ p (1–p) ] / 60 = 0,2 / 60 [ 11/60 – 0,3 P^ – 0,3 23/60 – 0,3 ] P (11/60 < P^ < 23/60 ) = P [ –––––––––– < ––––––––– < –––––––––– ] = [ ( 0,21/60) ( 0,21/60) ( 0,21 / 60) ] Per il Teorema del Limite Centrale: = P (1–97 < Z < 1,41) = † (1,41) – †(–1,97) = 0,

Distribuzione della Varianza Campionaria: Sia X una v.c. con E[X] = μ ; Var [X] = ø^2 Sia (X 1 , … Xn) un C.C.S. distribuito come X. 1) ø2^^ : = 1/ n ∑ (Xi – μ )^2

- E[ø2^] = ø^2 - Var [ø2^] = Troppo complessa - Se X^ ^ N (μ, ø^2 ) => n / ø^2 ø2^^ ^ X^2 (chi-q)n 2) S^2 _ : = 1/ n ∑ (Xi – X^)_^2 - E [S^2 __ ] = (n – 1)/n • ø^2 - Var [S^2 __* ] = Troppo complessa - Se X N (μ , ø^2 ) => n / ø^2 • S^2 __* X^2 (chi-q)(n–1) 3) S^2 : = 1/ (n–1) ∑ (Xi – X^)^2 - E [S^2 ] = ø^2 - Var [S^2 ] = Troppo complessa - Se X^ ^ N (μ , ø^2 ) => (n –1) / ø^2 •^ S^2 ^ X^2 (chi-q)(n–1) Esempio: I pesi dei pacchi di pasta seguono N (1 ; 0,0007) Si considera un campione di 10 pacchi. Calcolare la probabilità che S^2 ricada (0,0005 ; 0,0008) X = peso di un pacco di pasta n = X N ( 1 ; 0,0007 ) ( 9 • 0,0005 (n–1) 9 • 0,0008 ) P ( 0,0005 < S^2 < 0,0008 ) = P ( ––––––––– < –––– S^2 X^2 (chi-q) 9 < ––––––––– ) ( 0,0007 ø^2 0,0007 ) = P ( 6,43 < X^2 (chi-q) 9 < 10,29 ) = 0,