











































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Seconda parte del corso da 12 cfu di management delle imprese internazionali: l’inferenza statistica
Tipologia: Dispense
1 / 51
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!












































Il valore medio o atteso di una variabile casuale X è definito come: La varianza V(X) di una variabile casuale X è definita da: La varianza misura la differenza quadratica tra i possibili valori della v.c. e il suo valore atteso, con pesi dati dalle probabilità di osservare tali valori. La varianza è in effetti il valore atteso della v.c. [X-E(X)]^2 e si può anche scrivere come: La varianza risulta nulla se X assume probabilità 1 in corrispondenza a un solo valore e probabilità zero altrove, mentre è tanto più elevata quanto è più alta la dispersione intorno al valore atteso. La radice quadrata della varianza prende il nome di scostamento quadratico medio o deviazione standard ed è indicata con: DISTRIBUZIONE DI BERNOULLI Si consideri una prova nella quale ha interesse solo verificare se un certo evento si è o meno verificato. La v.c. generata da tale prova assumerà, per convenzione, il valore 1 se l’evento si è verificato e il valore 0 in caso contrario. Tale variabile casuale viene detta v.c. di Bernoulli, indicata con X-Bernoulli (π) e può assumere valore 1 con probabilità π e il valore 0 con probabilità 1- π, la sua funzione di probabilità può essere espressa come: La media e la varianza di tale distribuzione sono date da: Infatti:
La distribuzione binomiale può essere ottenuta considerando la somma di v.c. di Bernoulli, indipendenti e identicamente distribuite. Si consideri una prova che può avere solo due possibili risultati: successo e insuccesso. Il risultato di tale prova può essere descritto da una v.c. di Bernoulli che assume valore 1 per successo e valore 0 per insuccesso. Chiamiamo inoltre π la probabilità di successo di una prova. Si supponga ora di effettuare n prove, indipendenti le une dalle altre e nelle stesse identiche condizioni. Chiamiamo X 1 il risultato della prima prova, X 2 il risultato della seconda prova, …, Xn il risultato dell’n-esima prova. Ogni X è una v.c. di Bernoulli. Cosa si può dire sulla somma X= X 1 +X 2 +Xn? Poiché ogni X può assumere valore 0 oppure valore 1, è chiaro che la v.c. somma X corrisponde al numero di X uguali a 1. Si supponga, per esempio, che n=4; si ha: In altre parole, la v.c. X rappresenta il numero di successi in n prove indipendenti ripetute nelle stesse condizioni, ossia la somma di n v.c. di Bernoulli indipendenti e identicamente distribuite, quindi con stesso valore del parametro π. La funzione di probabilità della v.c. risultante X è chiamata funzione di probabilità binomiale, con parametri n (numero di prove) e π (probabilità di successo in una singola prova). Una v.c. Binomiale, indicata con X-Binomiale (π, n), rappresenta il numero di successi che si presentano in una sequenza di n sottoprove Bernoulliane indipendenti nelle quali è costante la probabilità di successo π. La funzione di probabilità Binomiale è definita come: per x=0, 1, 2, …, n e 0< π<1. La media e la varianza di tale distribuzione sono date da: Infatti, utilizzando le proprietà della funzione di ripartizione doppia si ha: Al variare dei parametri n e π si ottengono funzioni di probabilità che presentano una forma molto diversa:
La media e la varianza della v.c. Normale sono date da mentre la deviazione standard è σ. La funzione di densità Normale ha una forma campanulare, unimodale e simmetrica rispetto al valore x=μ, in corrispondenza del quale la funzione raggiunge il suo valore massimo. Da tali osservazioni discende che μ corrisponde contemporaneamente al valore atteso, alla mediana e alla moda della v.c. Normale X. Si dimostra inoltre che la funzione presenta due flessi in corrispondenza dei punti x=μ+ σ e x=μ- σ, inoltre f(x) 🡪0 per x 🡪±∞ Si può notare che la media μ determina la posizione della curva sull’asse delle ascisse, mentre la deviazione standard ne determina la dispersione. La distribuzione Normale è largamente utilizzata come modello probabilistico per i più svariati fenomeni. La sua importanza discende in buona parte da una proprietà che viene evidenziata nel Teorema del limite centrale. Tra tutte le v.c. Normali ha particolare importanza la v.c. Normale standardizzata Z-N (0;1) oppure Z-N (μ; σ^2 ) con media nulla e varianza unitaria. La trasformazione avviene attraverso lo scarto standardizzato: Tale v.c. ha la seguente funzione di densità: Per la proprietà di simmetria della Normale standardizzata rispetto all’asse z=0, si ha che f(z)=f(-z); inoltre, la funzione di ripartizione gode della seguente proprietà:
Ciò permette di semplificare i calcoli delle aree sottese dalla funzione di densità. Per esempio, la probabilità che Z assuma un valore nell’intervallo (-2; 2) si trova calcolando: PROPRIETA’ ● Ogni trasformazione lineare di una v.c. Normale è ancora una v.c. Normale, ossia, se X è una v.c. Normale, X-N (μ; σ^2 ), lo è anche Y= aX+b, dove a e b sono due numeri reali con a≠0. In particolare, si ha Y-N (aμ +b; a^2 σ^2 ). ● La somma di due v.c. Normali indipendenti è ancora una v.c. Normale con media e varianza pari, rispettivamente, alla somma delle medie e delle varianze delle due v.c. Normali. COME LEGGERE LE TAVOLE DELLA NORMALE ● All’interno della tavola ci sono le probabilità; ● In intestazione di riga (1 colonna) ci sono i valori di z: cifra intera e prima cifra decimale; ● In intestazione di colonna (1 riga) c’è la seconda cifra decimale di z; ● L’area nella tavola esprime la probabilità della funzione di ripartizione, quindi da -∞ fino allo specifico valore positivo di z. ● In virtù della simmetria della curva, valgono le seguenti relazioni: DISTRIBUZIONE CHI QUADRATO La v.c. Chi-quadrato è una distribuzione asimmetrica, continua e definita per valori reali non negativi. La funzione di densità dipende da un unico parametro, chiamato gradi di libertà, che è un intero positivo che si indica con il simbolo g. All’aumentare di g la distribuzione tende a una Normale, e per g> 80 l’approssimazione può essere considerata abbastanza buona (per g=80 l’indice di curtosi di Pearson è 3,15). La v.c. X^2 , indicata con X-X^2 (g), è una v.c. continua che può assumere valori nell’intervallo (0; +∞), con funzione di densità: dove il parametro g (gradi di libertà) è un intero positivo e il simbolo T (g\2) indica l’integrale:
L’area sottostante la curva esprime le probabilità legate a diversi valori di X^2. Per calcolare queste probabilità, si dovrebbe risolvere un integrale del tipo: Per evitare di calcolare l’integrale, si possono utilizzare le tavole che riportano la probabilità associata ad alcuni valori di X^2. Una tavola è così formata: ● Nel margine superiore si leggono alcune probabilità più ricorrenti; ● Nel margine sinistro il numero di gradi di libertà; ● Nell’interno della tavola, cioè in ciascuna delle caselle d’incrocio tra gradi di libertà e probabilità, s’individua un valore della corrispondente distribuzione X^2 , cioè uno scarto standardizzato al quadrato. DISTRIBUZIONE T DI STUDENT La v.c. t di Student somiglia per molti aspetti alla v.c. Normale standardizzata: è continua e definita su tutto l’asse reale e ha una funzione di densità di forma campanulare e simmetrica intorno all’asse T=0. La funzione di densità dipende da un unico parametro, chiamato gradi di libertà, che è un intero positivo che si può indicare con il simbolo g. All’aumentare di g la distribuzione tende a una Normale standardizzata, e già per g>30 l’approssimazione è considerata sufficiente nella gran parte delle applicazioni (per g=30 l’indice di curtosi di Pearson è pari a 3,23). La v.c. t di Student, indicata con T-Student (g), è una v.c. continua che può assumere valori su tutto l’asse reale, con funzione di densità: dove il parametro g è un intero positivo. La media e la varianza della distribuzione t di Student non sono sempre definite, in particolare: Uno dei motivi per cui è utile conoscere questa distribuzione è che questa si ottiene come funzione tra una v.c. Normale standardizzata e una v.c. Chi- quadrato tra loro indipendenti. In particolare, sia Z-N (0;1) e sia Y-X^2 (g); allora la variabile
è una v.c. t di Student con g gradi di libertà. INTEGRAZIONE QUINTANO CASTELLANO Quando si dispone di un campione di ampiezza n selezionato da una distribuzione normale con varianza non nota, per il calcolo di relazioni probabilistiche (intervalli di confidenza e test d’ipotesi) si fa riferimento a una distribuzione nota come “t” di Student, la quale può essere definita come un rapporto tra la variabile standardizzata media campionaria e la radice quadrata di una variabile X^2 ponderata con i gradi di libertà, cioè il numero delle quantità libere di variare dopo aver sottratto i vincoli: La forma della distribuzione t dipende dal numero di gradi di libertà (v=n-1), poiché al variare dei gradi di libertà s’individua una diversa distribuzione. Essendo v€ [0, ∞], si possono avere infinite distribuzioni t di Student. Il dominio della funzione è tutto l’insieme dei valori reali e la forma è simmetrica rispetto a μ=0; inoltre, al crescere del numero dei gradi di libertà, la forma della distribuzione approssima quella normale. Al limite, per v 🡪 +∞ si ha: P (t∞> 1,96) =0, P(Z>1,96) = 0, In altre parole, il valore critico che delimita a destra un’area pari a 0,025 è uguale sia se si utilizza la distribuzione t che la normale. Si può notare, fissata l’area, ad esempio 0,025, cioè P(tv>a) = 0,025 che il valore critico a, all’aumentare dei gradi di libertà (per v> 30), si avvicina sempre più rapidamente a 1,96, fino a coincidere con esso, per v= +∞ Una tavola tipo della t Student è così formata: ● Nel margine superiore si leggono alcune probabilità più ricorrenti; ● Nel margine sinistro si legge il numero dei gradi di libertà; ● Nell’interno della tavola, cioè in ciascuna delle caselle di incrocio tra gradi di libertà e probabilità, s’individua un valore della corrispondente distribuzione t. La tavola della distribuzione t contiene i valori critici associati alle probabilità più ricorrenti secondo questa relazione:
La forma della distribuzione F dipende dal numero di gradi di libertà m ed n e al variare di essi si ha una famiglia di distribuzioni di Fisher. Si noti che il dominio della distribuzione F è tra 0 e +∞ ed è asimmetrica. Nella F bisogna considerare due diversi gradi di libertà: v 1 per la variabile X^2 del numeratore (che si leggono nel margine superiore), e v 2 per la variabile X^2 del denominatore (che si leggono nel margine sinistro). Fissato α, cioè la probabilità, la casella all’incrocio tra v 1 e v 2 individua un valore critico W della distribuzione F. In realtà, esistono infinite distribuzioni F, cambiando l’area o la probabilità α per ogni v1 e v2 possibile, cioè da 1 a +∞. In una tavola tipo di F si segue il seguente schema: P (W (^) m,n>W^2 m,n) = α Due sono i problemi risolvibili attraverso la distribuzione F.
In conclusione, si deduce che: Pertanto, per ottenere il valore di una variabile F con n e m gradi di libertà, che delimita alla sua destra un’area pari a 1-α, è sufficiente calcolare dalla tavola il valore di una variabile F con m e n gradi di libertà e un’area α alla sua destra, e poi calcolare il reciproco di questo valore. TEOREMA DEL LIMITE CENTRALE Di fondamentale importanza nella teoria dei campioni, per la costruzione degli intervalli di confidenza e per l’inferenza statistica, è il teorema del limite centrale. A tal fine, occorre distinguere i casi di popolazione di riferimento infinita o finita. POPOLAZIONE INFINITA Estraendo tutti i possibili campioni casuali semplici di numerosità n da una popolazione infinita con media μ e varianza σx^2 , al crescere di n, la distribuzione della media campionaria approssima una distribuzione normale con media μx e varianza σ^2 \n. Dunque, la media campionaria è asintoticamente distribuita normalmente con: e varianza Quindi, data una popolazione infinita X-? (μx, σ^2 x), per campioni di dimensione relativamente grande, si avrà: Tale formulazione è valida anche per lo schema di estrazione da una popolazione finita ma con reinserimento di ciascun elemento nella procedura di formazione di ciascun campione, in modo da simulare una popolazione infinita. POPOLAZIONE INFINITA Estraendo tutti i possibili campioni casuali (di dimensione n) senza reinserimento da una popolazione finita (di dimensione N), con media μx e varianza σ 2 x, al crescere di n, la distribuzione della media campionaria approssima una distribuzione normale con media μx e varianza. Dunque, la media campionaria è asintoticamente distribuita normalmente con: Quindi, data una popolazione finita X-? (μx, σ^2 x), per campioni di dimensione sufficientemente grande, si avrà:
Se lo scopo è quello di ottenere informazioni sulla popolazione di interesse e non si può effettuare un’indagine totale, allora lo strumento più adatto è l’indagine campionaria, la quale consiste nell’estrazione e nello studio di un campione di unità della popolazione al fine di ottenere informazioni concernenti alcuni parametri dell’intera popolazione. L’indagine campionaria presenta delle differenze importanti a seconda che la popolazione di interesse sia finita oppure infinita. Una popolazione finita può essere studiata in modo esaustivo enumerando e osservando tutte le unità statistiche che la compongono. Tale procedura è stata già introdotta con il nome di indagine totale o censimento e consiste nell’osservare il valore assunto dal carattere d’interesse X in ciascuna delle N unità della popolazione. Tuttavia, queta procedura presenta molte limitazioni dovute ai costi, ai tempi di esecuzione e al livello di precisione. Per queste ragioni, è preferibile osservare solo una parte della popolazione, detta campione. Il numero di unità che compongono il campione è detto dimensione campionaria. Il rapporto tra la dimensione campionaria n e quella della popolazione N viene chiamato frazione di campionamento o frazione di sondaggio. L’elemento cruciale nella definizione del campione è dato dalla regola di selezione, ossia dalla procedura con la quale le unità campionarie sono estratte dalla popolazione. Per definire una regola di selezione probabilistica si deve individuare: ● L’insieme Ω, detto spazio campionario, formato da tutti i possibili campioni estraibili con una medesima tecnica da una popolazione; ● La probabilità di ogni campione c in Ω di essere estratto. In questo contesto gli eventi elementari che costituiscono lo spazio campionario sono i singoli campioni c. La coppia {Ω, probabilità dei campioni in Ω} è detta piano di campionamento o disegno campionario. L’elenco dei campioni distinti cambia a seconda che si consideri o meno l’ordine di estrazione. Due campioni non ordinati di uguale numerosità sono diversi tra loro se almeno un’unità del primo campione non è contenuta nel secondo campione. Nel caso di indagine campionaria si aggiunge un ulteriore tipo di errore, detto errore campionario, attribuibile al fatto che ogni conclusione riguardante la popolazione è basata in realtà solo sull’osservazione di un sottoinsieme. IL CAMPIONAMENTO CASUALE SEMPLICE Quando la popolazione è finita, il piano di campionamento più semplice che si può adottare è il campionamento casuale semplice che riveste un ruolo basilare all’interno delle tecniche di campionamento. Nel campionamento casuale semplice i campioni di uguale dimensione hanno tutti la stessa probabilità di essere estratti. La procedura di selezione delle unità pone alcuni problemi: ● Si devono conoscere a priori tutte le unità che compongono la popolazione; ● Tutte le unità della popolazione devono essere reperibili; ● Si deve procedere all’estrazione casuale delle unità. I primi due punti fanno riferimento alla disponibilità di liste di campionamento attendibili. Il terzo punto si riferisce alla tecnica di estrazione delle unità campionarie. Per risolvere quest’ultimo problema si associa a ogni elemento della popolazione un numero; da questo insieme di numeri se ne estraggono casualmente tanti quante sono le unità che devono formare il campione. Per estrarre i numeri in modo casuale ci si può avvalere delle tavole dei numeri casuali. L’estrazione delle unità può essere eseguita secondo due modalità distinte: con ripetizione o senza ripetizione. Nel primo caso, ogni unità estratta viene reintrodotta nella popolazione e quindi può essere successivamente riestratta; nel secondo caso, una volta estratta, un’unità non viene reintrodotta nella popolazione e quindi non può ripresentarsi nelle successive estrazioni. Nel
campionamento casuale semplice senza ripetizione, il numero di campioni ordinati diversi di dimensione n estraibili da una popolazione finita di numerosità N è dato da: Viceversa, se si considerano i campioni non ordinati, il loro numero è uguale a: In generale, il piano di campionamento casuale semplice senza ripetizione da una popolazione finita di N unità si basa su n prove successive:
Le statistiche non devono essere confuse con i parametri della popolazione, i quali si riferiscono all’intera popolazione, mentre le statistiche dipendono solo dalle osservazioni campionarie. In generale, una statistica t (X 1 , X 2 , Xn) assume valori diversi a seconda del particolare campione estratto; quindi, la probabilità che una statistica assuma un certo valore è pari alla probabilità complessiva di tutti i campioni per i quali si ottiene tale valore. Per questo motivo la distribuzione di probabilità di una statistica viene chiamata distribuzione campionaria. LA DISTRIBUZIONE DELLA MEDIA CAMPIONARIA NELLE POPOLAZIONI INFINITE Tra le statistiche più utilizzate, la media campionaria ricopre un ruolo particolare dovuto alle sue proprietà
per tutte le popolazioni infinite e per qualsiasi dimensione campionaria. Il valore atteso della media campionaria è uguale alla media della popolazione, ossia: La varianza della media campionaria è uguale alla varianza della popolazione divisa per la dimensione campionaria, ossia: Si può osservare che la distribuzione della media campionaria dipende dalla distribuzione della popolazione. Se la popolazione ha una distribuzione Normale X-N (μ; σ^2 ) allora, la distribuzione della media campionaria sarà ancora una Normale: Il suo valore standardizzato sarà: Si osservi che la distribuzione della media campionaria è meno variabile della distribuzione della popolazione, e che la riduzione della variabilità è tanto più forte quanto maggiore è la dimensione campionaria.
Se la popolazione X possiede una distribuzione di Bernoulli con parametro π, la distribuzione della media
con media π e varianza: In definitiva si ha che
ha una distribuzione proporzionale alla Binomiale, ossia: LA DISTRIBUZIONE DELLA MEDIA CAMPIONARIA NELLE POPOLAZIONI FINITE
rispettivamente la media e la varianza della popolazione. Si ha: Il calcolo della distribuzione campionaria della
nel caso di campionamento casuale da popolazioni finite è molto complesso. Tuttavia, se la dimensione campionaria n è relativamente piccola rispetto alla numerosità N della popolazione, la distribuzione campionaria può essere approssimata con la distribuzione Normale. Se la dimensione campionaria n è sufficientemente ampia ma allo stesso tempo molto più piccola della numerosità N della popolazione, allora la distribuzione
In pratica, è sufficiente che la dimensione campionaria n sia almeno maggiore di 50 e che la frazione di campionamento n\N sia piccola per far sì che sia possibile considerare soddisfacente tale approssimazione. Il valore atteso della media campionaria nel campionamento casuale è, quindi, sempre uguale alla media della popolazione, sia se questa è infinita sia se è finita. La varianza differisce nelle due diverse situazioni. In
se si pensa che nel caso di popolazioni finite il campione è più informativo rispetto a quello estratto da popolazioni infinite. Ovviamente, se la dimensione campionaria n è molto piccola rispetto a N allora la varianza della media campionaria tende, nei due schemi di campionamento, a essere uguale. CAP 11: STIMA PUNTUALE E STIMATORI
La correttezza di uno stimatore non ha implicazioni evidenti sulla singola stima, però implica che lo stimatore non ha deviazioni sistematiche rispetto al parametro 0 , ossia lo stimatore mediamente né sovrastima né sottostima il parametro. Per indicare la distorsione si usa spesso il termine inglese Bias. STIMATORI EFFICIENTI E MINIMO ERRORE QUADRATICO MEDIO Il nostro desiderio è che la stima t=t(x 1 , …, xn) sia il più possibile vicina al valore vero di 0. È necessario specificare con maggiore chiarezza il significato dell’affermazione “T assume valori prossimi a 0 ”. Il modo più semplice di precisare questa affermazione è quello di richiedere che la differenza |T- 0 |generi, al variare dei campioni, piccoli valori, in modo tale che sarà maggiore lo stimatore T. Questo approccio richiede il calcolo della distribuzione di probabilità dello stimatore T che risulta molto complesso. Per questa ragione bisogna affrontare in altro modo il problema. Prima di tutto si deve notare che l’errore di stima |T- 0 | è piccolo se e solo se (T- 0 )^2 è piccolo; quindi, come misura sintetica di prossimità di T a 0 , si può usare il valore atteso di (T- 0 )^2. Questa quantità viene chiamata errore quadratico medio dello stimatore T ed è indicata con il simbolo MSE(T). L’errore quadratico medio di uno stimatore T di un parametro 0 è dato dalla quantità: = var(T)+B(T)^2. L’MSE(T) è una misura sintetica della prossimità di uno stimatore T al parametro ignoto 0. A questo punto, si può introdurre il concetto di efficienza di uno stimatore: si dirà che T 1 è più efficiente di T 2 se possiede un errore quadratico medio più piccolo: MSE(T 1 ) <MSE(T 2 ) per tutti i possibili valori di 0. L’errore quadratico medio di uno stimatore può essere espresso come somma di due termini: la varianza dello stimatore e il quadrato della distorsione: dove Var(T)= E[(T-E(T)^2 ] è la varianza di T. La distorsione di uno stimatore corretto è nulla e quindi l’errore quadratico medio di uno stimatore di questo tipo coincide con la sua varianza. Se lo stimatore T è corretto, allora: MSE(T) =Var(T) per tutti i possibili valori di 0.
Quindi, se si restringe la scelta alla sola classe degli stimatori corretti, il criterio MSE(T) porta a preferire quello con variabilità più bassa. Dati due stimatori corretti, T 1 e T 2 , si dirà che T 1 è più efficiente di T 2 se e solo se Var(T 1 ) < Var(T 2 ) per tutti i possibili valori di 0. STIMATORI CONSISTENTI E ASINTOTICAMENTE CORRETTI È importante valutare anche le proprietà asintotiche degli stimatori. Una tra le principali proprietà asintotiche è la consistenza. Uno stimatore è consistente se la sua precisione aumenta all’aumentare della numerosità campionaria. Si può facilmente intuire che l’informazione desunta da un campione dipende dalla dimensione campionaria, ossia dal numero di unità statistiche osservate. Formalmente, uno stimatore Tn di un parametro 0, dove n indica la dipendenza dello stimatore dalla numerosità campionaria, è consistente se il suo errore quadratico medio tende a zero al tendere a più infinito della numerosità campionaria: E’ chiaro che MSE(Tn) tende a zero se e solo se sia la varianza sia la distorsione tendono a zero all’aumentare della numerosità campionaria. In simboli: Il significato della cosistenza in media quadratica risulta evidente da tale espressione se si considera che il limite di n che tende a più infinito di MSE (Tn) =0 implica che, al crescere di n, la distribuzione campionaria di Tn si addensa sempre di più intorno a 0, ossia tende a concentrare tutta la massa di probabilità in un intervallo di ampiezza infinitesima attorno al parametro 0. Se lo stimatore Tn è corretto, esso è consistente se e solo se la sua varianza tende a zero quando la numerosità campionaria n 🡪+∞. Uno stimatore corretto Tn è consistente in media quadratica se e solo se Il valore atteso di uno stimatore distorto può, al crescere della dimensione campionaria, tendere al vero valore del parametro. Uno stimatore Tn di un parametro 0 è asintoticamente corretto se: