Scarica Statistica-Inferenze Statistiche e più Appunti in PDF di Statistica solo su Docsity!
Inferenze
Statistiche
Slide e
Slide 4 - Inferenze Statistiche VARIABILI ALEATORIE MULTIVARIATE
- Una v.a congiunta può essere doppia, tripla,..., multipla.
- Una v.a doppia viene definita attraverso una coppia (X,Y), in cui sia X che Y sono v.a. FUNZIONE DI DISTRIBUZIONE CONGIUNTA
- Se le due v.a X ed Y sono entrambe continue si può definire una funzione di densità di probabilità congiunta tale che:
- Se X ed Y sono s-indipendenti: la funzione di densità di probabilità congiunta è uguale al prodotto delle funzioni di densità di probabilità marginali.
- Per una v.a multipla le cui componenti sono s-indipendenti si può definire una funzione di distribuzione congiunta: '
k.ykst-hflk.hn/Ytd3fx.ykdfx.ylxihokdy-frflxeXtxtoHn(
yttlytohl } fintanto"
(Kiki,.^ Xn^ ) È .kntinxntint^
.. infatti)
INTRODUZIONE ALL’INFERENZA
- Popolazione: insieme di oggetti di interesse per un dato studio - Campione: un qualunque sottoinsieme della popolazione. Si esamina un campione quando non conviene esaminare tutta la popolazione.
- Il termine inferenza è sinonimo di illazione: il primo ha connotazione positiva, il secondo negativa.
- L’inferenza statistica è l’insieme delle metodologie che consentono di portare risultati relativi ad un campione al livello della popolazione da cui è stato estratto il campione.
- L’inferenza è pertanto un procedimento induttivo CAMPIONE CASUALE
- Supponiamo di estrarre dalla popolazione un campione di numerosità n e di osservare la caratteristica C in ciascun individuo. Prima di osservare i valori avrò n v.a Dopo l’osservazione avrò n valori
- Il campione viene detto casuale se le v.a sono s-indipendenti ed identicamente distribuite con la stessa distribuzione di probabilità della popolazione. CAMPIONE CASUALE DI UNA POPOLAZIONE GAUSSIANA
- Una popolazione Gaussiana X è completamente determinata se si conoscono i parametri media, e varianza, X. Hai .nl/n^. (^) ( X.eu#n)X,sXzir..iXn .
HEY}^ ahah}^.
LE PROCEDURE INFERENZIALI Esistono 3 procedure inferenziali:
- La stima puntuale: si cerca di determinare valori puntuali dei parlamentari incogniti della popolazione mediante i valori del campione.
- La stima intervallare: si cercano degli intervalli contenenti con una certa fiducia i parametri della popolazione.
- La verifica d’ipotesi: si usa il campione per controllare la validità di ipotesi riguardanti i parametri della popolazione. STATISTICHE CAMPIONARIE
- Statistica: è una funzione delle osservazioni del campione. LA MEDIA CAMPIONARIA F- (^0) Nulla ,.^.^ An)^ per le^ v.^ a^ Xi^.^ È^ una (^) via
[ =^9 (x.
, ×,^ i ..^.^ An) (^) per i^ valori^ osservati^ xi^.^ È^ un^ valore). IÈÈlàhÈ
PROPRIETÀ DELLA VARIANZA CAMPIONARIA
- Il valore atteso della varianza campionaria non coincide con la varianza della popolazione. Si dice che è uno stimatore distorto della varianza della popolazione.
- Si definisce pertanto una varianza campionaria corretta:
- Il valore atteso della varianza campionaria corretta coincide con la varianza della popolazione.
- La varianza si può calcolare solo se si fanno assunzioni sulla legge di distribuzione della popolazione.
- Ad esempio nel caso di popolazione Gaussiana, si dimostra che: STIMA INTERVALLARE - La stima intervallare è una procedura inferenziale che conduce ad un intervallo (intervallo di fiducia/confidenza) contenente il parametro incognito della popolazione con un certo livello di fiducia.
- Il livello di fiducia viene solitamente assegnato a priori
- Detto Il generico parametro incognito della popolazione, denotiamo con IC. l’intervallo di confidenza per al livello E (^) ftp.efn È KIHa e fritte
..^ =^ ò
Ì
Ì
s :#I^ È hi^
- it g 2 Vals! ÷ 1- a 1- a 0 a (^) A a-^ a
- Se i parametri incogniti sono più di uno allora si parlerà di regioni di confidenza.
- Per costruire un intervallo di confidenza dobbiamo partire dal campione casuale. L’obbiettivo è arrivare ad una relazione del tipo:
- Per costruire una tale relazione definiamo una quantità pivotale (funzione ancillare): una funzione del campione e del parametro incognito la cui distribuzione di probabilità è nota e non dipende dal parametro incognito.
- La quantità pivotale non è una statistica
- Per ottenere un intervallo di confidenza, la quantità pivotale deve essere invertibile per STIMA INTERVALLARE DELLA MEDIA DI UNA POPOLAZIONE GAUSSIANA CON VARIANZA NOTA
- Consideriamo una popolazione X Gaussiana di cui la media è incognita mentre la varianza è nota.
- Una quantità pivotale utile allo scopo è: che ha una distribuzione di probabilità Gaussiana standard ed inoltre è invertibile per , infatti possiamo scrivere: X. (^) ,^ X".. .Nn. Pr (^) ftp.ih.dnfaaeuhk.... il f-
e - a
0 vk.K.hn (^). 9 :
2 =^ TI
onn
μ Pr (^) f
- Potendo controllare l’ipotesi nulla sulla base di un’evidenza campionaria, alla conseguente decisione (se accettarla o meno) è associata un inevitabile incertezza:
- Si definisce rischio di I tipo (e si indica con ) la probabilità di commettere un errore di I tipo. Analogamente si definisce rischio di II tipo (e si indica con ) la probabilità di commettere un errore di II tipo.
- viene detto livello di significativa del test: è la probabilità di accettare H. quando è vera.
- viene detto potenza del test: è la probabilità di rigettare H quando è falsa.
- Per la verifica di ipotesi si fa ricorso a statistiche test che sintetizzano le informazioni contenute nel campione.
- Si definisce poi una regione critica di ampiezza come quell’insieme di valori della statistica test che ha probabilità di verificarsi e che mi fa commettere un errore di I tipo. TEST D’IPOTESI SULLA MEDIA DI UNA POPOLAZIONE GAUSSIANA
- Consideriamo Again una popolazione X Gaussiana di cui la media è incognita, mentre la varianza è nota:
- Formuliamo il seguente sistema di ipotesi: × ✓ p 1- a 0 1- (^) p (^) o a × e " Ho :{Ho} Ha (^) :(μ (^) =p, >^ μ. }
- Sono entrambe ipotesi semplici che si contrappongono a vicenda.
- Per controllare l’ipotesi adottiamo la statistica test. Nel caso di popolazione Gaussiana si ha:
F
ENTI