Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Dispensa di statistica, Dispense di Statistica

Dispensa degli argomenti teorici principali dell'esame di Metodi statistici per la psicologia.

Tipologia: Dispense

2022/2023

Caricato il 18/01/2023

raffaella-vitagliano
raffaella-vitagliano 🇮🇹

4.3

(42)

33 documenti

1 / 26

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
PROBABILITÀ
Approccio assiomatico:
1. Individuazione dei concetti PRIMITIVI:
PROVA: sinonimo di esperimento probabilistico, ossia esperimento
soggetto ad incertezza (l’esito non può essere previsto con certezza).
EVENTO: uno dei possibili risultati della prova.
Gli eventi si indicano con le lettere maiuscole.
L’insieme di TUTTI i possibili risultati di una prova viene detta
SPAZIO CAMPIONARIO (o EVENTO CERTO perché almeno uno
degli eventi di cui si compone deve verificarsi per forza).
L’evento che non si verifica mai è detto EVENTO IMPOSSIBILE.
Gli eventi si possono mettere in relazione tra loro attraverso
l’ALGEBRA DI BOOLE (operazioni fondamentali UNIONE,
INTERSEZIONE, NEGAZIONE).
Queste operazioni si possono rappresentare graficamente mediante i
DIAGRAMMI DI VENN.
PROBABILITÀ: numero associato al verificarsi dell’evento.
2. Enunciazione dei postulati (ASSIOMI): affermazioni non dimostrabili.
3. TEOREMI dimostrabili attraverso i postulati.
OPERAZIONI TRA EVENTI
UNIONE (): L’unione tra due eventi A e B è quell’evento che si verifica quando si
verifica o A o B o entrambi, cioè si verifica ALMENO uno dei due eventi A e B.
L’operazione di unione si indica con A B e si legga “A o B” oppure “A unito B”.
Operativamente bisogna considerare tutti gli elementi di A e tutti gli elementi di B
presi UNA SOLA VOLTA.
INTERSEZIONE (): L’intersezione tra due eventi è l’evento che si verifica SOLO
SE si verificano sia A che B CONTEMPORANEAMENTE.
Questa operazione si indica con A B e si legge “A e B” oppure “A intersecato B”.
Operativamente bisogna considerare solo gli elementi COMUNI.
NEGAZIONE (
A
): la negazione dell’evento A è quell’evento che si verifica quando
NON si verifica A.
Questa operazione si indica con
A
che si legge “non A” oppure “A negato”.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a

Anteprima parziale del testo

Scarica Dispensa di statistica e più Dispense in PDF di Statistica solo su Docsity!

PROBABILITÀ

Approccio assiomatico:

  1. Individuazione dei concetti PRIMITIVI:  PROVA: sinonimo di esperimento probabilistico, ossia esperimento soggetto ad incertezza (l’esito non può essere previsto con certezza).  EVENTO: uno dei possibili risultati della prova. Gli eventi si indicano con le lettere maiuscole. L’insieme di TUTTI i possibili risultati di una prova viene detta SPAZIO CAMPIONARIO (o EVENTO CERTO perché almeno uno degli eventi di cui si compone deve verificarsi per forza). L’evento che non si verifica mai è detto EVENTO IMPOSSIBILE. Gli eventi si possono mettere in relazione tra loro attraverso l’ALGEBRA DI BOOLE (operazioni fondamentali  UNIONE, INTERSEZIONE, NEGAZIONE). Queste operazioni si possono rappresentare graficamente mediante i DIAGRAMMI DI VENN.  PROBABILITÀ: numero associato al verificarsi dell’evento.
  2. Enunciazione dei postulati (ASSIOMI): affermazioni non dimostrabili.
  3. TEOREMI dimostrabili attraverso i postulati. OPERAZIONI TRA EVENTI UNIONE (): L’unione tra due eventi A e B è quell’evento che si verifica quando si verifica o A o B o entrambi, cioè si verifica ALMENO uno dei due eventi A e B. L’operazione di unione si indica con A  B e si legga “A o B” oppure “A unito B”. Operativamente bisogna considerare tutti gli elementi di A e tutti gli elementi di B presi UNA SOLA VOLTA. INTERSEZIONE (): L’intersezione tra due eventi è l’evento che si verifica SOLO SE si verificano sia A che B CONTEMPORANEAMENTE. Questa operazione si indica con A  B e si legge “A e B” oppure “A intersecato B”. Operativamente bisogna considerare solo gli elementi COMUNI. NEGAZIONE ( A ): la negazione dell’evento A è quell’evento che si verifica quando NON si verifica A. Questa operazione si indica con A^ che si legge “non A” oppure “A negato”.

Due eventi si dicono INCOMPATIBILI se non possono verificarsi contemporaneamente: AB =  Due eventi si dicono NECESSARI se la loro unione è l’evento certo: AB =  Un evento A è incluso nell’evento B se tutte le volte che si verifica B certamente si verifica anche A: A  B (A incluso in B). Allo stesso modo si può anche dire che B include A  B  A. Se A è incluso in B e B è incluso in A, allora i due eventi coincidono. PROBABILITÀ Ci riferiamo alla probabilità come UN NUMERO ASSOCIATO AL PRESENTARSI DI UN EVENTO. Le interpretazioni alternative della probabilità sono:  CLASSICA  FREQUENTISTA  SOGGETTIVISTA POSTULATI DEL CALCOLO DELLA PROBABILITÀ  Postulato 1: la probabilità è una funzione che assegna ad ogni elemento di  (qualsiasi evento) un numero reale positivo o nullo (0). Non può esse mai negativa.  Postulato 2: l’evento certo o spazio campionario ha probabilità = 1.  Postulato 3: la probabilità dell’unione di due eventi incompatibili è uguale alla somma della probabilità dei singoli eventi. PROBABILITÀ CONDIZIONATA Quando capita di dover calcolare la probabilità del verificarsi di un evento B sapendo che un altro evento A, collegato al primo si è verificato. La probabilità dell’evento B DATO CHE l’evento A si è verificato si definisce probabilità CONDIZIONATA di B DATO A  P(B|A). Se il verificarsi di A NON modifica la probabilità del verificarsi di B, allora si dice che A e B sono EVENTI INDIPENDENTI quindi  P(B|A) = P(B). La probabilità di B dato A [P(B|A)] è definita come il RAPPORTO tra la probabilità dell’intersezione di A e B e la probabilità di A  P(B|A) = P ( A ∩B ) P ( A ) P(A  B) = P(A) P(B|A) esprime la probabilità dell’intersezione di due eventi come il prodotto della probabilità del primo evento per la probabilità del secondo evento dato che il primo evento già si è verificato.

Il teorema di Bayes consente di calcolare la probabilità che abbia agito una causa Ei nel manifestarsi dell’effetto A ovvero la probabilità P(Ei|A). Dato un effetto A ed m cause Ei, necessarie e incompatibili, il teorema di Bayes esprime la probabilità A POSTERIORI P(Ei|A), cioè la probabilità che avendo osservato l’evento A esso sia stato generato dalla causa Ei, in funzione delle probabilità a priori P(Ei) e delle verosimiglianze P(A|Ei). Esempio (virus|test positivo) P(V|T+) = P ( T +¿ V ) P ( V ) P ( T +¿ NV ) P ( NV ) + P ( T + ¿ V ) P ( V ) TEORIA DELLE VARIABILI CASUALI Una variabile casuale è una regola che associa ad ogni evento dello spazio campione un numero reale, quindi la vc stabilisce una corrispondenza tra gli eventi  e l’insieme dei numeri reali R. L’insieme dei valori che la vc può assumere è detta SUPPORTO della vc. Se i valori che una vc può assumere sono tutti i valori di un intervallo reale, la vc è CONTINUA; se invece assume solo un insieme finito o numerabile di valori si dice vc DISCRETA. Ad ogni evento corrisponde un solo numero reale, tuttavia lo stesso numero reale può essere associato a più eventi. La regola che crea la corrispondenza è arbitraria: la stessa prova può dare luogo a vc differenti a seconda di come viene definita la regola.  Insieme finito di eventi: i possibili valori assunti dalla vc sono una lista finita di numeri reali.  Insieme numerabile di eventi: i possibili valori assunti dalla vc sono in corrispondenza con i numeri interi e quindi sono infiniti ma numerabili. La vc DISCRETA è nota quando sono noti i valori che essa può assumere e le rispettive probabilità ovvero le coppie ( xi pi ¿^ dove pi = P (^ Xxi ); quindi, quando è nota la sua distribuzione di probabilità. La tabella che riporta l’insieme dei valori assumibili dalla vc con le rispettive probabilità è detta DISTRIBUZIONE DI PROBABILITÀ.

Una vc è CONTINUA se può assumere tutti i valori compresi in un qualsiasi intervallo di numeri reali. Poiché tali eventi (una infinità non numerabile) non è possibile elencarli, ognuno di essi ha probabilità nulla di verificarsi. Pertanto, per le vc continue non si fa riferimento alla probabilità del singolo valore x 0 ma consideriamo un intervallino infinitesimo del tipo ( x 0 ,^ x 0 − dx ). La probabilità che la vc assuma valore in tale intervallino è data dall’area sotto alla curva del rettangolino la cui base è definita proprio dall’intervallino ( x 0 ,^ x 0 − dx ). Una vc continua X è nota se conosciamo f(x) che è detta FUNZIONE DI DENSITÀ della vc continua X. Per calcolare l’area al di sotto della curva si utilizzano gli integrali. La vc continua è BEN DEFINITA quando è  0 e quando l’area sottesa alla curva è = 1. Anche la somma delle probabilità deve essere pari a 1. La funzione di densità NON è una probabilità, ma è solo PROPORZIONALE alla probabilità che la vc assuma valori in un intervallo infinitesimo. Una vc sia discreta che continua presuppone sempre la conoscenza di due informazioni:  I valori che la vc assume cioè il suo supporto  La distribuzione di probabilità oppure la funzione di densità, definita sul supporto Quando si devono confrontare vc, ricercare sintesi utili ed efficaci che tengano conto contemporaneamente sia dei valori che delle probabilità o densità. Le principali sintesi di una vc coinvolgono posizione e dispersione: ASPETTATIVA e RISCHIO. L’ aspettativa di una vc discreta X è indicata con E(X) ed è definita come il prodotto dei valori che una vc discreta assume per le corrispondenti probabilità. La quantità E(X) è definita anche VALOR MEDIO di una vc e viene indicata con il simbolo  (non confondere con media aritmetica); il valore medio è l’aspettativa che si ha circa una vc tenuto conto sia dei valori che delle probabilità. Esso non si riferisce a valori osservati ma ad un ipotetico esperimento probabilistico. Il valore medio di una costante è proprio la costante: E(c) = c. Proprietà: il valore medio di una somma (o differenza) è uguale alla somma (o differenza) dei valori medi. Il grado di rischio associato ad una vc deriva dalla dispersione dei suoi valori intorno al valore medio. Una misura di tale rischio è fornita dalla VARIANZA di una vc e viene indicata con Var(X) oppure con il simbolo σ 2 . Moltiplicando una variabile casuale per una costante la sua varianza viene moltiplicata per il quadrato della costante.

La varianza è nulla sia quando p = 0 (l’evento è impossibile), sia quando p = (l’evento è certo). In entrambi questi casi estremi, la vc di Bernoulli diventa una vc DEGENERE. VC BINOMIALE: Se si ripete per n volte e nelle medesime condizioni un esperimento Bernoulliano cioè caratterizzato da due soli esiti (successo ed insuccesso) si genera una sequenza di n sottoprove indipendenti a ciascuna delle quali si può associare una vc di Bernoulli. Tale schema equivale all’estrazione con ripetizione di n palline da un’urna. In tale prova interessa conoscere il numero X di volte in cui si è verificato l’evento E nel complesso delle n sottoprove, cioè il numero di successi in n prove. (es. quante volte esce testa, i nati maschi in tot ospedale, ecc.). Effettuando la prova si genera una sequenza di successi (se si verifica l’evento E) o insuccessi (se si verifica l’evento E ) cosicché lo spazio campione della prova consisterà di tutte le possibili sequenze di eventi E e E. Ad ogni sottoprova è associata una vc Ber (p) che assume valore 1 con probabilità p se si verifica E e il valore 0 con probabilità 1 – p se si verifica E. Pertanto, il numero X di successi in tutte le n sottoprove sarà esattamente pari al numero di volte che le vc di Bernoulli associate alle sottoprove hanno assunto il valore 1. In breve, la vc BINOMIALE conta il numero di successi in n sottoprove. Una vc discreta X si definisce binomiale se essa rappresenta il numero dei successi che si verificano in una sequenza di n sottoprove indipendenti nelle quali è costante la probabilità p di un successo. Essa dipende da due parametri (n, p) e sarà indicata con X Bin ( n , p ). Le possibili sequenze che danno luogo esattamente a x ed (n – x) insuccessi sono in numero pari alle combinazioni di elementi ad x ad x, cioè (^) ( n x )^ detto coefficiente binomiale. Siccome ciascuna sequenza è incompatibile con le altre, la probabilità che X assuma il valore x è la somma delle probabilità di tutte le (^) ( n x )^ sequenze che danno luogo ad x successi. Quindi la distribuzione di probabilità della vc X Bin ( n , p ) è: P ( X = x ) = ( n x )^ p x ¿ Tale distribuzione è ben definita perché P (^ X = x )^ ^^0 e si dimostra che la somma di tutte le probabilità è 1. Quando n = 1 la vc Binomiale coincide con la vc di Bernoulli. Valore medio Bin: E^ (^ X^ )^ = np Varianza Bin: Var^ (^ X^ )= np (^1 −^ p )

VC FREQUENZA: La variabile casuale binomiale può essere interpretata come la frequenza assoluta di un certo evento E (successo) in n sottoprove indipendenti. Per tali prove, si può anche definire la vc frequenza relativa Fn = X^ / n^ come il rapporto tra la vc binomiale e il numero n complessivo delle sottoprove. La vc frequenza relativa Fn possiede valore medio e varianza: E ( Fn )= E ( X n ) = np n = p Var ( Fn )= Var (^) ( X n ) = np ( 1 − p ) n^2 = p ( 1 − p ) n Per la vc frequenza assoluta valore medio e varianza crescono indefinitamente al crescere di n, per la vc frequenza relativa il valore medio è sempre p mentre la varianza tende a 0 per n  . In altri termini, per n  , la vc frequenza relativa tende a diventare una variabile casuale degenere assumendo solo il valore o con probabilità 1. VARIABILE CASUALE NORMALE Dipende da due parametri che sono il valor medio  e la varianza σ 2 . Ha una forma campanulare e simmetrica rispetto all’asse che passa per il valore medio. Il valore medio coincide con la moda e la mediana. Un vc X continua si dice vc NORMALE (o Gaussiana) con parametri  e σ^2 se è definita su tutto l’asse reale (quindi assume valori tra − ^ e + .  Se, a parità di σ 2 , si modifica il valore medio , allora la funzione di densità della vc Normale subisce una traslazione (si sposta) lungo l’asse X.  A parità di , se cresce σ 2 allora la curva diventa sempre più bassa e più piatta; al contrario, al diminuire di σ 2 la curva diventa sempre più alta e stretta.  La modifica della forma ha un riflesso sull’ampiezza dell’area sottesa alla curva nelle vicinanze del valor medio e nelle code; cioè ha un riflesso sulla probabilità dei valori vicini o distanti dal valor medio.  Se σ 2 0 la distribuzione della vc Normale tende a divenire DEGENERE perché assume, con probabilità 1, valori infinitamente vicini ad x = . Se X , σ 2 ) la trasformazione lineare Z =^ Xμ σ definisce la vc NORMALE STANDARDIZZATA Z (0,1). Come tutte le vc standardizzate, la vc Normale standardizzata ha valore medio uguale a 0 e varianza uguale a 1.

La vc CHI-QUADRATO è definita su tutto l’asse reale positivo (cioè tra 0 e infinito), ha valore medio pari a g e varianza pari a 2g. All’aumentare dei gdl la funzione di densità di questa vc tende a divenire sempre più simile a quella di una vc Normale. La vc F DI FISHER è costituita da due Chi-quadrato indipendenti e con gdl g 1 e g 2. I suoi parametri sono g 1 e g 2 , definiti gdl del numeratore e del denominatore, rispettivamente. La vc F di Fisher è definita su tutto l’asse reale positivo (non può avere valore negativo quindi). X = X 1 g 1 X 2 g 2 La vc T DI STUDENT ha parametro g, definto gdl. La vc T di Student è definita su tutto l’asse reale, presenta un valore medio pari a 0 ed ha una funzione di densità simmetrica e campanulare assai simile alla vc Normale standardizzata alla quale tende al crescere del parametro g. T = ZX g INFERENZA STATISTICA L’indagine campionaria si fonda su un sottoinsieme della popolazione di riferimento. L’obiettivo fondamentale è utilizzare i risultati ottenuti su un campione per acquisire delle conoscenze circa la popolazione da cui proviene il campione. Tale procedimenti di generalizzazione del campione all’intera popolazione da cui esso è stato estratto è l’oggetto dell’inferenza statistica. Definiamo POPOLAZIONE l’insieme delle informazioni statistiche che descrivono compiutamente il problema oggetto dello studio. Lo statistico traduce un problema reale in un problema statistico cioè un problema descrivibile mediante una vc. In pratica, in termini inferenziali vi è una coincidenza tra la popolazione e la vc X che descrive il fenomeno che vogliamo studiare su di essa. Dalla popolazione X viene estratto con ripetizione un sottoinsieme di n unità statistiche La procedura di selezione, PRIMA che essa sia concretamente realizzata, genera un CAMPIONE CASUALE costituito da vc indipendenti ed identicamente distribuite come la vc X di interesse nella popolazione.

DOPO aver effettuato l’esperimento si ottiene il CAMPIONE OSSERVATO costituito da numeri reali. Ogni numero reale xi rappresenta la realizzazione (cioè uno dei possibili valori) della vc Xi associata alla i-esima estrazione, ma in sostanza è una realizzazione della vc X definita nella popolazione. Le n vc campionarie sono n REPLICHE della vc X che descrive il fenomeno nella popolazione. Quindi:  Prima della selezione casuale la n-pla (X1, X2, …, Xn) rappresenta una n-pla di vc campionarie.  Dopo che la selezione casuale è stata concretamente effettuata, l’informazione di cui si dispone (x1, x2, …, xn) consiste in una n-pla di numeri reali. La procedura di scelta delle unità statistiche che entrano a far parte del campione forma l’oggetto della TEORIA DEI CAMPIONI. Non ha alcun senso parlare di un buon campione osservato o di un cattivo campione osservato. La qualità della procedura inferenziale può essere condotta ragionando sul campione casuale. Le procedure inferenziali della statistica sono tre, tra loro interconnesse:

  1. Teoria della stima: si cerca di determinare un valore numerico per il parametro (o i parametri) che caratterizza la popolazione X sulla base delle informazioni campionarie desumibili dal campione osservato.
  2. Test delle ipotesi: si cerca di valutare, sulla base delle informazioni campionarie, quale tra due affermazioni complementari (dette ipotesi statistiche) possa essere ritenuta maggiormente verosimile.
  3. Intervalli di confidenza: si cerca di determinare, sulla base dei dati campionari, un intervallo di valori in cui con un livello prefissato di fiducia possiamo ritenere che cada il parametro. Ogni procedura inferenziale richiede una sintesi del campione casuale e quindi di quello osservato una volta estratto. La sintesi delle vc è essa stessa una vc. Le funzioni che realizzano una sintesi del campione casuale sono definite statistiche. LE VC STATISTICHE  Definiamo statistica qualunque funzione a valori reali del campione T (^) n = T ( X 1 , X 2 ,… X (^) n ).  La statistica T^ n è una vc perché è funzione delle vc ( X 1 ,^ X 2 ,^ ^ Xn ).  Definiamo statistica calcolata il valore numerico tn = T^ (^ x 1 ,^ x 2 ,^ ^ xn )^ che la vc T^ n assume in corrispondenza di un particolare campione osservato ( x 1 ,^ x 2 ,…^ xn ).

La stima, essendo solo uno dei possibili valori che lo stimatore può assumere al variare del campione estratto, ha ben poco valore conoscitivo. Lo stimatore non è un valore numerico, ma è una variabile che ha delle proprietà. Le proprietà dello stimatore possono essere:  Finite = valide per ogni valore di n.  Asintotiche = valide per n grande (che tende ad ) Proprietà pratiche degli stimatori:  Non distorsione  Efficienza  Linearità Proprietà finite degli stimatori:

  1. Sufficienza: uno stimatore è sufficiente se riesce ad utilizzare tutta l’informazione utile presente nel campione che riguarda il parametro. Si può parlare di sufficienza solo presupponendo di conoscere la vc il cui parametro incognito intendiamo stimare. In modo informale, uno stimatore Tn è sufficiente se riassume ed esaurisce tutte le informazioni concernenti il parametro e contenute nel campione casuale. Una statistica sufficiente applicata ad un campione casuale ingloba in sé le informazioni presenti nel campione e che riguardano il parametro, tralasciando tutte le altre.
  2. Non distorsione: uno stimatore si dice non distorto se il suo valore medio coincide con il parametro da stimare (es. la media campionaria). Se lo stimatore è distorto invece il suo valore medio non coincide con il valore del parametro da stimare. La distorsione che denotiamo con b(Tn), (b è l’iniziale di bias) è pari alla differenza tra il valore medio dello stimatore e il parametro; cioè b^ (^ T^ n )= E^ (^ Tn )^ − parametro^ incognito.
  3. Efficienza: l’efficienza attiene alla stabilità di uno stimatore e può essere assoluta o relativa. Efficienza assoluta  si può valutare solo in relazione ad uno stimatore non distorto. Se uno stimatore è non distorto, quindi il suo valore coincide con il parametro da stimare, esso sarà anche efficiente in senso assoluto se presenta una varianza che è la più piccola possibile (es. media campionaria). NB: non distorsione ed efficienza sono proprietà finite degli stimatori.
  4. Linearità: uno stimatore si dice lineare se può essere espresso come combinazione lineare delle vc campionarie, quindi è una somma (es. media campionaria). Alcuni stimatori vengono definiti BLUE perché sono lineari e non distorti ed anche i più efficienti nell’insieme degli stimatori lineari e non distorti.

Proprietà asintotiche degli stimatori:

  1. Quando N è grande lo stimatore è asintoticamente non distorto  un parametro quindi si definire asintoticamente non distorto se al crescere di n la sua distorsione tende a diventare zero (e quindi il suo valore medio tende a coincidere con il parametro).
  2. Consistenza in media quadratica  se al crescere di n il suo MSE tende a zero (diventa sempre meno variabile).
  3. Normalità asintotica  se al crescere di n la distribuzione dello stimatore standardizzato tende alla normale standardizzata. Errore quadratico medio di uno stimatore: se lo stimatore è distorto (il suo valore medio non coincide con il parametro da stimare) anziché considerare la varianza considereremo l’errore quadratico medio (MSE)  l’MSE indica la variabilità di uno stimatore distorto. MSE (^) ( T (^) n )= Var (^) ( T (^) n )+¿ MSE serve anche per confrontare due diversi stimatori  dati due stimatori T^ 1 n e T^ 2 n di uno stesso parametro possiamo valutare l’efficienza relativa confrontando i loro MSE:

EFF ( T 1 n | T 2 n )=

MSE ( T 2 n )

MSE ( T 1 n ) {

se eff > 1 preferiamo T (^) 1 n se eff < 1 preferiamo T (^) 2 n se eff = 1 T (^) 1 n e T 2 n sono equivalenti Scegliamo sempre lo stimatore con MSE più piccolo perché sarà maggiormente efficiente. Metodo della Massima Verosimiglianza (ML): metodo di costruzione di uno stimatore. Gli stimatori ML possiedono tutte le proprietà desiderabili asintoticamente e sono presenti in tutte le procedure inferenziali (stima, test, intervalli di confidenza, ecc.). Essi derivano dal principio di verosimiglianza. L’ML si fonda sulla massimizzazione della funzione di verosimiglianza  se dobbiamo scegliere tra due possibili stime del parametro, è ragionevole scegliere quella che risulta più plausibile (verosimile) alla luce del campione che si è effettivamente osservato (che corrisponde a massimizzare la funzione di verosimiglianza). TEST DELLE IPOTESI Nel test delle ipotesi statistiche emerge chiaramente il ruolo della statistica come scienza delle decisioni in condizioni di incertezza. Il test delle ipotesi statistiche è una regola che in funzione del campione osservato ci consente di decidere se rifiutare o non rifiutare una ipotesi statistica H 0 riferita alla

L’errore del II tipo si verifica se non si rifiuta una ipotesi che invece era falsa. Questo errore viene ritenuto meno grave perché provoca una conferma dello status quo della conoscenza che poteva essere modificata essendo H 0 falsa. È impossibile minimizzare congiuntamente sia  che . Poiché l’errore del I tipo viene ritenuto più grave dell’errore di II tipo, la costruzione del test avviene fissando  molto piccolo e poi cercando di minimizzare  per il dato valore di  prefissato. Quando si rifiuta H 0 si dice che il test è significativo al livello  e questo significa che nel prendere la decisione di rifiutare l’ipotesi nulla la probabilità di commettere l’errore del I tipo è . Procedura operativa per un test delle ipotesi: individuare i valori critici ovvero le soglie che separano la regione di accettazione di H 0 dalla regione di rifiuto di H 0. A seconda del tipo di test si avrà:  Test unidirezionale a destra (maggiore di)  si rifiuta H 0 se tn >^  Test unidirezionale a sinistra (minore di)  si rifiuta H 0 se tn  Test bidirezionale (diverso da)  si rifiuta H 0 se tn ←^ 2 oppure tn >^ 2 Dove tn è la statistica calcolata, mentre i valori critici sono dedotti dalle tavole della distribuzione della vc statistica test. TEST SUL VALOR MEDIO DI UNA VC NORMALE Supponendo che la varianza sia nota utilizziamo la formula z ( Tn )= Xμ σ

√ n

Rifiuteremo H 0 se la statistica calcolata Tn = Xμ σ

√ n

dove è il valore dedotto dalla tavola z in corrispondenza di un’area di ampiezza  (ALL’INTERNO DELLA TABELLA).  Per confrontare valore critico ottenuto con formula z e valore critico cercare livello di significatività ALL’INTERNO della tabella e calcolarlo con zcalc. PRINCIPALI TEST PARAMETRICI

  1. Test sul valor medio di una vc normale con varianza non nota:  Per n <^30 : t = Xμ s

√ n −^1

con varianza corretta t : Xμ ^ s

√ n

Condizioni per rifiutare H 0 :

  1. H 1 :^ μ >^ μ 0 ^ tn > valore^ critico
  2. H 1 :^ μ <^ μ 0 ^ tnvalore^ critico
  3. H 1 :^ μ^ ^ μ 0 →tn^ >+ valore^ critico ( α^ /^2 ) o^ tn^ ← valore^ critico ( α^ /^2 )
  4. Test sulla differenza tra valori medi di vc normali con varianza incognita ma supposta uguale. Condizioni per rifiutare H 0 :
  5. H 1 :^ μxμ^ y >^0 ^ tn >^ valore^ critico
  6. H 1 :^ μxμ^ y <^0 ^ tnvalore^ critico
  7. H 1 :^ μxμ^ y ≠^^0 →tn^ >+ valore^ critico ( α 2 ) oppure tnvalore critico ( α 2 ) I valori critici sono dedotti dalla tavola della vc T di Student con gdl = n + m – 2.
  8. Test sul rapporto tra le varianze di vc normali: T (^) n ,m = sx , n 2 s (^) y, m 2 =^ σ (^) x 2 σ (^) y 2 F^ ( n −^1 ,^ m −^1 ) Serve per verificare l’ipotesi nulla che le varianze di due popolazioni siano uguali detta anche ipotesi di omogeneità delle varianze. H 0 : σ (^) x 2 = σ (^) y 2 equivalentemente H 0 : σ (^) x 2 σ (^) y 2 =^1 La statistica test Fn,m cui si fa riferimento è: Fn ,m = sX 2 sY 2 F ( n −^1 ,^ m −^1 ) Il test sul rapporto tra due varianze viene chiamato F di Fisher e viene utilizzato anche nell’ANOVA (analisi della varianza). Non è una distribuzione simmetrica ed è definita solo da valori positivi. Il valore critico si deduce dai valori critici sulla tabella n – 1 e m – 1. Al numeratore va sempre la varianza più grande proprio perché il risultato non può essere negativo. Se la statistica calcolata è maggiore del valore critico possiamo rifiutare l’ipotesi nulla.
  9. Test sul confronto tra proporzioni Condizioni per rifiutare H 0 :
  10. H 1 :^ p 1 >^ p 2 ^ zc^ > valore^ critico
  11. H 1 :^ p 1 <^ p 2 ^ zc^ ←^ valore^ critico
  12. H 1 :^ p 1 ^ p 2 ^ zc >+ valore^ critico ( α^ /^2 )^ o^ zc^ ← valore^ critico ( α^ /^2 )

PRIMA di procedere con il test ANOVA verificare omogeneità delle varianze con F di Fisher. Ai fini del test si utilizza la seguente statistica test: k = numero dei gruppi n = numerosità del campione Fn = DB k − 1 Dw nk sB 2 sW 2 Se H 0 è vera (cioè i valori medi sono tutti uguali) la statistica test Fn si distribuisce come una vc F di Fisher Fn F^ ( k^ −^1 ,^ nk^ ), con gdl (del numeratore) g 1 = k −^1 e (del denominatore) g 2 = nk. L’ipotesi nulla di uguaglianza dei valori medi dei vari trattamenti si rifiuta se: Fc > F ( k − 1 , nk ) Cioè se la statistica calcolata Fc è maggiore del valore critico F^ ( k^ −^1 ,^ nk^ )^ dedotto dalla tavola F. sB 2 =¿ DB k − 1 sW 2 =¿ Dw nk Le varianze sB 2 e sW 2 vengono anche indicate con MSB e MSW perché sono dei Mean Square. Il fatto che la statistica test risulti significativa nell’ANOVA vuol dire solo che le differenze campionarie nei valori medi non possono essere attribuite al caso, tuttavia non implica che l’effetto rilevato sul campione sia realmente importante ai fini delle decisioni da assumere. Occorre quindi valutare l’effect size che ci fornisce una indicazione della rilevanza dell’analisi. Tra le misure proposte vi sono eta-quadro (¿ 2 ) ¿ e omega-quadro (❑ 2 ).  Eta-quadro (¿ 2 )¿ è definito come il rapporto tra la devianza dei trattamenti DB e la devianza totale DT.  Omega-quadro (❑ 2 ) è una variante dell’indice eta-quadro. In teoria è normalizzato fra 0 e 1, ma ci sono situazioni in cui tale misura può diventare negativa. Omega-quadro è stato introdotto per disegni bilanciati o approssimativamente bilanciati.

Quando tutte o alcune delle assunzioni necessarie per condurre l’ANOVA non sono rispettate, si applica un test di tipo non parametrico che non è vincolato da quelle ipotesi sui dati e che prende il nome di Test di Kruskal-Wallis per l’ANOVA ad una via. Tale test è basato sui ranghi risposta associati alle risposte (dati dalla posizione occupata da ogni risposta nel loro elenco ordinato). CORRELAZIONE Nello scatterplot quando la nuvola di punti indica che al crescere di X cresce anche Y ci suggerisce che c’è un legame lineare tra le due variabili poiché la nuvola dei punti può essere approssimata da una retta, cioè da una relazione del tipo: y = ax + b (equazione di una retta). Dall’ispezione dello scatterplot possiamo comprendere anche se il legame è di tipo indiretto (+) o inverso (-) oppure se c’è assenza di legame. La misura delle variazioni congiunte è fornita dal COEFFICIENTE DI CORRELAZIONE LINEARE (r di Pearson) i valori variano tra -1 e +1. Nell’interpretazione va considerata la direzione del legame lineare espressa dal segno positivo (relazione diretta) o negativo (relazione inversa). Rispetto alla retta ideale che attraversa la nuvola dei punti il segno esprime se la retta avrà pendenza positiva o negativa. Il valore esprime la forza del legame lineare che può essere forte in senso positivo (prossimo a 1) o in senso negativo (prossimo a – 1). Se il valore è 0 non c’è correlazione lineare. Proprietà principali del coefficiente di correlazione lineare:

  1. Corr (X, Y) = Corr (Y, X)
  2. Corr (X, X) =
  3. – 1  Corr (X, Y)  + 1
  4. Se X e Y indipendenti  Corr (X, Y) = 0 REGRESSIONE LINEARE Spesso capita di raccogliere dati relativi ad una vc dipendente (detta variabile di risposta) Y relativa ad un fenomeno di interesse ed un insieme di variabili concomitanti (dette variabili esplicative con l’obiettivo di studiare le relazioni che sussistono tra la variabile dipendente e le variabili esplicative. Uno degli strumenti più rilevanti mediante i quali si conduce tale studio è costituito dalla modellistica statistica. In generale, un modello statistico stabilisce una relazione funzionale tra quello che si intende spiegare (variabile di risposta) e quello che può condizionare il valore (variabili esplicative). Il modello costituisce sempre una semplificazione della realtà che intende rappresentare, quindi: