


















Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Dispensa degli argomenti teorici principali dell'esame di Metodi statistici per la psicologia.
Tipologia: Dispense
1 / 26
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!



















Approccio assiomatico:
Due eventi si dicono INCOMPATIBILI se non possono verificarsi contemporaneamente: AB = Due eventi si dicono NECESSARI se la loro unione è l’evento certo: AB = Un evento A è incluso nell’evento B se tutte le volte che si verifica B certamente si verifica anche A: A B (A incluso in B). Allo stesso modo si può anche dire che B include A B A. Se A è incluso in B e B è incluso in A, allora i due eventi coincidono. PROBABILITÀ Ci riferiamo alla probabilità come UN NUMERO ASSOCIATO AL PRESENTARSI DI UN EVENTO. Le interpretazioni alternative della probabilità sono: CLASSICA FREQUENTISTA SOGGETTIVISTA POSTULATI DEL CALCOLO DELLA PROBABILITÀ Postulato 1: la probabilità è una funzione che assegna ad ogni elemento di (qualsiasi evento) un numero reale positivo o nullo (0). Non può esse mai negativa. Postulato 2: l’evento certo o spazio campionario ha probabilità = 1. Postulato 3: la probabilità dell’unione di due eventi incompatibili è uguale alla somma della probabilità dei singoli eventi. PROBABILITÀ CONDIZIONATA Quando capita di dover calcolare la probabilità del verificarsi di un evento B sapendo che un altro evento A, collegato al primo si è verificato. La probabilità dell’evento B DATO CHE l’evento A si è verificato si definisce probabilità CONDIZIONATA di B DATO A P(B|A). Se il verificarsi di A NON modifica la probabilità del verificarsi di B, allora si dice che A e B sono EVENTI INDIPENDENTI quindi P(B|A) = P(B). La probabilità di B dato A [P(B|A)] è definita come il RAPPORTO tra la probabilità dell’intersezione di A e B e la probabilità di A P(B|A) = P ( A ∩B ) P ( A ) P(A B) = P(A) P(B|A) esprime la probabilità dell’intersezione di due eventi come il prodotto della probabilità del primo evento per la probabilità del secondo evento dato che il primo evento già si è verificato.
Il teorema di Bayes consente di calcolare la probabilità che abbia agito una causa Ei nel manifestarsi dell’effetto A ovvero la probabilità P(Ei|A). Dato un effetto A ed m cause Ei, necessarie e incompatibili, il teorema di Bayes esprime la probabilità A POSTERIORI P(Ei|A), cioè la probabilità che avendo osservato l’evento A esso sia stato generato dalla causa Ei, in funzione delle probabilità a priori P(Ei) e delle verosimiglianze P(A|Ei). Esempio (virus|test positivo) P(V|T+) = P ( T +¿ V ) P ( V ) P ( T +¿ NV ) P ( NV ) + P ( T + ¿ V ) P ( V ) TEORIA DELLE VARIABILI CASUALI Una variabile casuale è una regola che associa ad ogni evento dello spazio campione un numero reale, quindi la vc stabilisce una corrispondenza tra gli eventi e l’insieme dei numeri reali R. L’insieme dei valori che la vc può assumere è detta SUPPORTO della vc. Se i valori che una vc può assumere sono tutti i valori di un intervallo reale, la vc è CONTINUA; se invece assume solo un insieme finito o numerabile di valori si dice vc DISCRETA. Ad ogni evento corrisponde un solo numero reale, tuttavia lo stesso numero reale può essere associato a più eventi. La regola che crea la corrispondenza è arbitraria: la stessa prova può dare luogo a vc differenti a seconda di come viene definita la regola. Insieme finito di eventi: i possibili valori assunti dalla vc sono una lista finita di numeri reali. Insieme numerabile di eventi: i possibili valori assunti dalla vc sono in corrispondenza con i numeri interi e quindi sono infiniti ma numerabili. La vc DISCRETA è nota quando sono noti i valori che essa può assumere e le rispettive probabilità ovvero le coppie ( xi pi ¿^ dove pi = P (^ X − xi ); quindi, quando è nota la sua distribuzione di probabilità. La tabella che riporta l’insieme dei valori assumibili dalla vc con le rispettive probabilità è detta DISTRIBUZIONE DI PROBABILITÀ.
Una vc è CONTINUA se può assumere tutti i valori compresi in un qualsiasi intervallo di numeri reali. Poiché tali eventi (una infinità non numerabile) non è possibile elencarli, ognuno di essi ha probabilità nulla di verificarsi. Pertanto, per le vc continue non si fa riferimento alla probabilità del singolo valore x 0 ma consideriamo un intervallino infinitesimo del tipo ( x 0 ,^ x 0 − dx ). La probabilità che la vc assuma valore in tale intervallino è data dall’area sotto alla curva del rettangolino la cui base è definita proprio dall’intervallino ( x 0 ,^ x 0 − dx ). Una vc continua X è nota se conosciamo f(x) che è detta FUNZIONE DI DENSITÀ della vc continua X. Per calcolare l’area al di sotto della curva si utilizzano gli integrali. La vc continua è BEN DEFINITA quando è 0 e quando l’area sottesa alla curva è = 1. Anche la somma delle probabilità deve essere pari a 1. La funzione di densità NON è una probabilità, ma è solo PROPORZIONALE alla probabilità che la vc assuma valori in un intervallo infinitesimo. Una vc sia discreta che continua presuppone sempre la conoscenza di due informazioni: I valori che la vc assume cioè il suo supporto La distribuzione di probabilità oppure la funzione di densità, definita sul supporto Quando si devono confrontare vc, ricercare sintesi utili ed efficaci che tengano conto contemporaneamente sia dei valori che delle probabilità o densità. Le principali sintesi di una vc coinvolgono posizione e dispersione: ASPETTATIVA e RISCHIO. L’ aspettativa di una vc discreta X è indicata con E(X) ed è definita come il prodotto dei valori che una vc discreta assume per le corrispondenti probabilità. La quantità E(X) è definita anche VALOR MEDIO di una vc e viene indicata con il simbolo (non confondere con media aritmetica); il valore medio è l’aspettativa che si ha circa una vc tenuto conto sia dei valori che delle probabilità. Esso non si riferisce a valori osservati ma ad un ipotetico esperimento probabilistico. Il valore medio di una costante è proprio la costante: E(c) = c. Proprietà: il valore medio di una somma (o differenza) è uguale alla somma (o differenza) dei valori medi. Il grado di rischio associato ad una vc deriva dalla dispersione dei suoi valori intorno al valore medio. Una misura di tale rischio è fornita dalla VARIANZA di una vc e viene indicata con Var(X) oppure con il simbolo σ 2 . Moltiplicando una variabile casuale per una costante la sua varianza viene moltiplicata per il quadrato della costante.
La varianza è nulla sia quando p = 0 (l’evento è impossibile), sia quando p = (l’evento è certo). In entrambi questi casi estremi, la vc di Bernoulli diventa una vc DEGENERE. VC BINOMIALE: Se si ripete per n volte e nelle medesime condizioni un esperimento Bernoulliano cioè caratterizzato da due soli esiti (successo ed insuccesso) si genera una sequenza di n sottoprove indipendenti a ciascuna delle quali si può associare una vc di Bernoulli. Tale schema equivale all’estrazione con ripetizione di n palline da un’urna. In tale prova interessa conoscere il numero X di volte in cui si è verificato l’evento E nel complesso delle n sottoprove, cioè il numero di successi in n prove. (es. quante volte esce testa, i nati maschi in tot ospedale, ecc.). Effettuando la prova si genera una sequenza di successi (se si verifica l’evento E) o insuccessi (se si verifica l’evento E ) cosicché lo spazio campione della prova consisterà di tutte le possibili sequenze di eventi E e E. Ad ogni sottoprova è associata una vc Ber (p) che assume valore 1 con probabilità p se si verifica E e il valore 0 con probabilità 1 – p se si verifica E. Pertanto, il numero X di successi in tutte le n sottoprove sarà esattamente pari al numero di volte che le vc di Bernoulli associate alle sottoprove hanno assunto il valore 1. In breve, la vc BINOMIALE conta il numero di successi in n sottoprove. Una vc discreta X si definisce binomiale se essa rappresenta il numero dei successi che si verificano in una sequenza di n sottoprove indipendenti nelle quali è costante la probabilità p di un successo. Essa dipende da due parametri (n, p) e sarà indicata con X Bin ( n , p ). Le possibili sequenze che danno luogo esattamente a x ed (n – x) insuccessi sono in numero pari alle combinazioni di elementi ad x ad x, cioè (^) ( n x )^ detto coefficiente binomiale. Siccome ciascuna sequenza è incompatibile con le altre, la probabilità che X assuma il valore x è la somma delle probabilità di tutte le (^) ( n x )^ sequenze che danno luogo ad x successi. Quindi la distribuzione di probabilità della vc X Bin ( n , p ) è: P ( X = x ) = ( n x )^ p x ¿ Tale distribuzione è ben definita perché P (^ X = x )^ ≥^^0 e si dimostra che la somma di tutte le probabilità è 1. Quando n = 1 la vc Binomiale coincide con la vc di Bernoulli. Valore medio Bin: E^ (^ X^ )^ = np Varianza Bin: Var^ (^ X^ )= np (^1 −^ p )
VC FREQUENZA: La variabile casuale binomiale può essere interpretata come la frequenza assoluta di un certo evento E (successo) in n sottoprove indipendenti. Per tali prove, si può anche definire la vc frequenza relativa Fn = X^ / n^ come il rapporto tra la vc binomiale e il numero n complessivo delle sottoprove. La vc frequenza relativa Fn possiede valore medio e varianza: E ( Fn )= E ( X n ) = np n = p Var ( Fn )= Var (^) ( X n ) = np ( 1 − p ) n^2 = p ( 1 − p ) n Per la vc frequenza assoluta valore medio e varianza crescono indefinitamente al crescere di n, per la vc frequenza relativa il valore medio è sempre p mentre la varianza tende a 0 per n . In altri termini, per n , la vc frequenza relativa tende a diventare una variabile casuale degenere assumendo solo il valore o con probabilità 1. VARIABILE CASUALE NORMALE Dipende da due parametri che sono il valor medio e la varianza σ 2 . Ha una forma campanulare e simmetrica rispetto all’asse che passa per il valore medio. Il valore medio coincide con la moda e la mediana. Un vc X continua si dice vc NORMALE (o Gaussiana) con parametri e σ^2 se è definita su tutto l’asse reale (quindi assume valori tra − ∞^ e + ∞. Se, a parità di σ 2 , si modifica il valore medio , allora la funzione di densità della vc Normale subisce una traslazione (si sposta) lungo l’asse X. A parità di , se cresce σ 2 allora la curva diventa sempre più bassa e più piatta; al contrario, al diminuire di σ 2 la curva diventa sempre più alta e stretta. La modifica della forma ha un riflesso sull’ampiezza dell’area sottesa alla curva nelle vicinanze del valor medio e nelle code; cioè ha un riflesso sulla probabilità dei valori vicini o distanti dal valor medio. Se σ 2 0 la distribuzione della vc Normale tende a divenire DEGENERE perché assume, con probabilità 1, valori infinitamente vicini ad x = . Se X , σ 2 ) la trasformazione lineare Z =^ X − μ σ definisce la vc NORMALE STANDARDIZZATA Z (0,1). Come tutte le vc standardizzate, la vc Normale standardizzata ha valore medio uguale a 0 e varianza uguale a 1.
La vc CHI-QUADRATO è definita su tutto l’asse reale positivo (cioè tra 0 e infinito), ha valore medio pari a g e varianza pari a 2g. All’aumentare dei gdl la funzione di densità di questa vc tende a divenire sempre più simile a quella di una vc Normale. La vc F DI FISHER è costituita da due Chi-quadrato indipendenti e con gdl g 1 e g 2. I suoi parametri sono g 1 e g 2 , definiti gdl del numeratore e del denominatore, rispettivamente. La vc F di Fisher è definita su tutto l’asse reale positivo (non può avere valore negativo quindi). X = X 1 g 1 X 2 g 2 La vc T DI STUDENT ha parametro g, definto gdl. La vc T di Student è definita su tutto l’asse reale, presenta un valore medio pari a 0 ed ha una funzione di densità simmetrica e campanulare assai simile alla vc Normale standardizzata alla quale tende al crescere del parametro g. T = Z √ X g INFERENZA STATISTICA L’indagine campionaria si fonda su un sottoinsieme della popolazione di riferimento. L’obiettivo fondamentale è utilizzare i risultati ottenuti su un campione per acquisire delle conoscenze circa la popolazione da cui proviene il campione. Tale procedimenti di generalizzazione del campione all’intera popolazione da cui esso è stato estratto è l’oggetto dell’inferenza statistica. Definiamo POPOLAZIONE l’insieme delle informazioni statistiche che descrivono compiutamente il problema oggetto dello studio. Lo statistico traduce un problema reale in un problema statistico cioè un problema descrivibile mediante una vc. In pratica, in termini inferenziali vi è una coincidenza tra la popolazione e la vc X che descrive il fenomeno che vogliamo studiare su di essa. Dalla popolazione X viene estratto con ripetizione un sottoinsieme di n unità statistiche La procedura di selezione, PRIMA che essa sia concretamente realizzata, genera un CAMPIONE CASUALE costituito da vc indipendenti ed identicamente distribuite come la vc X di interesse nella popolazione.
DOPO aver effettuato l’esperimento si ottiene il CAMPIONE OSSERVATO costituito da numeri reali. Ogni numero reale xi rappresenta la realizzazione (cioè uno dei possibili valori) della vc Xi associata alla i-esima estrazione, ma in sostanza è una realizzazione della vc X definita nella popolazione. Le n vc campionarie sono n REPLICHE della vc X che descrive il fenomeno nella popolazione. Quindi: Prima della selezione casuale la n-pla (X1, X2, …, Xn) rappresenta una n-pla di vc campionarie. Dopo che la selezione casuale è stata concretamente effettuata, l’informazione di cui si dispone (x1, x2, …, xn) consiste in una n-pla di numeri reali. La procedura di scelta delle unità statistiche che entrano a far parte del campione forma l’oggetto della TEORIA DEI CAMPIONI. Non ha alcun senso parlare di un buon campione osservato o di un cattivo campione osservato. La qualità della procedura inferenziale può essere condotta ragionando sul campione casuale. Le procedure inferenziali della statistica sono tre, tra loro interconnesse:
La stima, essendo solo uno dei possibili valori che lo stimatore può assumere al variare del campione estratto, ha ben poco valore conoscitivo. Lo stimatore non è un valore numerico, ma è una variabile che ha delle proprietà. Le proprietà dello stimatore possono essere: Finite = valide per ogni valore di n. Asintotiche = valide per n grande (che tende ad ) Proprietà pratiche degli stimatori: Non distorsione Efficienza Linearità Proprietà finite degli stimatori:
Proprietà asintotiche degli stimatori:
MSE ( T 2 n )
se eff > 1 preferiamo T (^) 1 n se eff < 1 preferiamo T (^) 2 n se eff = 1 T (^) 1 n e T 2 n sono equivalenti Scegliamo sempre lo stimatore con MSE più piccolo perché sarà maggiormente efficiente. Metodo della Massima Verosimiglianza (ML): metodo di costruzione di uno stimatore. Gli stimatori ML possiedono tutte le proprietà desiderabili asintoticamente e sono presenti in tutte le procedure inferenziali (stima, test, intervalli di confidenza, ecc.). Essi derivano dal principio di verosimiglianza. L’ML si fonda sulla massimizzazione della funzione di verosimiglianza se dobbiamo scegliere tra due possibili stime del parametro, è ragionevole scegliere quella che risulta più plausibile (verosimile) alla luce del campione che si è effettivamente osservato (che corrisponde a massimizzare la funzione di verosimiglianza). TEST DELLE IPOTESI Nel test delle ipotesi statistiche emerge chiaramente il ruolo della statistica come scienza delle decisioni in condizioni di incertezza. Il test delle ipotesi statistiche è una regola che in funzione del campione osservato ci consente di decidere se rifiutare o non rifiutare una ipotesi statistica H 0 riferita alla
L’errore del II tipo si verifica se non si rifiuta una ipotesi che invece era falsa. Questo errore viene ritenuto meno grave perché provoca una conferma dello status quo della conoscenza che poteva essere modificata essendo H 0 falsa. È impossibile minimizzare congiuntamente sia che . Poiché l’errore del I tipo viene ritenuto più grave dell’errore di II tipo, la costruzione del test avviene fissando molto piccolo e poi cercando di minimizzare per il dato valore di prefissato. Quando si rifiuta H 0 si dice che il test è significativo al livello e questo significa che nel prendere la decisione di rifiutare l’ipotesi nulla la probabilità di commettere l’errore del I tipo è . Procedura operativa per un test delle ipotesi: individuare i valori critici cα ovvero le soglie che separano la regione di accettazione di H 0 dalla regione di rifiuto di H 0. A seconda del tipo di test si avrà: Test unidirezionale a destra (maggiore di) si rifiuta H 0 se tn >^ cα Test unidirezionale a sinistra (minore di) si rifiuta H 0 se tn ← cα Test bidirezionale (diverso da) si rifiuta H 0 se tn ←^ cα 2 oppure tn >^ cα 2 Dove tn è la statistica calcolata, mentre i valori critici sono dedotti dalle tavole della distribuzione della vc statistica test. TEST SUL VALOR MEDIO DI UNA VC NORMALE Supponendo che la varianza sia nota utilizziamo la formula z ( Tn )= X − μ σ
Rifiuteremo H 0 se la statistica calcolata Tn = X − μ σ
zα dove zα è il valore dedotto dalla tavola z in corrispondenza di un’area di ampiezza (ALL’INTERNO DELLA TABELLA). Per confrontare valore critico ottenuto con formula z e valore critico cercare livello di significatività ALL’INTERNO della tabella e calcolarlo con zcalc. PRINCIPALI TEST PARAMETRICI
con varianza corretta t : X − μ ^ s
Condizioni per rifiutare H 0 :
PRIMA di procedere con il test ANOVA verificare omogeneità delle varianze con F di Fisher. Ai fini del test si utilizza la seguente statistica test: k = numero dei gruppi n = numerosità del campione Fn = DB k − 1 Dw n − k sB 2 sW 2 Se H 0 è vera (cioè i valori medi sono tutti uguali) la statistica test Fn si distribuisce come una vc F di Fisher Fn F^ ( k^ −^1 ,^ n − k^ ), con gdl (del numeratore) g 1 = k −^1 e (del denominatore) g 2 = n − k. L’ipotesi nulla di uguaglianza dei valori medi dei vari trattamenti si rifiuta se: Fc > F ( k − 1 , n − k ) Cioè se la statistica calcolata Fc è maggiore del valore critico F^ ( k^ −^1 ,^ n − k^ )^ dedotto dalla tavola F. sB 2 =¿ DB k − 1 sW 2 =¿ Dw n − k Le varianze sB 2 e sW 2 vengono anche indicate con MSB e MSW perché sono dei Mean Square. Il fatto che la statistica test risulti significativa nell’ANOVA vuol dire solo che le differenze campionarie nei valori medi non possono essere attribuite al caso, tuttavia non implica che l’effetto rilevato sul campione sia realmente importante ai fini delle decisioni da assumere. Occorre quindi valutare l’effect size che ci fornisce una indicazione della rilevanza dell’analisi. Tra le misure proposte vi sono eta-quadro (¿ 2 ) ¿ e omega-quadro (❑ 2 ). Eta-quadro (¿ 2 )¿ è definito come il rapporto tra la devianza dei trattamenti DB e la devianza totale DT. Omega-quadro (❑ 2 ) è una variante dell’indice eta-quadro. In teoria è normalizzato fra 0 e 1, ma ci sono situazioni in cui tale misura può diventare negativa. Omega-quadro è stato introdotto per disegni bilanciati o approssimativamente bilanciati.
Quando tutte o alcune delle assunzioni necessarie per condurre l’ANOVA non sono rispettate, si applica un test di tipo non parametrico che non è vincolato da quelle ipotesi sui dati e che prende il nome di Test di Kruskal-Wallis per l’ANOVA ad una via. Tale test è basato sui ranghi risposta associati alle risposte (dati dalla posizione occupata da ogni risposta nel loro elenco ordinato). CORRELAZIONE Nello scatterplot quando la nuvola di punti indica che al crescere di X cresce anche Y ci suggerisce che c’è un legame lineare tra le due variabili poiché la nuvola dei punti può essere approssimata da una retta, cioè da una relazione del tipo: y = ax + b (equazione di una retta). Dall’ispezione dello scatterplot possiamo comprendere anche se il legame è di tipo indiretto (+) o inverso (-) oppure se c’è assenza di legame. La misura delle variazioni congiunte è fornita dal COEFFICIENTE DI CORRELAZIONE LINEARE (r di Pearson) i valori variano tra -1 e +1. Nell’interpretazione va considerata la direzione del legame lineare espressa dal segno positivo (relazione diretta) o negativo (relazione inversa). Rispetto alla retta ideale che attraversa la nuvola dei punti il segno esprime se la retta avrà pendenza positiva o negativa. Il valore esprime la forza del legame lineare che può essere forte in senso positivo (prossimo a 1) o in senso negativo (prossimo a – 1). Se il valore è 0 non c’è correlazione lineare. Proprietà principali del coefficiente di correlazione lineare: