Scarica dispense statistica psicometrica e più Sbobinature in PDF di Statistica Psicometrica solo su Docsity!
IL METODO SCIENTIFICO
Il metodo scientifico consente di comprendere a fondo il perché dell’approccio psicometrico, dove ci si concentra sulle criticità di costrutti e teorie. La psicometria si occupa di studiare i metodi che servono a sviluppare, validare e costruire gli strumenti di misura in psicologia (in modo da scegliere e usare il miglior strumento possibile nello svolgimento della professione). La statistica psicometrica è una parte della psicometria, che caratterizza la ricerca nei vari ambiti della psicologia. Essa può essere usata da tutti gli psicologi, mentre può essere insegnata dopo una formazione appropriata. Il metodo scientifico si definisce tale perché è distinguibile dal metodo non scientifico. Il concetto attuale di scienza è evoluto soprattutto in riferimento al metodo , che determina ciò che è scientifico e ciò che non lo è. Le caratteristiche del metodo scientifico sono condivise dalla comunità scientifica e sono sottoposte a continue revisioni e cambiamenti (la statistica utilizza la matematica per fare descrizioni e previsioni). Il metodo adottato viene continuamente revisionato, anche per gli aspetti matematici. Per questo motivo viene definito scientifico, esso è valido perché è criticabile e può mettere in luce tutti i limiti della nostra conoscenza. Tale metodo è basato sulla logica (le affermazioni teoriche che spiegano i fenomeni sono legate fra loro secondo le regole della logica). Tuttavia, la logica formale non è sufficiente ed è necessario fare anche una verifica empirica di ciò che logicamente vogliamo sostenere. Quindi, viene usato l’esperimento scientifico per valutare la veridicità delle affermazioni teoriche. La parte pratica, ovvero l’esperimento, ci dà l’idea della veridicità del fenomeno. La prova sperimentale è usata in molti campi per verificare un'ipotesi o dimostrare un'idea. Quindi, la dimostrazione sperimentale parte ipotizzando l'esistenza di una legge scientifica, in base a cui si prevede il risultato di un esperimento. Dopo aver effettuato l'esperimento di verifica, in base al risultato ottenuto, ci sono due possibilità: l'ipotesi di partenza è stata verificata o l'ipotesi di partenza non è stata verificata. Tuttavia, la conclusione è soggetta a possibili errori, quindi, non è una certezza. Non ci sono verità assolute, ma conoscenze con un certo grado di sicurezza per essere affermate. Abbiamo bisogno di stimare l’errore grazie alla statistica che valuta l’indeterminatezza nelle affermazioni teoriche, valutate tramite l’esperimento in modo da capire la variabilità attribuibile all’errore e la variabilità dovuta alle caratteristiche del fenomeno. La statistica ci permette di determinare tutto ciò. Rispetto ai fenomeni e ai relativi errori ci sono due approcci paralleli:
- statistica descrittiva = si basa su una logica induttiva e si pone l’obiettivo di descrivere il fenomeno e si parte dall’osservazione della realtà empirica molto complessa. In particolare, la descrizione non parte dall’ipotesi ma dal campione e cerca di capire se ci sono delle possibili spiegazioni interpretative del fenomeno. Infatti, ottimizza i parametri e le misure sulla base dei dati raccolti. Ciò consente di dare le migliori interpretazioni possibili del fenomeno riuscendo a rappresentare sinteticamente i diversi valori relativi ai soggetti di un determinato gruppo (media, frequenza, percentuale, ecc). In particolar modo, ci si riferisce alla bontà della misura , che indica quanto è efficiente la stima della misura rispetto al campione stesso (non alla popolazione generale). Dal campione si vogliono avere delle informazioni sintetiche e indicative del funzionamento del fenomeno, quindi, non c’è un’ipotesi di partenza ma ci possono essere tante ipotesi interpretative. Quindi, si prendono in considerazione tanti indici e generalmente un campione numeroso in modo che l’efficienza della descrizione sia maggiore. Rispetto a ciò sono cruciali le tecniche di campionamento e la scelta delle variabili. Questa tipologia di statistica presenta diverse fonti di arbitrarietà che essa stessa non riesce a risolvere, l’unica soluzione è utilizzare diversi indici descrittivi. Tuttavia, questi indici non sono riferiti ad un errore di misura, ci dicono solo quanto la statistica è buona rispetto ai dati sperimentali (non ci dicono la probabilità di errore). In questo caso si ha solo una stima dell’efficienza dei parametri. Tuttavia, non si ha la possibilità di avere delle stime di quanto il risultato ottenuto sia generalizzabile nell’intera popolazione. Si è concentrati nella prospettiva di guardare il fenomeno, selezionare gli elementi più importanti per interpretarlo e si fa riferimento alla statistica per scegliere la strada migliore;
- statistica inferenziale = questa tipologia di logica è deduttiva e non ha bisogno della descrizione, perché ce l’ha già in mente e vuole verificare se essa è vera per la popolazione in generale a cui il fenomeno si riferisce. Prima di raccogliere i dati, formulo un’ipotesi che corrisponde alla formulazione di un’interpretazione del fenomeno dove vengono già descritte le relazioni tra le parti. In seguito, formulo un esperimento e raccolgo dati per cercare di convalidare o meno un’ipotesi. Essa parte da un’ipotesi e attua una serie di procedure per validarla, per poi alla fine, attraverso l’esperimento, dire con quale probabilità di errore riusciamo a generalizzare l’ipotesi sull’intera popolazione. La statistica inferenziale ha sempre bisogno di quella descrittiva, ma non è vero il contrario. La statistica descrittiva è fondamentale per interpretare il risultato ottenuto da quella inferenziale. L’approccio descrittivo puro permette di dimostrare un fenomeno che è considerato ancora troppo complesso per permettere di definire delle ipotesi.
La statistica descrittiva ci permette di aiutare la statistica inferenziale, la quale non ci permette di descrivere ulteriormente quella legge che vogliamo dimostrare ma ci dice solo se l’ipotesi può essere dimostrata o meno. Da un punto di vista inferenziale, noi possiamo avere tre tipologie di approccio:
- approccio frequentista (o fisheriano) = esso è stato sfruttato nello sviluppo dei test statistici in modo anticipato ed è quello più usato.
- approccio Bayesiano = ha sviluppato test statistici più avanti nel tempo e si pone in contrapposizione alla logica falsificazionista. Esso cerca di superare l’aspetto critico della logica falsificazionista, ovvero dimostrare vera un’idea falsificando quella opposta. La logica Bayesiana corrisponde ad un metodo in grado di confrontare le probabilità di ciascuna delle diverse idee, quindi, l’idea migliore viene decisa sulla base di un ragionamento probabilistico. Una scuola di pensiero afferma che in questo caso non c’è bisogno di soglie, infatti, è il ricercatore che, sulla base della realtà empirica, definisce la soglia migliore per riuscire a dimostrare la veridicità di un’ipotesi (questo deve essere fatto a priori, prima di raccogliere i dati). In questa logica, alla fine, ho un grado di credibilità dell’ipotesi, che confronto con il grado di credibilità di altre ipotesi.
- approccio alla cieca = non viene posto l’accento sulla valutazione statistica della dimostrazione che verrà effettuata. Esso non è un approccio scientifico e per questo viene poco usato. Sia l’approccio bayesiano che frequentista devono usare indici statistici che permettono di descrivere il campione e fare misure su esso. La media è una statistica descrittiva, che descrive l’andamento dei dati in una misura quantitativa. Ad esempio, la media aritmetica viene calcolata sommando tutti i punteggi e dividendo per il loro numero. In questo modo vedo in linea di massima l’andamento dei punteggi. La media è un buono strumento quando rappresenta il valore che, nel modo più efficiente, rappresenta l’andamento dei dati. Quindi, se i dati sono distribuiti in modo simmetrico rappresenta il modo in cui viene delineato l’andamento della popolazione. Tale strumento diventa un parametro per misurare l’andamento della popolazione, ma serve anche a capire quanto è precisa la stima curata. Essa viene usata, quindi, anche con altri parametri che rilevano l’oscillazione casuale per comprendere i valori di dispersione. Quando stimo una media su un campione penso di poter raggiungere il valore vero: si vuole prevedere il valore vero/teorico della popolazione, quel valore che se raccolgo qualsiasi altro campione casuale dovrebbe essere abbastanza simile. La distribuzione simmetrica è la migliore per raggiungere ciò. Si parla spesso di distribuzione gaussiana , che in realtà è solo teorica ed è un modello di riferimento. Più il campione tende a questa distribuzione più sono in grado di rilevare la distribuzione del campione in termini di media, sia la sua oscillazione causale. Noi vogliamo fare delle inferenze sul campione , che permettono di fare previsioni sulla popolazione. L’obiettivo è trovare leggi vere sull’intera popolazione, non solo sul campione. Quindi, la media deve essere riferita all’intera popolazione e per questo vengono fatte assunzioni. In questo modo siamo in grado di scegliere la statistica opportuna e passare dai dati raccolti sul campione a quelli generalizzabili sulla popolazione. Questo viene fatto sia in una logica Bayesiana che Fisheriana. Quindi, sia l’approccio Bayesiano che Fisheriano si occupano di stimare il valore vero e l’oscillazione casuale attorno ad esso tramite i dati raccolti con l’esperimento e danno una interpretazione dei parametri in termini probabilistici, ma con una logica e con calcoli totalmente diversi fra loro. In sostanza, la logica bayesiana stima la probabilità dei parametri sulla base dei dati sperimentali, mentre la logica frequentista stima la probabilità sulla base di parametri teorici.
Alcuni principi della logica falsificazionista
Il razionalismo critico di Popper si basa sul criterio della demarcazione in base al quale “è scientifica ogni affermazione (teoria) che può essere confutabile, ovvero quella che nella sua formulazione logica permette la possibilità di essere falsificata”. La ricerca scientifica non inizia dall’osservazione ma dai problemi che vengono risolti attraverso la dimostrazione empirica. Infatti, la scienza avanza per tentativi ed errori. Si definisce scientifica una teoria criticabile/confutabile (che non significa che la teoria deve essere confutata, ma che deve essere confutabile). Quindi, su una teoria deve essere testata la veridicità , in modo tale da riuscire a replicare il risultato. Oltretutto, serve chiarezza nella descrizione delle parti. La possibilità di confutare teorie sta alla base della misura dell’errore di una teoria. La dimostrazione di una teoria parte da un’ ipotesi. Per dimostrare una teoria non si parte dall’esperimento, esso è una conseguenza dell’ipotesi che deriva dalle informazioni che si hanno a riguardo. Una teoria non è scientifica quando non prevede la possibilità di misurare l’errore e va a determinare delle verità assolute (oltre, a quando non è confutabile e non può essere falsificata). Ciò accade quando:
- incompleta = mancano dei concetti che caratterizzano le parti;
- troppo complessa = diventa difficile l’interpretazione;
- scarsa precisione nella definizione delle relazioni e della misura delle parti che la compongono. Ad esempio, le teorie dogmatiche (teoria dell’inconscio) e le teorie tautologiche sono troppo indeterminate sotto molti aspetti e questo non permette la misurazione.
contempo è impossibile dimostrare l’assenza di relazioni o differenze (le relazioni tra più cose che compongono il fenomeno le troviamo sempre, anche se deboli). In particolare, nell’ipotesi sperimentale ci sono relazioni già stabilite, nell’ipotesi nulla queste sono formulate in senso complementare. Dopo aver identificato le due ipotesi, risulta importante identificare anche una distribuzione di valori attorno al valore vero dell’ipotesi nulla (che sarebbe zero), che caratterizza la possibilità di incorrere in errore. La distribuzione di probabilità che stimiamo attorno al valore vero dell’ipotesi nulla è automaticamente determinata e deve essere falsificata. Normalmente prendiamo il 95% dell’intervallo attorno al valore vero dell’ipotesi nulla. In seguito, dopo aver identificato l’ipotesi nulla e la sua distribuzione dobbiamo scegliere le variabili e il campione. Un campione è una parte, necessariamente ridotta, di punteggi selezionati dalla totalità dei punteggi. Una popolazione è l'intero insieme di punteggi. Quindi, un campione è un piccolo insieme o sottoinsieme preso dalla popolazione o dall'intero insieme di punteggi. Sia popolazione che campione si riferiscono ai punteggi di una variabile. In alcuni casi, la totalità dei punteggi è potenzialmente reperibile, ma spesso la popolazione dei punteggi è infinita e, quindi, è impossibile da specificare nella sua totalità. Infatti, nella ricerca il campione è conosciuto in dettaglio mentre la popolazione è generalmente sconosciuta. Tuttavia, il campione con ampiezza maggiore produce una stima migliore della media della popolazione. I campioni possono solo approssimare le caratteristiche della popolazione, ma generalmente le informazioni che si ricavano si ritengono sufficienti per trarne delle decisioni sulla popolazione. Se non si hanno informazioni dirette della popolazione, a parte le caratteristiche di un campione estratto dalla popolazione di punteggi, la migliore deduzione o inferenza sulle caratteristiche della popolazione riguarda le caratteristiche del campione selezionato da quella popolazione. Il campione deve presentare alcune caratteristiche fondamentali:
- rappresentativo e idoneo = il campione deve essere rappresentativo dell’intera popolazione, rispetto a cui devo andare nella letteratura a individuare i criteri di esclusione e inclusione che vengono definiti a priori in manuali (dove vengono riportati i sintomi delle varie patologie come il DMS). In questi sono spiegate le caratteristiche che l’individuo deve avere per fare parte di una categoria di popolazione e le caratteristiche che non devono avere per essere riferiti alla popolazione che si vuole studiare. Per essere rappresentativo e permetterci di generalizzare, il campione deve avere le stesse caratteristiche della popolazione. Inoltre, per essere idoneo deve essere sufficientemente ampio e casuale (la probabilità di ogni soggetto che scelgo deve essere uguale alla probabilità di qualsiasi soggetto di appartenere alla popolazione generale). In particolare, si fa riferimento al concetto di randomizzazione che significa che i punteggi vengano selezionati in modo tale che ogni punteggio della popolazione abbia la stessa possibilità di essere scelto (non viene prediletta la selezione di nessun punteggio particolare della popolazione). In sostanza, randomizzare significa selezionare casi in modo che tutti abbiano la stessa probabilità di essere inclusi e il campione randomizzato non è affetto da manipolazione. Esistono numerosi modi per selezionare un campione casuale o randomizzato, perché qualsiasi campione si scelga sulla base di come appare non è detto che lo sia:
- si scrive l'informazione di ogni membro della popolazione su un foglietto e si mettono tutti in un cappello, dove vengono mescolati, poi con gli occhi chiusi se ne pesca uno. Questo corrisponde al primo membro del campione. Questo procedimento si ripete per tutti gli altri membri. Tecnicamente il foglietto di carta dovrebbe essere riposizionato nel contenitore dopo essere stato selezionato così da poter essere selezionato ancora. Questo, spesso, non viene fatto perché con un'ampia popolazione si avrebbe poca differenza nei risultati.
- si inserisce il numero ogni membro della popolazione e si preme il tasto della randomizzazione appropriata sulla calcolatrice scientifica per generare un numero casuale. Il membro della popolazione che corrisponde al numero diventa membro del campione. Non servono necessariamente tecnologie avanzate, esistono anche tabelle statistiche. Si sceglie a caso un punto di partenza su una tabella e poi si scelgono i numeri usando una formula prestabilita. Tuttavia, queste tecniche sono fin troppo dispendiose in termini di tempo ed è per questo che esistono programmi e applicazioni apposite.
- abbia una numerosità sufficiente per confermare un’idea;
- sia conforme alle richieste del test che si intende usare = il campione viene scelto sulla base dell’ipotesi sperimentale, delle relazioni tra le parti e delle misure (alcune più grossolane e altre più precise) e il relativo grado di precisione (in base a cui il campione deve essere più o meno grande). In particolare, per essere conforme deve avere le stesse caratteristiche di distribuzione (forma di distribuzione di probabilità dei dati) e indipendenza (un campione lo usiamo in una volta sola per dimostrare un’idea, così siamo sicuri che la stima di errore viene valutata nel modo corretto). Solo dopo aver fatto ciò posso raccogliere i dati, dove devo prestare molta attenzione alle variabili confondenti. Dopo la raccolta dati, possiamo applicare delle statistiche descrittive per descrivere l’andamento dei dati e delle variabili, in modo da capire se le distribuzioni che ci aspettavamo sono state aspettate (sapere se la distribuzione è gaussiana o meno è fondamentale per applicare i test, che si dividono in base alla distribuzione della variabile).
In seguito, applico un test statistico , che devo aver già pianificato a priori. Esso viene applicato facendo delle assunzioni ovvero delle decisioni prese e date come vere, le principali che riguardano i test statistici sono assunzioni che riguardano la forma di distribuzione dei dati (ogni test statistico fa riferimento ad una specifica distribuzione dei dati e ogni distribuzione compete ad una misura). Tramite l’applicazione del test statistico stimo il parametro che mi dice se la differenza/relazione che ci aspettavamo è più grande dell’oscillazione casuale. Quindi, confronto l’ipotesi di differenza/relazione con la casualità , ciò mi dice quanto siamo lontani dal valore vero dell’ipotesi nulla. Il parametro identifica la distribuzione dei dati che usiamo per falsificare la distribuzione dei dati dell’ipotesi nulla. Se la differenza (valore del parametro) cade in una zona dove il valore dell’ipotesi nulla è poco probabile, possiamo ritenerla falsa. Mentre, se cade nell’intervallo di valori attorno al valore vero dell’ipotesi nulla con una probabilità troppo elevata non possiamo falsificarla. In sostanza, il risultato del test statistico è una stima di probabilità di errore (di primo tipo), che prende il nome di significatività (p). In particolare, si parla del calcolo della significatività attraverso il parametro, dove la significatività corrisponde alla probabilità di respingere l’ipotesi nulla pur essendo vera (errore di primo tipo), considerando i dati sperimentali raccolti. La significatività dipende in modo rilevante dalla numerosità del campione. Un campione piccolo è più improbabile che consenta di falsificare un’ipotesi nulla, quando questa è falsa. Allo stesso tempo, un campione grande permette di dimostrare come differenze significative anche quando sono molto piccole (quasi irrilevanti clinicamente). La significatività è fondamentale per capire se l’ipotesi sperimentale è vera ed è possibile falsificare l’ipotesi nulla. Quando andiamo a stimarla, non andiamo a stimare la probabilità dell’ipotesi nulla, bensì la probabilità dei dati sperimentali partendo dal presupposto che l’ipotesi nulla sia vera. Infatti, normalmente si è soliti parlare di condizionalità. Il livello di significatività che possiamo considerare accettabile viene stabilito a priori e normalmente varia tra 0.05 e 0.01. Se otteniamo una significatività inferiore a 0,05 (ovvero 5%) respingiamo l’ipotesi nulla e
affermiamo la nostra idea. Mentre, nel caso opposto, in realtà non dimostriamo l’ipotesi nulla, perché
l’uguaglianza è indimostrabile. Semplicemente non otteniamo una differenza significativa e non siamo
in grado di dimostrare l’ipotesi sperimentale. Quest’ultima conclusione potrebbe derivare da: H1 non è vera; errori commessi = i due più tipici sono quando due medie sono molto vicine, oppure due medie sono lontane ma con tanta variabilità (in questi casi può esserci un errore dovuto al campione). A prescindere dalla causa, a fronte della mancata significatività, devo riprendere tutti i dati e guardare perché non ho ottenuto un risultato significativo. Gli errori sono soliti solo della logica falsificazionista, ma di tutte le logiche inferenziali. In particolare, nella prova sperimentale si può andare incontro a due tipi di errori, per questo è fondamentale stabilire a priori il limite accettabile per l’errore di I e II tipo (possibilmente basso). L’obiettivo è dimostrare H1 con il minor limite di errore possibile, da definire in termini di probabilità.
- errore di primo tipo (o errore α) = quando viene dimostrata falsa un'ipotesi nulla che in realtà non è falsa. In questo modo viene dimostrata vera una relazione/legge scientifica che in realtà non esiste (si tratta dell’errore più grave). La probabilità di questo errore si chiama significatività e corrisponde alla probabilità di falsificare un’ipotesi nulla che è vera (partendo dai dati sperimentali). Più questa è bassa e meglio è, infatti, la comunità scientifica ha proposto una soglia pari a 0,05 (soglia = 5%), al di sotto della quale si ritiene
dimostrata l'ipotesi di partenza. Tuttavia, è necessario tenere a mente che l'ipotesi nulla non è mai vera in
senso stretto;
- errore di secondo tipo (o errore β) = quando non viene falsificata l'ipotesi nulla quando questa è realmente falsa e, di conseguenza, non viene dimostrata vera un’ipotesi sperimentale (che è effettivamente vera). L’errore beta può essere più grande dell’errore alfa perché viene considerato meno grave nella maggior parte dei casi (soglia = 20%). Nella pratica si preferisce considerare la potenza ovvero la probabilità di falsificare l'ipotesi nulla quando è falsa. La potenza dipende dalla numerosità del campione, dalla variabilità casuale della variabile misurata sui soggetti e dalla minima differenza che riteniamo non trascurabile dal punto di vista pratico. Tuttavia, l’errore beta posso riuscire a controllarlo a priori, mettendomi nella condizione migliore possibile per avere una determinata potenza del test (1 – beta) e avere un errore beta accettabile. Anche il concetto di intervallo di confidenza della media è molto importante ed esso corrisponde all' intervallo delle medie dei campioni che esclude l'estremo 5% delle medie. Di conseguenza, il 95% dell'intervallo di confidenza offre semplicemente l'intervallo delle medie dei campioni che occupa il 95% intermedio della distribuzione delle medie dei campioni. Inoltre, l'intervallo di confidenza sarà più ampio per i campioni più piccoli e per tutto il resto rimarrà invariato. Per definire le caratteristiche dei campioni e le loro medie, deviazioni standard, intervalli (ecc.) si parla di statistiche. Le stesse caratteristiche delle popolazioni sono chiamate parametri. Si usano le statistiche dei campioni per stimare o dedurre i parametri della popolazione da cui il campione viene estratto.
Infatti, la metodologia utilizzata da questa logica è complessivamente più corretta rispetto a quella bayesiana. Tuttavia, vi sono diversi limiti:
- un limite di questa logica è il fatto di dover definire a priori, in modo arbitrario, l’errore e i limiti al suo interno.
- si tratta di una logica semplice perché l’idea può essere dimostrata o falsificata. Infatti, essa costringe ad un ragionamento dicotomico ed è particolarmente rigido.
- spesso si rifiuta l'ipotesi nulla non perché è poco probabile ma perché, se fosse vera, sarebbe poco probabile ottenere risultati come quelli avuti nell'esperimento. Per cercare di non incorrere in questo errore viene calcolata la significatività;
- spesso i ricercatori ritengono i risultati dei loro esperimenti interessanti anche per i risultati non significativi, che spesso vengono interpretati come dimostrazioni di non differenza. Tuttavia, un risultato non significativo è da considerare semplicemente come una non dimostrazione dell'ipotesi di partenza.
- non posso avere stime di probabilità che confrontano ipotesi diverse. Non posso sapere dal risultato finale che probabilità ha di accadere la mia ipotesi sperimentale, né quella nulla e nemmeno ipotesi alternative. Attraverso la significatività so solo che probabilità di errore possiedo per dimostrare che l’ipotesi nulla è falsa. Ci possono essere situazioni paradossali , dove davanti allo stesso problema ho diverse soluzioni che sono tutte vere. Il paradosso di Lindley’s permette di comprendere ciò. La stima della probabilità di errore casuale associato alla dimostrazione è determinata da assunzioni corrette sulla distribuzione dell’H0. I risultati dell’inferenza statistica dipendono sempre dall’approccio con cui viene stimata la significatività (p) associata al parametro. Sulla base di statistiche Fisheriane e Bayesiane si possono in certe situazioni trovare risultati opposti.
La probabilità
Questo concetto viene usato principalmente per fare inferenze, all’interno delle ricerche scientifiche. Sia nella logica fisheriana (significatività), che nella logica Bayesiana (Bayes factor) possiamo trovarlo. Ci sono diverse definizioni di probabilità, tale concetto è stato molto studiato sia da filosofi che da scienziati. Tale concetto è stato definito in diversi modi, ognuno di questi ha una sua ragione di essere e una sua funzionalità. Non c’è una definizione univoca da parte della letteratura scientifica, infatti, tale concetto presenta diversi aspetti che è importante prendere in considerazione. → Una definizione della probabilità è quella definita classica. Quest’ultima ci dice che dato un insieme di eventi equiprobabili la probabilità di un evento è data da: numero di eventi favorevoli numero di eventi possibili Ma questa definizione ha il difetto di essere tautologica perché al suo interno ha il concetto di probabilità per definire la probabilità. In una definizione abbiamo bisogno di avere una spiegazione, invece, qui abbiamo il concetto stesso di probabilità ancora prima di definirlo. → Un’altra definizione di probabilità è quella frequentista , che si basa sul calcolo delle frequenze. In quest’ottica la probabilità di un evento corrisponde alla sua frequenza in un numero molto elevato di prove. Quando abbiamo un numero molto elevato di prove la differenza tra frequenza e probabilità si assottiglia fino a farle diventare molto simili. Si tratta di un valore infinitesimo. Non sono due concetti identici ma sono molto simili e la frequenza ci permette di fare una stima di probabilità (che è un concetto puramente teorico). Questa definizione fa riferimento alla legge dei grandi numeri : quando aumentiamo il numero delle prove, effettuandone un numero che tende all’infinito, succederà che frequenza e probabilità si assomiglieranno sempre di più. Quindi, la loro differenza diventerà molto piccola e noi andiamo a stimarla in termini probabilistici. In altri termini, al crescere del numero di prove la probabilità che la differenza tra p di E e la frequenza di E diventi molto piccola, tende a 1. Tuttavia, anche in questo caso non abbiamo una vera e propria definizione, infatti, probabilità e frequenza sono simili. Ma, la frequenza corrisponde al numero di volte in cui un evento accade e non può da sola definire la probabilità (che è un concetto diverso). → Un’altra definizione di probabilità è quella basata sugli assiomi (regole che ci servono per fare calcoli probabilistici). Questa definizione non definisce particolarmente la probabilità da un punto di vista teorico, bensì le regole del calcolo probabilistico da cui derivano i limiti di tale calcolo. Queste regole sono proprio gli assiomi : regole che non hanno bisogno di essere dimostrate e vengono accettate come vere.
- P (A) ≥ 0 ad ogni evento A corrisponde un valore p (A) maggiore uguale o a zero;
- P (Ω) = 1 la probabilità di tutti gli eventi possibili è uno;
- P (A∪B) = P(A) + P(B) se P(A∩B) = 0 la probabilità che si verifichi A o B, essendo mutualmente escludenti, è data dalla somma della probabilità di A e della probabilità di B. Le probabilità possono essere stimate, quando le stimiamo usiamo la frequenza, ma anche delle regole teoriche alla base del calcolo probabilistico.
→ La definizione più appropriata della probabilità è quella soggettiva fornita da Bruno de Finetti. Per definire in modo completo questo concetto dobbiamo considerare la probabilità come il grado di fiducia che diamo ad un evento, secondo le sue informazioni ed essendo coerenti rispetto a ciò. La probabilità di un evento E è la misura del grado di fiducia che un individuo coerente attribuisce al verificarsi dell’evento, avendo determinate informazioni sull’evento stesso. Per avere probabilità ci deve essere un soggetto/un agente che la valuta , quindi, non viene data in modo univoco. Quindi, due soggetti con diverse informazioni sull’evento, possono attribuire ad esso delle probabilità diverse. Un esempio di questa probabilità è la logica Bayesiana: io definisco la probabilità a posteriori, sulla base della probabilità a priori dove posso definire le informazioni che ho rispetto al fenomeno. Queste stanno alla base della probabilità a posteriori che attribuirò all’evento. Quindi, secondo la probabilità soggettiva un individuo non può pensare alla probabilità senza prendere in considerazione le proprie informazioni, che incidono sempre sul grado di fiducia che attribuiamo alla probabilità di verificarsi di un evento. Inoltre, il soggetto deve essere coerente e non dare all’evento qualsiasi grado di probabilità, così quest’ultima perderebbe la sua forza. Dobbiamo capire il grado di sicurezza con cui la legge è dimostrata e anche l’origine. Essendo coerenti si ha un controllo della valutazione del grado di fiducia effettuato dal soggetto, per capire come si fa a passare dal grado di informazione al grado di fiducia. La coerenza ha anche un valore matematico. Infatti, la somma della probabilità di due eventi (A e non A) ha un valore di 1 (A + non A = 1). Quindi prendendone uno e sottraendone l’altro, ottengo il valore di probabilità (A – non A = grado di probabilità). Tuttavia, l’individuo deve essere in grado di attribuire alla probabilità degli eventi dei valori appropriati (ex: quanto scommetto ed è probabile che io vinca a carte contro un professionista?). Quindi, il fatto che il soggetto sia coerente significa che deve manifestare aderenza alle regole del calcolo probabilistico quando si attribuisce un grado di fiducia. Quest’ultimo viene dato sulla base del grado di informazione. Tuttavia, possono esserci delle situazioni paradossali. Un esempio è il paradosso di Bertrand , ovvero un problema probabilistico all’interno di un problema geometrico. In questo caso dobbiamo calcolare la probabilità di trovate una corda casuale di una circonferenza più lunga del lato del triangolo equilatero iscritto. Una corda è un segmento che unisce due punti di circonferenza ed è casuale quando i suoi due punti estremi sono scelti in modo casuale. In base alla teoria della probabilità soggettiva, posso avere diverse soluzioni a seconda della visione che ho e di ciò che prendo in considerazione:
- prima soluzione = mi concentro sul punto interno affermando che ogni punto interno alla circonferenza individua il punto centrale della corda. Le corde il cui punto di mezzo sta nella circonferenza inscritta sono sempre più lunghe del lato. Tutte le corde con il centro nella circonferenza inscritta sono tutte più lunghe. Sapendo che la circonferenza inscritta è 1/4 della circonferenza grande, allora anche la probabilità di avere una corda che passa al suo interno sarà 1/4. Invece, fuori dalla circonferenza inscritta la probabilità corrisponde ai restanti 3/4.
- seconda soluzione = viene preso come riferimento l’origine, che rappresenta il punto di informazione per stimare la probabilità. Si prende il punto d’origine delle corde nell’apice del triangolo. Prendiamo un vertice qualsiasi che va a delineare tre zone (aree che sono tra loro equivalenti= zona di destra, zona centrale opposta e zona di sinistra). Tutte le corde che partono dal vertice e vanno nel lato opposto saranno più lunghe. Quelle che, invece, passano dal vertice e non arrivano al lato opposto sono più corte. La probabilità in questo caso sarà 1/3 perché solo nell’area centrale nel lato opposto le corde sono più lunghe (in quelle di destra e sinistra sono corte);
- terza soluzione = si prende in considerazione il fatto che ogni corda può essere vista come segmento perpendicolare ad un raggio della circonferenza. Quindi, tutte le corde perpendicolari al raggio, che è perpendicolare al lato, sono più lunghe nel momento in cui stanno tra il centro del triangolo e il lato. Invece, sono corte quando partono dalla fine del lato e vanno verso la circonferenza. Vengono delineate due aree: dal mezzo fino al lato (per ciascuno dei due lati presi in considerazione della circonferenza). Il risultato finale della probabilità di lunghezza delle corde è 1/2. Sono giusti tutti e tre i risultati, infatti, è un paradosso: soluzioni giuste a seconda del punto di vista preso in considerazione. → nell’ approccio Bayesiano , la probabilità è definita come il grado di fiducia sul verificarsi di un evento. Tuttavia, il suo valore si modifica rispetto ad una probabilità a priori in funzione dei risultati sperimentali. La coerenza è garantita dal rispetto degli assiomi sulla probabilità. Tuttavia, c’è sempre la possibilità di incorrere in soluzioni diverse o errori. In particolare, Thomas Bayes (1702-1761) ha introdotto una formula matematica che dà un metodo per correggere una probabilità alla luce delle nuove informazioni che si hanno sull’evento. Pertanto, nel caso in cui si abbia una stima preliminare di probabilità del verificarsi di un evento e quindi se si hanno nuove informazioni su esso si può ottenere la probabilità a posteriori dell'evento. Con l’aumentare delle informazioni aumenta l’efficienza del metodo di stima.
Mentre, se i due eventi sono tra loro indipendenti non c’è bisogno di tenere in considerazione la loro associazione e, quindi, il calcolo da fare è: p (A&B) = p (A) x p (B). → L’ evento somma corrisponde ad un evento in cui si verifica A oppure B, o (se non sono disgiunti) entrambi. Si sottrae alla somma quello che i due eventi hanno in comune, se non sono disgiunti, facendo: p (A+B) = p (A) + p (B) – p (A&B) L'ultimo termine di questa relazione è relativo all'insieme degli elementi in comune sia all'evento A che all'evento B e deve essere sottratto perché è contato due volte (sia in P(A) che in P(B)). EX: per calcolare la probabilità che, in un lancio di un dado, si ottenga un risultato pari o minore di 5 devo sommare la probabilità che il risultato sia pari che corrisponde a 3/6, con la probabilità che il risultato sia minore di 5 che corrisponde a 4/6. In seguito, devo sottrarre i 7/6 risultanti con la probabilità di ottenere un risultato pari e minore di 5 che corrisponde a 2/6. Il risultato è 5/6. → La legge della probabilità condizionata deriva dal teorema di Bayes. Quest’ultimo corrisponde ad una formulazione matematica per il calcolo della probabilità condizionata, che afferma che la probabilità di A dato B è proporzionale alla probabilità di B dato A. Questo teorema unisce tre informazioni fondamentali:
- probabilità di A;
- probabilità di B;
- probabilità di B dato A. In sintesi, il teorema di Bayes serve per stimare la probabilità condizionata di A dato B, partendo da B dato A. Queste ultime due vengono messe in associazione e viene affermato che sono proporzionali. Il fatto che siano proporzionali è dato dal fatto che all’interno della formula abbiamo la probabilità di B dato A, che viene moltiplicato per A. P (B dato A) x P (A) P (A dato B) = P (B) L'applicazione di questo teorema permette il calcolo della probabilità condizionata nel caso in cui si sia a conoscenza della probabilità inversa piuttosto che della probabilità diretta. Quando non sono note le probabilità assolute degli eventi A e B non è possibile calcolare la probabilità di B dato A in base alla probabilità di A dato B, non essendo applicabile il teorema di Bayes. In questo caso è possibile definire la verosimiglianza dell'evento B dato A come un valore proporzionale a P (A dato B), con costante di proporzionalità arbitraria. La verosimiglianza non è un valore assoluto, ma è relativo alla costante di proporzionalità utilizzata. Quindi, la verosimiglianza viene usata solo come rapporto fra due condizioni aventi le stesse probabilità assolute e, quindi, la stessa costante di proporzionalità. EX: consideriamo ad esempio di voler calcolare la probabilità che un soggetto, risultato positivo a un test diagnostico, sia realmente affetto dalla patologia esaminata. Supponiamo che il test abbia una sensibilità del 90%, cioè che i soggetti patologici abbiano una probabilità 0.9 di risultare positivi al test. Inoltre, consideriamo che la percentuale dei soggetti realmente affetti dalla patologia sia il 2% della popolazione globale e che i soggetti risultati positivi al test sia del 3%.
P =
0 , 9 x 0 , 02
La variabilità
La variabilità è una caratteristica fondamentale della vita e del mondo in cui viviamo, per questo deve essere tenuta in considerazione quando cerchiamo di fare affermazioni sul mondo reale. La statistica riguarda in gran parte l'interpretazione di questa variabilità. Le tecniche statistiche svolgono tre funzioni principali:
- forniscono modi per riassumere le informazioni raccolte da una moltitudine di fonti = le informazioni vengono organizzate nella maniera più chiara ed efficace possibile attraverso tabelle, diagrammi riassuntivi e semplici formule. Questa branca della statistica è chiamata statistica descrittiva in quanto descrive le informazioni raccolte nel modo più accurato e sintetico possibile;
- consentono di generalizzare con sicurezza informazioni da un campione all'intera popolazione = ciò viene attuato dalla statistica inferenziale e consente un grande risparmio di risorse nella ricerca;
- danno un senso a una grande quantità di dati che altrimenti sarebbero eccessivamente confusi = la quantità di dati che un ricercatore può raccogliere è elevata e le tecniche di esplorazione di dati consentono di chiarire le tendenze relative a tali dati tramite l'utilizzo di metodologie efficaci (semplificazione, esplorazione e riduzione di dati).
Le variabili
Le variabili sono eventi empirici oggetto della misura. Il ragionamento sulla variabile serve per capire come usare le misure, che sono di vario tipo. La variabile è quella misura per cui abbiamo una buona aderenza fra sistema numerico e sistema empirico. Tuttavia, c’è sempre un grado di errore. Una variabile è ogni cosa che varia e che può essere misurata.
Esistono diverse scale di misurazione, tuttavia, per quasi tutti i fini pratici, in statistica possono essere considerati due diversi tipi di misure:
- misure numeriche = assegnazione di un valore numerico in una misurazione (variabile), che prendono anche il nome di punteggi. Quindi, i numeri quantificano una variabile (ex. QI);
- misure nominali/categoriali = le misurazioni possono non corrispondere esattamente al concetto quotidiano di misura, bensì, possono riguardare piuttosto la categorizzazione. Infatti, le variabili possono essere parte di categorie e assumere diversi valori. In questi casi si parla anche di misure qualitative/nominali, in quanto normalmente queste categorie vengono descritte a parole, dando loro dei nomi. Questi valori non sono punteggi ma frequenze , che corrispondono al numero dei casi che derivano da molte misurazioni separate. Le variabili nominali (categoriche) vanno ad identificare dei valori che hanno l’accezione di essere delle etichette (anche se corrispondono a dei numeri), che determinano l’appartenenza ad una categoria piuttosto che ad un’altra. Nella ricerca psicologica spesso le variabili vengono misurate e quantificate. Ci sono due modalità di misurazione degli oggetti: misurazione analitica (molto precisa e dettagliata e si basa sui numeri); misurazione sintetica (partendo dai numeri si cerca di andare al cuore degli aspetti grossolani del fenomeno, si tratta di un metodo più sintetico). Ovviamente, avendo più dettagli siamo più precisi e vediamo differenze piccole, ma al contempo siamo meno sicuri di ciò che stiamo dicendo e perdiamo una visione globale del fenomeno. Dobbiamo confrontare la variabile con il sistema empirico di riferimento.
Classificazione delle variabili in base al disegno sperimentale:
Le variabili possono essere classificate in base al ruolo nel disegno sperimentale:
- studi correlazionali = si accerta soltanto se esiste una relazione tra le variabili , che hanno tutte lo stesso ruolo e non hanno una relazione di causalità;
- relazione causale = viene attribuito alle variabili un valore di tipo causale e possiamo identificare una variabile dipendente e dei fattori (variabile indipendente). Tutte queste variabili possono essere molteplici. Ci possono anche essere delle variabili confondenti che vengono definite tali dal momento in cui mi accorgo di esse solo a posteriori (quando abbiamo raccolto i dati). Si tratta del riconoscimento di variabili che non avevamo considerato, perché non ne eravamo a conoscenza. Dobbiamo, innanzitutto, stabilire se c’è una relazione causale o bidirezionale (disegno correlazionale). Nel caso della relazione causale, il rapporto tra le variabili potrebbe essere più o meno chiaro e, in base a ciò, si parla di relazioni genuine o spurie. In sostanza, i casi di chiara relazione fra variabile dipendente e fattore sono dette relazioni genuine. Mentre, quando il rapporto tra variabile dipendente e fattore non è chiaro, si parla di relazioni spurie. Infine, nel caso in cui la relazione è genuina ma bidirezionale (entrambe le variabili possono essere considerate influenti l’una sull’altra, si parla di una relazione mutua (o correlazione). Rispetto a ciò, posso trovare due condizioni diverse a cui vengono sottoposti i soggetti durante l’esperimento:
- gruppo sperimentale = gruppo la cui esperienza viene manipolata;
- gruppo di controllo = gruppo utilizzato per stabilire un confronto con quello sperimentale (rispetto al quale deve essere simile, anche nel trattamento) e verificare gli effetti della manipolazione. Esso si definisce tale in quanto voglio vedere se la condizione che voglio studiare è diversa da quella di riferimento.
Classificazione delle variabili in base alle caratteristiche:
- quantitativa = usata tramite le medie (solo queste si possono classificare in quantitative e non quantitative). Tutte le variabili dipendenti sono quantitative e se sono gaussiane possiamo confrontarle nei due gruppi rispetto alla media, se non lo sono usiamo altri indici. EX: phonological task verbal fluencing = viene data una lettera bisogno dire il maggior numero di parole che inizia con quella lettera; non word repetition task = ti dico una non parola e devi ripeterla solo sulla base del suono che hai sentito. In questo caso il numero degli errori come variabile quantitativa; spoon = due parole composte da fonemi (da tenere in memoria), costruendo una parola nuova in base ai fonemi. Implica il riconoscimento fonemico e la memoria di lavoro, dove vengono trattenuti i suoni per costruire parole nuove. Spoon A indica la correttezza delle parole che vengono dette e la Spoon S è la velocità nel dare la risposta giusta.
- qualitativa = misurata tramite frequenze. Una variabile quantitativa può essere trasformata in qualitativa sulla base di valori soglia in base a cui posso affermare se una persona ha il deficit o meno (poi i deficit vengono sommati tra loro), mentre per trasformare la variabile qualitativa in quantitativa Conto le persone nel campione totale che hanno il disturbo o meno
Ci sono delle norme che regolano la produzione di tabelle e grafici in statistica, i quali devono essere chiari, concisi e comunicare velocemente le principali tendenze dei dati. Se essi non soddisfano questi obiettivi sono inutili. Le statistiche descrittive sono in gran parte delle tecniche relativamente semplici di tipo visivo e numerico che permettono la descrizione degli aspetti principali dei dati, con lo scopo di comunicarli ad altri e beneficiarne per comprendere la distribuzione delle risposte dei partecipanti alla ricerca. Inoltre, la distinzione fra dati nominali e quantitativi è importante per la scelta della tabella o del grafico appropriato da usare.
Tabelle e grafici
L’obiettivo di grafici e tabelle è rendere più semplice la visualizzazione del dato a chi la legge. Possiamo avere tanti dati e variabili ma ci sono stratagemmi che ci consentono di rendere più leggibili anche le rappresentazioni più complesse. L’obiettivo delle statistiche descrittive è sintetizzare i dati e permettere di avere un’idea interpretativa più semplice. Non esiste un grafico oggettivamente più appropriato, ciò dipende dagli scopi della ricerca. Ci sono delle variabili che possono essere rappresentate solo con determinate tipologie di grafici. A seconda della tipologia della variabile ci sarà un grafico ideale. Innanzitutto, è importante definire se i dati sono variabili quantitative o qualitative. Risulta importante tenere a mente che le variabili che ammettono differenti tipi di risposta in contemporanea (ambigue) andrebbero evitate. Infatti, andrebbe ammessa una sola risposta per variabile per ogni partecipante. Inoltre, le categorie non devono essere troppe ed è preferibile che non ci siano troppi pochi soggetti (soprattutto nelle variabili nominali). Infatti, a volte invece che avere troppe categorie con troppi pochi casi è meglio accorparle tra di loro secondo dei criteri. Tuttavia, in alcuni casi può essere utile far vedere che in una categoria ci sono pochi soggetti rispetto alle altre, allora, in questo caso non si accorperà. Ciò dipende dalle circostanze. La cosa importante è decidere quale è l’unità di misura che guida la modalità di rappresentazione. Quando si impostano grafici e tabelle, per evitare di incorrere in errori, è bene prestare attenzione ad alcuni accorgimenti:
- etichettare il più chiaramente possibile ogni elemento di tabelle e grafici, inoltre, è bene indicare se l'altezza delle barre si riferisce alla frequenza o alla frequenza percentuale;
- sia nel caso di tabelle che di grafici è importante inserire un titolo e una didascalia esaustiva, che ne descrivano brevemente il contenuto. Quando si hanno dati sotto forma di punteggi è preferibile utilizzare grafici di frequenza e istogrammi. I punteggi possono essere combinati in fasce di punteggi per esigenze di chiarezza e ciò consente l’uso di grafici a torta per punteggi.
- tabelle e grafici per dati nominali = devono mostrare le frequenze dei casi in ognuna delle categorie considerate. Lo scopo non è comunicare tutti i dettagli dei dati, ma piuttosto evidenziare le principali tendenze cercando di creare un numero più piccolo di categorie più ampie. Nelle variabili nominali o categoriche le unità di misura sono il numero dei casi o le frequenze percentuali. Nel caso di una variabile nominale posso vedere quanti soggetti hanno quel valore. Alcune linee guida fondamentali da seguire sono: mantenere un basso numero di categorie (soprattutto quando i partecipanti sono pochi); provare a combinare categorie in maniera utile e significativa in relazione agli scopi della ricerca (spesso vengono attuati degli accorpamenti di categorie poco frequenti). Quando si rappresentano delle tabelle di frequenza è importante elencare le categorie scelte e la frequenza dei casi corrispondente ad ognuna di esse. frequenza singola = numero di volte che una categoria o il valore di una variabile si verifica nei dati (ho un’idea immediata dei soggetti nelle categorie rispetto al numero totale delle condizioni possibili); frequenza percentuale = frequenza espressa come percentuale sul totale delle frequenze (o sul numero totale dei casi). Riesco a vedere in modo ottimale come fra loro le diverse categorie sono sbilanciate rispetto al totale, ma perdo l’informazione della numerosità. Nei casi di categorie nominali è preferibile utilizzare tabelle di frequenza e grafici a barre o a torta. A volte è preferibile trasformare le tabelle di frequenza in grafici e i principali, per dati di tipo nominale, sono:
- grafici a torta = sono delle forme di presentazione con cui si ha molta familiarità, essi esprimono semplicemente ogni categoria come una fetta di torta , che globalmente rappresenta tutti i casi. Tuttavia, è importante mantenere un numero ridotto di fette, altrimenti si può creare confusione. Ogni fetta deve essere indicata chiaramente con il nome della categoria e con la frequenza percentuale corrispondente;
- grafici a barre = le barre rappresentano l'ampiezza delle categorie. Le lunghezze relative delle barre rivelano velocemente le principali tendenze dei dati. Inoltre, le barre devono essere separate da uno spazio fisso. Alcune regole da seguire per rendere chiari i grafici a barre: l’altezza delle barre corrisponde alla frequenza di categorie (non punteggi); ogni barra dovrebbe essere etichettata chiaramente; troppe barre rendono il grafico di difficile lettura;
è meglio evitare di avere molte categorie senza o con pochi casi (che spesso vengono combinate nella categoria “altro”); se una categoria importante presenta pochi casi deve comunque essere inserita; l'asse verticale (altezza delle barre) deve chiaramente essere indicato come frequenza o percentuale di frequenza; le barre dovrebbero essere della stessa larghezza. Una variante del grafico a barre è il pittogramma , dove le barre sono sostituite da disegni di diversa grandezza e da elementi legati alle categorie che catturano l'attenzione. Tuttavia, esso è poco utilizzato professionalmente, in quanto le figure che crescono in altezza diventano anche più larghe. Ciò può falsare la reale grandezza delle categorie, in quanto l’unico elemento che l'osservatore deve considerare è l'altezza delle figure.
- tabelle e grafici per punteggi numerici = per decidere quale tabella o grafico utilizzare in questi casi è importante prendere in considerazione il numero dei diversi valori registrati per la variabile in esame. Spesso, per avere una tabulazione più efficace, i punteggi possono essere raggruppati in fasce. Inoltre, dato che molte variabili psicologiche hanno un range più piccolo di valori numerici, è molto frequente utilizzare domande con un numero limitato predeterminato di alternative di risposta (ex. scala Likert). In questa scala ci sono solo 5 possibili valori, in modo che inserire questo tipo di dati in una tabella risulti abbastanza facile. Un istogramma potrebbe risultare miglior tipo di grafico statistico per rappresentare questi dati, infatti, esso rappresenta differenti punteggi di una misurazione su scala numerica. Negli istogrammi delimito la distanza tra i valori della variabile, che sono distanti tra loro per valori prestabiliti. Quindi, posso vedere il tutto come una variabile intera in un continuum. Negli istogrammi abbiamo una variabile quantitativa continua. Una difficoltà comune riscontrata in psicologia è l'avere un piccolo numero di soggetti, infatti, spesso vengono utilizzate fasce di punteggi , anziché valori individuali, in modo da rappresentare le principali caratteristiche dei dati. Tuttavia, l'adeguamento delle fasce di punteggio è una procedura che richiede molto tempo e soprattutto molte prove ed errori. In questo il computer rappresenta un’alternativa vantaggiosa per ricodificare più velocemente i punteggi in fasce. Anche l'istogramma deve riuscire a trasmettere efficacemente le informazioni. Infatti, le fasce devono avere la stessa ampiezza e, quindi, devono coprire gli stessi intervalli di punteggi. Sia i grafici a barre che ad istogramma ci fanno vedere i picchi di frequenza e la variabilità, ovvero le informazioni sintetiche fondamentali per la raccolta dati. Tanto più è grande la larghezza attorno al picco e tanto più grande è la variabilità dei dati (questo vale sia per gli istogrammi che per i grafici a barre). La variabilità è data da quanto i dati sono lontani dal picco. Per ogni valore della variabile se è riconoscibile un dato più probabile. Più la curva è stretta più i dati hanno una frequenza stretta attorno al picco. La variabilità è sempre in relazione al picco di frequenza che è fondamentale perché tramite la rappresentazione vogliamo vedere l’andamento dei dati in modo sintetico. Le percentuali cumulative hanno senso solo se la variabile è ordinale. Esse competono ad una variabile ordinale e danno un’informazione aggiuntiva perché ci dice come cresce la percentuale dei casi al crescere di una variabile ordinale (se è continua è preferibile). Tutte le volte che possiamo usare questa rappresentazione di frequenza cumulativa è molto utile per vedere come cresce la frequenza dei casi al crescere della variabile ordinale. Ci possono essere variabili che crescono più velocemente e altre più lentamente.
La descrizione numerica delle variabili
La descrizione dei dati attraverso tabelle e grafici richiede una grande quantità di spazio, per questo può risultare efficace l'uso di indici numerici che descrivono le distribuzioni delle variabili. In questo modo, grandi quantità di dati possono essere descritte adeguatamente attraverso l'uso di pochi indici numerici. In particolare, si parla di parametri descrittivi e i principali sono: media, moda, mediana e indici di dispersione. Il primo passo è stabilire se la variabile è di tipo nominale categorico o se è un punteggio:
- se si tratta di una variabile nominale categorica è possibile applicare solo la moda ;
- per i punteggi è possibile applicare: media, mediana e moda. Queste ultime tre rappresentano le misure principali dei punteggi tipici, che permettono di attuare concettualizzazioni. Inoltre, media, moda e mediana sono indici di centralità. Solitamente la media, la mediana e la moda quando vengono applicate alla stessa serie di punteggi forniscono valori differenti dalla tendenza centrale. Coincidono solo quando la distribuzione è simmetrica e il picco centrale. Mentre, differenze significative tra questi tre indici corrispondono ad una distribuzione di punteggi asimmetrica o sbilanciata. Per effettuare calcoli statistici non è necessario che le distribuzioni di punteggi siano perfettamente simmetriche, tuttavia, la presenza di simmetria rende i calcoli più accurati.
La dispersione dei punteggi: variabilità
Il concetto di variabilità è collegato al termine statistico varianza. La varianza è una formula matematica utile per indicare la variabilità (ma non è l'unico modo per valutarla). Risulta possibile valutare la variabilità dal grafico , in base alla larghezza della curva , ma possiamo anche usare indici di dispersione così chiamati perché ciascuno ci dice quanto sono dispersi i dati rispetto al valore centrale (ex. in riferimento alla media e alla mediana).
Il range e il range interquartile
Un indice di dispersione è il range , che ci dice quanto è ampio l’intervallo dei nostri dati. In sostanza, ci fornisce informazioni sull’ampiezza dell’intervallo tra il valore più piccolo e quello più grande. Tuttavia, il range non si riferisce in modo preciso agli indici di centralità, esso si riferisce a tutti i dati. Quindi è molto grossolano e risente degli estremi, per questo si usa poco in riferimento agli indici di centralità. Gli outlier possono portare l'analisi al rischio di conclusioni erronee. Essi sono punteggi molto atipici per i propri dati tanto da distorcere ogni tendenza (in quanto sono eccessivamente grandi o piccoli). Si tratta di pochi casi fuori misura rispetto al resto dei dati che possono indurre il ricercatore in errore. Gli outlier possono essere il risultato di un'ampia gamma di fattori diversi e risulta particolarmente importante eliminarli per evitare che possano risultare fuorvianti. Normalmente per identificarli basta analizzare i propri dati e i relativi grafici o tabelle, tuttavia, ciò implica un qualche giudizio soggettivo da parte del ricercatore. Si preferisce usare una tipologia di range più precisa, detta range interquartile che va ad indicare il valore minimo e massimo intorno alla mediana. Esso è basato sul 50% centrale dei punteggi, disposti in ordine di grandezza (non è affetto dagli outlier). Per calcolare l’interquartile, i punteggi vengono ordinati dal più piccolo al più grande e vengono ignorati il 25% dei punteggi più piccoli e il 25% di quelli più grandi. Quindi, per calcolare interquartile è necessario suddividere la distribuzione dei punteggi in quarti e considerare il range dei due quarti centrali (50%), ignorando gli altri due quarti estremi (25% e 25%). In questo modo viene conservato il 50% dei valori centrali della distribuzione originale. La differenza tra il punteggio più grande e quello più piccolo, in questo 50% situato centralmente, rappresenta l'interquartile. Gli outlier non possono incidere sull’interquartile in quanto si trovano nel 25% superiore o inferiore dei punteggi che viene eliminato dal calcolo. In generale, l'interquartile rappresenta un migliore indicatore della variabilità rispetto al range totale, in quanto vengono esclusi i valori estremi. Il box plot mostra la distribuzione dei dati per una variabile continua e consente di visualizzare il centro e la relativa distribuzione dei dati. La linea centrale nella scatola rappresenta la mediana dei dati. La metà dei dati si trova sopra questo valore e l'altra metà sotto. Se i dati sono simmetrici, la mediana è al centro della scatola. Se, invece, i dati sono asimmetrici, la mediana sarà più vicina alla parte superiore o a quella inferiore della scatola. La parte inferiore e superiore della scatola mostrano il 25° e il 75° percentile, ciascuno di essi esclude un quarto (25 %) dei dati. La lunghezza della scatola è la differenza tra i due percentili e si chiama range interquartile (IQR). Le linee che si estendono a partire dalla scatola sono chiamate baffi
(inner fence). I baffi rappresentano il range dei valori, non compresi gli
outliers. I baffi si estendono per 1,5 volte dal range interquartile sia dalla parte superiore e inferiore della scatola. Se i dati ricadono sopra o sotto la fine dei baffi, sono denominati spesso outlier. Questi ultimi sono i casi che distano dal range interquartile più di 1,5 volte lo scarto interquartile (distanza tra i valori indicanti il 25esimo o il 75esimo centile). Gli estremi sono i valori che distano più di tre volte la distanza interquartilica (1,5 da una parte e 1,5 dall’altra).
Gli scarti dalla media (o deviazione dalla media)
Un'altra misura è rappresentata dalla deviazione dalla media (o media degli scarti della media). Si tratta di un indice che viene calcolato utilizzando la media di una serie di punteggi e valutando quanto ogni punteggio si discosti da tale media. Queste deviazioni vengono poi sommate (ignorando i segni negativi) tra loro e così si ottiene il totale delle deviazioni dalla media. Infine, si divide questo valore per il numero dei punteggi, in modo da ottenere lo scarto medio dalla media di una serie di punteggi.
La varianza e la stima della varianza
La varianza è un indice statistico che misura la dispersione dei dati attorno alla media, quando la variabile è quantitativa a distribuzione gaussiana. Essa viene usata per stimare la variabilità e la dispersione attorno alla media , quindi, ci permette di valutare l’efficienza della stima attorno alla media e la dispersione dei dati attorno al valore centrale. In sostanza, la varianza ci dice di quanto i nostri dati si discostano dal valore vero della popolazione in media.
La dispersione dei dati può essere rappresentata numericamente dalla varianza. Le dispersioni (deviazioni standard) possono essere calcolate solo se la variabile quantitativa ha una distribuzione gaussiana attorno alla media. La varianza è la somma dei quadrati degli scarti dalla media, diviso il numero degli scarti. Essa viene calcolata in maniera molto simile alla deviazione della media tranne che per un particolare: ogni deviazione dalla media viene elevata al quadrato prima di essere sommata. Se ottengo la differenza tra il punteggio e la media, ottengo quanto ogni valore è lontano dalla media e così valuto ogni punteggio. La somma di tutte queste distanze mi dà sempre come valore zero (proprio perché facendo la media aritmetica azzero gli scarti, trovando un valore comune). Gli scarti non li posso sommare così come sono, altrimenti si autoannullerebbero e, quindi, li elevo tutti al quadrato. In seguito, divido per il numero degli scarti. Due variabili possono avere la stessa media, ma se la varianza è diversa (indice di dispersione), esse avranno una distribuzione molto diversa dei valori. Ci sono diversi modi per calcolare la varianza e alcuni metodi sono particolarmente. Tuttavia, possiamo trovare anche una formula statistica (formula definitoria) con cui si esprime la varianza, che è la seguente: σ 2 = ∑ ( X − X ) 2 N Tuttavia, questo è il valore teorico della varianza che dipende dalla numerosità campionaria, infatti un campione piccolo rischia di produrre una cattiva stima di media e varianza. Quindi quando il campione è piccolo si usa una formula diversa della varianza, per la varianza stimata.
- il numeratore delle due formule è uguale (anche se scritto in modo diverso);
- il denominatore cambia perché per la varianza teorica c’è N (numerosità della popolazione generale). EX: Se sai che il peso medio di un gruppo di 5 persone è di 80 kg, a quante di queste persone ti servirà chiedere il peso per poterlo conoscere di tutti e 5? Ipotizziamo che, tra queste 5 persone, 4 pesano ognuna 90 kg. Ti serve davvero chiedere il peso anche al quinto componente o hai già tutto quello che ti serve per ricavarne il peso? In questo esempio, il peso del quinto componente lo puoi ricavare facilmente per differenza. La media è data infatti dalla somma dei valori per tutte le osservazioni divisa per il numero di osservazioni. Pertanto, se la media è uguale a 80 ed il numero di osservazioni è pari a 5, la somma dei valori sarà pari a 80*5=400. Se sommi i primi 4 valori, avrai 90+90+90+90=360. Per arrivare a 400 mancano 40 kg che deve essere quindi necessariamente il peso della quinta persona. Stimare il parametro media impone quindi un vincolo alla libertà di variare delle osservazioni. Di conseguenza, dopo aver stimato la media di 5 punteggi, abbiamo solo 4 pezzi di informazioni indipendenti, anche se la numerosità campionaria è pari a 5. Tutte le volte quindi che in un’analisi si utilizza la stima di una media, il numero dei gradi di libertà di ridurrà di 1. Questo N-1 viene detto anche grado di libertà che deriva dagli scarti (dalla media). Uno scarto deriva dalla media , non dalla varianza e, quindi, è automaticamente determinato. Quindi, sottraiamo 1 ad N, perché 1 caso è automaticamente determinato dalla media. In questi casi si parla di varianza stimata, che riesce a pesare la varianza in modo tale da tener conto del fatto che quando è calcolata su un campione più piccolo, il valore della varianza sarà più grande. Quindi, così mi avvicino di più al valore vero della popolazione, riuscendo ad aver una migliore stima della variabilità. s 2 = ∑ x 2 − ( ∑ x ) 2 N N − 1 I gradi di libertà sono il numero di casi non vincolati, cioè che possono essere scelti in modo arbitrario e che sono sempre dati da N-1, perché nel calcolo degli scarti, noi possiamo calcolare in modo vincolato solo un caso. Gli altri possono avere diversi altri valori, possono variare e avere comunque la stessa media. Questo è determinato dal fatto che gli scarti alla fine devono dare come somma 0. Soltanto la numerosità dei dati -1 ci può dare il grado di libertà e la media determina qual è il valore dei dati che possiamo avere. Avendo quei 5 casi, 4 possono cambiare arbitrariamente, ma solo uno è vincolato. In sostanza, la stima della varianza viene pesata anche per la numerosità dei casi.
- più sono i casi = più la stima è efficiente e la variabilità minore;
- meno sono i casi = meno è efficiente la stima e la variabilità maggiore.
I percentili
Il percentile deriva dalla frequenza percentuale cumulativa e corrisponde al valore sotto al quale abbiamo una certa percentuale di casi (compreso il valore stesso). In sostanza, i percentili rappresentano per ogni valore la percentuale di punteggi inferiori o uguali a quel valore. Si usano alcuni percentili di riferimento per individuare i
Per ogni variabile, essendo teorica, possiamo fare delle supposizioni su quale sarà la sua distribuzione, proprio perché per ogni variabile possiamo aspettarci a priori la distribuzione. C’è la possibilità di identificare delle funzioni matematiche che delineano in modo preciso quali sono le distribuzioni più frequenti. Spesso si può fare riferimento a funzioni di distribuzione matematiche/teoriche che ci danno un’idea immediata della distribuzione dei valori della variabile. Si parla di funzioni di distribuzione utili perché ci fanno prevedere l’andamento di variabili solitamente studiate in psicologia. La funzione di distribuzione ci dice per ogni x (ovvero ogni valore della variabile) come fare a calcolare la probabilità di ottenere un valore che è minore o uguale ad x. Quindi, non viene calcolata solo la probabilità di x, ma anche di tutti i valori più bassi di x. La funzione di distribuzione è anche detta distribuzione cumulativa , perché si sommano tutti i valori, anche i più piccoli. Per ogni tipologia di variabile, anche il calcolo della distribuzione deve avere un calcolo diverso. Per ogni punteggio possibile viene calcolata la frequenza. In questo caso si può passare dalla frequenza alla frequenza cumulativa, sommando quante persone hanno quel valore o uno più basso. La funzione cumulativa ci permette di vedere come al crescere dei valori aumentano le frequenze. Questa valutazione può essere fatta anche per le probabilità, non solo per le frequenze. In sostanza, le frequenze possono anche essere presentate in una distribuzione cumulativa, dove ogni barra rappresenta la frequenza del valore sull’asse orizzontale sommata (cumulata) alle frequenze di tutti i valori inferiori. In questi casi, l’andamento è necessariamente non decrescente. Se devo calcolare la probabilità per ogni valore che possiedo rispetto ad un numero di casi finiti, divido semplicemente le prove che possiedo sulla base delle prove totali possibili. In questo caso abbiamo una probabilità per ogni valore x discreto della variabile. Infatti, andiamo a calcolare la probabilità di x sul totale degli eventi possibili. Ciò è possibile attraverso una tabella, che indichi per ogni valore la sua probabilità. Una rappresentazione analoga può essere fatta utilizzando un istogramma, dove si può assegnare a ogni valore della variabile una colonna la cui altezza è proporzionale alla probabilità di quel valore. Tuttavia, nella maggior parte dei casi non ho n casi finiti, ma ho infiniti valori della variabile (ex. tempo di risposta), così per calcolare la funzione cumulativa e passare dalla frequenza alla probabilità ho bisogno di un calcolo diverso. Così nel caso di una variabile continua non calcoliamo la probabilità di x, ma la probabilità di x in un piccolo intervallo. In questo modo i casi diventano finiti e per ogni valore possiamo calcolare la sua probabilità. In questo caso la funzione di distribuzione della variabile viene definita su una formula che è basata su valori calcolati sulla densità di probabilità. La densità di probabilità è una funzione che viene utilizzata per riuscire a calcolare la probabilità del valore in funzione dell’intervallo che si stabilisce a priori come intervallo di interesse. Questo intervallo sarà infinitesimo, ovvero molto piccolo. Si definisce densità di probabilità la funzione f(x) ottenuta calcolando la probabilità che la variabile assuma un valore compreso in un intervallo piccolissimo, di grandezza infinitesima, attorno al valore x e dividendo questa probabilità per la larghezza dell'intervallo. Infatti, ciò che ci dà la possibilità del calcolo è l’ampiezza dell’intervallo considerato. Attraverso questa funzione riesco a passare dalla distribuzione di frequenza a quella di probabilità. In sostanza, è necessario partire sempre dalle frequenze per calcolare la funzione di distribuzione di probabilità dei valori della variabile. Sia che la variabile sia continua che discreta, posso passare da una distribuzione delle frequenze ad una di probabilità. Nel caso di una variabile gaussiana, la forma della funzione di una variabile gaussiana viene definita completamente da media e varianza (e tramite esse riesco a passare da una all’altra). A determinare la formula di distribuzione di probabilità:
- numerosità;
- probabilità di partenza di P e di Q = se sono uguali la distribuzione è sempre simmetrica e il valore centrale è quello più probabile. Se sono diversi, uno dei due è più probabile e non c’è una situazione di simmetria. Quindi, se sono complementari posso sempre ricavare la probabilità dell’altro valore (che sarà speculare, nel caso della distribuzione binomiale).
Distribuzione uniforme
Questo tipo di distribuzione è relativa ad una variabile discreta o continua, dove ogni valore della variabile è equiprobabile. Quindi, tutti i valori hanno la stessa probabilità di accadere e non ce n’è uno più probabile. EX: nel lancio di un dado a sei facce, la probabilità di ogni valore della mia variabile è 1/6 (uno fratto la numerosità della mia variabile).
Distribuzione binomiale
La distribuzione binomiale (p = q = 1/2) riguarda una variabile che può avere due soli risultati, dove P e Q sono i valori della variabile (P è la probabilità e Q è quella complementare). Per si tratta di una distribuzione che riguarda variabili qualitative dicotomiche. Il vantaggio è che se conosco la probabilità di un valore, automaticamente è determinata la probabilità di un altro valore. Stabilendo uno, posso capire il valore dell’altro. EX: faccio un’estrazione dove i possibili risultati sono di avere successo o insuccesso. Se la probabilità di successo è uguale a quella di insuccesso, ognuna risulterà uguale a 1/2. Mentre, se sorteggiamo due volte
una variabile che ha queste caratteristiche i risultati potranno essere: SS SI IS II. Ognuno di questi ha probabilità 1/4 e, quindi, sono equiprobabili. Il risultato della seconda estrazione è indipendente dal risultato della prima e ogni risultato della doppia estrazione è equiprobabile. La probabilità di ciascuna coppia di risultati è data dal prodotto di 1/2 x 1/2 e, quindi, equivale ad 1/4. Mentre, se facciamo tre estrazioni possibili risultati sono: SSS SSI SIS SII ISS ISI IIS III. Se la probabilità di successo (P) è diversa dalla probabilità di insuccesso (Q = 1 – P) allora la distribuzione diventa asimmetrica. Tale asimmetria tende a scomparire al crescere del numero (n) delle prove. Infatti, al tendere di (n) all'infinito, la distribuzione binomiale tende alla distribuzione normale. In una variabile binomiale la media è data da np, mentre la varianza è uguale a npq. La distribuzione normale o gaussiana può essere considerata come limite della distribuzione binomiale al crescere del numero degli eventi.
Distribuzione normale (gaussiana)
La distribuzione normale descrive variabili quantitative, continue, con distribuzione simmetrica e picco centrale. La curva normale descrive una particolare forma della curva di frequenza e viene considerata come una forma a campana simmetrica. Inizialmente, si pensava che le distribuzioni nel mondo naturale corrispondessero a questa forma. Al giorno d'oggi, si è scoperto che la curva normale non è universale, anche se molte distribuzioni hanno approssimativamente questa forma. Essa è molto utilizzata in statistica (e soprattutto in ambito psicologico, dove è la migliore da avere) in quanto i teorici hanno sviluppato molte tecniche statistiche basandosi sull'assunzione che le distribuzioni dei punteggi presentino questa forma a campana, detta anche normale (distribuzione gaussiana). In questa distribuzione, c’è un picco centrale attorno a cui i valori si distribuiscono in modo simmetrico. Più ci allontaniamo dal picco e più i valori si distribuiscono in modo caratteristico. Infatti, se poniamo l’asse centrale, le due curve che partono sono esattamente identiche. Inoltre, la media è il picco centrale e in una distribuzione normale coincide con la moda e con la mediana. Quando definiamo la distribuzione normale, questa viene definita da tre punti:
- limite della distribuzione binomiale = la distribuzione gaussiana è quella a cui tendono tutte le altre distribuzioni, al crescere del numero delle prove. In particolare, la distruzione binomiale è dimostrato che crescendo N questa diventi sempre più simile ad una gaussiana. Questo è vero per la distribuzione binomiale, come per qualsiasi distribuzione asimmetrica in cui si raccolgono tante prove; – curva degli errori = la distribuzione normale viene definita anche curva degli errori, in quanto gli errori si distribuiscono attorno al valore vero con distribuzione gaussiana. Questo è utile per valutare l’errore nella dimostrazione;
- distribuzione a massima entropia = valuta l’andamento della casualità. Infatti, valuta la probabilità di infiniti valori possibili attorno al valore vero. Attorno al valore medio, alla sua destra e sinistra, i valori sono sempre meno probabili. Massima entropia significa che ci dà informazioni sulla condizione massima di disordine (caso) possibile. Infatti, questo tipo di distribuzione è quella meno strutturata e più casuale. Tuttavia, queste definizioni sono solo teoriche. La distribuzione dei dati sperimentali ci dice se possiamo considerare gaussiana la nostra variabile. Una generica variabile normale può essere indicata con può essere indicata con N ( μ , σ 2 ) e presenta:
- media (valore teorico della media) = μ ( miu )
- varianza (valore teorico della varianza) = σ 2 ( sigma ) Quindi, conoscendo la media e la varianza, possiamo riuscire conoscere la probabilità di tutti i valori possibili della variabile e riuscire a prevedere l’andamento generale di una popolazione di riferimento e stimare il valore vero. La funzione di distribuzione deve sottendere, come valori di probabilità, la somma di tutti i valori e come risultato complessivo devono dare sempre 1. Essendo la distribuzione di una variabile continua, il suo valore per un dato x corrisponde alla densità di probabilità per quel valore. In questa distribuzione, il picco dovrebbe giacere sulla media e le dimensioni dipendono dalla varianza. Infatti, tanto più è grande la varianza, tanto più la curva è allargata e schiacciata (e viceversa). La varianza è sinonimo di maggiore variabilità e maggiore distanza dalla media, quindi, corrisponde alla larghezza della curva. Con una variabile continua che possiamo assumere abbia una distribuzione simmetrica, è utile usare la distribuzione gaussiana come riferimento. Diventa indispensabile andare a stabilire quanto lontani siamo dalla distribuzione gaussiana. Una combinazione lineare di più variabili gaussiane crea una nuova variabile che conserva le caratteristiche della distribuzione gaussiana. Tuttavia, lo stesso non accade per altri tipi di combinazioni come il prodotto e il rapporto fra due variabili gaussiane, l'elevamento a potenza e altre operazioni non lineari. In questi casi la nuova variabile (ottenuta tramite la trasformazione delle variabili di partenza) ha una distribuzione diversa dalla normale.