Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


appunti programma statistica psicometrica, Dispense di Statistica

appunti lezioni statistica psicometrica

Tipologia: Dispense

2020/2021

Caricato il 18/04/2024

autilia-ammendola-1
autilia-ammendola-1 🇮🇹

11 documenti

1 / 10

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
STATISTICA: scienza che mediante metodi qualitativi e quantitativi studia un collettivo per
descrivere o prevedere un fenomeno
STATISTICA PSICOMETRICA: insieme di tecniche qualitative e quantitative di indagine
psicologica che tende alla valutazione del comportamento umano
STATISTICA DESCRITTIVA: branca della statistica che mediante indici di tendenza centrale,
posizione, variabilità e di froma studia e riassume l’informazione contenuta in un determinato
collettivo: insieme di unità statistiche oggetto di studio (termine generico)
POPOLAZIONE: insieme di unità statistiche omogenee rispetto ad alcune caratteristiche
(es.maschi)
CAMPIONE: insieme di unità statistiche (xi) estratto da una popolazione di cui è un qualche modo
rappresentativo
CARATTERE O VARIABILE: qualunque attributo che assume valori diversi quando sottoposto ad
osservazione (es. colori occhi)
MODALITA’ O CATEGORIE: manifestazione del carattere (es. verdi, blu, marroni)
SCALA DI STEVENS: MUTABILI VARIABILI
NOMINALE ORDINALE METRICA: A LIVELLO
A RAPPORTO
DICOTOMICA POLITOMICA
N.B: I TEST PSICOLOGICI SONO METRICI TRANNE LA SCALA LITCHERT ( ES. DA 1 A 10,
1=MINIMO 10=MASSIMO )CHE E’ ORDINALE
STATISTICA DESCRITTIVA
INDICI DI TENDENZA CENTRALE: INDICANO IL CENTRO DELLA DISTRIBUZIONE
Moda: modalità che corrisponde alla frequenza più elevata.
Calcolabile in tutte le scale (nom. Ord. Nom)
Possono essere distribuzioni bimodali, multimodali o amodali
La moda è centro di ordine 0 ovvero minimizza gli scarti elevati a 0
MEDIANA: modalità che occupa la posizione centrale ella serie ordinata lasciando dietro il 50% e
davanti l’altro 50.
Calcolabile in scale ordinali e metriche
Corrisponde al Q2
Centro di origine 1, minimizza gli scarti elevati a 1
MEDIA: modaltà che rappresenta la condizione di equidistribuzione del carattere, ovvero il
baricentro della distribuzione
È la somma di tutte le modalità, divisa per la numerosità del collettivo
Calcolabile solo su scale metriche
Più sensibile della mediana ai valori estremi (outliers)
Poprietà: internalità = è sempre compresa tra minimo e massimo della distribuzione
pf3
pf4
pf5
pf8
pf9
pfa

Anteprima parziale del testo

Scarica appunti programma statistica psicometrica e più Dispense in PDF di Statistica solo su Docsity!

STATISTICA: scienza che mediante metodi qualitativi e quantitativi studia un collettivo per descrivere o prevedere un fenomeno STATISTICA PSICOMETRICA : insieme di tecniche qualitative e quantitative di indagine psicologica che tende alla valutazione del comportamento umano STATISTICA DESCRITTIVA : branca della statistica che mediante indici di tendenza centrale, posizione, variabilità e di froma studia e riassume l’informazione contenuta in un determinato collettivo: insieme di unità statistiche oggetto di studio (termine generico) POPOLAZIONE : insieme di unità statistiche omogenee rispetto ad alcune caratteristiche (es.maschi) CAMPIONE : insieme di unità statistiche (xi) estratto da una popolazione di cui è un qualche modo rappresentativo CARATTERE O VARIABILE : qualunque attributo che assume valori diversi quando sottoposto ad osservazione (es. colori occhi) MODALITA’ O CATEGORIE: manifestazione del carattere (es. verdi, blu, marroni) SCALA DI STEVENS : MUTABILI VARIABILI NOMINALE ORDINALE METRICA: A LIVELLO A RAPPORTO DICOTOMICA POLITOMICA N.B: I TEST PSICOLOGICI SONO METRICI TRANNE LA SCALA LITCHERT ( ES. DA 1 A 10, 1=MINIMO 10=MASSIMO )CHE E’ ORDINALE STATISTICA DESCRITTIVA INDICI DI TENDENZA CENTRALE : INDICANO IL CENTRO DELLA DISTRIBUZIONE Moda : modalità che corrisponde alla frequenza più elevata. Calcolabile in tutte le scale (nom. Ord. Nom) Possono essere distribuzioni bimodali, multimodali o amodali La moda è centro di ordine 0 ovvero minimizza gli scarti elevati a 0 MEDIANA : modalità che occupa la posizione centrale ella serie ordinata lasciando dietro il 50% e davanti l’altro 50. Calcolabile in scale ordinali e metriche Corrisponde al Q Centro di origine 1, minimizza gli scarti elevati a 1 MEDIA : modaltà che rappresenta la condizione di equidistribuzione del carattere, ovvero il baricentro della distribuzione È la somma di tutte le modalità, divisa per la numerosità del collettivo Calcolabile solo su scale metriche Più sensibile della mediana ai valori estremi (outliers) Poprietà: internalità = è sempre compresa tra minimo e massimo della distribuzione

Invarianza alle trasformazioni= è invariante rspetto alle trasformazioni lineari Scarti= è la somma degli scrati di ogni valore della media è sempre uguale a 0 Minimi quadrati= è centro di ordine 2 ovvero minimizza gli scarti elevati al quadrato INDICI DI POSIZIONE QUANTILE : punteggio della distribuzione al di sotto del quale è stata raccolta una certa percentuale di dati Calcolabile su scala metrica o ordinale Quantile è un termine generico. INDICE DI VARIABILITA’ : ATTITUDINE DI UN CARATTERE A VARIARE DEVIANZA: somma de quadrati degli scarti della media VARIANZA: media dei quadrati degli scarti della media DEVIAZIONE STANDARD : Radice quadrata della varianza COEFFICIENTE DI VARIAZIONE : tutte le misure viste finora sono di variabilità assoluta. Il cv è una misura di variabilità relativa ovvero permette di confrontare due inisemi di dati per verificare quale dei due ha la variabilità maggiore INDICI DI FORMA Una distribuzione si dice simettrica quando dividensola con un asse al centro le 2 metà saranno uguali. Se non è simemtrica si parla d asimmetria CURTOSI : indica la variabilità dovuta ai valori meno frequenti rispetto quelli più vicini alla media. Distribuzione normocurtica: dati mediamente concentrati attorno alla media. Forma a campana della curva (curva normale) Distribuzione platicurtica: dati scarsamente concentrati attorno alla media. Coda schiacciata della curva Distribuzione leptocurtica: dati fortemente concentrati attorno alla media. Forma allungata della curva. STATISTICA INFERENZIALE Branca della statistica che mediante tecniche basate sul calcolo della probabilità permette di fare potesi e trarre inferenze su una popolazione a partire da 1 o più campioni di osservazione Probabilità : msura dell’avveribilità di un evento. Eventi possibili: spazio campionario (omega). DISGIUNTA: si applica la regola della somma. Si commette su un solo evento con più puntate INCOMPATIBILI: il verificarsi di un evento non può coincidere con il verificarsi dell’altro COMPATIBILI: il verificarsi di un evento può coincidere con il verificarsi dell’altro CONGIUNTA: Si scommette su più eventi con una sola puntata. Calolcabile solo per eventi compatibili

  • EVENTI INDIPENDENTI (con reinserimento): il verificarsi del primo evento non modifica la probabilità del verificarsi del secondo
  • EVENTI DIPENDENTI (senza reinserimento): il verificarsi del primo evento modifica la probabilità del verificarsi del secondo.

Binomiale: 4 casi di applicazione (VEDI QUADERNO) DISTRIBUZIONE NORMALE N La variabile casuale normale è una variabile casuale continua i cui valori vanno da – infinito a +infinito (nella pop). La sua importanza è dovuta al fatto che molti dei fenomeni che si misurano in natura all’aumentare del numero di osservazione (ossia di n) tendono a “normalizzare” cioè a distribuirsi secondo una curva a campana (vedi teorema limite centrale) La v.c normale è simmetrica (media, moda, mediana coincidono) è un unimodale e normocurtica I parametri sono: μ (massimo della funzione) e sigma (sarebbe la varianza rivolta alla popolazione) L’area sottesa all’intera curva rappresenta l’intero spazio campionario quindi ha valore 1˜˜ AREA CURVA INTERA: 1 AREA META’ CURVA: 0. Gli intervalli compresi tra le dev.standard sono sempre costanti Come si calcola la probabilità di un intervallo di valori? Dato che la probabilità corrisponde ad un’area sottesa alla curva per calcolarla avremo bisogno degli integrali. Esistono tavole con integrali già sviluppati per usarle occorre inanzitutto però standardizzare i valori di interesse STANDARDIZZARE: significa trasformare un punteggio grezzo xi in un punteggio standard zi, ovvero trasferire il punteggio grezzo su una distribuzione normale standardizzata cioè una distribuzione normale che ha i paramentri fissi. μ= 0 SIGMA= 1 Una volta standardizzato si cerca nella tavola Z per indentificare il valore dell’ area. La normale gode della proprietà della riproduttività. La somma di g variabili casuali normali N (μ e sigma) identiche e indipendenti è ancora una varabile casuale normale con parametri g * μ e g*sigma IDENTICHE: con la stessa distribuzione di probabilità INDIPENDENTI: distribuzione di probabilità composte da unità indipendenti tra loro Sia y= x1 +x2+….xn e xi ˜ N(μ e sigma) allora y ˜ N(μ; sigma) TEOREMA DEL LIMITE CENTRALE Indioendentemente dalla forma iniziale di una distribuzione essa tede a normalizzarsi quando aumenta la numerosità del campione n In particolare si approssima alla normale se n > 30 e converge alla normale se n  ∞ O: la somma di n variabili casuali identiche e indipendenti converge alla varabile casuale normale per n  ∞ O: data una successione di variabili casuali con la stessa media e la stessa deviazione standard, la successione converge ad una variabile casuale normale per n ∞.

DSTRIBUZIONI CAMPIONARIE

Le distribuzioni di probabilità descrivono il nodo di distribuirsi di una variabile casuale in un determinato gruppo di punteggi ovvero un campione e i singoli punti della distrubuzione rappresentano le singole unità statistiche (xi) che compongono il campione. Le singole unità statistihe vengono sintetizzate da un idice descrittivo ovvero da una statistica campionaria come la media (nella normale), la proporzione di successi p (nella biniomale) o la varianza (nel chi quadrato). Distribuzione campionaria: rappresentano l’insieme di tutti i campioni di ampiezza n che compongono una popolazione ognuno dei quali possiede una singola statistica campionaria. I punti di una dstribuzione campionaria sono quindi le singole statstiche campionarie di ogni campione. Queste ultime saranno sintetizzate dalla loro speranza matematica che si ipotizza coincida con il parametro indagato nella popolazone. Una statistica campionaria è una variabile casuale o aleatoria che sintetizza l’info contenuta in un campione. Parametro è il corrispettivo di una statistica nella popolazione. È la caratterstica della popolazione che indaghiamo tramite la statstica del campione. STATISTICA: Media(campionaria), P(proporzione campionaria), S AL QUADRATO(varianza campionaria) PARAMETRO: μ, PI GRECO, SIGMA QUADRO La proporzione campionaria è una statistica che viene usata soprattutto per variabili qualitative P= K/n P= 1/n ∑ x  FORMULA SOLO TEORICA In singoli campioni si calcolano il numero k di successi su n prove e si ottiene una p per ognuno di loto (sono singole binomiali). Queste p riportate su un’unica curva danno vita alla distribuzione delle proporzioni campionarie ovvero alla distribuzione che considera il numero medio di successi in campioni di n elementi. Anche le distribuzioni campionarie hanno speranza matematica e deviazione standard. Nel caso della distribuzione di p: E(P)= ∏ ∂(questo è sigma)= √∏ * (1-∏)/n Anche per le distribuzioni campionarie si può effettuare la standardizzazone delle singole statistiche. Nel caso della distribuzione di P : z= p - ∏ / √∏ * (1 - ∏)/n per i dati quantitativi su una distribuzione della media campionaria, ovvero la distribuzione delle medie di tutti i campioni di ampiezza n estraibili della popolazione. la media campionaria è una variabile casuale ed è una statistca campionaria, funzione del campione casuale estratto (x1, x2 ….. xn). MEDIA= ∑ xn/n

Uno stimatore è una variabile casuale ed è una qualsiasi funzione definita sul campione casuale estratto in grado di fornire info utili circa un parametro incognito della popolazione. Il valore dallo stiatore in corrispondenza di uno specifico campione è chiamato stima. Uno stiatore si dice naturale se possiede la stessa espressione matematica del parametro che stima ù8ad es. Media e Mi hanno la stessa formula) Per valutare l’affidabilità di uno stimatore si usano 3 proprietà: correttezza o non distorsione: si dice corretto se la sua speranza atematica è ugale al parametro che stima. Se ad esempio T è uno stimatore di teta per definire T uno stimatore corretto si vede verificarse che: E(T) = Ѳ Consistenza = uno stimatore si dice consistente se all’aumentare della numerosità caampionaria la sua distribuzione di porbabilità si concentra in corrispondenza del parametro che stima (cioè i valori vicini al parametro i più frequenti) Efficienza : se possiede la variabilità minore rispetto a tutti gli altri stimatori che misurano lo stesso parametro. CAMPIONE CASUALE/OSSERVATO Campione casuale: collezione di n variabili identiche e indipendenti (uno dei campioni potenzialmente estraibili da una pop) Campione osservato: insieme dei numeri reali realizzazione delle n variabili casuali del campione(campione effettivamente estratto) INTERVALLI DI CONFIDENZA Modo per stimare il parametro di una popolazione a partire da una statistica campionaria è quello di stabilire un range dei possibili valori che questo parametro può assumere, ovvero stabilire un intervallo di confidenza. È possibile stabilire diversi livelli di intervallo: i più comuni sono al 90%, al 95 e al 99. Per stabilire l’intervallo di confidenza della media della pop MI si parte dalla formula della standardizzazione e si effettuano una serie di passaggi logici per isolare MI Media – Z * S / √ n – 1 < μ < media + Z * S/√ n – 1 I valori di + - z si trovano in base al livello di confidenza scelto. Se ad esempio abbiamo scelto un intervallo al 95% significa che la parte di curva restante è il 5% che distribuito sulle due code della distribuzione diventa 2,5% ovvero 0,025%. In base a questo valore di area localizziamo i valori z sulla tavola z e lo inseriamo nella formula per creare l’intervallo. Sulla tavola si cerca nelle celle colonna b il valore più vicino a 0,025 e si vede a che corrisponde SE VOGLIAMO TROVARE UN PUNTO Z IN BASE ALLE AREE: 0,05  1, 0,025  1, 0,01  2, 0,005  2, LA VERIFICA DELLE IPOTESI

È un procedimento statistico mediante il quale si può stabilire se uno o più campioni sono rappresentativi di una o più popolazioni, tramite l’applicazione di test della significatività. Si pate da un obiettivo di ricercare ovvero un’assunzione da verificare tramite un esperiemento. Quando si conduce un esperimento ovvero quando si applica un test si hanno 2 ipotesi in opposizione tra loro: IPOTESI NULLA (H0): l’ipotesi di partenza che si vuole confutare. Si assume che il parametro di una pop sia uguale ad un determinato valore noto. IPOTESI ALTERNATIVA O SPERIMENTALE (H1): è l’ipotesi che si vuole sostenere mediante l’esperiemento. Si assume che il parametro sia minore, maggiore o diverso da un determinato valore. Si possono avere 2 ipotesi: A) HP a monodirezione: se abbiamo i simboli < o > cioè se già noto che la curva della popolazione presente sotto l’ipotesi alternativa si trovi a sinistra o a destra dell’ipotesi nulla. B)HP a bidirezionale: se abbiamo il simbolo diverso cioè quando non sappiao se la curva H1 si trova a sinistra o destra di H0. Il processo di verifica delle ipotesi avviene in un ottica dalsificazionista ovvero per dimostrare che h1 è probabilmente vera, si deve dmostrare H0 è probabilemnte falsa. Questo avviene perché anche se siao interessati a H1, essa non ci fornisce valori numerici esatti con cui lavorare, H invece ci offre un valore certo con cui lavorare è anche detta infatti ipotesi del lavoro. L’area estrema di H0 è detta livello di significatività (a) è rappresenta la zona in cui H0 è troppo improbabile per essere vera e va quindi rifutata. A è quindi lo spartiacque tra H0 e H1 e divide H in due aree: la zona di accettazione e di rifiuto. Se l’ipotesi alternativa è bidirezionale a si troverà su entrambe le code della distribuzione di H0 ed il suo valore va dunque dimezzato (se la distribuzione è simmetrica). La regione di accettazione e rifiuto sono sottoinsieme dello spazio campionario ovvero appartengono entrambi ad H0. In alcuni casi esiste una regione di indecisione ovvero una zona in cui H0 e H1 sono troppo sovrapposte e non è possibile stabilire l’ipotesi corretta. Per descrivere se accettare o rifiutare H0 si applica la statistica test propria di ciascun tets ( ovvero la formula) che sarà il nostro valore calcolato da confronatre, un valore critico ovvero il punto dal quale inzia la zona di rifiuto. Il valore critico infatti si ricava in base ad a usano la tavola di ciscun test. Dato che il procedimento della verifica delle ipotesi avviene in un’ottica probabilistica, quando si prende una decisione su H0, non si sarà mai certi di non aver commesso un errore Tipo di errore: PRIMO TIPO O SPECIE (a) = rifiutare un H0 che in realtà è vera SECONDO TIPO O SPECIE (BETA): accettare un H0 che in realtà è falsa Beta è il corrispettivo di a nella curva di H La restante parte di H1 ovvero 1 – beta rappresenta la probabilità di rfiutare correttamente un H falsa ome tale è chiamata potenza statistica del test. La probabilità di commettere dei due errori varia in base all’ampiezza della regione a. Se a è molto piccola aumenta la probabilità di commettere un errore di II tipo ma diminuisce quella di commettere un errore di I tipo Se a è molto grande aumenta la probabilità di commettere un errore di tipo I ma diinuisce quella di commettere un errore di tipo II e di conseguenza aumenta la potenza del test.

Il rapporto di correlazione eta quadro valuta l’associazione tra una mutabile sconnessa e una variabile e valuta in pratica qual è la quota della variabilità totale misurata sulla variabile dipendente che è attribuibile alla variabilità between ovvero all’effetto speriementale della var.dipendente x Come test se i campioni sono 3  ANOVA Se chiede solo l’indice  eta quadro Tra 2 caratteri ordinali o tra 1 ordinale e 1 metrica INDICE ps( RHO) di spearman e test di spearman Tra 2 variabili metriche  coefficiente di correlazione lineare semplice prodotto-momento di Bravais Person p (r di pearson). TEST SU P DI PEARSON La r di pearson è definibile come la covarianza standardizzata La covarianza è la misura di quanto 2 variabili metriche variano in modo congiunto  TEORICA La r di pearson valuta se tra due variabili esiste una relazione di tipo lineare ovvero una relazione descrivibile attraverso una linea retta

  • 1 ≤ p ≤ + Se p +/ -  relazione lineare perfetta psotiva/negativa: le due var. sono linearmente dipendenti Se p = o  assenza di relazione lineare: le due var sono linearmente indipendenti ALTRI MODI DI SCRIVERE LA FORMULA DELLA R DI PEARSON (FORMULARIO) COV(X;Y) = ∑(X – XMEDIO) (Y – YMEDIO)/n O COV (ZX;ZY) = ∑(ZX * ZY)/n