Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Dispensa psicometria, Dispense di Psicometria

Dispense di psicometria anno accademico 2022-2023 contenenti appunti presi durante la lezione integrati con le slide proposte dalla professoressa.

Tipologia: Dispense

2022/2023

Caricato il 27/02/2023

Chiaramente00
Chiaramente00 🇮🇹

4.4

(5)

19 documenti

1 / 93

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
PSICOMETRIA
Prof. Silvia Testa
Statistica per la ricerca sociale
esame orale se fatti i test di autoverifica: 22 novembre 9-11 e 10 gennaio 10-12
Gruppo B
Fornisce gli strumenti per fare ricerca, per test psicologici e scegliere quale utilizzare in base ai casi,
anche elementi di vita quotidiana.
Psicometria è una parola composta: una parole rimanda alla psiche e l’altra alla misurazione, quindi
significa misurazione di proprietà mentali Le proprietà mentali son caratteristiche degli individui
non direttamente osservabili, ma tramite degli strumenti: capacità cognitive, atteggiamenti, tratti
della personalità e percezioni. Caratteristiche che distinguono gli individui.
Esistono due definizioni:
Restrittiva: disciplina che rileva le proprietà. Metodi matematico-statistici per lavorare su ciò che
vogliamo conoscere, misurare. Costruzione di test psicologici e valutazione di quei test: sono
attendibili? es. vogliamo misurare l’intelligenza verbale: non possiamo saperlo noi perché potremmo
auto-ingannarci, quindi sopravvalutarsi o sottovalutarsi. Non si ha una scala su cui basarsi. Non
sappiamo nello specifico la definizione di intelligenza verbale. Siccome non si può auto-valutarsi
bisogna cercare i comportamenti che sono sintomi di intelligenza verbale: un esempio è la
conoscenza dei vocaboli. Bisogna trovare degli indizi comportamentali come la lettura di brani con
comprensione del testo, prove di analogie verbali. Si analizza con la psicometria l’accuratezza delle
risposte, si mettono in relazione i punteggi ottenuti con altre scale.
Estensiva: disciplina che si occupa delle procedure che si avvalgono di linguaggio matematico-
statistico, a servizio dello studio di fenomeni di interesse per la psicologia.
Gli strumenti sono procedure statistiche di base usate per analizzare i dati della ricerca empirica (un
dato rilevato dai sensi, la ricerca è una risposta che si basa su dei fatti, un insieme di operazioni per
produrre delle risposte sulla realtà).
La ricerca empirica è una successione di operazioni per produrre risposte e domande sulla realtà:
definizione usata in ogni ambito della ricerca. Insieme di procedure per trovare risposte usando per
rispondere dei dati della realtà.
Un processo di ricerca empirica può essere articolato su più livelli:
1. disegno della ricerca, progettazione: una sfida, momento in cui decidiamo qual è
l’oggetto della ricerca per capire come raggiungere determinati risultati. È il momento in cui
si passa in rassegna gli studi anche precedenti, lo stato dell’arte e la letteratura sul fenomeno
che vogliamo analizzare. Si decidono anche i passi successivi e come lavoreremo con i dati e
come verranno pubblicati i risultati. Il successo del risultato dipende moltissimo da questa
prima fase. Es. studiare la criminalità minorile: quali sono le condotte criminali? Come li
rileviamo? Intervistiamo dei minori, dei testimoni privilegiati o fonti ufficiali? Quale fascia di
età consideriamo? Quale territorio? Quali altre caratteristiche di questi minori vogliamo
rilevare per comprendere meglio il fenomeno? Con quali procedure analizziamo i dati?
1. organizzazione e produzione dei dati: momento in cui si rilevano le informazioni in
base al tipo di ricerca che si conduce. Ci sono due tipi fondamentali di ricerca:
osservazionale: osservazione dei dati tramite questionari, griglie, si rileva qualcosa di
esistente e sperimentale: il ricercatore manipola le informazioni (es. manipolazione dosaggio
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d

Anteprima parziale del testo

Scarica Dispensa psicometria e più Dispense in PDF di Psicometria solo su Docsity!

PSICOMETRIA

Prof. Silvia Testa

Statistica per la ricerca sociale esame orale se fatti i test di autoverifica: 22 novembre 9-11 e 10 gennaio 10- Gruppo B Fornisce gli strumenti per fare ricerca, per test psicologici e scegliere quale utilizzare in base ai casi, anche elementi di vita quotidiana. Psicometria è una parola composta: una parole rimanda alla psiche e l’altra alla misurazione, quindi significa misurazione di proprietà mentali Le proprietà mentali son caratteristiche degli individui non direttamente osservabili, ma tramite degli strumenti: capacità cognitive, atteggiamenti, tratti della personalità e percezioni. Caratteristiche che distinguono gli individui. Esistono due definizioni:

  • Restrittiva : disciplina che rileva le proprietà. Metodi matematico-statistici per lavorare su ciò che vogliamo conoscere, misurare. Costruzione di test psicologici e valutazione di quei test: sono attendibili? es. vogliamo misurare l’intelligenza verbale: non possiamo saperlo noi perché potremmo auto-ingannarci, quindi sopravvalutarsi o sottovalutarsi. Non si ha una scala su cui basarsi. Non sappiamo nello specifico la definizione di intelligenza verbale. Siccome non si può auto-valutarsi bisogna cercare i comportamenti che sono sintomi di intelligenza verbale: un esempio è la conoscenza dei vocaboli. Bisogna trovare degli indizi comportamentali come la lettura di brani con comprensione del testo, prove di analogie verbali. Si analizza con la psicometria l’accuratezza delle risposte, si mettono in relazione i punteggi ottenuti con altre scale.
  • Estensiva : disciplina che si occupa delle procedure che si avvalgono di linguaggio matematico- statistico, a servizio dello studio di fenomeni di interesse per la psicologia. Gli strumenti sono procedure statistiche di base usate per analizzare i dati della ricerca empirica (un dato rilevato dai sensi, la ricerca è una risposta che si basa su dei fatti, un insieme di operazioni per produrre delle risposte sulla realtà). La ricerca empirica è una successione di operazioni per produrre risposte e domande sulla realtà: definizione usata in ogni ambito della ricerca. Insieme di procedure per trovare risposte usando per rispondere dei dati della realtà. Un processo di ricerca empirica può essere articolato su più livelli:
    1. disegno della ricerca, progettazione: una sfida, momento in cui decidiamo qual è l’oggetto della ricerca per capire come raggiungere determinati risultati. È il momento in cui si passa in rassegna gli studi anche precedenti, lo stato dell’arte e la letteratura sul fenomeno che vogliamo analizzare. Si decidono anche i passi successivi e come lavoreremo con i dati e come verranno pubblicati i risultati. Il successo del risultato dipende moltissimo da questa prima fase. Es. studiare la criminalità minorile: quali sono le condotte criminali? Come li rileviamo? Intervistiamo dei minori, dei testimoni privilegiati o fonti ufficiali? Quale fascia di età consideriamo? Quale territorio? Quali altre caratteristiche di questi minori vogliamo rilevare per comprendere meglio il fenomeno? Con quali procedure analizziamo i dati?
    2. organizzazione e produzione dei dati: momento in cui si rilevano le informazioni in base al tipo di ricerca che si conduce. Ci sono due tipi fondamentali di ricerca: osservazionale: osservazione dei dati tramite questionari, griglie, si rileva qualcosa di esistente e sperimentale: il ricercatore manipola le informazioni (es. manipolazione dosaggio

di un farmaco: 200 persone soffrano di insonnia, su 100 il farmaco e su 100 placebo. Si producono i dati, non vengono rilevati. Il modo in cui andiamo a produrre dipende dall’approccio che stiamo utilizzando che dipende dal disegno che abbiamo scelto. Le informazioni vanno poi organizzate anche con altri dati già presenti (fonti secondarie), non arrivano da noi, ma noi le organizzeremo in modo finalizzato a rispondere alle nostre domande di ricerca. L’organizzazione avviene in una matrice se i dati sono di forma numerica, ma se si cambia contesto di ricerca dove i dati non sono numeri, ma documenti l’organizzazione dei dati questi materiali vengono organizzati secondo chi li ha prodotti, secondo un ordine cronologico o secondo altri principi che permettano l’analisi dei dati raccolti.

  1. analisi dei dati per giungere ad una risposta: elaborazione per rispondere alle domande di partenza. Le informazioni vengono messe in relazione tra di loro (studiare una popolazione sperduta significa studiare i manufatti, in ambito psicologico invece entra in campo la statistica, i dati prodotti sono codificati con dei numeri e si utilizzano delle procedure statistiche).
  2. esposizione dei risultati: si racconta ciò che è stato rilevato e si confronta con la letteratura, si descrivono i limiti della ricerca, ma anche le nuove scoperte. Si scoprono delle limitazioni legate al tipo di ricerca scelta all’inizio. Ricerca empirica di tipo quantitativo: riguarda l’organizzazione dei dati tramite una matrice e i dati vengono analizzati impiegando strumenti della statistica (branca del sapere che si occupa di costruire strumenti per analizzare i dati non testuali, ma numerici, in cui è stato possibile rendere ogni notazione un numero). La matrice più utilizzata è CASO PER VARIABILE (CxV). I casi sono tipicamente informazioni sugli individui e le colonne sono delle variabili (genere, età). Le procedure statistiche si dividono in due branche: •descrittiva •inferenziale Conoscenze e strumenti di base di ogni ricerca empirica e di base per l’approccio restrittivo della psicometria. La statistica descrittiva è una branca autonoma con procedure per sintetizzare o porre in relazione dati raccolti su un collettivo (insieme di oggetti/individui su cui si concentra la propria analisi). Es. 1000 individui che decidono chi votare: c’è bisogno di uno strumento che sintetizzi o che raggruppi in base a delle caratteristiche (ad esempio come cambia il voto in base al sesso). Altro esempio: reddito medio delle famiglie italiane: bisogna sintetizzare le informazioni. La statistica descrittiva fornisce gli strumenti per rispondere a queste domande. La statistica inferenziale invece permette di estendere i risultati ottenuti su un campione di osservazioni all’intera popolazione. Il tipo di procedura e di conclusione sono più complessi. Si intervista un sottoinsieme e gli strumenti della statistica permetteranno di generalizzare, non è una generalizzazione deterministica perché bisognerebbe indagare tutta la popolazione, ma si arriva una conoscenza di natura probabilistica. Ci sono dei livelli di significatività che tiene conto dell’incertezza visto che non si lavora sull’intero collettivo. Bisogna tener conto della possibilità che ci si sta sbagliando. Es. efficacia di una terapia o di un farmaco, qualità di un vino (selezionare un sottoinsieme di bottiglie e testare poi le qualità), relazione tra tratti di personalità e dipendenza da internet, atteggiamento degli italiani verso gli immigrati. Questo è più complesso perché il percorso è più lungo: si parte da un universo di cui vorremmo conoscere tutto, ma non possiamo perché è troppo grande. Dovremo quindi scegliere un campione seguendo delle regole. Una volta scelto il campione si otterranno allora i risultati e si analizzeranno i dati. Servono delle procedure per permettere la generalizzazione.

•numero di stati della proprietà che si vogliono mantenere distinti. •codici da assegnare ai valori della variabile. Si tratta di un insieme di decisioni per concretizzare un codice numerico nella matrice CxV. ESEMPIO: stato civile (proprietà) Coniugato Celibe/Nubile Separato Divorziato Vedovo -> sono stati Si vogliono codificare questi stati, oppure alcuni stati possono essere codificati insieme. Decido che accorpo gli stati di separati, divorziati e vedovi in ALTRO e lascio separati i coniugati ed i celibi/nubili. Gli stati rilevati attraverso un questionario sono detti MODALITÀ, CATEGORIE O VALORI. Le tre categorie saranno allora: Coniugato, nuvole o altro. Per passare ad una variabile devo anche decidere i codici numerici da assegnare alle categorie. Codice 1: coniugato Codice 2: celibe/nubile Codice 3: altro Sono partito a cinque stato e le ho rese 3 categorie. Il codice numerico è solo un’etichetta che distingue le persone che si trovano nei diversi stati. Esempio 2: livello di istruzione (proprietà che diventa poi una variabile) Dottorato di ricerca Laurea magistrale Laurea triennale Diploma Licenza media Nessun titolo Quanti stati mantengo? Unisco licenza media e nessun titolo, lascio a sé lo stato diploma, unisco laurea magistrale e triennale e lascio il dottorato di ricerca. Abbino poi i codici numerici 1,2,3, e 4. Chi ha ricevuto un livello di istruzione più basso viene riconosciuto con un codice numerico più basso. Posso scegliere qualsiasi numero, ma che siano in ordine. ESEMPIO 3: anni di scolarità Dottorato di ricerca: 22 -> non sono codici numerici casuali, ma gli anni effettivi di istruzione. Laurea magistrale: 18 Laurea triennale: 16 Diploma: 13 Licenza media: 8 Di una stessa proprietà (istruzione) possiamo rilevarlo come variabile in due modi diversi: titolo di studio più elevato e anni di istruzione. ESEMPIO 4: proprietà fisiche come altezza e peso. Bisogna scegliere l’unità di misura, scegliere il numero di cifre decimali e scegliere lo strumento di misura e di chi registra l’esito della misurazione.

Gli stati possibili sono infiniti perché dipende dall’unità di misura (se uso il metro quasi tutti sarebbero un metro, posso discriminare di più usando i cm). Bisogna quindi scegliere l’unità di misura e decidere quanti stati mantenere distinti: mantengo distinti chi è alto 165,5 e 165,8? No, li accorpo. Ci sono anche qui dei limiti per la scelta dei codici numerici. Se devo indagare sull’età posso usare delle fasce, però perderei delle informazioni e posso quindi decidere di chiedere l’età compiuta. Se lavoro con dei neonati andrò a considerare i mesi o i giorni. Il sottoinsieme dipende dal contesto di ricerca. ESEMPIO 5: proprietà mentali come l’intelligenza Gli stati sono virtualmente invisibili. La definizione operativa in caso di proprietà mentali (non misurabili) è fatta da un insieme di decisione come quale materiale empirico si usa per rilevare indizi sullo stato della proprietà. Bisogna scegliere quale prove somministrare: l’insieme delle prove che scelgo di utilizzare rientra nella definizione operativa. Verrà prodotto un numero che indica lo stato di quella determinata proprietà. Si utilizzano delle prove già disponibili e di cui si ha già una garanzia: test mentali. Due test per rilevare l’intelligenza cognitiva sono: la WAIS e la KABC: strumenti che danno un punteggio interpretato come QI, ma sono composti da prove diverse e per questo la definizione operativa è diversa. Ogni individuo avrà un punteggio diverso. Per arrivare al numero si usano le informazioni presenti sul manuale del test (come usare lo strumento per produrre un risultato). È importante mantenere distinguere variabili e proprietà. I codi 1 e 2 possono avere un significato diverso a seconda del tipo di variabile. I calcoli statistici delle diverse variabili sono molto diversi tra loro. Modi di distinguere le variabili (OPERAZIONI CANONICHE): •La classificazione in categorie non ordinate (stato civile, sesso e credo religioso): variabile CATEGORIALE •Ordinamento (classificazione in categorie ordinate, come l’età): variabile ORDINALE •misurazione (altezza): variabile CARDINALE, lì i numeri iniziano a mantenere le proprietà dei numeri cardinali (es. 2 continua ad essere la metà di 4). •conteggio (numero di figli): variabile CARDINALE Le variabili categoriali e ordinali possono anche unite come variabili QUALITATIVE, mentre le variabili cardinali sono dette QUANTITATIVE. In ambito psicologico non è sufficiente e bisogna classificare in modo più sofisticato. CLASSIFICAZIONE DEI TIPI DI VARIABILI SECONDO STEVENS (1946): Quattro livelli di scala: 0.Scala nominale (variabili categoriali) 1.Scala ordinale (variabili ordinali) 2.Scala di intervalli 3.Scala di rapporti ->insieme intervalli e rapporti sono le variabili quantitative Tra i quattro tipi c’è un ordine e si può parlare di livelli, sono delle scale che richiamano una scala di misura. Le operazioni che facciamo per costruire una variabile sono un’operazione di misura. Adotta una creazione estensiva del concetto di misurazione. “La misurazione, nel senso più ampio, consiste nell’attribuzione di numeri a oggetti o eventi seguendo determinate regole. Il fatto che si possono assegnare dei numeri seguendo regole differenti porta a differenti tipi di scala e differenti tipi di misurazione”. SCALA DI MISURA : un sistema che mette in relazione gli stati di oggetti su determinate proprietà e i numeri reali: <SE, f, SN>

I numeri sono delle semplici etichette. Per aprire il tipo di scala ci si chiede quale trasformazione ammissibile si può fare: in queso caso trasformare in qualsiasi numero. Un tipo di scala assoluta può essere rappresentata dal numero di accessi ad Instagram. Non tutte le colonne della CxV sono variabili (es. la prima colonna dove c’è l’identificativo, perché l’identificativo non è esito della definizione operativa di una proprietà) Una colonna è una variabile se:

• È l’esito della definizione operativa di una proprietà

• Presenta almeno due valori distinti (se un numero si ripete lungo tutta una colonna è una

costante non una variabile)

• Consente il confronto tra i valori: devo poter confrontare almeno le colonne tra di loro.

Solitamente non posso confrontare le righe tra loro perché non avrebbe senso, ma per alcune variabili lo posso fare. (Es. studio sul bilancio/tempo: come le persone spendono il loro tempo. In questo caso io posso confrontare quanto tempo il caso 1 passa a dormire rispetto al caso 2, ma posso vedere anche che se il caso 1 passa il 50% a dormire il caso 2 passa 30% a fare sport. Confronto dunque righe e colonne). COLUM CONDITIONAL : una matrice che consente solo confronti tra colonne ROW CONDITIONAL : una matrice che permette di confrontare solo le righe UNCONDITIONAL : una matrice che permette il confronto tra righe e colonne Statistica descrittiva monovariabile La statistica descrittiva fornisce strumenti per studiare i risultati di un’unica variabile, ma anche per mettere a confronto i risultati di più variabili. Se nella ricerca avremo raggiunto solo un sottoinsieme dell’universo che ci interessa passeremo anche alla statistica inferenziale, altrimenti ci fermiamo a quella descrittiva.

Monovarietà: lavora su una sola variabile alla volta. Statistiche che sintetizzano il contenuto di singole variabili. Multivariabile: statistica che analizzano più variabili Come si descrive una variabile categoriale?

• Distribuzione di frequenza : creare una tabella in cui mettiamo quante righe quante sono

le modalità della variabile e nella seconda colonna riportiamo il conteggio del numero dei casi che possiedono quella modalità. L’ultima riga è il totale, ovvero la somma delle frequenze che deve corrispondere al numero di casi. Frequenza assoluta (n): numero di casi che presenta una certa modalità della variabile. La distribuzione di frequenza (quando le variabili sono categoriali) si chiama serie sconnessa di frequenze. Faccio la sommatoria delle frequenze che vanno da 1 a K (n1+n2+n3...nk+...=N) Posso calcolare anche le frequenze relative o percentuali che si ottengono partendo dalla frequenza assoluta dividendola per la numerosità dei casi. La frequenza relativa (f) Sommando tutte le frequenze relative otteniamo 1 perché è la somma di tutte le proporzioni che quindi restituisce l’intero. Frequenze percentuali: q= fx Sommando tutte le q ottengo 100 Calcolando il rapporto solitamente si arrotonda alla terza cifra decimale per le frequenze relative, e alla prima cifra decimale per quelle percentuali. Le percentuali sono utili per mettere in relazione le diverse modalità dei casi, le variabili in due collettivi differenti (es. maschi/femmine). Frequenze percentuali sono anche più utilizzate perché sono più semplici da esprimere.

Esercizio Se è presente un’unica moda allora si dice distribuzione unimodale. Se rappresento la stessa variabile in collettivi diversi e in uno stesso collettivo c’è sempre la stessa frequenza allora la moda non esiste. Inoltre la moda può essere più di una (distribuzione bimodale) e in alcuni casi se le frequenze, anche se diverse sono molto simili, allora la moda non è molto informativa (es. nella colonna z).

• Operatori di dispersione: ho bisogno di un secondo valore che mi dica quanto la moda

sia informativa. Gli operatori di dispersione ci dicono quanta diversità, ovvero dispersione c’è tra i valori dei diversi casi. A seconda del tipo di variabile abbiamo operatori diversi. Quando ho una variabile categoriale uso l’ indice di Gini. Per le variabili categoriali la dispersione viene meglio detta eterogeneità. Esempio c’è meno eterogeneità nel caso A perché ci sono 80 individui su cento che sono uguali tra loro e 20 diversi. Mentre nel caso B sono 50 e 50. Si ha massima eterogeneità quando i casi si distribuiscono equamente tra le varie modalità. C’è meno dispersione quando c’è una modalità che prevale sulle altre Indice di mutabilità del Gini Formula: Se assume un valore piccolo allora ci sarà poca eterogeneità. Mentre sarà un valore alto quando c'è tanta eterogeneità. È la sommatoria delle frequenze relative al quadrato. Ci serve conoscere la scala su cui si posa il valore del Gini. Questa scala va da 0, ad un massimo che è dato da (K-1)/K. Esempio L'indice del Gini è una misura assoluta, cioè un numero che dipende dal numero di modalità della variabile. Dipende dall'unità di misura della variabile, se la variabile è cardinale. Possiamo passare da misure assolute a misure relative. Le misure relative assumono sempre valori compresi in un intervallo noto a priori. Un intervallo che non dipende dalle caratteristiche della variabile o dal numero dei casi. Solitamente l'intervallo scelto è quello tra 0 e 1. Misura assoluta= Se l'eterogeneità è 0 la moda sarà molto informativa. Più l'eterogeneità è alta meno la moda sarà informativa. DESCRIVERE VARIABILE ORDINALE:

  • Distribuzione di frequenza : è come per la variabile categoriale, ma le modalità devono essere

disposte in ordine crescente). Di nuovo la somma delle frequenze assolute restituisce il numero di casi. Possiamo sempre calcolare allo stesso modo le frequenze relative e percentuali. Se totale dà 1 sono frequenze relative, se dà 100 sono frequenze percentuali e se restituisce il numero dei casi, sono frequenze assolute. Se sommo più frequenze ottengo la frequenza cumulata. Nella colonna accanto alle frequenze percentuali troviamo le frequenze cumulate. La frequenze cumulate dell'ultima modalità sarà sempre 100.

  • Rappresentazione grafica
  1. Istogramma : rettangoli uno adiacenti all'altro, non sono separati come nel diagramma a barre. Non sono separati per sottolineare che c’è un ordine. Dobbiamo considerare l'orientamento dell'asse X.
  2. Spezzata a gradini: le frequenze sono sulle ordinate e sulle ascisse le modalità della variabile. Tiro su rettangoli cancellando poi le altezze. In questo caso riconosco che si tratta di frequenze cumulate perché l'andamento cresce.
  • Operatori di tendenza centrale: restituisco uno scalare che esprime sinteticamente come si è manifestata la proprietà in esame nell'intero collettivo. Una misura di tendenza centrale è un valore che rappresenta al meglio la distribuzione interna.
  1. Moda
  2. Mediana : tiene in considerazione che è presente un ordine. Va a cercare il valore che si trova al centro. E' la modalità che appartiene a quel caso che, dopo aver ordinato i casi dal valore più basso a quello più alto, divide esattamente a metà la distribuzione. Per calcolare la mediana bisogna, innanzitutto, disporre le modalità in ordine crescente. Dopodiché è necessario individuare il caso mediano. Nell'esempio la mediana è 1; 7 è l’identificativo del caso mediano. M=XcMdn cioè la mediana è il valore × che appartiene al caso mediano. Se N è dispari: Cmdn= (N+1) SeN è pari: avrò due casi mediani
  3. Cmdn= N/2 ( mediana scadente )
  4. Cmdn= (N/2)+1 ( mediana sufficiente )
    • Operatori di dispersione : la dispersione è un concetto un po' diverso per le variabili ordinali. Corrisponde sempre alla diversità. Nel caso della tabella la colonna Z è quella che possiede più diversità. Anche se anche in W ci sono due 50, in Z ci sono 50% persone con titolo elementare e 50% persone con laurea quindi molta più diversità rispetto a quelli che hanno titoli simili come in W.
  • Operatori di posizioni (o quantili): valori della variabile associati a posizioni particolari. Anche la mediana lo è perché è associata alla posizione in mezzo. I quantili sono valori della variabili che suddividono la distribuzione in un certo numero di porzioni equi-numerose (con la stessa frequenza dei casi). I più utilizzati sono i quartili (quando individuiamo 4 porzioni) i decili (10 porzioni) e i

e1= 3/2 0 ,655= 0. COME DESCRIVERE UNA VARIABILE CARDINALE: C’è ancora distribuzione di frequenza, rappresentazione grafica di una distribuzione di frequenza, operatori di tendenza centrale e di posizione, operatori di dispersione e si aggiungono gli INDICI DI FORMA. Variabili cardinali di tipo A: hanno un numero limitato di modalità, si parla anche di variabile cardinale discreta, tra un valore e l’altro non ci sono altri valori (es. numero di figli). Le variabili cardinali di tipo B hanno un numero elevato di modalità, esito della rilevazione di una proprietà continua (peso, altezza). TIPO A ES: numero di componenti della famiglia. Per la distribuzione di frequenza metto nella prima colonna le modalità e nella seconda il numero di casi di ogni modalità. La distribuzione di frequenza prende il nome di SERIAZIONE DI FREQUENZE. Nella rappresentazione si usa un istogramma: i rettangoli sono adiacenti , ma la base del rettangolo non è arbitraria, hanno ampiezza unitaria. Le basi non sono convenzionali. L’asse orizzontale ha valori di numeri cardinali. GLI OPERATORI DI TENDENZA CENTRALE: restituiscono un numero rappresentativo di tutto il collettivo considerato. Esistono la moda, la mediana ed in questo caso anche la MEDIA. La moda è il valore che si presenta più volta, la mediana lascia il 50% degli individui al di sopra ed il restante 50% al di sotto. Mdn=x(N+1)/2 -> Se N dispari Mdn=(xN/2 + xN/2+1)/2 -> Se N pari e faccio la media tra i due risultati. La media aritmetica: indicata con la lettera x utilizzata per indicare la variabile con una stanghetta sopra. PROPRIETÀ DELLA MEDIA ARITMETICA: 1.Se si somma N volte la media si ottiene lo stesso valore che si otterrebbe sommando gli N valori di X. (Es. quantità trasferibili come reddito: 10 individui: calcolo la media, alloco ad ogni individuo la cifra della media e se le sommo ottengo la stessa somma totale). 2.La somma dei singoli valori meno la media (scarto dalla media) quindi la somma degli scarti della media è uguale a 0. La media rende nulla la somma degli scarti.

  1. La somma degli scarti al quadrato assume il suo valore minimo quando A coincide con la media. Gli scarti della media presi al quadrato restituiscono come somma il minor valore possibile. Minimizza gli scarti al quadrato. Costante moltiplicata per un valore che cambia. La somma di una somma si può riscrivere come somma delle sommatorie. Vedere le slide per le dimostrazioni. Minimizzare significa trovare il numero dell’ incognita che mi dia il valore più basso. Per le variabili cardinali a volte è più informativa la mediana. La media sfrutta tutte le informazioni numeriche dei dati, la mediana prescinde dal valore numerico e considera solo l’ordine. La media però in alcuni casi è ingannevole. 10 individui sostengono un esame, i risultati sono riportati. Una persona ha preso 18, 3 hanno preso 28, 3 hanno preso 29 ed uno 30. Calcolo la media (27,9). Tutti i valori sono superiori a 27 tranne il 18 e per questo la media è ingannevole per solo un valore che si discostano: il 18 è definito un OUTLIER (valore anomalo che di discosta). Vado a calcolare la mediana che è 29: in questo caso è più informativa. La media invece risente degli outlier. La mediana si preferisce alla media in presenza di outlier. OPERATORI DI DISPERSIONE:

• Differenza interquartile

• Campo di variazione

• Varianza

• Scostamento semplice medio

• Coefficiente di variazione

o standard

Se il valore è 0 si ha a che fare con una costante e non una variabile. Le due principali sono la varianza e la deviazione standard.

stessa ampiezza (non è obbligatorio usare classi uguali perché dipende da cosa siamo studiando e per lo scopo). Bisogna poi calcolare quanti casi rientrano in ogni classe. Il valore minimo di ogni classe è detto limite inferiore (l1) ed il valore massimo è detto limite superiore (L1). Si parla di seriazione di frequenze in classi. Il limite vero si ottiene e andando a sottrarre o ad aggiungere mezza unità ai limiti tabulati. Sono espressi in una scala di misura più specifica rispetto ai limiti tabulati. Diventa più facile calcolare l’ampiezza di ogni classe. È importante capire come sono stati arrotondati i nostri dati. Si può comprendere con più precisione se un determinato dato è incluso o escluso da una determinata classe. L’ampiezza della classe k sarà data dalla differenza tra il limite superiore vero k ed il limite inferiore vero k. 1 49,5 I-159,5 indica che saranno valori tra 149,5 incluso e 159,5 escluso. Alcuni classi hanno una frequenza ridotta e si può decidere di accorpare delle classi. Si può costruire na classe più ampia. DENSITÀ DI FREQUENZA: numero di individui per unità di misura. Densità= frequenza assoluta/ampiezza. Ho accorpato due classi ed una sarà di ampiezza 20, i valori sembrano distribuiti omogeneamente, ma l’ultima classe rappresenta due classi accorpate. Frequenza e densità sono proporzionali nelle classi della stessa ampiezza. VALORE CENTRALE DELLA CLASSE: il valore medio tra il limite vero superiore ed il limite vero inferiore. (L+l)/2. La distribuzione di frequenza si rappresenta con un istogramma: rettangoli sull’asse dell’ ascisse con i valori delle variabili. Le basi dei rettangoli devono essere adiacenti, ma l’ampiezza delle basi del rettangolo devono essere proporzionali all’ampiezza delle classi. La frequenza si può calcolare con l’area del rettangolo rappresentato. Si può utilizzare anche il poligonale di frequenza come rappresentazione, ossia la congiunzione tra le basi superiori dei rettangoli. Si parte dai valori centrali delle nostre classi. È simile alla spezzata a gradini (crescente) della variabili ordinali, in quel caso erano frequenze cumulate. Nelle variabili ordinali le categorie non rappresentano una proprietà continua, in quella poligonale la linea è continua perché si ha una proprietà continua. La poligonale è l’approssimazione di una funzione continua. Bisogna usare dei valori puntuali e per questo si decide di usare il valore centrale. Immaginiamo ora di avere rilevato l’altezza su un collettivo molto ampio e di andare a rappresentare la distribuzione di questa variabile attraverso un istogramma con rettangoli della stessa ampiezza, sempre più piccoli.

Cercando di far tendere l’ampiezza della base del rettangolo il valore centrale della classe corrisponde all’intera classe e per questo a funzione diventa continua. Si forma la curva di Gauss, è un dispositivo fondamentale in psicologia. Si usano le caratteristiche di questa funzione per comprendere venti. Viene detta distribuzione normale. Nel piano cartesiano i valori sottostanti sono le variabili (es. altezza), la funzione in se rappresenta la densità di frequenza. La moda, la mediana e la media sono nella posizione centrale, del picco. Questo nostro punto detto μ coincide con moda, media e mediana. La curva è simmetrica quindi la prima metà coincide con la seconda. Curva normale significa che il grosso degli individui ha un’altezza che non si sposta dalla media. La distribuzione dell’altezza simmetrica ed il grosso dei valori si concentra intorno alle media e quindi sono poco frequenti i casi estremi. σ è la deviazione standard, σ quadro la varianza. L’asse orizzontale è un asintoto, la funzione si avvicina sempre di più all’asse senza mai raggiungerlo. La funzione ha un valore massimo che corrisponde a μ. Il punto di flesso flesso (punto dove la funzione cambia di concavità) corrisponde a μ+deviazione standard e μ-deviazione standard. μ e σ sono i parametri che governano la distribuzione di frequenza. Quando un fenomeno si distribuisce omogeneamente la maggioranza dei valori di distribuisce in μ+deviazione standard e μ-deviazione standard. L’altezza ha quindi una distribuzione normale. Gran parte delle proprietà psicologiche si distribuiscono in modo normale (es. estroversione, dimensione della personalità). Alcune proprietà non si distribuiscono come la funzione di Gauss (es. ricchezza, rilevazione della depressione, rilevazione della creatività). Con la curva di Gauss si può anche calcolare la probabilità. La distribuzione cambia aspetto secondo μ e σ, quindi secondo la media e la deviazione standard. Un cambiamento della media ci fa passare a distribuzioni più spostate su asse positivo o negativo. La distribuzione rossa ha una devianza diversa e lo capisco per il punto di flesso che è più grande ed in quella blu è ancora più grande (varianza più alta ossia più dispersione). La linea rossa continua ha una deviazione standard maggiore rispetto alla linea rossa tratteggiata.

Si considerano gli scarti della media presi alla terza per valutare il grado di simmetria e di asimmetria, mentre per valutare il grado di curtosi considero gli scarti della media presi alla quarta. μ indica un momento omogeneo: la media dei valori di una variabile o degli scarti della media, presi con esponente intero. L’ordine è dato dall’esponente a cui sono elevati i componenti della sommatoria. La media è un momento centrale perché si lavora sugli scarti dei valori della media la stanghetta indica il momento centrale. Gli dici di forma servono quindi a capire quanto si è lontani dalla forma normale. I valori di forma vicini a 0 indicano una simmetria, vicino a 1 si tratta di una asimmetria negativa e se si avvicinano a -1 si tratta di un’asimmetria positiva. Nella distribuzione non normale media e mediana hanno valori che si allontanano, mentre nella distribuzione normale media e mediana assumono valori più simili. Si deve tenere conto infatti degli outlier che vanno a modificare il valore della media. Conviene quindi calcolare la medianaìè+ per avere un valore più rappresentativo. COME CAMBIANO MEDIA, VARIANZA E DEVIAZIONE STANDARD SE CAMBIO L’UNITÀ DI MISURA E L’ORIGINE DELLA SCALA? Nella scala di intervalli posso variare unità di misura e l’origine della scala. La media sui dati trasformati risente dei cambiamenti: yprimo= my+a diventa. La media subisce la stessa trasformazione. Media di yprimo= my(con trattino)+a. La varianza sui dati sottoposti a variazioni rimane la medesima, è insensibile al cambiamento di origine. La varianza cambia invece per lo stesso valore con cui ho cambiato l’unità di misura, ma elevato al quadrato. La deviazione standard risente dell’unità di misura, ma cambia allo stesso modo. Cambiando unità di misura cambia la media e la varianza (in modo quadratico). COEFFICIENTE DI VARIAZIONE: toglie l’effetto dell’unità di misura utilizzando la deviazione standard. Prende la deviazione standard e la divide per la media: calcola quante volte la deviazione standard contiene la media. Dividendo l’unità di misura essa sparisce. Si può usare solo nelle scale di rapporti, nella scala di intervalli l’origine è variabile e la media può valere zero e quindi il calcolo sarebbe impossibile. STANDARDIZZAZIONE: Effettuata su uno o più valori di una variabile trasformando i valori in nuovi valori più utili. Non è una statistica che riassume i contenuti di una variabili, ma di una trasformazione di valori. Il VALORE GREZZO è il valore di partenza ed il PUNTEGGIO ZETA (z) il valore che otteniamo dopo la trasformazione. Sottrarre la media significa spostare l’origine della scala e dividere per la deviazione significa che varianza e deviazione standard sono uguale a 1. PROPRIETÀ DEI PUNTEGGI Z:

• La somma degli Z è uguale a 0.

• La somma degli zeta elevati al quadrato è uguale a N. La media è quindi pari a 0.

• La varianza dei punti Z è uguale a 1.

La s dei punteggi grezzi diventa la nuova unità di misura. Lo scarto al numeratore indica se il valore è maggiore o minore della media. Al denominatore ci deve essere la deviazione standard perché è influenzata dall’unità di misura e per questo permette di modificare l’unità di misura. Si può standardizzare ogni variabile cardinale. I punti Z sono una trasformazione lineare dei punteggi grezzi. Se il punteggio di z è 0 so che il valore x è uguale alla media. Se il punteggio z è maggiore di zero la prestazione è maggiore della media e se z è minore di z la prestazione è minore della media. La standardizzazione si applica a singoli valori e permette da passare dal valore singolo alla sua controparte che permette una lettura immediata guardando il segno capisco se è maggiore o superiore alla media. Molti fenomeni della psicologia si distribuiscono in modo normale, ogni fenomeno ha una sua media μ e la sua deviazione standard. Se standardizzo i valori di una distribuzione normale genero un’unica distribuzione: DISTRIBUZIONE NORMALE STANDARDIZZATA (con media zero e la deviazione standard è 1 ). La lettura degli intervalli tipici ci aiuta, il 68% dei valori cade tra l’intervallo -1 ed 1, il secondo intervallo (tra -2 e 2) contiene il 95% dei valori ed il terzo (tra -3 e 3) il 99% dei valori. La standardizzazione torna quindi molto utile nelle variabili a distribuzione normale. La standardizzazione non cambia la forma della distribuzione, ma solo l’origine e l’unità di misura. La standardizzazione è alla base di molte procedure di statistica. È anche fondamentale per l’interpretazione dei risultati ad un test di psicologia. La prestazione del singolo paziente viene confrontata con la prestazione di un campione di riferimento. Standardizzo quindi la prestazione con la media dei risultati ottenuti dal campione rappresentativo. I punti T sono una trasformazione lineare dei punti z, si caratterizzano per avere una meda pari a 50 e deviazione standard pari a 10. T= 50+10z I punteggi QI invece sono una trasformazione lineare dei punti z e si caratterizzano per avere media pari a 100. Deviazione standard pari a 15 QI= 100+15z INTRODUZIONE ALLA STATISTICA INFERENZIALE: Uso la statistica inferenziale nelle situazioni di incertezza. Quando un’indagine raggiunge tutte le unità della popolazione usa la statistica descrittiva. Calcolerò delle statistiche ed i risultati costituiranno la risposta alla nostra domanda. Nella ricerca in ambito psicologico un ricerca non può raggiungere tutte le unità (dispendioso in termini di tempo o costi) e per questo si entra un sottoinsieme di unità: il CAMPIONE (gli elementi costituiscono i casi della CxV). Le statistiche ci danno i risultati sul campione.