Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Statistica: Popolazione, Campione, Caratteri, Indicatori e Analisi, Appunti di Psicometria

Introduzione alla statistica: popolazione, campione, caratteri quantitativi e qualitativi, indicatori riflessivi e formativi, analisi fattoriale. Scelta della popolazione in base agli obiettivi di ricerca. Concetto di campione rappresentativo. Caratteri misurati con variabili continue o discrete. Indicatori in relazione a costrutti teorici. Analisi fattoriale per individuare dimensioni latenti. Regressione multipla per valutare capacità predittiva di variabili.

Tipologia: Appunti

2020/2021

Caricato il 21/01/2022

aannaat27
aannaat27 🇮🇹

23 documenti

1 / 12

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Concetti statistici di base
Concetto di popolazione
La popolazione rappresenta l’insieme dei componenti cui l’indagine del ricercatore è
rivolta. La popolazione, dunque, è l’insieme degli individui o unità statistiche che
presentano caratteristiche comuni: stessa età, sesso, luogo di appartenenza etc…
La scelta della popolazione dipende da quelli che sono gli obiettivi che il ricercato ha
nella sua ricerca. la rilevazione ed elaborazione statistica riguarda i CARATTERI o
gli ARGOMENTI comuni agli individui della popolazione.
La popolazione può essere FINITA (costituita da numero finito di elementi), e può
variare da molto limitato a MOLTO GRANDE oppure può essere INFINITA.
Dunque, ciò che caratterizza la popolazione è il concetto di VARIABILE.
Concetto di campione
Il campione è quella parte della popolazione sulla quale le variabili di interesse della
popolazione vengono misurate e diventa rappresentativo della popolazione quando la
distribuzione dei dati di osservazioni eseguite su di esso corrisponde a quelle
riscontrate nella popolazione. Il campione è definito come un sottoinsieme della
popolazione composto da un numero inferiore di individui.
Ad esempio, un campione può essere composto da 500 ragazzi di età compresa tra i
10 e i 15 anni. In psicologia, durante una ricerca, si lavora sempre su campioni.
Dunque, i risultati che otterremo ci daranno le caratteristiche di tutta la popolazione.
Un campione si dice rappresentativo della popolazione quando ne riflette in modo
adeguato le caratteristiche. Quello che viene osservato in esso è generalizzabile alla
popolazione. La procedura di individuazione degli elementi che costituiscono il
campione è detto campionamento.
I caratteri o tipi di dati
I caratteri possono essere di tipo:
Quantitativi
In termini quantitativi parliamo di un qualcosa che è espresso mediante dei
numeri/valori che hanno un riscontro maggiore nella realtà: statura, peso, tempo di
durata.
Un carattere che assume valori diversi si chiama variabile.
Esempio:
1. il peso degli studenti di una classe varia da soggetto a soggetto → il carattere
‘’peso’ è una variabile di tipo quantitativa.
2. la temperatura esterna varia durante il giorno → il carattere ‘’temperatura’ è una
variabile quantitativa. colore dei capelli etc.
pf3
pf4
pf5
pf8
pf9
pfa

Anteprima parziale del testo

Scarica Statistica: Popolazione, Campione, Caratteri, Indicatori e Analisi e più Appunti in PDF di Psicometria solo su Docsity!

Concetti statistici di base

Concetto di popolazione

La popolazione rappresenta l’insieme dei componenti cui l’indagine del ricercatore è rivolta. La popolazione, dunque, è l’insieme degli individui o unità statistiche che presentano caratteristiche comuni: stessa età, sesso, luogo di appartenenza etc… La scelta della popolazione dipende da quelli che sono gli obiettivi che il ricercato ha nella sua ricerca. la rilevazione ed elaborazione statistica riguarda i CARATTERI o gli ARGOMENTI comuni agli individui della popolazione. La popolazione può essere FINITA (costituita da numero finito di elementi), e può variare da molto limitato a MOLTO GRANDE oppure può essere INFINITA. Dunque, ciò che caratterizza la popolazione è il concetto di VARIABILE.

Concetto di campione

Il campione è quella parte della popolazione sulla quale le variabili di interesse della popolazione vengono misurate e diventa rappresentativo della popolazione quando la distribuzione dei dati di osservazioni eseguite su di esso corrisponde a quelle riscontrate nella popolazione. Il campione è definito come un sottoinsieme della popolazione composto da un numero inferiore di individui. Ad esempio, un campione può essere composto da 500 ragazzi di età compresa tra i 10 e i 15 anni. In psicologia, durante una ricerca, si lavora sempre su campioni. Dunque, i risultati che otterremo ci daranno le caratteristiche di tutta la popolazione. Un campione si dice rappresentativo della popolazione quando ne riflette in modo adeguato le caratteristiche. Quello che viene osservato in esso è generalizzabile alla popolazione. La procedura di individuazione degli elementi che costituiscono il campione è detto campionamento.

I caratteri o tipi di dati

I caratteri possono essere di tipo:

• Quantitativi

In termini quantitativi parliamo di un qualcosa che è espresso mediante dei numeri/valori che hanno un riscontro maggiore nella realtà: statura, peso, tempo di durata. Un carattere che assume valori diversi si chiama variabile.

Esempio :

  1. il peso degli studenti di una classe varia da soggetto a soggetto → il carattere ‘’peso’’ è una variabile di tipo quantitativa.
  2. la temperatura esterna varia durante il giorno → il carattere ‘’temperatura’’ è una variabile quantitativa. colore dei capelli etc.
  • Qualitativi rientra come un concetto di modalità. Quando parliamo di caratteri qualitativo è qualcosa che riguarda una qualità: colore degli occhi, religioni. Esempio:
  1. il colore degli occhi varia da persona a persona → il carattere ‘’colore degli occhi’’ è una variabile di tipi qualitativa.

Le variabili

Le variabili raccolte in uno studio vanno esaminate rispetto alla loro distribuzione. La prima distinzione da effettuarsi va fatta sulle variabili di tipo:

  • Continue Intendiamo le variabili che possono assumere un valore tendenzialmente infinito come altezza o temperatura. Nel caso di variabili continue, la distribuzione di frequenza si rappresenta con una curva dove sull’asse delle ascisse sono riportati i valori della variabile e sull’asse delle ordinate è riportata la frequenza.
  • Discreto si intendono quelle variabili che assumono solo un certo numero di valori. Ad esempio, nei test psicologici i numeri di risposte corrette. Nel caso di variabili discrete, la rappresentazione grafica della sua distribuzione è chiamata istogramma. I valori della variabile discreta saranno classi di punteggi che verranno rappresentate graficamente da rettangoli proporzionali alla frequenza dei valori. L’istogramma è composto sempre da ascissa e ordinata dove si inseriranno i valori delle classi e altri valori.

La rappresentazione grafica della distribuzione di una variabile discreta non è altro che un modo conveniente di esprimere le frequenze dei valori della variabile. Il punto di partenza è una tavola delle frequenze nella quale sono riportate le informazioni fondamentali della distribuzione.

  • Modello regressivo

Si basa su tecniche statistiche come la regressione multipla. Nella regressione multipla si distingue in variabile che predicono (variabile indipendente) e variabile che viene predetta (variabile dipendente). Possiamo valutare inoltre, l’importanza relativa di ciascuna variabile perditrice. Esempio : Immaginiamo voler predire la somma di denaro che viene spesa nelle lotterie. La nostra variabile può essere parzialmente predetta dalla propensione al rischio delle persone, dalla loro agiatezza economica dalla quantità di denaro che si può vincere, ecc... Quindi, tutte queste variabili avranno alta capacità predittiva. Con la regressione multipla, oltre al loro potere predittivo complessivo , possiamo anche valutare l’importanza relativa di ciascuna variabile predittiva. Potremmo sapere ad esempio, se conta di più l’agiatezza economica o la propensione al rischio.

  • Modello fattoriale

È una tecnica che consente di individuare dimensioni latenti ad una serie di item o variabili. Cioè, se alcune variabili si correlano tra loto possiamo pensare che ci sia qualcosa che li accomuna. Ad esempio, se piace parlare con persone sconosciute è molto probabile che piace anche andare alle feste). Utilizzando l’analisi fattoriale noi cerchiamo di vedere se queste correlazioni sono sufficientemente elevate e coese da consentire una o più dimensioni.

Rivelazione spoglio dei dati e distribuzioni di frequenze

Dalla carta al computer e tabulazione dei dati

Tutte le ricerche di psicologia iniziano con la compilazione e la somministrazione di test che può essere in forma cartacea, sotto forma di questionari o può essere online. In ogni cosa, si raccolgono i dati di supporto cartaceo poi si organizzano i dati e si elaborano al computer. Questo processo si chiama tabulazione dei dati. I dati possono essere:

_1. La categorizzazione del comportamento di ogni singolo soggetto;

  1. Le risposte di un soggetto ad una scala di atteggiamento;
  2. Le risposte di un singolo soggetto a un questionario di personalità._

Questi dati vengono definiti dati grezzi perché non sono né organizzati, né direttamente elaborati dal ricercatore. Per poter elaborare i dati grezzi è necessario organizzarli mediante un’operazione chiamata tabulazione. Per poter procedere con l’analisi dei dati è necessario costruire un database che contiene tutti i dati raccolti. Il database è una sorta di griglia costituita da righe e colonne. Perciò, abbiamo dei dati grezzi che dobbiamo organizzare prima in una tabella e poi nei file dati.

Operazioni preliminari per la tabulazione dei dati

  1. Prima di tutto dobbiamo costruire un legame tra il questionario cartaceo e la tabella o il file di dati siglando ciascun questionario con un numero. Questo perché nel file dei dati non ci sono né nomi, né cognomi dei soggetti che hanno risposto al questionario ma ci sono semplicemente dei numeri che si associano al soggetto. È necessario siglare il questionario per poter poi ritrovare quel questionario nella nostra tabella in caso di errori. In questo modo si ha anche la possibilità di poter ritornare al dato grezzo.
  2. È necessario stabilire l’ ordine secondo il quale le risposte vengono trascritte nella tabella o inserite nel file. Questo perché si deve seguire per tutti i soggetti sempre lo stesso ordine.
  3. Bisogna scegliere un nome in codice per le variabili sulle quali si vuole lavorare. Questo nome in codice è chiamato etichetta. Se si tratta di un file di dati non può essere più lunga di 8 caratteri.
  4. È necessario seguire la numerazione che le domande hanno nel supporto cartaceo.
  5. Può essere necessario codificare numeramene alcune variabili; di solito si attribuisce un numero della scala natura: 1,2,3,4. Se la variabile prevede solo due alternative conviene utilizzare 0 e 1, come nel caso uomo/donna o spostato/divorziato. È chiaro che il codice scelto è del tutto arbitrario, perciò, è necessario tenere memoria delle variabili originali e del relativo codice attribuito attraverso una leggenda.

RIASSUMENDO.

Avremo che i dati grezzi subiranno una TABULAZIONE (ordine, etichetta, codi- fica).

Di questo processo devo tenere memoria attraverso la LEGGENDA.

Alla fine della tabulazione posso trasferire i miei dati in un FILE DI DATI che posso elaborare attraverso il computer.

Esempio 2: Potrei avere anche una tabella di questo genere dove i dati non sono su scala intervalli equivalenti. Ogni riga corrisponde un soggetto da 1 a 10 e sono state rilevate 4 variabili non codificate. Perciò, a questa tabella corrisponde la tabella generica che mi rappresenta i soggetti e le variabili.

TABELLA GENERICA

La tabella generica rappresenta:

  • I soggetti ( N ) nella colonna  N = numero soggetti
  • Il termine generico del soggetto è I Nella riga ci sono le variabili:
  • Il termine generico delle variabili è J
  • Il valore infinito delle variabili è P X11 è riferito al valore della prima variabile del primo soggetto, è l’incrocio tra il soggetto e la variabile che stiamo studiando. X12 è riferito alla seconda variabile del primo soggetto e così via.. fino ad arrivare a XIJ è riferito al gen X2J Inoltre, la somma per riga e per colonna è sempre uguale ad un unico numero.

soggetti

variabili Valore infinito della variabile

LE FORMULE

1. Sommatoria in riga del soggetto Posso sommare tutte le variabili XIJ della riga per un soggetto. La sommatoria va da J=1, che è il primo valore della variabile, a P che sono i valori infiniti della varia- bile. La variabile I rimane ferma

� 𝑥𝑥𝑖𝑖 𝐽𝐽̇

𝑃𝑃

𝑗𝑗=

2. Sommaria in colonna del soggetto Posso sommare tutti i valori della prima variabile I che va da 1 a N. N è il numero totale dei soggetti previsti

� 𝑥𝑥𝑖𝑖 𝐽𝐽̇

𝑁𝑁

𝑖𝑖=

3. Sommaria di tutti i valori di X nella prima variabile che va da 1 a N. Posso fare la somma di tutti i numeri che stanno nella tabella. Perciò è la DOPPIA SOMMATORIA delle variabili Xij. Quindi questa somma ha 2 indici  i va da 1 a N / J va da 1 a P. Ma la sommatoria avviene solo se l’indice che varia è i ovvero quando i va da 1 a N. Dunque, J rimane ferma.

Esempio tabulazione dei dati grezzi all’interno di un software statistico Supponiamo di aver raccolto le risposte di 9 individui a 5 scale di differenziale se- mantico per la misura dell'atteggiamento verso l'uso del filo interdentale. Le 5 scale di differenziale semantico erano ancorate agli aggettivi:

  • Positivo/ Negativo
  • Utile/ Inutile
  • Saggio/ Sciocco
  • Efficace/ Inefficace
  • Piacevole/ Spiacevole. Nelle prime 3 colonne compaiono le informazioni relative al rispondente:
  • SS � Numero ordine
  • genere → 1=M / 2=F
  • età Le altre colonne includono le risposte dei soggetti alle 5 scale di differenziale se- mantico.

𝑁𝑁

𝑖𝑖= 1

𝑃𝑃

𝑗𝑗=

Calcolo delle frequenze nel caso di variabili su scala ad intervalli o rapporti Supponiamo di aver rilevato il peso della variabile X di 20 ragazzi.

  • Le variabili (il peso dei ragazzi in ordine casuale) sono: 72-74-76-75-76-78-72- 73-75-77-75-76-74-79-74-73-75-77-78. Questi sono i valori che x può assu- mere.
  • Nella tabella metto in ordine crescente le variabili.
  • La variabile X può assumere K valori diversi. Qui abbiamo che X=8 , cioè as- sume 8 valori diversi.
  • Per costruire la distribuzione di frequenza dobbiamo contare per ognuno dei K quante volte quel valore compare nell'insieme dei dati grezzi.

Il totale dei soggetti è n=20 perciò anche la sommatoria delle frequenze sarà 20. (∑𝑓𝑓 = 20) La sommatoria delle frequenze è uguale ad n, perciò n ed F coincidono. (∑𝑓𝑓 = 𝑛𝑛)

Esempio 1: Questa è una riproposta di una delle colonne della tabella che abbiamo fatto prima (prima tabella). La frequenza è il numero di casi osservati per qualsiasi modalità della variabile oggetto di studio.

In questo caso è semplificata con 10 soggetti per riga con un'unica variabile. Tra 10 soggetti abbiamo visto chi ha risposto sì (1) cioè 4 soggetti SI= Quindi la frequenza è 4 F= 4

Esempio 2 : In questo caso le modalità di risposta non sono due quindi dovrò considerare tutti i valori della variabile X2. I valori vengono identificati e tabulati in questo modo: F1 = 1 F2 = 3 F3 = 1 F4 = 3 F5 = 2

I valori della X sono tutti diversi nella serie di numeri, perciò, le 5 frequenze saranno diverse tra loro e relative al valore della variabile. Quindi abbiamo: F1=1 relativo al valore 27 F2=3 relativo al valore 28 F3=1 relativo al valore 30 F4=3 relativo al valore 33 Per la distribuzione di frequenza avremo: ∑𝑓𝑓𝑖𝑖 = 10 = 𝑁𝑁 Ovvero la sommatoria della frequenza per l’indice di sommatoria. Dunque  F= Perciò avremo che F sarà sempre uguale al numero dei soggetti F=N

RIASSUMENDO… X= Valore generico della variabile F= Numero delle volte che si presenta un valore di X K= Numero dei valori diversi che può assumere la variabile X N= Numero dei soggetti

Possiamo indicare con K il numero dei valori diversi che può assumere una variabile e con N il numero dei soggetti

𝑘𝑘

1 La x è un valore generico della variabile, mentre la f è il numero delle volte che si presenta un valore di x, K il numero dei valori di x