Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Psicometria Freiheit, Panieri di Psicometria

PANIERE 16/07/2018 Set Domande PSICOMETRIA SCIENZE E TECNICHE PSICOLOGICHE (D.M. 270/04)

Tipologia: Panieri

2019/2020

Caricato il 02/01/2020

freiheit_
freiheit_ 🇮🇹

4.5

(28)

7 documenti

1 / 15

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Lez. 1
11. Descriva i metodi qualitativi
I metodi qualitativi non fanno ricorso alla quantificazione, non hanno l’obbiettivo della verifica delle ipotesi e non
formulano leggi generali. Sono quei metodi che ci permettono di avere dei testi con una narrazione che descrive quello
che è successo durante una rivelazione ma senza poterne quantificare il risultato. Essi si basano tramite diverse
tecniche o strumenti:
Osservazione partecipante: Il ricercatore è immerso nel suo piano di ricerca. L’osservatore partecipa in modo attivo
alla vita quotidiana del fenomeno da lui studiato e/o del gruppo da lui preso in analisi, fingendosi parte di esso ed
apprendendo anche le loro dinamiche. Individua e spiega i vari comportamenti e le norme che determinano il
comportamento tra i vari soggetti.
Osservazione a distanza: non vi è una sovrapposizione di ruolo tra chi compie la ricerca e il soggetto della ricerca. Il
ricercatore in questo caso mantiene un ruolo professionale, quindi mantiene un distacco emotivo e cognitivo rispetto
ciò che studia. Salvaguarda, per quanto possibile, l’oggettività che rappresenta in generale il punto debole
dell'approccio qualitativo.
Focus group: vi è un gruppo limitato con un singolo argomento da discutere. Vi è un massimo di 12 partecipanti scelti
in base all’argomento proposto e alle caratteristiche. La discussione viene spesso ripresa con una videocamera allo
scopo di analizzare anche il non verbale e le dinamiche del gruppo stesso.
Interviste che si dividono in: strutturate, semi strutturate e non strutturate:
Le interviste strutturate viene definita così perché l’intervistatore segue uno schema di domande ben preciso senza
permettere all’intervistato di intervenire se non all’interno della ricerca dell’intervistatore.
La semi-strutturata l’intervistatore permette all’intervistato di potersi ‘’muovere’’ senza seguire dettagliatamente
una traccia. In questo caso esiste una traccia definita dal ricercatore, ma l’intervistatore offre all’intervistato un lieve
margine di manovra.
L’intervista non strutturata chi risponde è libero. L’intervistatore pone un paio di domande ed evita di interrompere
il parlante. Questo tipo di intervista viene denominata anche narrativa. L'intervistatore considera anche il linguaggio
non verbale, le espressioni emotive e altri aspetti comportamentali.
LEZ. 2
10. Descriva le caratteristiche delle variabili psicologiche.
Una variabile può essere definita come qualsiasi caratteristica psicofisica o fisica, che può assumere valori diversi in un
determinato intervallo. Esse sono quindi delle caratteristiche misurabili. Si distinguono in: variabili continue: quelle
variabili che possono assumere infiniti valori, mentre discrete:
possono assumere soltanto valori interi. Per variabili latenti si intendono quei costrutti non direttamente osservabili
mentre per le variabili osservabili sono la definizione dei costrutti latenti attraverso un processo di
operazionalizzazione. Per variabili indipendenti si intendono le variabili stimolo o comportamenti che causano su altri
eventi o comportamenti. Le variabili dipendenti sono influenzate dal sistema considerato e cambiano al cambiare delle
variabili indipendenti.
LEZ. 3
08. Descriva le differenze e la relazione tra sistema numerico e sistema empirico
Il sistema numerico fa riferimento all’insieme di valori associati a dati raccolti. Esso fa riferimento a convenzioni
matematiche ed astrazioni numeriche. Ad esempio il sistema di riferimento potrebbe essere: Insieme dei numeri
Naturali compresi tra 0 e 100 (estremi inclusi) In questo caso sappiamo che i valori che fanno parte del nostro sistema
saranno 101 numeri: 0, 1, 2, 3, 4, …, 37, …, 100.
Il sistema empirico invece fa riferimento al complesso dei dati raccolti e disponibili. Il processo di raccolta dati in
psicologia è indispensabile perché permette di definire i costrutti psicologici sulla base (empirica appunto) di specifici
domini di conoscenza e indagine. Se esaminiamo l’ottimismo lo facciamo empiricamente nel momento in cui
raccogliamo dei dati per formare un sistema di riferimento rispetto alla realtà indagata. Ovviamente, questa realtà è
relativa alla nostra indagine specifica e va dunque relazionata al luogo e al tempo storico che stiamo considerando: in
psicologia non ci sono «universali».
LEZ. 4
08. Descriva gli indicatori che possono essere usati per l'osservazione del comportamento
???
In psicologia quando si parla di osservazione si fa riferimento al comportamento. L’obbiettivo specifico è quello di saper
quantificare le osservazioni dell’oggetto di studio. Tutte le osservazioni conducono a quattro tipi di misure:
LATENZA: intervallo di tempo da presentazione di uno stimolo e la risposta ad esso.
FREQUENZA: numero delle volte in cui si presenta un determinato evento.
DURATA: tempo in cui il comportamento viene mantenuto.
INTENSITÀ: è più difficile da definire e misurare. Spesso viene confusa con la frequenza, ovvero si assume la
frequenza come indicatore di intensità della caratteristica da misurare.
LEZ. 5
11. Descriva i concetti di popolazione e di campione
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Anteprima parziale del testo

Scarica Psicometria Freiheit e più Panieri in PDF di Psicometria solo su Docsity!

Lez. 1

11. Descriva i metodi qualitativi

I metodi qualitativi non fanno ricorso alla quantificazione, non hanno l’obbiettivo della verifica delle ipotesi e non formulano leggi generali. Sono quei metodi che ci permettono di avere dei testi con una narrazione che descrive quello che è successo durante una rivelazione ma senza poterne quantificare il risultato. Essi si basano tramite diverse tecniche o strumenti: Osservazione partecipante: Il ricercatore è immerso nel suo piano di ricerca. L’osservatore partecipa in modo attivo alla vita quotidiana del fenomeno da lui studiato e/o del gruppo da lui preso in analisi, fingendosi parte di esso ed apprendendo anche le loro dinamiche. Individua e spiega i vari comportamenti e le norme che determinano il comportamento tra i vari soggetti. Osservazione a distanza: non vi è una sovrapposizione di ruolo tra chi compie la ricerca e il soggetto della ricerca. Il ricercatore in questo caso mantiene un ruolo professionale, quindi mantiene un distacco emotivo e cognitivo rispetto ciò che studia. Salvaguarda, per quanto possibile, l’oggettività che rappresenta in generale il punto debole dell'approccio qualitativo. Focus group: vi è un gruppo limitato con un singolo argomento da discutere. Vi è un massimo di 12 partecipanti scelti in base all’argomento proposto e alle caratteristiche. La discussione viene spesso ripresa con una videocamera allo scopo di analizzare anche il non verbale e le dinamiche del gruppo stesso. Interviste che si dividono in: strutturate, semi strutturate e non strutturate: Le interviste strutturate viene definita così perché l’intervistatore segue uno schema di domande ben preciso senza permettere all’intervistato di intervenire se non all’interno della ricerca dell’intervistatore. La semi-strutturata l’intervistatore permette all’intervistato di potersi ‘’muovere’’ senza seguire dettagliatamente una traccia. In questo caso esiste una traccia definita dal ricercatore, ma l’intervistatore offre all’intervistato un lieve margine di manovra. L’intervista non strutturata chi risponde è libero. L’intervistatore pone un paio di domande ed evita di interrompere il parlante. Questo tipo di intervista viene denominata anche narrativa. L'intervistatore considera anche il linguaggio non verbale, le espressioni emotive e altri aspetti comportamentali.

LEZ. 2

10. Descriva le caratteristiche delle variabili psicologiche.

Una variabile può essere definita come qualsiasi caratteristica psicofisica o fisica, che può assumere valori diversi in un determinato intervallo. Esse sono quindi delle caratteristiche misurabili. Si distinguono in: variabili continue: quelle variabili che possono assumere infiniti valori, mentre discrete: possono assumere soltanto valori interi. Per variabili latenti si intendono quei costrutti non direttamente osservabili mentre per le variabili osservabili sono la definizione dei costrutti latenti attraverso un processo di operazionalizzazione. Per variabili indipendenti si intendono le variabili stimolo o comportamenti che causano su altri eventi o comportamenti. Le variabili dipendenti sono influenzate dal sistema considerato e cambiano al cambiare delle variabili indipendenti.

LEZ. 3

08. Descriva le differenze e la relazione tra sistema numerico e sistema empirico

Il sistema numerico fa riferimento all’insieme di valori associati a dati raccolti. Esso fa riferimento a convenzioni matematiche ed astrazioni numeriche. Ad esempio il sistema di riferimento potrebbe essere: Insieme dei numeri Naturali compresi tra 0 e 100 (estremi inclusi) In questo caso sappiamo che i valori che fanno parte del nostro sistema saranno 101 numeri: 0, 1, 2, 3, 4, …, 37, …, 100. Il sistema empirico invece fa riferimento al complesso dei dati raccolti e disponibili. Il processo di raccolta dati in psicologia è indispensabile perché permette di definire i costrutti psicologici sulla base (empirica appunto) di specifici domini di conoscenza e indagine. Se esaminiamo l’ottimismo lo facciamo empiricamente nel momento in cui raccogliamo dei dati per formare un sistema di riferimento rispetto alla realtà indagata. Ovviamente, questa realtà è relativa alla nostra indagine specifica e va dunque relazionata al luogo e al tempo storico che stiamo considerando: in psicologia non ci sono «universali».

LEZ. 4

08. Descriva gli indicatori che possono essere usati per l'osservazione del comportamento

In psicologia quando si parla di osservazione si fa riferimento al comportamento. L’obbiettivo specifico è quello di saper quantificare le osservazioni dell’oggetto di studio. Tutte le osservazioni conducono a quattro tipi di misure: LATENZA : intervallo di tempo da presentazione di uno stimolo e la risposta ad esso. FREQUENZA : numero delle volte in cui si presenta un determinato evento. DURATA : tempo in cui il comportamento viene mantenuto. INTENSITÀ : è più difficile da definire e misurare. Spesso viene confusa con la frequenza, ovvero si assume la frequenza come indicatore di intensità della caratteristica da misurare.

LEZ. 5

11. Descriva i concetti di popolazione e di campione

La popolazione riguarda tutti gli elementi a cui si rivolge il ricercatore nella sua indagine. La popolazione ha un suo sottoinsieme, cioè il campione nonché una serie di elementi presi in considerazione. Quando stiamo lavorando ad un progetto di ricerca si parte con la definizione di chi è coinvolto. Questa domanda è fondamentale nella ricerca e nella valutazione, così da portarci a delle risposte che ci permettono di: definire il nostro progetto purchè sia calibrato con il raggiungimento del nostro obiettivo e capire fino a che punto i nostri risultati possono essere considerati generali.

LEZ. 6

11. Descriva il processo che permette di passare da un costrutto ad una valore numerico.

Il costrutto è un processo abbastanza vago. I concetti però per essere analizzati e valutati devono assumere un significato più preciso. Questo significato di solito deriva dalla teoria e dalle conoscenze scientifiche presente in letteratura in cui ogni autore fa riferimento quindi una volta che noi stabiliamo un significato preciso alla nostro costrutto possiamo passare alla fase successiva. Questa fase viene detta di operazionali azione e ci permette di passare dal significato che abbiamo dato al nostro costrutto alla definizione di variabile cioè di quelle misure che serviranno per valutare e misurare precisamente il nostro costrutto quindi possiamo definire praticamente quale strumenti andremo ad utilizzare per attuare la nostra misurazione questo processo è un processo fondamentale che deve essere fatto in maniera molto accurata anche qui sarà cura del ricercatore continuare a far riferimento alla teoria che avevo usato nel primo processo di definizione del costrutto per poter essere sicuro di usare degli strumenti adeguati.

LEZ. 7

12. Descriva le caratteristiche della scala nominale facendo anche degli esempi.

La scala nominale permette soltanto di essere etichettata e quindi di avere diversi livelli che possono essere distinti tramite etichetta. Le uniche operazioni possibili sono quelle di controllo, per capire se un valore è uguale o meno da quello preso in considerazione. Queste operazioni di etichettatura vengono anche chiamate variabili nominali, dove il nome/etichetta corrisponde ad un numero. L’operazione che compiono queste variabili è quella di permettere al ricercatore di identificare le possibili categorie che rappresentano per ciascun individuo. La scala nominale rappresenta la forma più semplice di misurazione. Consiste nell’assegnare dei casi a gruppi o categorie, senza attribuire ad essi alcun genere di informazione quantitativa e nessun criterio di ordine. Infatti, le scale nominali non consentono di quantificare le differenze fra due individui appartenenti a categorie diverse. Per i dati a questo livello di scala si possono solo suddividere i referenti in categorie distinte, mutuamente esclusive ed esaustive: la scala nominale è un sistema di classificazione costituto da almeno due categorie dove ogni caso rientra solo ed esclusivamente in una categoria.

13. Descriva le caratteristiche della scala ordinale facendo anche degli esempi.

Un carattere qualitativo è ordinale quando le modalità possiedono un ordine, ovvero possono essere distribuite lungo una scala. Es: pessimo, cattivo, mediocre, buono ed ottimo oppure i giorni della settimana.

14. Descriva la differenza tra variabili qualitative e quantitative facendo anche degli esempi.

Qualitative: la variabile genere può assumere due valori: maschile e femminile che definiamo come qualità di appartenenza (etichette che identificano il valore della variabile). Queste variabili hanno la caratteristica di non assumere nessun valore numerico che sia una quantità. Infatti, se noi dovessimo definire numericamente maschi e femmine, in realtà non avremmo delle quantità di persone ma delle etichette. Quantitative: l’operazione che compiono queste variabili è quella di permettere al ricercatore identificare le possibili categorie che rappresentano per ciascun individuo.

LEZ. 8

04. Descriva le caratteristiche della scala a rapporti equivalenti facendo anche degli

esempi. ????

Le variabili a rapporti equivalenti possono apparire come nominali, ordinali, a intervalli equivalenti ma avranno anche delle proprietà di moltiplicazione e divisione in quanto i valori da esse assunti rappresentano delle quantità moltiplicabili, con zero assoluto. Ad esempio la scolarità espressa in anni, assume dei valori ordinati e quantificati e posso dire che un individuo con scolarità 10 anni ha una scolarità doppia (moltiplicazione) di uno con 5 anni di scolarità.

05. Descriva le caratteristiche della scala a intervalli facendo anche degli esempi.

Le variabili a intervalli equivalenti sono sempre anche sia nominali, sia ordinali, ma avranno anche delle proprietà di somma e sottrazione in quanto i valori da esse assunti rappresentano delle quantità. Tipico esempio sono le scale di preferenza che assumono ad esempio valori da 1 a 10 con salti di 1 (1, 2, …, 10). Valori ordinati e quantificati.

LEZ. 9

05. Cosa intendiamo quando parliamo di statistica descrittiva?

L’unità di analisi della statistica generalmente non è il singolo individuo, ma la collettività, ovvero un insieme di individui. Anche se non facciamo riferimento alla totale popolazione di riferimento, nella statistica descrittiva

09. Descriva la differenza tra frequenze assolute e relative.

Con il termine frequenze assolute intendiamo il numero di volte in cui si presenta un determinato evento o una determinata modalità di risposta. Per calcolarla dovremmo conteggiare le possibilità modalità di risposta che la variabile X può assumere e ottenere così il numero di soggetti che forniscono una specifica risposta. Il totale della somma delle frequenze assolute sarà pari al totale delle unità statistiche considerate. Le frequenze relative invece possono essere calcolate a partire da quelle assolute, ricavando la percentuale per ogni modalità di frequenza assoluta. Per calcolarle basterà dunque dividere il valore di frequenza assoluta per la numerosità del campione e moltiplicare il risultato per 100. Andremo così a riunire i dati in tabella, in cui oltre ai valori delle variabili X di risposta e alle relative frequenze assolute, riporteremo per ogni valore di frequenza assoluta il relativo valore di frequenza relativa. Il totale delle frequenze relative sarà pari a 100. Frequenze assolute e relative non sono altro che due diversi modi di rappresentare le diverse modalità di risposta e ognuna di esse, presa singolarmente, non aggiunge informazioni rispetto all’altra. E’ evidente comunque che la rappresentazione di una tabella mediante frequenze relative rende più intuitiva e comprensibile l’interpretazione dei dati.

LEZ. 12

07. Descriva le frequenze cumulate.

Le frequenze cumulate sono delle frequenze ottenute da frequenze assolute e relative semplicemente sommando le frequenze della specifica categoria che stiamo considerando e delle precedenti. Otterremo così frequenze assolute cumulate e frequenze relative cumulate. Questa tipologia di frequenze vengono spesso calcolate in relazione a variabili ordinabili a intervalli equivalenti e a rapporti equivalenti. Nel caso in cui le modalità siano numerose, esse potranno essere raggruppate in classi, delle quali potremo ugualmente calcolare le frequenze cumulate riportandole in tabella insieme alle assolute e relative. Per una più immediata comprensione dei dati potremmo calcolare le frequenze cumulate percentuali.

LEZ. 13

04. Descriva le caratteristiche principali dei grafici

Le rappresentazioni grafiche sono utili per riportare dei dati ottenuti tramite ricerche. Essi rappresentano un fenomeno in forma visiva permettendo così a chiunque di capirne l’andamento di un fenomeno. l grafici sono utilizzati non solo a scopo descrittivo, ma anche scientifico se si ricerca il modello matematico del fenomeno (ossia una funzione che esprima l‘andamento del fenomeno). Le componenti di un grafico sono: I dati: sono rappresentati in barre, linee, aree o punti. Elementi strutturali che consentono la comprensione dei dati comprendono: titolo del grafico, titolo ed etichette degli assi, unità di misura ed etichetta dei dati, griglia, legenda, note, fonte dei dati. Elementi decorativi non sono legati ai dati.

LEZ. 15

02. Descriva le tabelle di contingenza.

Le tabelle di contingenza sono specifiche tabelle utili a rappresentare due misure in relazione tra loro, ovvero a condurre un’analisi bivariata. Vengono prese in considerazione due variabili X e Y, di cui rappresentiamo le relative

modalità. Ad ogni coppia si farà corrispondere una frequenza n rappresentata dagli elementi della popolazione che presentano contemporaneamente le due modalità di X e Y, indicate rispettivamente con Xi e Yj. In maniera più specifica andremo a riportare nella colonna verticale la variabile X e nella riga orizzontale la variabile Y. In seguito riporteremo nelle celle tutti gli elementi di N che presentano contemporaneamente le modalità di X e Y, ottenendo così le frequenze congiunte. Fatto ciò, calcoleremo le frequenze marginali assolute, e precisamente le frequenze marginali di X ottenute dalla sommatoria dei valori delle singole frequenze tra tutte le righe, e le frequenze marginali di Y, ottenute dalla sommatoria dei valori delle singole frequenze tra tutte le colonne. La somma delle frequenze assolute di X e di Y ci fornirà il valore della numerosità N della popolazione.

LEZ. 16

06. Descriva moda e mediana.

Moda e mediana sono indici che permettono di sintetizzare un insieme di misura tramite un unico valore rappresentativo. La moda rappresenta il valore o la modalità che ha la più alta frequenza all’interno della distribuzione. La mediana invece, è la misura che occupa la posizione centrale in un campione di dati disposti in ordine crescente in base al loro valore. Per individuare la posizione della mediana, se il numero N dei termini è dispari, la posizione della mediana coinciderà con il valore centrale; se esso invece è pari, la posizione della mediana corrisponderà ai due valori centrali della distribuzione, di cui verrà calcolata la semisomma.

07. Trovi moda e mediana della seguente distribuzione esplicitando il procedimento usato

per ottenere il risultato: 7, 3, 5, 4, 7, 6, 9. (la serie di numeri data potrebbe cambiare ad ogni

prova d'esame)

LEZ. 17

06. Parli dei quantili.

I quantili sono utilizzati in statistica per frazionare in N parti uguali un insieme di dati numerici disposti in ordine progressivo crescente ( o decrescente ). Da una seriazione composta da un numero finito di termini P, la popolazione viene ordinata in ordine crescente. Successivamente la serie viene suddivisa in N parti uguali. I valori della seriazione che cadono esattamente nella suddivisione sono detti quantili di ordine X / N. Dove X è la posizione nel quantile nelle N suddivisioni.

07. Usando la seguente distribuzione calcoli i quartili: punteggio ad un test di memoria: 22,

36, 23, 30, 33, 27, 32, 27. (i valori potranno cambiare nelle varie prove di esame)

  • Deviazione standard : • Indice di dispersione con unità di misura uguale alla media. • indica la variabilità assoluta • Indica di quanto, mediamente, i dati osservati si discostano dalla loro media.

LEZ. 20

06. Descriva le caratteristiche della deviazione standard.

La deviazione standard è anche detta scarto quadratico medio. Si definisce scarto quadratico medio, o deviazione standard, la media quadratica, semplice o ponderata, degli scarti dei valori dalla media aritmetica. Lo scarto quadratico medio è tanto più piccolo quanto più i dati sono prossimi al valore medio ed è eguale a zero se e solo se i dati sono tutti eguali fra loro. Il quadrato dello scarto quadratico medio σ2 è detto varianza. La varianza è eguale alla differenza tra la media aritmetica semplice o ponderata dei quadrati dei termini e il quadrato della media. Lo scarto quadratico medio è un indice della dispersione dei dati molto sensibile per evidenziare l’esistenza di dati che si scostano molto dal valore medio.

LEZ. 21

04. Descriva le caratteristiche principali dello scostamento semplice medio

Un altro indice di variabilità è lo scostamento semplice medio, che è la media aritmetica dei valori assoluti degli scarti delle xi da un valore medio. Si utilizzano due scostamenti semplici medi: 1° — lo scostamento semplice medio dalla media aritmetica 2° — lo scostamento semplice medio dalla mediana Ci permette con la media aritmetica di analizzare dei valori assoluti degli scarti delle osservazioni da un valore medio, con la mediana invece, viene calcolato lo scarto dei valori dal valore mediano. Cambia il calcolo del valore che viene osservato.

LEZ. 22

03. Descriva il concetto di concentrazione.

Lo studio della concentrazione e utile per vedere se il fenomeno è equamente distribuito fra tutte le unità statistiche oppure è concentrato in poche unità. Si calcolano le frequenze cumulate e le intensità cumulate. Le prime dividendo le frequenze cumulate per la somma delle frequenze e le seconde dividendo le intensità cumulate per l’intensità globale (somma di tutti i prodotti tra le variabili e le frequenze). Se le intensità relative cumulate sono uguali alle frequenze relative cumulate, significa che il fenomeno è equidistribuito poiché ad una certa frazione delle unità statistiche corrisponde una frazione eguale dell‘intensità del fenomeno; se, invece, sono minori, il fenomeno è tanto più concentrato quanto più le intensità relative cumulate differiscono dalle frequenze relative cumulate.

LEZ. 23

10. Descriva la concezione frequentista della probabilità

La prima concezione molto importante è la frequentista basata sull’esperimento e sull’osservazione di prove ripetute del fenomeno che è oggetto di studio. La concezione frequentista, che si può applicare quando si possono eseguire tante prove, quante se ne vogliono sull’evento, oppure sono disponibili tavole con i risultati di rilevazioni statistiche relative ad un certo fenomeno (ad esempio, le tavole di mortalità e di sopravvivenza). Secondo la concezione frequentista, per conoscere la probabilità di un evento si deve ricorrere all’esperimento. È importante rilevare che per un frequentista non ha senso calcolare la probabilità di un evento attraverso una singola prova. Analizzando un gran numero di prove si riscontra una regolarità che permette di assegnare una valutazione di probabilità del verificarsi dell’evento in esame. La concezione frequentista è basata sulla definizione di frequenza relativa di un evento. La legge empirica del caso permette di formulare la seguente definizione frequentista di probabilità per eventi ripetibili. La probabilità di un evento è la frequenza relativa in un numero di prove ritenuto “ sufficientemente ” elevato. In generale non si può dire quante prove siano necessarie, perché il numero delle prove dipende dal fenomeno in esame. La frequenza, calcolata in un gran numero di prove, permette di prevedere i risultati di prove future eseguite nelle stesse condizioni.

11. Descriva la concezione logicistica della probabilità.

Si definisce evento composto o prodotto logico degli eventi, l’evento che risulta verificato se gli eventi componenti si verificano entrambi. Nella rappresentazione insiemistica all’evento composto è associato il sottoinsieme degli eventi componenti. La probabilità di un evento è una reazione logica fra l’evento stesso ed un insieme di conoscenze di cui si dispone.

LEZ. 24

11. Descriva la concezione classica della probabilità.

La probabilità P(E) di un evento E è il rapporto fra il numero m dei casi favorevoli (al verificarsi di E) ed il numero n dei casi possibili, giudicati egualmente possibili: P (E) = m / n (casi favorevoli su casi possibili). La probabilità è dunque, un numero razionale p compreso fra 0 ed 1: 0 ≤ p ≤ 1. Un esempio può essere il lancio della moneta per il gioco testa o croce. Se si chiede quale sia la probabilità di ottenere testa, la persona risponderà che sarà del 50% e l’altro 50% sarà la probabilità di uscita della croce. La probabilità di avere la testa quindi sarà di ½. Questa probabilità varia da probabilità 0 a probabilità 1 e probabilmente la risposta si colloca tra questi due estremi.

12. Descriva la concezione soggettiva della probabilità

Detta anche personale, questa probabilità corrisponde alla non possibilità di determinare casi possibili e favorevoli. In questo caso, si stima la probabilità in base allo stato di informazione. ‘’ la probabilità P(E) di un evento E è la misura del grado di fiducia che un individuo coerente attribuisce, in base alle sue informazioni ed alle sue opinioni, al verificarsi dell’evento E.’’ in pratica le valutazioni di probabilità sono soggettive, ossia possono variare da individuo a individuo, ma deve essere rispettata la coerenza. Un esempio potrebbe essere una scommessa. ES: vi è il 70% di probabilità che un certo evento E si verifichi. Significa che (in questo caso è tutto correlato alla scommessa), X (quindi una persona) è disposto a pagare 70 euro per riceverne 100 nel caso si verifichi l’evento ed inversamente, esserne disposti a riceverne 70 e pagarne 100 nel caso si verifichi l’evento E. In questo caso la probabilità è un numero reale compreso tra 0 e 1. Infatti: se l’evento è giudicato IMPOSSIBILE, il prezzo è p= se l’evento è giudicato CERTO, il prezzo è p= in tutti i casi, risulta 0<p<1.

LEZ. 25

11. Descriva la probabilità composta.

Viene considerata probabilità composta, quella probabilità del verificarsi di tutti gli avvenimenti contemporaneamente. La probabilità composta permette di effettuare rapidi calcoli per varie situazioni. Mettiamo caso 3 eventi: P prende 30 in psicometria, metodologia ed analisi. Associamo i seguenti dati: P=30 psicometria= 1/10; P=30 metodologia=1/15; P= 30 analisi dei dati= 1/7. La probabilità composta quindi verrà misurata, facendo la MOLTIPLICAZIONE di tutte le frazioni. In questo caso 1/1050. Quindi P avrà l’1/1050 di prendere 30 in tutte le materie.

12. Descriva la probabilità condizionata.

Riguarda due eventi compatibili e dipendenti (prendiamo il caso di 2 soggetti X1 ed X2). Si definisce probabilità condizionata X2 al verificarsi di X1. Quindi la probabilità che si verifichi X2 una volta che X2 si sia già verificato.

13. Voglio calcolare la probabilità di avere due cuccioli neri, uno nella cucciolata della mia

gatta (1/5) e uno da quella della gatta della mia amica (1/8). Descrivere il tipo di probabilità

calcolata e svolgere il calcolo. (I valori potrebbero cambiare ad ogni prova di esame)

LEZ. 26

12. Descriva la distribuzione uniforme di probabilità

La distribuzione uniforme di probabilità è la distribuzione equa della stessa probabilità su ogni elemento su un insieme finito. Un esempio di questa distribuzione è una moneta testa/croce, dove ogni lato corrisponde al 50% di probabilità. Un altro esempio di distribuzione discreta uniforme è fornito dal lancio di un dado equilibrato: ognuno dei valori 1, 2, 3, 4, 5 e 6 ha eguale probabilità 1/6 di verificarsi.

13. Cos'è una distribuzione di probabilità?

È un modello matematico che collega i valori di una variabile alle probabilità che tali valori possano essere osservati. Le distribuzioni di probabilità vengono utilizzate per modellizzare il comportamento di un fenomeno di interesse in relazione alla popolazione di riferimento, ovvero alla totalità dei casi di cui lo sperimentatore osserva un dato campione. In base al campione che stiamo analizzando possiamo notare due tipi di distribuzione di probabilità: CONTINUE : la variabile viene espressa su una scala continua DISCRETE : la variabile viene misurata con valori numerici interi Le distribuzioni di probabilità vengono espresse da una legge matematica chiamata FUNZIONE DI DENSITA’ DI PROBABILITA’ indicata con f(x) o funzione di probabilità indicata con p(x) rispettive per le funzioni continue e discrete. Media e varianza corrispondono ai parametri di maggior interesse della distribuzione della probabilità X.

13. Descriva il concetto di inferenza statistica.

È un concetto che va dal particolare al generale, quindi dall’analisi di un singolo campione si può trarre l’osservazione sull’intera popolazione. Vi sono due tipi di inferenza: STIMA CAMPIONARIA : dal campione si può stimare il valore di qualche parametro della popolazione, come una media, una varianza, una frequenza VERIFICA DELLE IPOTESI : per mezzo del campione si vuole decidere se un’ipotesi fatta su una data popolazione è accettabile, o rifiutabile, ad un dato livello di significatività. L’estensione a tutta la popolazione delle conclusioni ricavate da un campione comporta un certo rischio, pertanto si dovrà scegliere un campione in modo da saper valutare l’errore che si può commettere. Nella trattazione dell’inferenza statistica, dopo aver indicato come scegliere un campione, analizziamo la distribuzione delle variabili e, in base ad essa, operiamo delle stime dei parametri della popolazione indicando l’errore medio o il grado di fiducia della stima. Infine esaminiamo brevemente i concetti fondamentali della verifica delle ipotesi, in quanto uno studio approfondito richiederebbe tecniche particolari che esulano dal programma. Numerose ragioni spingono il ricercatore ad utilizzare un campione per trarre delle conclusioni sull’intera popolazione; tra cui: a) il costo elevato di una rilevazione totale; b) l’impossibilità di investigare tutte le unità statistiche quando l’universo è costituito da un numero molto grande di elementi (ad esempio, l’analisi di un costrutto su tutta la popolazione italiana), oppure quando non si possono conoscere tutte le unità avendone a disposizione solo un numero limitato, come tipicamente accade nelle analisi psicologiche; c) i limiti di tempo, ad esempio i dati ricavati da un censimento sono disponibili solo dopo alcuni anni e perciò, in certi casi, i risultati ottenuti sono inutili perché il fenomeno si è nel frattempo modificato d) la possibilità che l‘investigazione danneggi o addirittura distrugga le unità statistiche, come, ad esempio, avviene nella verifica della durata di un lotto di lampadine o del punto di rottura di una partita di barre metalliche; la prova su tutte le lampadine o su tutte le barre porterebbe alla loro totale distruzione. Questo generalmente non accade nelle indagini psicologiche.

14. Descriva il campionamento casuale.

La scelta del campione nel campionamento casuale è affidata al caso e non deve essere influenzata, più o meno consciamente, da chi compie l’indagine. caratteristiche essenziali di un campionamento casuale semplice sono: a) ogni unità della popolazione ha eguale probabilità di fare parte del campione; b) ogni campione deve avere la stessa probabilità di essere formato. Il metodo del campione casuale semplice si può applicare se la popolazione è statisticamente omogenea e le unità statistiche sono individuabili mediante un numero. Un modo semplice per operare tale campionamento consiste nel numerare tutte le unità della popolazione, mettere in un’urna tante palline numerate, tutte eguali fra loro, quante sono le unità della popolazione e quindi sorteggiare da tale urna le palline per formare il campione. Invece dell’urna si preferisce oggi ricorrere ad una tavola di numeri casuali. Le tavole dei numeri casuali si costruivano, un tempo, con metodi empirici; attualmente si utilizzano i computer che dispongono di un apposito programma che fornisce una successione di numeri a gruppi di due, tre, quattro, n cifre. Il campionamento casuale semplice è il campionamento probabilistico per eccellenza: ad esso sono, infatti, legati tutti gli altri tipi più complessi di campionamento che hanno l’obiettivo di aumentare la precisione delle stime. Il momento fondamentale è la scelta del disegno campionario: essa sarà supportata da ogni informazione, nota a priori, sulle unità della popolazione (U) considerata. A seconda della qualità o quantità di tali informazioni, sarà possibile applicare disegni semplici o complessi. Svantaggi: 1. non si utilizzano le informazioni note a priori sulla popolazione sulle caratteristiche distributive delle variabili; 2. non è considerato conveniente per i suoi elevati costi di rilevazione dei dati e per i tempi di organizzazione del lavoro. Vantaggi: 1. evitare le distorsioni provocate da campionamenti non casuali; 2. permettere di stimare gli errori di campionamento.

LEZ. 31

11. Descriva il campionamento non probabilistico.

I campionamenti probabilistici presentano una caratteristica comune che risiede nel fatto che ogni unità della popolazione ha una probabilità nota e diversa da 0 di essere inclusa nel campione. Potremo anche trovarci nella condizione in cui non sia possibile conoscere la probabilità di inclusione nel campione di ogni unità, in tal caso si ricorre ad uno dei campionamenti non probabilistici. L’utilizzo di tali tecniche rende però impossibile valutare: grado di precisione delle stime e i rischi di commettere errori. La costruzione di campioni mediante l’uso di tali tecniche ha lo scopo di raffigurare in “piccolo” la popolazione considerata; i campioni così ottenuti sono detti “a scelta ragionata”.

12. Descriva il campionamento a più stadi.

Il campionamento a più stadi viene attuato nella pratica. Avere più stadi o più livelli ha lo scopo di voler individuare un campione di unità selezionandole su più livelli. L’obiettivo principale del campionamento a più stadi è quello di studiare le “unità elementari” che nel nostro caso possono essere dei soggetti X. I principi principali del campionamento a più

stadi sono: tra le unità elementari appartenenti ad un gruppo vi siano ampie differenze e le differenze tra i gruppi primari siano limitate. Nel campionamento a più stadi sono presenti vantaggi e svantaggi: per quanto riguarda i vantaggi: • liste delle unità: per ogni stadio sono necessarie le sole liste delle subpopolazioni contenute nelle unità selezionate al livello superiore. Pertanto esso si presenta utile quando le liste della popolazione da sottoporre ad indagine non sono disponibili o sono costose da reperire.

  • i costi si riducono notevolmente su larga scala perché la rilevazione dei dati è concentrata e si limitano i disagi organizzativi e umani. Per quanto riguarda gli svantaggi: • complessità della metodologia di stima;
  • rischio che le stime siano inefficienti proprio per il fatto che unità appartenenti ad un insieme tendono spesso ad assomigliarsi.

13. Descriva il campionamento stratificato

“Stratificare” una popolazione significa ripartirla in sottopopolazioni. L’operazione di stratificazione consiste nel raggruppare le unità statistiche in strati omogenei, vale a dire strati con caratteri comuni sulla base di informazioni relative ad una popolazione. Estraendo da ogni strato un campione casuale semplice, si darà luogo ad un campionamento casuale stratificato. Si ricorre ad esso quando ci troviamo di fronte ad un universo di elevata ampiezza. Il principio è, infatti, quello di suddividere le N unità di una popolazione in H strati quanto più omogenei possibili rispetto a una certa modalità del carattere considerato che sia in stretta correlazione con la variabile d’indagine, in modo che le unità dei singoli strati abbiano poca variabilità. In tal modo sarà possibile stimare con molta precisione determinate caratteristiche pur non utilizzando campioni di eccessiva ampiezza. Utilizzando la stratificazione si potrà ridurre la varianza campionaria senza dover aumentare l’ampiezza del campione. Il motivo del campionamento stratificato esigenze amministrative e organizzative che richiedono una suddivisione geografica (regione o provincia), decentrando e facilitando le operazioni di rilevazione. Trova maggiore applicazione nelle indagini psicologiche e sociali su vasta scala quando i caratteri della popolazione possono presentare grande variabilità o forte asimmetria.

LEZ. 32

11. Descriva le proprietà di uno stimatore.

Correttezza : Uno stimatore si dice corretto se la media di tutte le possibili stime, effettuate con i possibili campioni di dimensione n, risulta uguale al corrispondente parametro della popolazione. Se risulta la media calcolata sul campione è diversa dal corrispondente parametro della popolazione allora lo stimatore viene definito distorto. Efficienza : Tuttavia se lo stimatore è corretto, l’errore quadratico medio coincide con la varianza campionaria dello stimatore. Tenuto conto che solitamente si preferiscono stimatori con una distorsione trascurabile all’aumentare dell’ampiezza campionaria n, per misurare la precisione di uno stimatore si fa riferimento alla sua varianza campionaria piuttosto che all’errore quadratico medio. Lo stimatore migliore è quello meno disperso attorno al valore vero ma incognito del parametro Consistenza : Se si verifica che all’aumentare di n cresce la probabilità che il parametro stimato coincida con quello della popolazione di riferimento, si dice che lo stimatore è consistente (o coerente). Non c’è una regola che dica quale proprietà sia più importante. In generale, si preferisce utilizzare stimatori non distorti, pur sapendo che tale proprietà da sola non basta, soprattutto se non vale la proprietà della consistenza

12. Descriva i concetti di parametro, stimatore e stima.

Si definisce parametro di una popolazione statistica un valore caratteristico della popolazione, ossia una grandezza costante di quella popolazione. Se dalla popolazione estraiamo un campione di n unità (x1, x2, …, xn), dal campione si ricava un valore per valutare un parametro della popolazione, valore che dipende dagli elementi che formano il campione. Si definisce stimatore, o statistica, una funzione degli elementi che formano il campione e si definisce stima il valore di T calcolato con gli elementi di un certo campione. Occorre sapere distinguere fra questi tre elementi: parametro θ, stimatore T e stima. il parametro θ è una costante della popolazione considerata lo stimatore T è una funzione delle variabili campionarie (x1, x2, …, xn) che sono variabili casuali, ossia T =f(x1, x2, …, xn) ovvero una variabile casuale definita nel relativo spazio campionario con una sua distribuzione di probabilità; la stima è il numero reale, valore della funzione 𝑓 quando si assegnano alle variabili Xi i valori xi del

campione estratto.

LEZ. 33

11. Definisca la differenza tra stima puntuale e di intervallo.

Stime puntuali: di un parametro, se la stima si esprime con un valore numerico. La stima puntuale è più generale e più semplice da calcolare, si può applicare in ogni caso anche in assenza di informazioni sulla popolazione, ma talvolta può portare a valutazioni errate. Stime di intervallo di un parametro, se si determina un intervallo che, ad un prefissato livello di fiducia, contiene il parametro incognito. La stima per intervallo si applica se è nota la legge di distribuzione degli stimatori, ha un ambito di applicazione più ristretto, ma permette di valutare meglio l’errore che si può commettere.

12. Descriva l'errore medio di campionamento.

la media e vogliamo sapere se la differenza tra le medie è significativa useremo il test di student. Il valore di “t” dipende dall’ampiezza e viene determinato dai gradi di libertà della distribuzione (pari a n-1). Sono disponibili delle tavole della distribuzione t di student. È un test parametrico. Condizione di validità della distribuzione t student è che la distribuzione dei dati sia normale, le varianze siano omogenee, le osservazioni siano raccolte in modo indipendente.

11. Descriva la differenza tra test unilaterale e bilaterale. ?????

La differenziazione tra test unilaterale a 1 coda o bilaterale a 2 code ha l’effetto importantissimo di determinare la distribuzione delle probabilità e il valore critico per rifiutare l’ipotesi nulla. Esistono maggiori probabilità di rifiutare l’ipotesi nulla quando si effettua un test ad una coda , che quando si effettua un test a 2 code. Alla stessa probabilità totale in un test unilaterale il valore critico è minore di quello bilaterale. Il test unilaterale è più potente del test bilaterale(la potenza di un test è la capacità di rifiutare l’ipotesi nulla quando essa è falsa)

12. Descriva l'errore di primo e secondo tipo e le strategie che possono essere applicate per

ridurli.

Quando si sottopone ad un test bilaterale o unilaterale, un ipotesi nulla Ho contro un’ipotesi alternativa H1 si determinano due decisioni opposte fra loro: accettare Ho e rifiutare H rifiutare Ho ed accettare H1. Si possono commettere due errori: rifiutare Ho quando è vera accettare Ho quando è falsa Se si rifiuta un’ipotesi quando essa è vera si commette un errore che viene detto “errore di prima specie” questo rifiuto avviene se la stima ricavata dal campione è significativamente differente dal valore 0o dell’ipotesi. Se si accetta un’ipotesi quando è falsa si commette un errore detto “errore di seconda specie “ questa accettazione avviene se la differenza fra 0o e la stima del campione estratto è poco significativa tanto da indurre ad accettare 0o come valore del parametro della popolazione. Ogni regola di decisione deve minimizzare gli errori, purtroppo però se si riduce l’errore di un tipo aumenta l’errore dell’altro tipo; per ridurli entrambi si deve aumentare la dimensione del campione ma spesso questo non è possibile.

LEZ. 37

13. Descriva le caratteristiche principali del t test.

Il t test è un test statistico di tipo parametrico con lo scopo di verificare se il valore medio di una distribuzione si discosta significativamente da un certo valore di riferimento, la varianza è sconosciuta. Il t test detto anche t student si basa sul confronto di medie. La distribuzione t varia in funzione dei gradi di libertà , cioè della numerosità campionaria. Il t di student è un test statistico che serve per confrontare due gruppi di dati replicati. In sostanza confronta la differenza tra la media dei due gruppi, considerando la dispersione dei dati (espressa come deviazione standard). Nota che se hai più di due gruppi non è corretto usare il t test, devi usare l'analisi della varianza (ANOVA). Non è necessariamente usato per problemi di genetica, lo puoi usare per qualsiasi problema di statistica. Esempio : Consideriamo un esperimento in cui trattiamo delle cellule con una sostanza X che aumenta la quantità della proteina P. Abbiamo 5 piastre di cellule che vengono trattate con X e 5 piastre di controllo che vengono trattate solo con il veicolo. Andiamo poi a misurare la quantità di P con un certo metodo e otteniamo questi valori (sono numeri assolutamente casuali): Piastre controllo: 1.4 - 1.6 - 1.2 - 1.9 - 1. Piastre trattate: 2.1 - 2.6- 1.8 - 2.3 - 2. Calcoli la media dei due gruppi e la deviazione std: controlli - media: 1.44 dev. std.: 0. trattate - media: 2.24 dev. std.: 0. A questo punto calcoli la varianza come somma delle due deviazioni standard al quadrato diviso il numero di campioni. Quindi: varianza = 0.320.32/5 + 0.300.30/5 = 0. Ora calcoli il valore di t come valore assoluto della differenza delle medie diviso radice quadrata della varianza. |1.44-2.24|/0.2 = 4 Ora prendi una tablella dei valori del t test (es. questa) e cerchi il valore nella casella con n1+n2-2 gradi di libertà (quindi 5+5-2=8) e corrispondente alla probabilità che vuoi controllare (es. 0.01). Per 8 gradi di libertà con p=0.01 il valore di t è 2. Poichè il nostro valore (4) è maggiore di questo, vuol dire che c'è meno di 1/100 di probabilità che i due gruppi siano diversi solo per caso (e non a causa del trattamento). Quindi possiamo con una buona confidenza dire che il trattamento ha un effetto. Poichè il valore è minore di 4.499, non possiamo dire che la probabilità è minore di 1/1000.

LEZ. 38

07. Descriva le caratteristiche principali del test del chi-quadrato.

Si basa sulla relativa distribuzione di probabilità. Si può utilizzare con le variabili su scala ordinale e/o nominale.

Lo scopo principale di questa statistica è di verificare le differenze tra valori osservati e valori teorici (generalmente chiamati “attesi”) e di effettuare un’inferenza sul grado di scostamento fra i due. Praticamente la tecnica viene usata con 3 diversi: a) la casualità della distribuzione di una variabile categoriale; b) l’indipendenza di due variabili qualitative (nominali o ordinali); c) le differenze con un modello teorico. Il test del chi-quadrato è un test statistico così come il t-test che abbiamo visto nelle precedenti lezioni. In particolare è un test che si costruisce calcolando sulle numerosità (non sulle proporzioni) la statistica: i dati vengono distinti in: Osservati sono le numerosità osservate. Attesi sono le numerosità attese se fosse vera l’ipotesi nulla.

LEZ. 39

13. Descriva i concetti principali legati alla regressione.

La funzione che esprime il legame di dipendenza di una variabile dall’altra viene definita funzione di regressione ed è molto utile perché permette di valutare entro i limiti dell’intervallo dei dati rilevanti, il valore della variabile dipendente al variare della variabile indipendente. La funzione più utilizzata soprattutto se i dati rilevati sono numerosi è la funzione lineare, si parla allora di regressione lineare. Se invece fra le due variabili non esiste un legame di dipendenza, esse possono influenzarsi reciprocamente o essere entrambe dipendenti da un’altra grandezza o essere indipendenti

LEZ. 41

13. Descriva le caratteristiche principali del coefficiente di Bravais-Pearson.

La covarianza è la somma degli scarti di una media che possono essere negativi, positivi o nulli. Essa però non viene assunta come indice, perché il suo valore può variare da meno infinito a più infinito. Alla sua normalizzazione si ottiene il coefficiente di correlazione lineare di Bravais-Pearson, un importante indice statistico: Si definisce coefficiente di correlazione lineare di' Bravais-Pearson il rapporto fra la covarianza di X e di Y ed il prodotto degli scarti quadratici medi di X e di Y. L’indice r di correlazione lineare di Bravais-Pearson gode di importanti proprietà: •è un valore senza dimensioni e quindi non dipende dalle unità di' misura delle variabili X e Y; •il suo valore è compreso fra –1 e +1 •se r

O, la correlazione è diretta, o positiva, ossia all’aumentare dei valori della X, i valori della Y tendono ad aumentare e, viceversa, al diminuire dei valori della X, i valori della Y tendono a diminuire; •se r < 0, la correlazione è inversa, o negativa, ossia all’aumentare dei valori della X, i valori della Y tendono a diminuire e, viceversa, al diminuire dei valori della X, i valori della Y tendono ad aumentare; •se r = 1, la correlazione è perfetta positiva, cioè i punti del diagramma sono disposti su una retta ed esiste una relazione lineare crescente fra i valori della X ed i valori della Y. •se r = -1, la correlazione è perfetta negativa, cioè i punti del diagramma sono disposti su una retta ed esiste una relazione lineare decrescente fra i valori della X ed i valori di Y. •se r = 0, non esiste correlazione lineare, potrebbe, però, sussistere una correlazione curvilinea quando la funzione interpolante fosse una funzione non lineare. Infine il coefficiente r è la media geometrica dei due coefficienti di regressione, preceduta dal segno più, se i due coefficienti sono positivi, dal segno meno, se i due coefficienti sono negativi.

14. Parli della covarianza.

L’analisi della correlazione fra due variabili conduce a misurare la forza o l’intensità del legame fra due variabili, sia quando fra esse esiste una relazione di dipendenza, sia quando fra esse non è possibile, o non ha significato, determinare una relazione di dipendenza. Mentre la regressione ricerca una funzione, la correlazione esprime con un numero, il coefficiente di correlazione lineare, come le due variabili variano congiuntamente. Per misurare la variabilità congiunta di due variabili X e Y si introduce la covarianza di X e di Y. La covarianza può essere positiva, negativa o nulla perchè la covarianza è la somma dei prodotti degli scarti dalla media di X per gli scarti dalla media delle Y, scarti che possono essere positivi, negativi o nulli.

LEZ. 42

10. Descriva le caratteristiche principali del coefficiente di determinazione.

Il coefficiente di determinazione r2, indica quale frazione di varianza totale è dovuta alla dipendenza lineare fra y e x, cioè indica quanto il modello della regressione lineare è aderente al fenomeno in studio. Per questo motivo r2 può essere utilizzato per stabilire la “ bontà “ di un modello lineare: quanto più r2 è prossimo a 1 tanto è maggiore la bontà del modello lineare.

LEZ. 45

08. Descriva le caratteristiche principali delle linee di regressione.

Partendo da una tabella a doppia entrata si sono costituite due tabelle a semplice entrata le cui coppie di valori non sono però semplici coppie, ma sono ponderate (cioè ad ogni coppia si deve associare una frequenza). Queste due tabelle si interpolano con una funzione lineare utilizzando il metodo dei minimi quadrati (se è possibile), e le due rette ottenute vengono dette rette di regressione. Per verificare l’esistenza di una correlazione tra i caratteri, si disegna un diagramma di dispersione per rappresentare nel piano cartesiano le osservazioni con punti o cerchietti. Se il diagramma di dispersione suggerisce una relazione lineare tra i dati ed inoltre, il valore del coefficiente di correlazione è prossimo a uno, anche se tra i dati non esiste una relazione perfettamente lineare, ha senso determinare l’equazione