Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


paniere aperte psicometria, Panieri di Psicometria

VARIABILI INTENSIVE E ESTENSIVE La difficoltà nel definire un concetto di misurazione nell’ambito delle Scienze Psicologiche e Sociali può essere ricondotta alla natura stessa dei fenomeni in esame. La maggior parte dei costrutti (i.e. delle variabili di natura psicologica DETTE LATENTI) sono grandezze intensive, non direttamente misurabili e, se graduabili, non necessariamente sommabili. Il concetto di misurazione, anche nelle scienze fisiche, è meno ovvio da formalizzare di quanto possa sembrare pensando al concetto intuitivo di misura. Il caso intuitivo è infatti il caso più semplice: la misurazione di una grandezza estensiva, come la massa, per la quale la concatenazione empirica ha un equivalente matematico nell’operazione di addizione.

Tipologia: Panieri

2023/2024

Caricato il 21/11/2024

alquimia-healing-arts
alquimia-healing-arts 🇮🇹

8 documenti

1 / 13

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
VARIABILI INTENSIVE E ESTENSIVE
La difficoltà nel definire un concetto di misurazione nell’ambito delle Scienze Psicologiche e Sociali può
essere ricondotta alla natura stessa dei fenomeni in esame. La maggior parte dei costrutti (i.e. delle variabili
di natura psicologica DETTE LATENTI) sono grandezze intensive, non direttamente misurabili e, se
graduabili, non necessariamente sommabili. Il concetto di misurazione, anche nelle scienze fisiche, è meno
ovvio da formalizzare di quanto possa sembrare pensando al concetto intuitivo di misura. Il caso intuitivo è
infatti il caso più semplice: la misurazione di una grandezza estensiva, come la massa, per la quale la
concatenazione empirica ha un equivalente matematico nell’operazione di addizione.
Grandezze estensive, ovvero grandezze divisibili, sommabili e direttamente misurabili la massa, il peso, la
lunghezza, il volume . -Grandezze intensive, ovvero grandezze non direttamente osservabili, non sommabili,
ma graduabili come aggressività e bellezza.
Descriva gli indicatori che possono essere usati per l'osservazione del comportamento. !
I costrutti non sono direttamente osservabili per la loro misurazione si ricorre a dei modelli di misurazione,
gli indicatori, che misurano le modalità con cui il costrutto si rende manifesto. Questi indicatori sono:
latenza, frequenza, intensità e durata. La latenza indica l’intervallo di tempo che intercorre tra uno stimolo e
il verificarsi di un evento (la conseguente risposta); rappresenta quindi i tempi di reazione. La frequenza
indica il numero di volte che un evento si presenta (es. nr di volte che sono stato pessimista o ottimista).
L’intensità utilizza la frequenza come indicatore di intensità (% di ottimismo in una situazione). La durata
indica il tempo in cui un singolo comportamento viene
mantenuto (ampiezza dell’onda cerebrale).
Descriva le caratteristiche della scala nominale. !
La scala nominale rappresenta la forma più semplice di misurazione delle variabili qualitative. Consiste nel
definire una variabile attraverso una etichette o categoria, senza attribuirne alcun genere di informazione
quantitativa e nessun criterio di ordine. Infatti, le scale nominali non consentono di quantificare le
differenze, ma è un livello puramente qualitativo, che si caratterizza per l'esclusività, nel senso che il
numero assegnato ad un attributo della variabile è distinto da tutti gli altri e rappresenta sempre e soltanto
quell'attributo. Variabili nominali sono, ad esempio, il sesso, lo stato civile, l'occupazione, ectc.! Queste
variabili non possono essere impiegate per operazioni matematiche, ma solamente confrontare se le variabili
sono uguali o diverse, con lo scopo di identificare il valore assunto dalla variabile.
Descriva le caratteristiche della scala ordinale. !
Il livello ordinale possiede, la proprietà di esprimere i valori in ordine di grandezza (ranking) e di
confrontare le posizioni relative all'interno dei numeri assegnati ad una variabile. Così è, ad esempio, il
livello di scolarità, all'interno del quale possiamo stabilire una gerarchia che, partendo dal valore più basso
(1 = Analfabeta), raggiunga il valore massimo (8 = Specializzazione post- laurea o più di una laurea)
attraverso gradi crescenti di scolarizzazione (p. es., 2 = Alfabeta, 3 = Terza elementare, 4 = Licenza
elementare, 5 = Licenza media inferiore, 6 = Maturità, 7 = Diploma universitario, 8 = Laurea). ! È chiaro
che il punteggio "3" indica un livello di scolarizzazione inferiore rispetto al punteggio "6" e questo ci
consente di confrontare livelli diversi di una stessa variabile, ma non di stabilire l'entità della differenza tra i
due livelli mediante un'operazione matematica: non si può, in altri termini, sottrarre la "Terza elementare"
dalla “Maturità" Le variabili possono essere diverse a seconda delle caratteristiche che andremo ad
analizzare, e sono definite qualitative quando esprimono una qualità, in cui le modalità sono dei valori non
numerici (ad esempio: il genere o il credo religioso) che ci permettono di analizzare principalmente le
caratteristiche del nostro costrutto.! Un carattere qualitativo è ordinale se le modalità posseggono
naturalmente un ordine, e possono essere disposte lungo una scala (ad esempio gli attributi pessimo, cattivo,
mediocre, buono e ottimo, oppure i giorni della settimana).! Un carattere qualitativo è nominale se le
modalità non posseggono alcun ordine naturale (ad
esempio: le malattie o il colore degli occhi).!
Mentre le variabili quantitative esprimono una quantità, in cui le modalità sono dei valori numerici (ad
esempio: l'altezza o il numero di figli) che ci permettono di avere delle informazioni più precise.
Descriva le caratteristiche della scala a intervalli. !
Quando è possibile stabilire un’unità di misura, qualunque essa sia, oltre alle informazioni relative all’essere
uguale o diverso (Sc. Nominale) e maggiore e minore (Sc. Ordinale), diventa nota la distanza tra un
punteggio e un altro, costante, in cui si può stabilire non solo un ordine, ma anche l’esatta distanza tra i
pf3
pf4
pf5
pf8
pf9
pfa
pfd

Anteprima parziale del testo

Scarica paniere aperte psicometria e più Panieri in PDF di Psicometria solo su Docsity!

VARIABILI INTENSIVE E ESTENSIVE

La difficoltà nel definire un concetto di misurazione nell’ambito delle Scienze Psicologiche e Sociali può essere ricondotta alla natura stessa dei fenomeni in esame. La maggior parte dei costrutti (i.e. delle variabili di natura psicologica DETTE LATENTI) sono grandezze intensive, non direttamente misurabili e, se graduabili, non necessariamente sommabili. Il concetto di misurazione, anche nelle scienze fisiche, è meno ovvio da formalizzare di quanto possa sembrare pensando al concetto intuitivo di misura. Il caso intuitivo è infatti il caso più semplice: la misurazione di una grandezza estensiva, come la massa, per la quale la concatenazione empirica ha un equivalente matematico nell’operazione di addizione. Grandezze estensive , ovvero grandezze divisibili, sommabili e direttamente misurabili la massa, il peso, la lunghezza, il volume. -Grandezze intensive , ovvero grandezze non direttamente osservabili, non sommabili, ma graduabili come aggressività e bellezza. Descriva gli indicatori che possono essere usati per l'osservazione del comportamento.! I costrutti non sono direttamente osservabili per la loro misurazione si ricorre a dei modelli di misurazione, gli indicatori, che misurano le modalità con cui il costrutto si rende manifesto. Questi indicatori sono: latenza, frequenza, intensità e durata. La latenza indica l’intervallo di tempo che intercorre tra uno stimolo e il verificarsi di un evento (la conseguente risposta); rappresenta quindi i tempi di reazione. La frequenza indica il numero di volte che un evento si presenta (es. nr di volte che sono stato pessimista o ottimista). L’intensità utilizza la frequenza come indicatore di intensità (% di ottimismo in una situazione). La durata indica il tempo in cui un singolo comportamento viene mantenuto (ampiezza dell’onda cerebrale). Descriva le caratteristiche della scala nominale.! La scala nominale rappresenta la forma più semplice di misurazione delle variabili qualitative. Consiste nel definire una variabile attraverso una etichette o categoria, senza attribuirne alcun genere di informazione quantitativa e nessun criterio di ordine. Infatti, le scale nominali non consentono di quantificare le differenze, ma è un livello puramente qualitativo, che si caratterizza per l'esclusività, nel senso che il numero assegnato ad un attributo della variabile è distinto da tutti gli altri e rappresenta sempre e soltanto quell'attributo. Variabili nominali sono, ad esempio, il sesso, lo stato civile, l'occupazione, ectc.! Queste variabili non possono essere impiegate per operazioni matematiche, ma solamente confrontare se le variabili sono uguali o diverse, con lo scopo di identificare il valore assunto dalla variabile. Descriva le caratteristiche della scala ordinale.! Il livello ordinale possiede, la proprietà di esprimere i valori in ordine di grandezza (ranking) e di confrontare le posizioni relative all'interno dei numeri assegnati ad una variabile. Così è, ad esempio, il livello di scolarità, all'interno del quale possiamo stabilire una gerarchia che, partendo dal valore più basso (1 = Analfabeta), raggiunga il valore massimo (8 = Specializzazione post- laurea o più di una laurea) attraverso gradi crescenti di scolarizzazione (p. es., 2 = Alfabeta, 3 = Terza elementare, 4 = Licenza elementare, 5 = Licenza media inferiore, 6 = Maturità, 7 = Diploma universitario, 8 = Laurea).! È chiaro che il punteggio "3" indica un livello di scolarizzazione inferiore rispetto al punteggio "6" e questo ci consente di confrontare livelli diversi di una stessa variabile, ma non di stabilire l'entità della differenza tra i due livelli mediante un'operazione matematica: non si può, in altri termini, sottrarre la "Terza elementare" dalla “Maturità" Le variabili possono essere diverse a seconda delle caratteristiche che andremo ad analizzare, e sono definite qualitative quando esprimono una qualità, in cui le modalità sono dei valori non numerici (ad esempio: il genere o il credo religioso) che ci permettono di analizzare principalmente le caratteristiche del nostro costrutto.! Un carattere qualitativo è ordinale se le modalità posseggono naturalmente un ordine, e possono essere disposte lungo una scala (ad esempio gli attributi pessimo, cattivo, mediocre, buono e ottimo, oppure i giorni della settimana).! Un carattere qualitativo è nominale se le modalità non posseggono alcun ordine naturale (ad esempio: le malattie o il colore degli occhi).! Mentre le variabili quantitative esprimono una quantità, in cui le modalità sono dei valori numerici (ad esempio: l'altezza o il numero di figli) che ci permettono di avere delle informazioni più precise. Descriva le caratteristiche della scala a intervalli.! Quando è possibile stabilire un’unità di misura, qualunque essa sia, oltre alle informazioni relative all’essere uguale o diverso (Sc. Nominale) e maggiore e minore (Sc. Ordinale), diventa nota la distanza tra un

punteggio e un altro, costante, in cui si può stabilire non solo un ordine, ma anche l’esatta distanza tra i

livelli della variabile misurata, e per tale motivo non è presente uno zero assoluto.In questa scala non potrò moltiplicare o dividere i valori perchè sarebbe scorretto (es. dire che una persona che ha espresso 2 come valore di pessimismo, sia la metà di 4 Descriva le caratteristiche della scala a rapporti equivalenti.! La scala a rapporti equivalenti ha le stesse caratteristiche della scala a intervalli equivalenti, con la differenza che il valore zero indica un'effettiva assenza dell’attributo misurato.Le variabili sono “a rapporti” quando, oltre ad avere diversità (Sc. Nominale), ordine (Sc. Ordinale) ed equivalenza (Sc. A intervalli) dell’intervallo, contengono uno zero che indica vera assenza di quantità misurata; in tale scala si può stabilire che un punteggio è il doppio dell’altro (prendere 100 è prendere il doppio di 50). Descriva le tabelle di contingenza.! Le tabelle di contingenza sono specifiche tabelle utili a rappresentare due misure in relazione tra loro, ovvero a condurre un’analisi bivariata. Vengono prese in considerazione due variabili X e Y, di cui rappresentiamo le relative modalità. Ad ogni coppia si farà corrispondere una frequenza n rappresentata dagli elementi della popolazione che presentano contemporaneamente le due modalità di X e Y, indicate rispettivamente con Xi e Yj. In maniera più specifica andremo a riportare nella colonna verticale la variabile X e nella riga orizzontale la variabile Y. In seguito riporteremo nelle celle tutti gli elementi di N che presentano contemporaneamente le modalità di X e Y, ottenendo così le frequenze congiunte. Fatto ciò, calcoleremo le frequenze marginali assolute, e precisamente le frequenze marginali di X ottenute dalla sommatoria dei valori delle singole frequenze tra tutte le righe, e le frequenze marginali di Y, ottenute dalla sommatoria dei valori delle singole frequenze tra tutte le colonne. La somma delle frequenze assolute di X e di Y ci fornirà il valore della numerosità N della popolazione. DESCRIVA GLI INDICI DI DISPERSIONE.! Le misure di dispersione esprimono la tendenza delle singole osservazioni di una distribuzione ad allontanarsi dalla tendenza centrale, ovvero la “variabilità” dei dati. I diversi indicatori sono: numero di categorie; range ( Xmax - Xmin); differenza interquartile (Q3-Q1); varianza; deviazione standard. La dispersione esprime la “bontà” o la “povertà” della tendenza centrale quale descrittore di una distribuzione, dando un valore informativo circa l'ampiezza della valutazione del valore rispetto al valore centrale del valore calcolato VARIABILI PSICOLOGICHE Le variabili psicologiche sono dimensioni teoriche (costrutti) non osservabili direttamente, ma misurabili mediante l’individuazione di indicatori osservabili di cui sono l’espressione. L’indicatore è una variabile osservabile che si ipotizza cogliere il costrutto o parte di esso. La scelta degli indicatori non è ovvia. C’è sempre una componente arbitraria poiché dipendono da un lato dalle teorie dei ricercatori e dall’altro dagli strumenti adottati per misurarli. SIST EMP E NUM Il processo di misura mette in relazione due insiemi: l'insieme costituito dagli elementi che si vogliono misurare (detto insieme empirico ) e un secondo insieme (insieme numerico ) volto a rappresentare mediante numeri le relazioni che esistono all'interno dell'insieme empirico. Nella misurazione la relazione tra sistema empirico e numerico deve essere UNIVOCA. COSTRUTTI TEORICI (VARIABILI LATENTI)  OPERAZIONALIZZAZIONE INDICATORI OSSERVABILI (VARIABILI MANIFESTE) VARIABILI: QUALITATIVE: caratterizzate da categorie (nominali e ordinali) QUANTITATIVE: caratterizzata da valori che variano in grandezza (a intervalli e a rapporti) CONTINUE: possono assumere qualsiasi valore in un insieme continuo DISCRETE O DISCONTINUE: prevedono categorie distinte e possono assumere solo valori interi INDIPENDENTE: manipolata dallo sperimentatore o dagli eventi DIPENDENTE: ciò che consegue alla manipolazione D’ERRORE/INTERVENIENTI: che producono errori (casuali o sistematici) INDAGINI

1) L’INDAGINE DESCRITTIVA: dare una rappresentazione 2) L’INDAGINE CORRELAZIONALE:

si ipotizza una compresenza sistematica, senza alcuna relazione di causa ed effetto 3) L’INDAGINE

CAMPIONAMENTO

la più importante distinzione riguardo il tipo di campionamento è tra campioni probabilistici e campioni non probabilistici. Se la scelta delle unità da inserire nel campione è casuale si parla di campionamento probabilistico. In questo tipo di campionamento, ogni unità statistica della popolazione oggetto di indagine avrà una probabilità maggiore di zero ed individuabile a priori di essere inclusa nel campione. è quindi indispensabile disporre di una lista contenente l’elenco di tutte le unità che costituiscono la popolazione che si vuole analizzare. Quando invece non è proprio possibile ottenere una lista, allora la scelta delle unità da includere nel campione è svolta in modo non casuale e si parla di campionamento non probabilistico. I campionamenti non probabilistici hanno in genere tempi e costi di rilevazione molto più bassi di quelli probabilistici. Per questo motivo molte ricerche sono in realtà svolte ricorrendo a questo tipo di campionamento. in un report che presenta i risultati di un campionamento non probabilistico è importante riportare con la massima precisione possibile non solo i criteri di inclusione e di esclusione ma anche il processo di selezione e le caratteristiche del campione così che chi legge possa decidere in autonomia se tale campione è rappresentativo della realtà di interesse. I metodi più utilizzati per effettuare un campionamento non probabilistico sono: Il campionamento a scelta ragionata Le unità statistiche da includere nel campione sono scelte in modo ragionato (ad esempio, basandosi sul parere di esperti con conoscenza specialistica del problema o sulla letteratura) così da selezionare solo quelle che meglio rispondono agli obiettivi di ricerca. Il campionamento per quote Le unità statistiche da includere nel campione sono selezionate in modo che il campione rispetti le proporzioni presenti nella popolazione oggetto di studio in base ad alcune variabili (ad esempio, il genere, la fascia di età, l’area geografica). Si arriva in questo modo alla definizione delle “quote”, cioè del numero di unità statistiche che dovranno essere inserite nel campione per ogni classe. campionamento statistico (che si appoggia alla teoria dei campioni o " teoria del campionamento ") sta alla base dell'inferenza statistica, la quale si divide in due grandi capitoli: la teoria della stima e la verifica d'ipotesi. In particolare, una rilevazione si dice campionaria quando è utile per fare inferenza, ossia per desumere dal campione stesso un'informazione relativa all'intera popolazione. Il campione (statistico) è un insieme di unità statistiche estratto da una popolazione. Tramite il campione si possono stimare, entro determinati limiti di errore, le proprietà dell'intera popolazione. Esistono vari tipi di campionamento: 1)Campionamento probabilistico e non probabilistico (nel primo tutte le unità appartenenti alla popolazione o universo della quale si vuole estrarre un campione hanno la stessa probabilità nota di venire estratte, nel secondo questo non avviene). Il più semplice campionamento probabilistico è il campionamento casuale semplice: si tratta di estrarre a caso da una popolazione predeterminata un numero prefissato di elementi che costituiranno il campione. • Per fare ciò si assegna un numero a tutti gli elementi della popolazione e, attraverso la generazione di numeri casuali, si estraggono tanti numeri quanti sono gli elementi del campione desiderato. Un altro metodo è il campionamento stratificato, il quale consiste nel suddividere la popolazione in più popolazioni omogenee rispetto ad una caratteristica e da queste estrarre campioni casuali semplici. • Più le sottopopolazioni sono omogenee (cioè poco variabili) minore sarà la numerosità del campione necessario a garantirne la rappresentatività. Ad hoc: soggetti sono volontari, difficile generalizzare. Campionamento sistematico Differisce dal campionamento casuale semplice soprattutto dal punto di vista della tecnica di estrazione dei soggetti: infatti essi non vengono più estratti uno per uno in maniera casuale, ma una volta estratta un'unità, il campione estratto è determinato secondo un criterio ragionato. Campionamento a più stadi Il primo stadio è uguale a quello del campionamento a grappoli. Successivamente, da ogni grappolo selezionato è estratto un campione casuale di unità statistiche di secondo stadio e così via per il numero di stadi prefissati. VARIABILI La variabile (o carattere) X è quel particolare aspetto delle unità statistiche che costituisce l'oggetto dell'indagine. Esempi di variabili che possono essere rilevate su un insieme di persone sono l'età, lo stato civile, la religione, la professione, il titolo di studio, il reddito, il numero di automobili possedute. Su un

insieme di imprese si può voler rilevare il fatturato, gli investimenti, il numero di dipendenti, la quota di mercato. Su un insieme di appezzamenti agricoli si può essere interessati a conoscere la composizione del suolo, l'esposizione al sole, il livello di irrigazione, il clima. Le variabili si suddividono, in relazione alle loro caratteristiche, in variabili qualitative (o categoriali) e variabili quantitative. Una variabile si dice qualitativa quando le sue determinazioni (dette anche modalità o categorie) sono espresse mediante aggettivi o sostantivi. Esempi comuni di variabili qualitative sono il sesso, lo stato civile, il gruppo sanguigno, il colore degli occhi e dei capelli, il titolo di studio, il livello di soddisfazione relativo ad un certo prodotto o servizio. Va sottolineato che le modalità di una qualsiasi variabile qualitativa risultano sempre incompatibili fra di loro ed esaustive, nel senso che ciascuna di esse non può coesistere con nessuna delle altre e che la lista delle modalità comprende tutti i modi in cui la variabile può manifestarsi. Le variabili qualitative si suddividono ulteriormente in ordinabili e non ordinabili (dette anche sconnesse o sparse) in relazione alla possibilità di stabilire o meno un ordinamento naturale delle modalità. Nel primo caso è naturale elencare le modalità in modo ordinato, mentre nel secondo caso ogni ordinamento risulta del tutto arbitrario. Per esempio, il titolo di studio è una variabile qualitativa ordinabile in quanto c’è un’ordinamento naturale delle sue modalità, mentre la variabile sesso risulta sparsa. Altri esempi di caratteri ordinabili sono il ceto sociale, l'anno del corso di studi, la qualifica funzionale degli impiegati, il grado nella gerarchia militare, la “dimensione” delle imprese (piccola, media e grande). Una variabile si dice quantitativa quando le sue determinazioni (dette anche valori o intensità) sono espresse mediante valori numerici. Esempi di variabili quantitative sono il reddito, il numero di figli, il rendimento di un titolo azionario, il voto conseguito all’esame di maturità. Le variabili quantitative si suddividono in discrete e continue. Una variabile quantitativa si dice discreta quando può assumere un insieme finito o numerabile di valori, mentre si dice continua quando può assumere, almeno in teoria, tutti i valori compresi in un intervallo reale o, in altri termini, può assumere una infinità non numerabile di valori diversi. Le variabili quantitative discrete derivano generalmente da operazioni di conteggio, come ad esempio il numero dei componenti delle famiglie, il numero di veicoli circolanti, il numero di dipendenti di un’azienda e quello degli sportelli bancari. Le variabili quantitative continue, invece, derivano spesso da operazioni di misurazione, come ad esempio la temperatura, la statura, il peso, l’altitudine, la superficie coltivabile. FREQUENZA La frequenza assoluta registra il numero di volte in cui appare un determinato valore nell'osservazione. La frequenza relativa registra IL RAPPORTO tra fr assoluta e numero tot di osservaz in % quindi esprime la percentuale di occorrenza di un determinato valore. la frequenza cumulata associata ad una modalità o a una classe di modalità, è pari alla somma della sua frequenza assoluta e di quelle delle modalità che la precedono. GRAFICI dati riportati in barre. Linee e punti hanno elementi strutturali e decorativi DIAGRAMMI CARTESIANI ascisse (anni, giorni categorie variabili) e ordinate (le frequenze, intensità con unità di misura) ISTOGRAMMI Numero di variabili: 1. Mostra la forma o la distribuzione dei dati; è utile per l'identificazione degli outlier, migliore per variabili quantittative. GRAFICI A BARRE Numero di variabili:

  1. Mostra il conteggio della frequenza dei valori di una variabile categorica; può essere verticale oppure orizzontale. GRAFICA A RETTANGOLI SEPARATI GRAFICI A LINEE Numero di variabili: 2. Mostra i cambiamenti nel tempo. I valori sull'asse x devono essere ordinati cronologicamente. I grafici a linee, chiamati anche grafici lineari o carte sequenziali GRAFICI A DISPERSIONE Numero di variabili: 2 o più, a seconda del numero di variabili utilizzate per definire i gruppi per colori o indicatori. Mostra un possibile rapporto tra due variabili, identificando gli outlier. GRAFICI A TORTA ideali per ogni rappresentazione, Numero di variabili: 1 o più. Mostra i rapporti di una parte con il tutto per una data variabile. Aggiungere categorie per più grafici a torta è più utile che usare un grafico a torta singolo. Nel caso di un'unica variabile, un grafico a barre può essere più utile per distinguere differenze minime tra i valori. Un Poligono di frequenza ( bene per quantitativi) consiste di pezzi di linea retta che collegano i punti medi delle classi alle rispettive frequenze. o quale percentuale di valori del campione sono al di sotto (o uguali) ad un prefissato valore.

TABELLE Le tabelle di contingenza sono un particolare tipo di tabelle a doppia entrata (cioè tabelle con

etichette di riga e di colonna), utilizzate in statistica per rappresentare e analizzare le relazioni tra due o più variabili. In esse si riportano le frequenze congiunte delle variabili.

caso la probabilità del secondo evento P(B|A) è influenzata dal primo evento già realizzato (A). La probabilità del primo evento è, invece, semplice e indipendente perché si verifica prima. ESEMPIO ambo a lotto (i numeri non vengono reinseriti) Il primo evento P(A) condiziona la probabilità del secondo evento P(B|A). DESCRIVA LA CONCEZIONE FREQUENTISTA DELLA PROBABILITA'! La definizione frequentista si applica ad esperimenti casuali i cui eventi elementari non siano ritenuti ugualmente possibili, ma assume che l'esperimento sia ripetibile più volte, idealmente infinite, sotto le stesse condizioni.! Tale probabilità si basa sulla legge dei grandi numeri (o legge empirica del caso) secondo cui, in un gran numero di prove fatte tutte nelle medesime condizioni, la frequenza relativa dei successi tende al valore teorico della probabilità; ciò fa pensare che in fenomeni in cui la probabilità classica non è applicabile, è possibile considerare la frequenza di eventi già accaduti e considerarla come probabilità di eventi futuri. Risulta subito evidente il limite di questa definizione: non si precisa quanto grande debba essere il numero di prove, ed è necessario ripetere le prove nelle medesime condizioni. DESCRIVA LA CONCEZIONE LOGISTICA DELLA PROBABILITA'! Per alcuni studiosi la probabilità di un evento è una relazione logica fra l’evento stesso ed un insieme di conoscenze di cui si dispone. Nel nostro secolo si ha un’impostazione astratta, l’impostazione assiomatica, che sviluppa tutta la teoria della probabilità partendo da due concetti primitivi: evento e probabilità, e assegnando alcuni assiomi. Questa concezione ha avuto molta importanza ed ha permesso di raggiungere notevoli risultati da un punto di vista generale, applicabili ai settori più svariati DESCRIVA LA CONCEZIONE CLASSICA DELLA PROBABILITA'.! La probabilità P (E) di un evento E è il rapporto fra il numero m dei casi favorevoli (al verificarsi di E) e il numero n dei casi possibili, giudicati egualmente possibili. La definizione classica di probabilità é inutilizzabile quando non si conoscono a priori il numero dei casi possibili, come nella quasi totalità degli eventi reali. DESCRIVA LA CONCEZIONE SOGGETTIVA DELLA PROBABILITA'.! Secondo la teoria soggettiva la probabilità è la misura del grado di fiducia che un individuo attribuisce al verificarsi di un dato evento in base alle sue conoscenze dello stesso. Si applica quando la teoria classica e la teoria frequentata non sono più d’aiuto, ovvero dove non si può più determinare se i casi sono possibili o impossibili, e quindi serve una valutazione soggettiva.! Le valutazioni soggettive possono variare da individuo a individuo, ma deve essere rispettata la coerenza. È fondamentale che il soggetto abbia il maggior numero di informazioni possibili e, tramite esse, sappia attribuire determinate probabilità a determinati eventi: in tal caso la probabilità soggettiva si può ritenere affidabile. DISTRIBUZ probabilità Una distribuzione di probabilità è un modello matematico che collega i valori di una variabile alle probabilità che tali valori possano essere osservati. 2 tipi di distribuz: continue (variabile espressa su scala continua con intervalli come temperatura) o discrete (variabile misurata con valori numerici interi si ha numero finito di eventi lancio dadi) A seconda della natura della variabile casuale, discreta o continua, la distribuzione di probabilità può essere: Distribuzione di probabilità discreta Il fenomeno è osservabile con un numero intero di modalità. Distribuzione di probabilità continua La distribuzione di probabilità è continua quando la variabile casuale assume un insieme continuo di valori. Il fenomeno statistico è osservabile con un numero infinito o troppo elevato di modalità. La distribuzione di Poisson è una distribuzione casuale discreta di media e varianza identiche che si utilizza per calcolare la probabilità che un certo evento si manifesti esattamente x volte in una certa unità spazio- temporale. SI USA per misurare il numero di chiamate ricevute in un call-center in un determinato arco temporale, come una mattinata lavorativa. Questa distribuzione è anche nota come legge degli eventi rari. Viene utilizzata la distribuzione di Poisson **quando un evento E soddisfa le seguenti tre ipotesi:

  1. La probabilità che si verifichi un evento in un tempo molto piccolo è proporzionale all'intervallo temporale stesso**. 2) La probabilità che si verifichi un secondo evento nello stesso intervallo dt è molto piccola. La distribuzione binomiale serve per calcolare la probabilità di avere x successi in n prove indipendenti. Per prove indipendenti intendiamo che la probabilità che tale prova abbia successo o meno non venga influenzata dalla prova precedente e non abbia a sua volta influenza sulla prova successiva. Per eventi di tipo dicotomico (positivo, negativo, corretto, sbagliato) e mutualmente escludenti.

La variabile aleatoria ipergeometrica è una distribuzione di probabilità discreta. Viene utilizzata per stimare la probabilità di ottenere un certo numero di successi in un campione di dimensione fissa, estratto

senza reimmissione (o reinserimento, o riposizione) da una popolazione finita. Dist discreta uniforme Si dice

che una V. C. discreta ha DISTRIBUZIONE UNIFORME se tutti i suoi valori hanno la stessa

probabilità.

La distribuzione normale è una distribuzione della probabilità continua di un fenomeno statistico intorno alla media. È anche conosciuta come distribuzione gaussiana dal nome del suo autore, il matematico tedesco Gauss, che la formula per la prima volta all'inizio del XIX secolo. In una distribuzione normale, media, moda e mediana coincidono e la distribuzione di frequenza appare simmetrica rispetto al valore centrale, con un'ampiezza variabile in base alla deviazione standard. Curva a campana eventi di grandi dimnensioni. La deviazione standard è il punto di flesso della funzione.La distribuzione normale standardizzata è un caso specifico che si ottiene quando la media è uguale a zero (μ=0) e la deviazione standard è uguale a uno (σ=1). In questo caso la curva della distribuzione è centrata intorno al valore zero (x=0). Si usa molto per i test psicologici. STANDARDIZZAZ Standardizzare una variabile statistica RENDE DATI DIRETTAM CONFRONTABILI, al contrario dei dati grezzi si possono comparare ad es risultati di IQ di diversi test La formula della standardizzazione è: Zx=xi−media/dev st STIMA STIMATORE La stima statistica consiste nel trarre delle conclusioni su alcune proprietà statistiche della popolazione mediante informazioni su campioni. La stima può essere: §puntuale à si risolve in un valore assunto a rappresentare una proprietà statistica (un parametro) della popolazione §intervallare à si risolve nel fissare

due valori tra cui si presume sia compreso un parametro della popolazione. Basandoci sull’universo dei

campioni possiamo valutare le caratteristiche di una particolare statistica campionaria (es. la media),

analizzandone il comportamento su tutti i potenziali campioni estraibili dalla popolazione • Una

statistica campionaria ci permette di «stimare» il valore della caratteristica incognita della

popolazione. Questa statistica si chiama «Stimatore» • Lo stimatore potrà avere vari valori al variare

del campione. • Il valore realizzato sul campione effettivamente osservato si chiama «stima».

In statistica uno stimatore (puntuale) è una funzione che associa ad ogni possibile campione un valore del parametro da stimare. È una funzione di un campione di dati estratti casualmente da una popolazione. Il valore assunto dallo stimatore in corrispondenza a un particolare campione è detto stima. Per STIMA PUNTUALE DEI PARAMETRI s'intende l'insieme dei metodi inferenziali che permettono di attribuire un valore ad un parametro della popolazione, utilizzando i dati di un campione casuale osservato (x1, x2,…,xn) ed elaborandoli. Lo stimatore è uno strumento teorico che permette di dare dei giudizi sulla bontà della stima. • È necessario individuare lo stimatore più adeguato per stimare i parametri della popolazione. • Proprietà finite: valgono per qualsiasi numerosità del campione • Proprietà asintotiche: valgono solo per campioni di grande numerosità Vedremo ad esempio che per stimare la media della popolazione si può utilizzare la media campionaria, mentre la varianza campionaria non è lo stimatore migliore della varianza della popolazione. stima intervallare da come risultato un intervallo continuo di valori detto intervallo di confidenza PROPR FINITE DI UNO STIMATORE • Correttezza: riferita al valore atteso • Efficienza: riferita alla variabilità Definizione di Correttezza: uno stimatore T è corretto se il suo valore atteso coincide col parametro θ che si vuole stimare Fra tutti i campioni ce ne sono alcuni che forniscono sotto-stime e altri sovra-stime del parametro, altri ancora che danno valori molto lontani, altri molto vicini o anche uguali, Stimatore è corretto se sovra-stime e sottostime si compensano, e in media lo stimatore coincide con il valore vero incognito del parametro. Un'altra proprietà desiderabile per uno stimatore è quella di essere poco variabile, quindi di determinare in media stime del parametro più vicine al valore vero incognito • La variabilità solitamente è misurata dalla deviazione standard che nel caso di uno stimatore è anche detta errore standard. • Efficienza è una proprietà relativa e riguarda la variabilità di uno stimatore. • Uno stimatore è detto più efficiente di un altro se determina stime del parametro più vicine al vero valore, in media, rispetto ad altri stimatori. • Si parla di efficienza di uno stimatore in termini di confronto con quella di un altro stimatore INTERVALLO CONFIDENZA

Contrapposta all’ipotesi nulla H0 si ha l’ipotesi alternativa Ha. L’ipotesi alternativa può essere di tre tipi, tra loro mutuamente esclusivi: BILATERALE, UNILAT DX E UNILAT SX. La prima delle tre alternative precedenti è non-direzionale; le ultime due specificano invece degli scostamenti direzionali dall’ipotesi nulla. In qualsiasi applicazione concreta della procedura di verifica di ipotesi statistiche viene usata solo una delle possibili versioni dell’ipotesi alternativa. Si noti che le ipotesi nulla e alternativa sono specificate nei termini

del parametro d’interesse (nel caso presente, μ). E’ bilaterale quando ci si chiede se tra la media del

gruppo A (nel caso presente, metodo computer) e quella del gruppo B (metodo tradizionale) esiste

una differenza significativa, senza sapere a priori quale sia maggiore (o minore). E’ unilaterale

quando è possibile escludere a priori, come privo di significato e risultato solo di errori nella

conduzione dell’esperimento, il fatto che la media di B possa essere minore o maggiore della A. Si

ha un test unilaterale, per esempio, quando si confrontano i risultati di un farmaco con il placebo. L’unica domanda razionale è se gli individui ai quali è stato somministrato il farmaco abbiano risultati migliori nella sopravvivenza di coloro ai quali è stato somministrato il placebo. Se il gruppo al quale è stato somministrato il farmaco avesse un risultato medio minore dell’altro, sarebbe illogico e quindi sarebbe inutile proseguire l’analisi, con qualunque test statistico. Si ha un test bilaterale, per esempio, quando si confrontano i risultati di due metodi di insegnamento, come nel caso presente, per valutare quale abbia l’effetto migliore. In questo caso ci sono due alternative, che lo sperimentatore ritiene ugualmente logiche e possibili. CHI QUADRO l test del chi-quadrato viene usato per verificare l'ipotesi che i dati corrispondano a quelli attesi. L'idea alla base del test è di confrontare i valori osservati nei dati e quelli attesi qualora l'ipotesi nulla fosse vera. Due comuni test del chi-quadrato consistono nel verificare se le frequenze osservate in una o più categorie corrispondono alle frequenze attese. X^2=(DATO OSSERVATO -DATO ATTESO)^2/DATO ATTESO quindi POI SI DEVE confrontare il valore ottenuto con la Tabella dei valori di chi-quadrato REGRESSIONE Il termine regressione è un indicatore statistico che indica l'esistenza o meno di relazione tra due (analisi bivariata) o più variabili (analisi multivariata) quantitative. L'analisi della regressione è una tecnica usata per analizzare una serie di dati che consistono in una variabile dipendente e una o più variabili indipendenti. Lo scopo è stimare un'eventuale relazione funzionale esistente tra la variabile dipendente e le variabili indipendenti. Si sceglie l'analisi di correlazione quando si vuole riassumere la relazione diretta fra due variabili. Si sceglie invece la regressione per prevedere o spiegare la risposta numerica. Da un punto di vista delle formule, la regressione lineare è una funzione matematica basata dall’equazione della retta. Nello specifico, un modello di regressione lineare è composto da:

  • Una sola variabile risposta quantitativa (detta anche dipendente o Y)
  • Una o più variabili esplicative (dette anche X o regressori)
  • Un coefficiente di regressione per ogni variabile esplicativa più un coefficiente per l’intercetta (β)
  • Un termine di errore (ε). Questo perché la relazione tra due variabili non è quasi mai perfettamente riassumibile tramite un’equazione matematica. Questo accadrebbe solo nel caso in cui tutte le unità statistiche si comportassero esattamente nello stesso modo (un po’ come degli scalatori in cordata). Nello specifico, la variabile risposta (la Y) è determinata dai valori dell’intercetta (β0) a cui vengono sommati i valori delle variabili esplicative (le X) moltiplicate per i loro coefficienti (β), più un termine d’errore (ε EPSILON). Modello di regressione lineare semplice : quando c’è un solo regressore. Si studia quindi la relazione tra due variabili
  • Modello di regressione lineare multiplo : quando c’è più di un regressore. In questo caso, si studia invece l’ effetto contemporaneo di più x sulla y.

Coefficiente BARVAIS PEARSON Il coefficiente di correlazione r di Pearson è la tecnica statistica più conosciuta per valutare la correlazione lineare tra due variabili. Spesso però questo indice è utilizzato in modo sbagliato. In questo articolo scoprirai quali sono tutte le verifiche da fare per capire se puoi utilizzare questa analisi di correlazione. Ma anche come interpretare l’indice e come riportare i risultati in un report. Inoltre, ti mostrerò quali sono tutte le strategie alternative che puoi adottare. si utilizza per determinare la forza e la direzione di una relazione lineare tra due variabili continue.

Ad esempio, puoi utilizzarla per determinare la forza e la direzione di una relazione lineare tra i valori della pressione sistolica ed il peso di un campione di pazienti. Oppure per valutare la relazione lineare tra il numero di parole scritte in un racconto e l’età di un campione di studenti. O magari per verificare se ci sia una correlazione lineare tra la capacità polmonare e la performance sportiva in una gara sui 100 metri piani. Se questo indice fa riferimento alla popolazione viene indicato con la lettera greca rho (ρ), mentre se ci si riferisce ad un campione si utilizza la lettera r dell’alfabeto latino. le due variabili devono essere entrambe quantitative E appaiate sugli stessi casi. Il grafico di correlazione deve mostrare una relazione di tipo lineare tra le due variabili. Non devono essere presenti outliers influenti. La distribuzione di entrambe le variabili deve essere normale. coefficiente di correlazione si calcola come rapporto tra la covarianza delle due variabili e il prodotto delle loro deviazioni standard. CORRELAZ Il concetto di correlazione Si dice che due variabili A e B sono correlate quando i valori di una variabile A tendono a seguire quelli dell’altra variabile B con una certa regolarità Esempio. Con l’aumentare del reddito disponibile aumentano anche le spese che le persone affrontano. Correlazione positiva o concordanza: Due variabili crescono contemporaneamente Correlazione negativa o discordanza: Una variabile cresce mentre l’altra diminuisce. Correlazione nulla o incorrelazione: Due variabili non hanno la tendenza a crescere o diminuire contemporaneamente. Quando la relazione è positiva i dati tendono a distribuirsi su una linea retta (crescente) in cui le x e le y crescono contemporaneamente Quando la relazione è negativa i dati tendono a distribuirsi su una linea retta (decrescente) in cui mentre la x cresce la y diminuisce e viceversa Quando la relazione è neutra (o nulla) i dati non sono distribuiti secondo una retta ma variano in maniera casuale (es. Scatter plot o nuvola di punti) COVARIANZA Quando si osservano due caratteri diversi, e , riferiti ad una medesima popolazione, dei quali conosciamo i valori numerici e , si può fare riferimento ad indici statistici che possono descrivere come i due insiemi di

dati variano tra loro. Uno tra questi è la covarianza campionaria. per calcolare la covarianza

campionaria, è necessario determinare i valori della media campionaria dei due caratteri.

LA COVARIANZA è la media del prodotto degli scarti medi Una covarianza campionaria positiva indica che è ragionevole attendersi un aumento della seconda grandezza all’aumentare della prima oppure una diminuzione della seconda al decrescere della prima. In altri termini, una covarianza campionaria positiva indica che le due serie di dati hanno un comportamento “concorde”. Viceversa, una covarianza campionaria negativa indica che i dati hanno comportamenti mediamente “discordi”. Una covarianza campionaria pressoché uguale a zero indica che i dati non sono in relazione diretta tra loro. Il coefficiente di correlazione r è il rapporto tra covarianza di due variabili X,Y ed il prodotto delle radici quadrate delle varianze di X e di Y (deviazioni standard) R coeff correlaz Quando r = -1 o r = 1 abbiamo una perfetta linea retta (tutti i punti su di una linea) I casi intermedi sono indicati da punti approssimativamente distribuiti secondo una retta Se r = 0 non abbiamo alcun comportamento lineare COEFF DETERMINAZ Quando si costruisce un modello di regressione lineare, spesso è importante capire quanto è forte la sua capacità predittiva. Cioè quanto le variabili indipendenti (le x) riescono a predire bene i valori della variabile dipendente (la y). Per stabilirlo si utilizzano una serie di misure, denominate “ indici della bontà di adattamento ”. Queste misure valutano quanta differenza c’è tra i valori osservati di y nel campione ed i valori che il modello ha stimato per y. Piccole discrepanze tra i valori attesi ed osservati indicano che il modello si adatta bene ai dati. Al contrario, grandi discrepanze tra valori attesi ed osservati indicano che il modello non spiega bene la variabilità presente nei dati. In particolare, in questo articolo ci concentreremo sull’ R quadro, uno degli indici statistici più popolari tra chi si occupa di analisi dati. L’R quadro è anche detto coefficiente di determinazione o di adattamento ai dati (in inglese, goodness of fit) e viene utilizzato solo nei modelli di regressione lineare. Tuttavia, il suo utilizzo è talmente diffuso che anche per i modelli non lineari negli anni sono stati proposti una serie di indici simili, detti pseudo R quadro.

quindi il t test di Wilcoxon quando dobbiamo confrontare due medie di campioni dipendenti con test non parametrici. Confronterò la somma dei ranghi (positivi e negativi) con un valore critico tabulare. Quali sono gli assunti per usare un test parametrico?! Si definisce test parametrico un test statistico che si può applicare in presenza di una distribuzione libera dei dati, o comunque nell'ambito della statistica parametrica, in cui viene assunta un’ipotesi a priori sulle caratteristiche della popolazione (dato un parametro), basandosi su sei assunti principali: variabili continue o misurate in un intervallo, indipendenza fra media e varianza, variabili distribuite in modo normale, omogeneità delle varianze, i risultati delle analisi dei campioni si applicano alle popolazioni, e la dimensione del campione deve essere >10 (meglio se > o = di 30) Descriva le caratteristiche principali del test U di Mann-Whitney.! Analogamente al T-test di Student per dati indipendenti, questo test è utilizzato in esperimenti in cui si confrontano due campioni indipendenti, ma la variabile in studio non rispetta le condizioni di applicabilità dei test parametrici. Questo test può essere utilizzato come test di confronto tra due campioni in maniera analoga ai test ipotesi parametrici di confronto medie (test Z se la varianza è nota ed il test t di Student se la varianza non è nota). Il test di Mann-Whitney si applica solitamente quando le assunzioni per effettuare il test parametrico non sono soddisfatte, ovvero quando entrambe le condizioni 1 e 2 sono presenti:!

  1. le distribuzione della variabile oggetto di studio non è normale!
  2. le dimensioni campionarie sono ridotte ( n < di 30 casi in almeno un campione).