La standardizzazione

•Variabili cardinali "

•consiste: in una doppia trasformazione"

1) prima: si normalizzano i dati rispetto alla loro media , poi si normalizzano i risultanti scarti

rispetto alla deviazione standard "

2) Dopo: consiste nella compressione o dilatazione della distribuzione dei punteggi a seconda

della sua dispersione "

• formula: Zi = (Xi - X) \ S

Analisi Bivariata (cap.4)

Ipotesi —> di solito viene espressa mediante una proposizione che mette in relazione due

o più variabili "

Distribuzione di frequenza congiunta

•Analisi statistica delle relazioni fra due variabili —> si basa: sull’esame delle distribuzioni di

frequenza congiunta —> cioè l’incrocio di due o più distribuzioni di frequenza semplici"

i totali di riga e di colonna vengono abitualmente chiamati “marginali” e corrispondono alle

distribuzioni di frequenza monovariate. "

Forma, forza e direzione

Con le tecniche di analisi bivariata si cercando di individuare:"

-Forma —> le possibili configurazioni delle relazioni fra le due variabili in questione —>

es: la tabella precedente, ci presenta una possibile forma della relazione fra le variabili,

con i giovani (15-34 anni) che preferiscono il partito A, gli adulti 35-54enni che

preferiscono il partito B e gli over-54enni che preferiscono il partito C. "

-Forza "

-Direzione delle relazione fra due variabili —> comprendere la relazione di causalità

fra le variabili —> quando si parla di causa-eﬀetto ci si riferisce all’esistenza di un

nesso tra eventi tali per cui la manifestazione di uno è la conseguenza diretta e

necessaria della manifestazione dell’altro —> diﬃcoltà nell’individuazione dei

percorsi causali: perché:

1) L’individuazione della direzione causale della relazione non è semplice, perché nelle

scienze sociali spesso le relazioni non hanno livelli di forza particolarmente elevati, perché

hanno spesso carattere “tendenziale” (tendenzialmente, i giovani tendono a votare per il

partito A; ma ci sono anche tanti giovani che votano per i partiti B e C e tanti non giovani

che votano per il partito A), "

2) sono assai di frequente di natura bi-direzionale. "

3) anche nel caso poi in cui si individui una relazione e la sua direzione causale, ciò non significa

riuscire necessariamente a ricostruirne il meccanismo causale (si rileva che i giovani votano

tendenzialmente più per il partito A e che la direzione causale indica che sia l’età a influenzare il

voto – e naturalmente non il contrario – ma non si riesce a comprendere il motivo, il perché). "

Statistica, analis multivariata, Dispense di Statistica

Documenti correlati

Anteprima parziale del testo

Scarica Statistica, analis multivariata e più Dispense in PDF di Statistica solo su Docsity!

La standardizzazione

Analisi Bivariata (cap.4)

Ipotesi —> di solito viene espressa mediante una proposizione che mette in relazione due

o più variabili

Distribuzione di frequenza congiunta

Forma, forza e direzione

Con le tecniche di analisi bivariata si cercando di individuare:

Forma —> le possibili configurazioni delle relazioni fra le due variabili in questione —>

es: la tabella precedente, ci presenta una possibile forma della relazione fra le variabili,

con i giovani (15-34 anni) che preferiscono il partito A, gli adulti 35-54enni che

preferiscono il partito B e gli over-54enni che preferiscono il partito C.

Forza

Direzione delle relazione fra due variabili —> comprendere la relazione di causalità

fra le variabili —> quando si parla di causa-effetto ci si riferisce all’esistenza di un

nesso tra eventi tali per cui la manifestazione di uno è la conseguenza diretta e

necessaria della manifestazione dell’altro —> difficoltà nell’individuazione dei

percorsi causali: perché:

1) L’individuazione della direzione causale della relazione non è semplice, perché nelle

scienze sociali spesso le relazioni non hanno livelli di forza particolarmente elevati, perché

hanno spesso carattere “ tendenziale” ( tendenzialmente , i giovani tendono a votare per il

partito A; ma ci sono anche tanti giovani che votano per i partiti B e C e tanti non giovani

che votano per il partito A),

Variabili indipendenti e dipendenti

Analisi Bivariata: quando le variabili sono categoriali (cap.5)

Percentualizzazione

Presentazioni dele tabelle

Misure di forza della relazione

Misure di associazione

Il Chi quadrato (χ

\

Misure di associazioni basate sulla riduzione proporzionale dell’errore

Misure di congraduazione

una nominale, si usano le misure di associazione

principio: cioè sul confronto fra i valor i assunti da X e Y su tutte le possibili coppie di

casi:

una coppia di casi è detta concordante —> se per un caso i valori assunti sulle

variabili X e Y sono entrambi maggiori (o entrambi minori) dei valori assunti da un altro

caso sulle stesse variabili (per es. il caso 1 ha un titolo di studio più elevato e una più

frequente pratica sportiva del caso 2).

dell’altro caso su una variabile e un valore minore sull’altra variabile (o viceversa) (per

es. il caso 1 ha un livello di istruzione più elevato e una minore pratica sportiva rispetto

al caso 2).

Se la maggioranza delle coppie di casi è concordante —> allora abbiamo una

relazione fra le due variabili di segno positivo.

Se la maggioranza delle coppie di casi è discordante —> allora abbiamo una

relazione fra le due variabili di segno negativo.

Se c’è lo stesso numero di coppie concordanti e di coppie discordant i —> allora

non c’è relazione fra le due variabili.

) di Kendall ,

d di Somers

Gamma ( γ ) di Goodman e Kruskal —> γ = C-D

C+D

C= n. Di coppie concordanti D= coppie discordanti

γ —> assume valore: +1 in caso di perfetta relazione positiva, -1 in caso di perfetta

relazione negativa e 0 in caso di assenza di relazione

processo di ordinamento delle unità di analisi in sequenza ordinata —> si basano: sul

confronto fra la posizione che il singolo caso assume nelle due graduatorie (per capire,

appunto, se e quanto le due graduatorie cograduino o siano “contro-graduate” e

quanto lo siano). —> più nota è il Rho ( ρ ) di Spearman :

1) lineare positiva (o diretta)

2)lineare negativa (o indiretta)

3) nessuna relazione

4) curvilinea

=> il diagramma di dispersione —> consente di comprendere innanzitutto la forma (dunque

3. Coefficiente di determinazione R

R

Casi anomali e casi influenti

Quando la variabile indipendente è categoriale

TEOREMA FONDAMENTALE DELLA VARIANZA:

• quanto^ maggiore è il peso di BSS^ (e dunque quanto inferiore è quello di WSS), tanto p iù forte

• Casi limite:

- WSS=0 —> Tutti i casi all’interno di ciascuna delle categorie della variabile nominale o ordinale

- BSS=0 —> Ogni categoria della variabile nominale o ordinale presenta esattamente la stessa

(ETA QUADRATO) —> coefficiente che sintetizzi la forza della relazione:

• Formula:

INTRODUZIONE ALL’ANALISI MULTIVARIATA (cap.7)