





Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
spiegazione regressione multipla con SPSS procedure
Tipologia: Appunti
1 / 9
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!






La REGRESSIONE è un insieme di procedure statistiche che consentono di usare le informazioni che si hanno su una variabile per predirne un’altra. Y = a + bx + e a=intercetta, valore in cui la retta X incontra l’asse delle Y, rappresenta il valore predetto di Y in corrispondenza di X uguale a zero. b =coefficiente angolare, inclinazione della retta, parametro della popolazione, rappresenta l’incremento predetto di Y per un incremento unitario di X. e = errore Dato il modello lineare y* = a + b·X, la stima dei parametri “a” e “b” avviene mediante un criterio matematico chiamato “ criterio dei minimi quadrati ”. E’ basato sulla minimizzazione di una funzione di perdita tra i valori realmente osservati y e i valori teorici del modello y*. Bontà di adattamento Si dimostra che l’indice che misura la bontà di adattamento di una retta di regressione è il coefficiente di determinazione r Quali sono i passi per compiere analisi del modello di regressione?
Su Spss: Procedura: Analizza > Confronta Medie > Test t campioni indipendenti T TEST PER CAMPIONI APPAIATI Usa lo stesso campione ma in due istanti temporali distinti Le medie nei due momenti differenti sono le stesse? Lo andiamo a verificare con Ho Campione estratto casualmente dalla popolazione con caratteristiche omogenee E’ un disegno a Misure ripetute due volte sullo stesso campione (prima e dopo sugli stessi soggetti). Un gruppo sottoposto a due livelli (prima/dopo) della VARIABILE INDIPENDENTE CATEGORICA (manipolata o non manipolata) Rilevazione della VARIABILE DIPENDENTE METRICA due volte sullo stesso gruppo Analisi statistica per rilevare una differenza tra le due rilevazioni ascrivibile alla INDIPENDENTE (unica differenza prima/dopo) In questo caso si parla di disegni sperimentali entro i soggetti (o within). I disegni descritti per due rilevazioni sono estendibili a k rilevazioni sugli stessi soggetti (campione). I disegni sperimentali possono essere misti ovvero contenere rilevazioni entro e tra soggetti. 1 campione - Due istanti temporali Tempo t0: Media: Mt Tempo t1: Media: Mt Verifica d’ipotesi bidirezionale ⎧⎨ H0: Mt0 =Mt1 ⎩H1: Mt0 ≠ Mt Se p-value è minore di α si rifiuta H0 Se p-value è maggiore di α si accetta H Su SPSS: Procedura: Analizza > Confronta Medie > Test t campioni appaiati
**1) BETWEEN a un fattore con più di due modalità
- Ad una via/fattore 1 variabile dipendente metrica 1 fattore qualitativo in almeno 3 modalità Si vuole testare l’ipotesi nulla che le medie della VD nei gruppi sia UGUALE contro l’ipotesi alternativa che almeno una sia diversa. Analogo del t test per camp indip ma con più di due gruppi. - A due o più vie / fattori SENZA REPLICA 1 variabile dipendente metrica - 2 fattore qualitativi Ogni possibile combinazione dei fattori si ripete una sola volta Si vogliono testare le ipotesi nulla che le medie della VD nei gruppi siano UGUALI contro le ipotesi alternative che almeno una sia diversa. CON REPLICA 1 variabile dipendente metrica - 2 fattore qualitativi Ogni possibile combinazione dei fattori si ripete almeno 2 volte Si vogliono testare le ipotesi nulla che le medie della VD nei gruppi siano UGUALI contro le ipotesi alternative che almeno una sia diversa. Presenza dell’interazione - Per misure ripetute 1 variabile dipendente metrica 3 o piu’ istanti temporali Si vogliono testare le ipotesi nulle che le medie della VD nei diversi istanti temporali siano UGUALI contro le ipotesi alternative che almeno una sia diversa. E’ l’analogo del test t per campioni appaiati quando si hanno più di due osservazioni Studi longitudinali. DISEGNO WITHIN Si utilizza come variabile di riferimento la F di SNEDECOR L'analisi della varianza si basa sulla scomposizione della variabilità totale dei dati in una parte dovuta alla variabile indipendente ed una dovuta a tutte le variabili non controllate Risponde alla domanda: a variabilità tra i gruppi (between) è sufficientemente diversa dalla variabilità all'interno dei gruppi (within) da poter considerare significativamente diverse le medie di due (o più) gruppi? Quando l'ipotesi nulla è vera (cioè non ci sono differenze significative tra le medie, ovvero il trattamento non produce effetti) la variabilità tra i gruppi e quella entro i gruppi devono essere molto simili poiché ambedue comprendono solo variabilità d'errore; la varianza fra i gruppi e la varianza entro i gruppi sono in realtà due stime indipendenti della stessa varianza: la varianza della popolazione. Quando l'ipotesi nulla è falsa (cioè ci sono differenze significative tra le medie e quindi il trattamento ha prodotto qualche effetto) la variabilità tra i gruppi sarà maggiore di quella entro i gruppi. L'analisi della varianza si basa perciò sulla scomposizione della variabilità dei dati e sul successivo confronto tra le varianze mediante il test statistico F di Fisher di cui è nota la distribuzione campionaria. In realtà da un punto di vista matematico-statistico la scomposizione della variabilità non riguarda la varianza vera e propria bensì la somma dei quadrati degli scarti (devianza) e, separatamente, i gradi di libertà; le varianze vengono calcolate dividendo le devianze per i rispettivi gradi di libertà.
L’obiettivo dell’analisi fattoriale è l’identificazione di una struttura sottostante ad un insieme di variabili rilevate. Si studiano le relazioni tra le variabili originarie per trovare un nuovo insieme, di dimensioni minori che esprime comunalità tra var originarie. È una tecnica esplorativa dei dati e non è possibile aspettarsi una soluzione definitiva ed univoca. L’esperienza e il know-how del ricercatore rivestono un ruolo fondamentale nel decidere il numero e l’interpretazione dei fattori. Si assume che due variabili correlate condividano caratteristiche comuni (FATTORI). 3 OBIETTIVI: 1 studiare semplificare e ridurre la dimensionalità 2 studiare la struttura semplice dei dati in fase esplorativa 3 trovare fattori latenti Si parte da una serie di var osservate con struttura di correlazione e variabilità. Ogni variabile ha una quota di var comune con le altre e una quota di var unica. Sintetizziamo quindi le var andando ad identificare questa quota di var comune ci sono dei prerequisiti :
Metodi per l’estrazione dei fattori
- Componenti principali - anche con multicollinearità Partendo dalle k var. osservate, determina k nuovi fattori come combinazioni lineari incorrelate dalle variabili osservate. Il criterio è quello di massimizzare la varianza preservata. La prima componente recupera la max variabilità possibile, la seconda il max della rimanente ecc... L’ACP prende in considerazione TUTTA la variabilità, non differenziando tra comune e unica. E’ un altro modo di scrivere le variabili, non e’ un AF in senso stretto. Di importante utilizzo se le unità statistiche sono RIDOTTE - Asse principale la vera e propria Analisi Fattoriale. Da un punto di vista matematico è identica all’ACP. La matrice di partenza non è R, ma R ridotta. Si considerano SOLO le comunalità, escludendo le unicità, cioè si considera solo la quota di variabilità comune a tutte le variabili. Mentre nelle CP la soluzione è unica, nell’AF c’è una parte di indeterminatezza data dalla stima iniziale della comunalità di ogni variabile. Da utilizzare solo se la numerosità campionaria è molto elevata (rapporto 10:1) , e se la quota di comunalità è assolutamente rilevante. **- Massima verosimiglianza