Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Práctica 8. STATA, Ejercicios de Psicología

Asignatura: Metodos Estadisticos y Psicometricos (MEP), Profesor: J. Blas Navarro, Carrera: Psicologia, Universidad: UAB

Tipo: Ejercicios

2013/2014

Subido el 12/07/2014

sara_katsu-1
sara_katsu-1 🇪🇸

4

(193)

34 documentos

1 / 5

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
2013-Models Estadístics i Psicomètrics: Pràctica 8 1
Pràctica 8 - Regressió lineal múltiple, models predictius i diagnòstics del model
Continuant l’estudi sobre SATISFACCIÓ dels clients de restaurants, en aquesta pràctica
estimarem models predictius que incloguin varies variables predictives i interaccions de primer
nivell.
Les hipòtesis de l’estudi que examinarem són:
H2a: La predicció de la SATISFACCIÓ (SG) millora notablement en un model multivariat amb
interaccions de primer ordre.
H2b: La predicció de la INTENCIÓ DE RECOMANAR (IR) millora notablement en un model
multivariat amb interaccions de primer ordre.
Al finalitzar aquesta pràctica hauríeu de ser capaços de:
A partir d'un conjunt de variables predictives seleccionar el millor model de regressió per
realitzar una predicció.
Amb el model seleccionat, realitzar prediccions per un determinat conjunt de valors en els
predictors.
Diagnosticar el model verificant el compliment de 4 supòsits (normalitat dels residuals, casos
mals predits, casos molt influents en les prediccions, i homogeneïtat de variàncies).
PREGUNTES
1) Obre la matriu de dades Satisfaccio.dta.
Per establir un model predictiu de la Satisfacció General (SG) es partirà del conjunt dels 7
factors que valoren diferents aspectes del restaurant. Escriu a continuació el nom de les
variables que contenen els 7 factors:
PER_SER , FIABI, PRODUC, INS_NET_DEC, TEMPS, ACC_ENT, PREU
2) Amb la estratègia de selecció per passos cap endarrere (backward elimination), selecciona el
subconjunt de predictors més adient de la SG, partint dels 7 predictors indicats en la pregunta
anterior.
Pots seguir els següents passos:
Statistics > Other > Stepwise estimation
o A "Command" seleccionar regress.
o Afegir a "Dependent variable": SG
o Afegir a "Term1 - variables to be included or excluded together": PER_SER (la resta de
predictors s'introduiran amb la sintaxi)
o Marcar la casella "Significance level for removal from the model" i escriure el valor 0.10.
o Marcar la casella "Significance level for addition to the model" i escriure el valor 0.05.
o Clicar "OK"
o Atenció: a la sintaxi que es genera afegir manualment la resta de predictors de manera
que la comanda final sigui:
stepwise, pr(0.10) pe(0.05) : regress SG (PER_SER) (FIABI) (PRODUC) (INS_NET_DEC)
(TEMPS) (ACC_ENT) (PREU)
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga Práctica 8. STATA y más Ejercicios en PDF de Psicología solo en Docsity!

Pràctica 8 - Regressió lineal múltiple, models predictius i diagnòstics del model

Continuant l’estudi sobre SATISFACCIÓ dels clients de restaurants, en aquesta pràctica estimarem models predictius que incloguin varies variables predictives i interaccions de primer nivell.

Les hipòtesis de l’estudi que examinarem són:

H2a: La predicció de la SATISFACCIÓ (SG) millora notablement en un model multivariat amb interaccions de primer ordre.

H2b: La predicció de la INTENCIÓ DE RECOMANAR (IR) millora notablement en un model multivariat amb interaccions de primer ordre.

Al finalitzar aquesta pràctica hauríeu de ser capaços de:

 A partir d'un conjunt de variables predictives seleccionar el millor model de regressió per realitzar una predicció.  Amb el model seleccionat, realitzar prediccions per un determinat conjunt de valors en els predictors.  Diagnosticar el model verificant el compliment de 4 supòsits (normalitat dels residuals, casos mals predits, casos molt influents en les prediccions, i homogeneïtat de variàncies).

PREGUNTES

1) Obre la matriu de dades Satisfaccio.dta.

Per establir un model predictiu de la Satisfacció General (SG) es partirà del conjunt dels 7 factors que valoren diferents aspectes del restaurant. Escriu a continuació el nom de les variables que contenen els 7 factors: PER_SER , FIABI, PRODUC, INS_NET_DEC, TEMPS, ACC_ENT, PREU

2) Amb la estratègia de selecció per passos cap endarrere ( backward elimination ), selecciona el subconjunt de predictors més adient de la SG, partint dels 7 predictors indicats en la pregunta anterior. Pots seguir els següents passos: Statistics > Other > Stepwise estimation o A "Command" seleccionar regress. o Afegir a "Dependent variable": SG o Afegir a "Term1 - variables to be included or excluded together": PER_SER (la resta de predictors s'introduiran amb la sintaxi) o Marcar la casella "Significance level for removal from the model" i escriure el valor 0.10. o Marcar la casella "Significance level for addition to the model" i escriure el valor 0.05. o Clicar "OK" o Atenció: a la sintaxi que es genera afegir manualment la resta de predictors de manera que la comanda final sigui: stepwise, pr(0.10) pe(0.05) : regress SG (PER_SER) (FIABI) (PRODUC) (INS_NET_DEC) (TEMPS) (ACC_ENT) (PREU)

Quants predictors conté el millor model seleccionat amb el mètode de passos cap enrere “backward”?: 5

Quins predictors han estat eliminats, en quin ordre s’han eliminat i per què?: El primer ha estat PREU, ja que el seu grau de significació (p) és 0.478, molt superior al límit 0.10; el segon predictor eliminat ha estat TEMPS perquè té també un grau de significació alt (p = 0.252).

Per què no s'eliminen els predictors INSTAL·LACIONS-NETEJA-DECORACIÓ i ACCESOS- ENTORN, malgrat els seus graus de significació són superiors a 0.05?: Perquè el criteri d'eliminació de variables s'ha fixat en p > 0.

Valora la capacitat predictiva del model final: El valor del coeficient de determinació ajustat (R^2 aj. = 0.477) resulta estadísticament molt significatiu (F (^) 5,181 = 34.86, p < 0.0005). La capacitat predictiva d'aquest model és mitjana-alta.

3) Aplicant l’estratègia de tots els possibles subconjunts, seleccionar el millor model predictiu de la SG partint dels 7 predictors anteriors, i de les 6 interaccions entre PER_SER i la resta de predictors. Quines interaccions afegiràs al model de partida? c.PER_SER#c.FIABI c.PER_SER#c.PRODUC c.PER_SER#c.INS_NET_DEC c.PER_SER#c.TEMPS c.PER_SER#c.ACC_ENT c.PER_SER#c.PREU La sintaxi a executar és: allsets SG PER_SER FIABI PRODUC INS_NET_DEC TEMPS ACC_ENT PREU /// c.PER_SER#c.FIABI c.PER_SER#c.PRODUC c.PER_SER#c.INS_NET_DEC /// c.PER_SER#c.TEMPS c.PER_SER#c.ACC_ENT c.PER_SER#c.PREU, linear

Quants models diferents es valoren? 792 Quin és el valor més petit del criteri Cp de Mallows? 4.

Obre l'arxiu que conté els resultats de tots els models avaluats fent servir la comanda: use allsets_results.dta, clear

Visualitza la nova matriu de dades amb els 792 models valorats i indica els predictors del model seleccionat d'acord al criteri Cp de Mallows: PER_SER FIABI PRODUC TEMPS c.PER_SER#c.TEMPS Es tracta d'un model que compleix el principi jeràrquic? Raona el perquè. Sí compleix el principi jeràrquic ja que les variables que formen la única interacció inclosa en el model, PER_SER i TEMPS, també es troben com a efectes principals.

6) Avalua el model seleccionat amb el criteri Cp de Mallows valorant:

a) La normalitat dels residuals estudentitzats b) La possible existència de casos malament predits c) La possible existència de casos molt influents en la estimació dels coeficients d) La homogeneïtat de variàncies

a) La normalitat dels residuals estudentitzats. En primer lloc es generen els residuals estudentitzats: Statistics > Postestimation > Predictions, residuals, etc o Marcar “Studentized residuals”. o Dona un nom en New variable name: “STResid” o Clicar "OK" predict STResid, rstudent

A continuació es verifica la seva normalitat amb la prova de Shapiro-Wilk i el gràfic de caixa: Statistics > Summaries, tables, and tests > Distributional plots and tests > Shapiro-Wilk normality test o Seleccionar la variable “STResid” o Clicar "OK" swilk STResid

Graphics > Box plot o Seleccionar la variable “STResid” o Clicar "OK" graph box STResid

Què es conclou respecte a la normalitat dels residuals? La prova de Shapiro-Wilk és estadísticament no significativa (p=0.195) i el gràfic de caixa confirma la normalitat al no trobar-se asimetries.

b) Possible existència de casos malament predits. Es demana un llistat dels clients amb residuals estudentitzats majors en valor absolut a 1.96. Data > Describe data > List data o Seleccionar les variables “CLIENT” i “STResid”. o Marcar la casella “Do not list observation numbers” o A la pestanya "by/if/in", a la expressió “if”, escriure la condició de filtre: “ abs(STResid)>1.96” list CLIENT STResid if abs(STResid)>1.96, noobs

Quants casos tenen residuals que indiquen una mala predicció? 12 Quin cas te la pitjor predicció? El cas 55 amb un residual estudentitzat de 3.

c) Possible existència de casos molt influents en la estimació dels coeficients. Generem la distància de Cook per cada CLIENT, i desprès es llisten els casos amb valors que siguin Cook > 1. Statistics > Postestimation > Predictions, residuals, etc o Marcar “Cook’s distance”. o Dona un nom en New variable name: “Cook” o Clicar "OK" predict Cook, cooksd

Data > Describe data > List data o Seleccionar les variables “CLIENT” i “Cook”. o Marcar la casella “Do not list observation numbers” o A la pestanya "by/if/in", a la expressió “if”, escriure la condició de filtre: “Cook > 1” list CLIENT Cook if Cook>1, noobs

Quants casos tenen una influència excessiva en la estimació dels coeficients? Cap cas.

d) Homogeneïtat de variàncies. Generem el gràfic de valors predits contra residuals estudentitzats. Graphics > Twoway graphs (scatter, line, etc) o Clicar "Create..." o Deixar seleccionat "Basic plots" - "Scatter", i afegir a "Y variable": STResid, i a "X variable": SGPred. o Clicar "Accept..." o Clicar "OK" twoway (scatter STResid SGpred)

Què es pot concloure sobre la homogeneïtat de variàncies dels residuals a partir del gràfic?: La variància sembla més petita per valors predits baixos i alts que per valors predits mitjans. S'observen diferències però no esta clar si són d'una magnitud prou important com per considerar que es viola el supòsit. També es calcula la prova de Breusch-Pagan: Statistics > Postestimation > Reports and statistics o Deixar seleccionades les opcions per defecte i clicar "OK" Estat hettest

Què es pot concloure sobre la homogeneïtat de variàncies dels residuals a partir de la prova de Breusch-Pagan?: El resultat estadísticament significatiu suggereix que no es compleix el supòsit de igualtat de variàncies. Per tant, les conclusions obtingudes amb el model seleccionat no són completament fiables i s'haurien d'interpretar amb cautela. Tanmateix, seria convenient seleccionar un model predictiu alternatiu i verificar els seus diagnòstics.