



Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Metodos Estadisticos y Psicometricos (MEP), Profesor: J. Blas Navarro, Carrera: Psicologia, Universidad: UAB
Tipo: Ejercicios
1 / 5
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!




Pràctica 8 - Regressió lineal múltiple, models predictius i diagnòstics del model
Continuant l’estudi sobre SATISFACCIÓ dels clients de restaurants, en aquesta pràctica estimarem models predictius que incloguin varies variables predictives i interaccions de primer nivell.
Les hipòtesis de l’estudi que examinarem són:
H2a: La predicció de la SATISFACCIÓ (SG) millora notablement en un model multivariat amb interaccions de primer ordre.
H2b: La predicció de la INTENCIÓ DE RECOMANAR (IR) millora notablement en un model multivariat amb interaccions de primer ordre.
Al finalitzar aquesta pràctica hauríeu de ser capaços de:
A partir d'un conjunt de variables predictives seleccionar el millor model de regressió per realitzar una predicció. Amb el model seleccionat, realitzar prediccions per un determinat conjunt de valors en els predictors. Diagnosticar el model verificant el compliment de 4 supòsits (normalitat dels residuals, casos mals predits, casos molt influents en les prediccions, i homogeneïtat de variàncies).
1) Obre la matriu de dades Satisfaccio.dta.
Per establir un model predictiu de la Satisfacció General (SG) es partirà del conjunt dels 7 factors que valoren diferents aspectes del restaurant. Escriu a continuació el nom de les variables que contenen els 7 factors: PER_SER , FIABI, PRODUC, INS_NET_DEC, TEMPS, ACC_ENT, PREU
2) Amb la estratègia de selecció per passos cap endarrere ( backward elimination ), selecciona el subconjunt de predictors més adient de la SG, partint dels 7 predictors indicats en la pregunta anterior. Pots seguir els següents passos: Statistics > Other > Stepwise estimation o A "Command" seleccionar regress. o Afegir a "Dependent variable": SG o Afegir a "Term1 - variables to be included or excluded together": PER_SER (la resta de predictors s'introduiran amb la sintaxi) o Marcar la casella "Significance level for removal from the model" i escriure el valor 0.10. o Marcar la casella "Significance level for addition to the model" i escriure el valor 0.05. o Clicar "OK" o Atenció: a la sintaxi que es genera afegir manualment la resta de predictors de manera que la comanda final sigui: stepwise, pr(0.10) pe(0.05) : regress SG (PER_SER) (FIABI) (PRODUC) (INS_NET_DEC) (TEMPS) (ACC_ENT) (PREU)
Quants predictors conté el millor model seleccionat amb el mètode de passos cap enrere “backward”?: 5
Quins predictors han estat eliminats, en quin ordre s’han eliminat i per què?: El primer ha estat PREU, ja que el seu grau de significació (p) és 0.478, molt superior al límit 0.10; el segon predictor eliminat ha estat TEMPS perquè té també un grau de significació alt (p = 0.252).
Per què no s'eliminen els predictors INSTAL·LACIONS-NETEJA-DECORACIÓ i ACCESOS- ENTORN, malgrat els seus graus de significació són superiors a 0.05?: Perquè el criteri d'eliminació de variables s'ha fixat en p > 0.
Valora la capacitat predictiva del model final: El valor del coeficient de determinació ajustat (R^2 aj. = 0.477) resulta estadísticament molt significatiu (F (^) 5,181 = 34.86, p < 0.0005). La capacitat predictiva d'aquest model és mitjana-alta.
3) Aplicant l’estratègia de tots els possibles subconjunts, seleccionar el millor model predictiu de la SG partint dels 7 predictors anteriors, i de les 6 interaccions entre PER_SER i la resta de predictors. Quines interaccions afegiràs al model de partida? c.PER_SER#c.FIABI c.PER_SER#c.PRODUC c.PER_SER#c.INS_NET_DEC c.PER_SER#c.TEMPS c.PER_SER#c.ACC_ENT c.PER_SER#c.PREU La sintaxi a executar és: allsets SG PER_SER FIABI PRODUC INS_NET_DEC TEMPS ACC_ENT PREU /// c.PER_SER#c.FIABI c.PER_SER#c.PRODUC c.PER_SER#c.INS_NET_DEC /// c.PER_SER#c.TEMPS c.PER_SER#c.ACC_ENT c.PER_SER#c.PREU, linear
Quants models diferents es valoren? 792 Quin és el valor més petit del criteri Cp de Mallows? 4.
Obre l'arxiu que conté els resultats de tots els models avaluats fent servir la comanda: use allsets_results.dta, clear
Visualitza la nova matriu de dades amb els 792 models valorats i indica els predictors del model seleccionat d'acord al criteri Cp de Mallows: PER_SER FIABI PRODUC TEMPS c.PER_SER#c.TEMPS Es tracta d'un model que compleix el principi jeràrquic? Raona el perquè. Sí compleix el principi jeràrquic ja que les variables que formen la única interacció inclosa en el model, PER_SER i TEMPS, també es troben com a efectes principals.
6) Avalua el model seleccionat amb el criteri Cp de Mallows valorant:
a) La normalitat dels residuals estudentitzats b) La possible existència de casos malament predits c) La possible existència de casos molt influents en la estimació dels coeficients d) La homogeneïtat de variàncies
a) La normalitat dels residuals estudentitzats. En primer lloc es generen els residuals estudentitzats: Statistics > Postestimation > Predictions, residuals, etc o Marcar “Studentized residuals”. o Dona un nom en New variable name: “STResid” o Clicar "OK" predict STResid, rstudent
A continuació es verifica la seva normalitat amb la prova de Shapiro-Wilk i el gràfic de caixa: Statistics > Summaries, tables, and tests > Distributional plots and tests > Shapiro-Wilk normality test o Seleccionar la variable “STResid” o Clicar "OK" swilk STResid
Graphics > Box plot o Seleccionar la variable “STResid” o Clicar "OK" graph box STResid
Què es conclou respecte a la normalitat dels residuals? La prova de Shapiro-Wilk és estadísticament no significativa (p=0.195) i el gràfic de caixa confirma la normalitat al no trobar-se asimetries.
b) Possible existència de casos malament predits. Es demana un llistat dels clients amb residuals estudentitzats majors en valor absolut a 1.96. Data > Describe data > List data o Seleccionar les variables “CLIENT” i “STResid”. o Marcar la casella “Do not list observation numbers” o A la pestanya "by/if/in", a la expressió “if”, escriure la condició de filtre: “ abs(STResid)>1.96” list CLIENT STResid if abs(STResid)>1.96, noobs
Quants casos tenen residuals que indiquen una mala predicció? 12 Quin cas te la pitjor predicció? El cas 55 amb un residual estudentitzat de 3.
c) Possible existència de casos molt influents en la estimació dels coeficients. Generem la distància de Cook per cada CLIENT, i desprès es llisten els casos amb valors que siguin Cook > 1. Statistics > Postestimation > Predictions, residuals, etc o Marcar “Cook’s distance”. o Dona un nom en New variable name: “Cook” o Clicar "OK" predict Cook, cooksd
Data > Describe data > List data o Seleccionar les variables “CLIENT” i “Cook”. o Marcar la casella “Do not list observation numbers” o A la pestanya "by/if/in", a la expressió “if”, escriure la condició de filtre: “Cook > 1” list CLIENT Cook if Cook>1, noobs
Quants casos tenen una influència excessiva en la estimació dels coeficients? Cap cas.
d) Homogeneïtat de variàncies. Generem el gràfic de valors predits contra residuals estudentitzats. Graphics > Twoway graphs (scatter, line, etc) o Clicar "Create..." o Deixar seleccionat "Basic plots" - "Scatter", i afegir a "Y variable": STResid, i a "X variable": SGPred. o Clicar "Accept..." o Clicar "OK" twoway (scatter STResid SGpred)
Què es pot concloure sobre la homogeneïtat de variàncies dels residuals a partir del gràfic?: La variància sembla més petita per valors predits baixos i alts que per valors predits mitjans. S'observen diferències però no esta clar si són d'una magnitud prou important com per considerar que es viola el supòsit. També es calcula la prova de Breusch-Pagan: Statistics > Postestimation > Reports and statistics o Deixar seleccionades les opcions per defecte i clicar "OK" Estat hettest
Què es pot concloure sobre la homogeneïtat de variàncies dels residuals a partir de la prova de Breusch-Pagan?: El resultat estadísticament significatiu suggereix que no es compleix el supòsit de igualtat de variàncies. Per tant, les conclusions obtingudes amb el model seleccionat no són completament fiables i s'haurien d'interpretar amb cautela. Tanmateix, seria convenient seleccionar un model predictiu alternatiu i verificar els seus diagnòstics.