




Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Tema 9 de la asignatura modelos estadísticos y psicométricos
Tipo: Apuntes
1 / 8
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!





La estimación de un modelo de regresión se puede hacer con una de 2 finalidades diferentes según los objetivos de investigación: ● Modelo con finalidad predictiva : obtener el mejor modelo que permita predecir la respuesta de interés en sujetos nuevos y con el mínimo error posible. Los mejores modelos predictivos son los que minimizan el error (varianza residual o parte no explicada) con el menor número posible de predictores (principio de parsimonia). Ejemplo → se quiere predecir, en el momento de ingresar, el nivel de ansiedad al cabo de una semana de estancia en un centro hospitalario de los pacientes psicóticos, utilizando como predictores su edad, dosis de fármaco antipsicótico, número de brotes durante el último año, apoyo social y familiar y nivel socioeconómico. ● Modelo con finalidad explicativa: se trata de construir un modelo de regresión para evaluar la magnitud del efecto de una exposición concreta de interés (X) sobre la respuesta (Y). Este uso del modelo implica una estrategia de selección de variables más compleja, ya que se debe tener en cuenta dos fenómenos centrales en la investigación: interacción y confusión. Ejemplo → se quiere conocer cómo influencian los años de duración de la enfermedad en el nivel de ansiedad de los pacientes psicóticos al cabo de una semana de estar ingresados en un centro hospitalario.
En las investigaciones con finalidad predictiva se tiene como objetivo seleccionar el conjunto de predictores o variables independientes que mejor predice la variable dependiente. Para obtener el mejor modelos se deben equilibrar dos principios básicos de la investigación: ● Principio de menor error (ausencia de sesgo). Busca predecir la VD con el menor error y mayor precisión posible. ● Principio de parsimonia : Persigue seleccionar el modelo más simple posible. De acuerdo a este principio el mejor modelo predictivo no incluiría ningún predictor. Hay diferentes estrategias que equilibran los dos principios anteriores: la selección automática mediante pasos sucesivos (Stepwise) y la selección mediante todos los posibles subconjuntos (all subsets). 2.1. Selección del mejor modelo predictivo mediante “pasos sucesivos”. Hay 2 métodos de selección por pasos sucesivos: eliminación hacia atrás (backward elimination) e inclusión hacia delante (forward selection). Método de eliminación hacia atrás:
El mejor modelo predictivo obtenido con el método backward es: En modelos con finalidad predictiva la interpretación de los coeficientes es secundaria, el objetivo principal es utilizar la ecuación para realizar predicciones en casos nuevos que no están en la muestra. Si en lugar de utilizar el método de eliminación hacia atrás (backward) se aplica el método de inclusión hacia delante (forward) (la única diferencia en la comanda es poner “pe” en lugar de “pr”), se llega al mismo resultado: En el primer paso se añade Afronta, que es el predictor con valor p más pequeño y <0.05, y en el segundo paso se añade Resid que es, de los 3 que quedan, el predictor con valor p más pequeño y <0.05. Los 2 predictores que no se han introducido tienen valores p>0.05. El modelo seleccionado con los predictores Afronta y Resid tiene una capacidad predictiva extraordinaria (R2A=0.91). 2.2. Selección del mejor modelo predictivo mediante “Todos los posibles subconjuntos”. Cuando el modelo inicial contiene un número elevado de predictores y/o interacciones entre predictores, la mejor estrategia de selección del mejor modelo predictivo es el método de todos los posibles subconjuntos (all subsets). Consiste en construir todos los posibles submodelos combinando entre sí todos los predictores, y valorar para cada submodelo su capacidad predictiva utilizando el R2A (valor + grande = mejor) o el Cp de Mallows (valor + pequeño = mejor). Comanda allsets realiza este proceso de selección construyendo en primer lugar todos los modelos con un predictor, después todos los modelos con dos predictores y así sucesivamente hasta el modelo máximo que contiene todos los predictores.
Para cada subconjunto se presenta información de los diferentes indicadores de capacidad predictiva (Cp, R2A, etc.) Ejemplo : estimar el mejor modelo predictivo del estrés a partir de los 4 predictores Afrontamiento, Grado de experiencia previa, Inteligencia emocional y Tipo de residencia, y de las interacciones de primer orden entre Afrontamiento y los otros 3 predictores. Efectos principales: Afronta, Gexper, IE, Resid. Efectos de interacción: AfrontaxGexper, AfrontaxIE, AfrontaxResid. Recordamos que para introducir interacciones con Stata se debe utilizar el operador “#”, el prefijo “c.” en cada predictor cuantitativo y el prefijo “i.” en cada predictor categórico. La comanda allsets evalúa solo subconjuntos que cumplan el criterio jerárquico. El listado indica que se han evaluado un total de 34 submodelos, que el menor valor Cp es 2.58 y el mayor valor R2A es 0.052. Para ver el detalle de los 34 submodelos se debe abrir el archivo de datos “allsets_results.dta”, que contiene la información de los 34 submodelos, ordenador por Cp en orden creciente. El primer modelo es el mejor modelo predictivo:
Predecir la variable dependiente de los casos que forman parte de la muestra es absurdo, porque ya se tiene el valor real. La predicción se debe hacer para casos nuevos que no estén en la muestra original. Estos casos nuevos se deben añadir a la matriz de datos y deben tener valor en los predictores del modelo y no deben tener valor en la VD. Es incorrecto hacer predicciones para valores de X que se encuentren fuera del rango de valores observados en la muestra ya que, como se ilustra en la imagen siguiente, la relación entre X e Y puede ser diferente a la estimada más allá de estos límites. Ejemplo: utilizando el mejor modelo seleccionado con la estrategia de todos los posibles subconjuntos, predecir el valor de estrés de los siguientes sujetos: A. Vive en ámbito Rural y tiene puntuación de 80 en Afrontamiento. B. Vive en ámbito Urbano y tiene puntuación de 20 en Afrontamiento. C. Vive en ámbito Rural y tiene puntuación de 95 en Afrontamiento. La predicción para el sujeto C. no se puede hacer, ya que su valor de Afrontamiento=95 está fuera del rango de valores de Afrontamiento observados en la muestra (15-87). Para hacer la predicción de los sujetos A. y B., en primer lugar se deben añadir los 2 casos nuevos al final de la matriz de datos con los valores indicados en los 2 predictores:
A continuación se ejecuta la sintaxis que calcula la predicción puntual y los intervalos de predicción de la puntuación y de confianza de la media (son comandas post-estimación, por tanto hay que asegurarse de que el último modelo estimado es el mejor modelo predictivo): Al calcular las predicciones con Stata se añaden a la matriz de datos nuevas variables que contienen la predicción puntual y los límites inferior y superior de los dos intervalos: Se concluye que un sujeto que vive en entorno Rural y tiene una puntuación el Afrontamiento =80 tiene un valor predicho de 8.71 puntos, con un intervalo de predicción del 95% entre 0 y 20.35 puntos. La media de estrés predicha de estos sujetos es de 8.71 puntos con un intervalo de confianza del 95% entre 3.28 y 14. puntos.