

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Analisis Multivariante, Profesor: A A, Carrera: Psicología, Universidad: USC
Tipo: Apuntes
1 / 3
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!


La regresión logística es hoy en día una de las herramientas estadísticas más utilizadas en ciencias de la salud. Es una técnica que pone a prueba modelos cuyo objetivo es predecir la probabilidad de ocurrencia de un evento, y cuyas variables pueden tener cualquier nivel de medida. Se trata no sólo de identificar aquellas variables que resultan relevantes, sino también estimar la probabilidad de que un individuo con unas características concretas, o bajo determinadas situaciones, experimente o sufra un fenómeno en concreto. Por ello la regresión logística es la herramienta estadística acertada para la identificación de factores de riesgo y de factores de protección.
En cuanto a las variables, la VD es de naturaleza cualitativa, con dos o más categorías (si es dicotómica hablaríamos de regresión logística binaria y si consta de varias categorías se trataría de una regresión logística multinomial. La VI admite todo tipo de variables, sean métricas o no. Los puntos fuertes de la Regresión Logística son lo siguientes:
El principal inconveniente es que al utilizar como VD la probabilidad de ocurrencia del evento de interés, utiliza como función de enlace una función logarítmica, lo que implica una complejidad matemática mayor.
ESQUEMA GENERAL Y VARIABLES IMPLICADAS
Lo que la Regresión Logística hace es realizar pronósticos de pertenencia a un grupo en base a la estimación de probabilidades, a partir de las puntuaciones de los sujetos en diferentes VI que se presumen importantes. La Y´, por tanto, va a ser una probabilidad, con valores posibles entre 0 y 1. El modelo general sería P(Y=1)= α+β 1 X 1 + β 2 X 2 +…+ βn X (^) n+ε y su función sería no lineal, en forma de “S”, y que recibe el nombre de función logística. Dicha función permite asignar a la VD(Y) valores a partir de los valores observados en una VI(X), e identificar pronósticos erróneos, que son los puntos que caen fuera de la curva logística.
En cuanto a la curva de la función, cuanto mayor sea la pendiente de esta, mayor será el coeficiente de Regresión Logística asociado al predictor en cuestión y más certeros los pronósticos, ya que el área de incertidumbre será menor. En cuanto a la Regresión Logística es conveniente conocer términos como:
Los pasos a seguir son similares a los establecidos en la Regresión Lineal
La estimación del modelo se realiza mediante el procedimiento de Máxima Verosimilitud. Una vez estimados los coeficientes de Regresión Logística, es preciso calcular e error típico de cada uno de ellos y evaluar su significación estadística.
A continuación, se procede a la evaluación del ajuste del modelo en su conjunto, para lo que se recurre al contraste Chi-cuadrado , con el que se comprueba si la capacidad explicativa del modelo es significativamente distinta a cero. Como indicadores de la bondad de ajuste se utilizan la R 2 de Cox y Snell y el R 2 de Nagelkerke. Es posible también evaluar la eficacia predictiva del modelo, elaborando una tabla en la que se compara el grupo de pertenencia pronosticado con el grupo de pertenencia real para cada sujeto que compone la muestra, obteniendo así el porcentaje de sujetos correctamente clasificados.
Una vez que el modelo alcanza los niveles de ajuste deseados es el momento de proceder a su interpretación definitiva, informando de la importancia relativa de cada una de las VI que lo integran. Para conocer que VI son buenos predictores se recurre al estadístico de Wald , mediante el que se contrasta la hipótesis de que el coeficiente estimado a partir de los datos muestrales es significativamente distinto de cero en la población. Un coeficiente “b” positivo implica un aumento en la probabilidad de ocurrencia del evento y negativo una disminución. Un “b” positivo se corresponde con un ODD RATIO mayor que 1, mientras que si es negativo el ODD RATIO será menor que 1. El análisis finaliza con un estudio de los residuos y la identificación de posibles casos anómalos,
con la aplicación de un procedimiento de validación, como la Validación Cruzada.
En este tipo de regresión la VD no es un valor numérico concreto que se atribuye a Y, sino que pasa a ser el logaritmo neperiano de la probabilidad de ocurrencia del evento estudiado, dividido