Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


TEMA 5 REGRESIÓN LOGÍSTICA, Apuntes de Psicología

Asignatura: Analisis Multivariante, Profesor: A A, Carrera: Psicología, Universidad: USC

Tipo: Apuntes

2016/2017

Subido el 06/02/2017

trabada89
trabada89 🇪🇸

3.8

(42)

30 documentos

1 / 3

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
TEMA 5
REGRESIÓN LOGÍSTICA
La regresión logística es hoy en día una de las herramientas estadísticas más utilizadas en
ciencias de la salud. Es una técnica que pone a prueba modelos cuyo objetivo es predecir la
probabilidad de ocurrencia de un evento, y cuyas variables pueden tener cualquier nivel de
medida. Se trata no sólo de identificar aquellas variables que resultan relevantes, sino también
estimar la probabilidad de que un individuo con unas características concretas, o bajo
determinadas situaciones, experimente o sufra un fenómeno en concreto. Por ello la regresión
logística es la herramienta estadística acertada para la identificación de factores de riesgo y de
factores de protección.
En cuanto a las variables, la VD es de naturaleza cualitativa, con dos o más categorías (si es
dicotómica hablaríamos de regresión logística binaria y si consta de varias categorías se trataría
de una regresión logística multinomial. La VI admite todo tipo de variables, sean métricas o no.
Los puntos fuertes de la Regresión Logística son lo siguientes:
Gran potencial de aplicación en diferentes ámbitos, como el clínico y el biomédico.
Se adapta a las necesidades de los investigadores
Permite hacer pronósticos particulares acerca de la probabilidad de ociurrencia de un
determinado evento
Gran flexibilidad en lo que a tipo de datos se refiere, ya que admite cualquier tipo de
variables, independientemente de su naturaleza
Ofrece la posibilidad de identificar de forma sencilla factores de riesgo y de protección
Es robusta ante el incumplimiento de determinados supuestos, como la distribución
normal de las VI.
El principal inconveniente es que al utilizar como VD la probabilidad de ocurrencia del evento
de interés, utiliza como función de enlace una función logarítmica, lo que implica una
complejidad matemática mayor.
ESQUEMA GENERAL Y VARIABLES IMPLICADAS
Lo que la Regresión Logística hace es realizar pronósticos de pertenencia a un grupo en base a
la estimación de probabilidades, a partir de las puntuaciones de los sujetos en diferentes VI que
se presumen importantes. La Y´, por tanto, va a ser una probabilidad, con valores posibles entre
0 y 1. El modelo general sería P(Y=1)= α+β1X1+ β2X2+…+ βnXn+ε y su función sería no lineal,
en forma de “S”, y que recibe el nombre de función logística. Dicha función permite asignar a
la VD(Y) valores a partir de los valores observados en una VI(X), e identificar pronósticos
erróneos, que son los puntos que caen fuera de la curva logística.
En cuanto a la curva de la función, cuanto mayor sea la pendiente de esta, mayor será el
coeficiente de Regresión Logística asociado al predictor en cuestión y más certeros los
pronósticos, ya que el área de incertidumbre será menor.
En cuanto a la Regresión Logística es conveniente conocer términos como:
ODD: es la razón o cociente entre la probabilidad de que un evento tenga lugar y la
probabilidad de que no tenga lugar. Lo que la Regresión Logística pretende es
identificar aquellas VI que hacen variar esa ODD.
ODD RATIO: es la razón o cociente entre la probabilidad de que un evento ocurra bajo
unas determinadas circunstancias frente a otras, es un cociente entre dos ODD.
pf3

Vista previa parcial del texto

¡Descarga TEMA 5 REGRESIÓN LOGÍSTICA y más Apuntes en PDF de Psicología solo en Docsity!

TEMA 5

REGRESIÓN LOGÍSTICA

La regresión logística es hoy en día una de las herramientas estadísticas más utilizadas en ciencias de la salud. Es una técnica que pone a prueba modelos cuyo objetivo es predecir la probabilidad de ocurrencia de un evento, y cuyas variables pueden tener cualquier nivel de medida. Se trata no sólo de identificar aquellas variables que resultan relevantes, sino también estimar la probabilidad de que un individuo con unas características concretas, o bajo determinadas situaciones, experimente o sufra un fenómeno en concreto. Por ello la regresión logística es la herramienta estadística acertada para la identificación de factores de riesgo y de factores de protección.

En cuanto a las variables, la VD es de naturaleza cualitativa, con dos o más categorías (si es dicotómica hablaríamos de regresión logística binaria y si consta de varias categorías se trataría de una regresión logística multinomial. La VI admite todo tipo de variables, sean métricas o no. Los puntos fuertes de la Regresión Logística son lo siguientes:

  • Gran potencial de aplicación en diferentes ámbitos, como el clínico y el biomédico.
  • Se adapta a las necesidades de los investigadores
  • Permite hacer pronósticos particulares acerca de la probabilidad de ociurrencia de un determinado evento
  • Gran flexibilidad en lo que a tipo de datos se refiere, ya que admite cualquier tipo de variables, independientemente de su naturaleza
  • Ofrece la posibilidad de identificar de forma sencilla factores de riesgo y de protección
  • (^) Es robusta ante el incumplimiento de determinados supuestos, como la distribución normal de las VI.

El principal inconveniente es que al utilizar como VD la probabilidad de ocurrencia del evento de interés, utiliza como función de enlace una función logarítmica, lo que implica una complejidad matemática mayor.

ESQUEMA GENERAL Y VARIABLES IMPLICADAS

Lo que la Regresión Logística hace es realizar pronósticos de pertenencia a un grupo en base a la estimación de probabilidades, a partir de las puntuaciones de los sujetos en diferentes VI que se presumen importantes. La Y´, por tanto, va a ser una probabilidad, con valores posibles entre 0 y 1. El modelo general sería P(Y=1)= α+β 1 X 1 + β 2 X 2 +…+ βn X (^) n+ε y su función sería no lineal, en forma de “S”, y que recibe el nombre de función logística. Dicha función permite asignar a la VD(Y) valores a partir de los valores observados en una VI(X), e identificar pronósticos erróneos, que son los puntos que caen fuera de la curva logística.

En cuanto a la curva de la función, cuanto mayor sea la pendiente de esta, mayor será el coeficiente de Regresión Logística asociado al predictor en cuestión y más certeros los pronósticos, ya que el área de incertidumbre será menor. En cuanto a la Regresión Logística es conveniente conocer términos como:

  • ODD: es la razón o cociente entre la probabilidad de que un evento tenga lugar y la probabilidad de que no tenga lugar. Lo que la Regresión Logística pretende es identificar aquellas VI que hacen variar esa ODD.
  • ODD RATIO: es la razón o cociente entre la probabilidad de que un evento ocurra bajo unas determinadas circunstancias frente a otras, es un cociente entre dos ODD.
  • Si el resultado es superior a 1 estamos ante un factor de protección.
  • Si en resultado es inferior a 1 se trataría de un factor de riesgo.

PASOS A SEGUIR EN LA REGRESIÓN LOGÍSTICA

Los pasos a seguir son similares a los establecidos en la Regresión Lineal

  1. Planteamiento del problema y objetivos
  2. Diseño de la investigación
  3. Comprobación de supuestos
  4. Estimación del modelo
  5. Evaluación del ajuste
  6. Interpretación de resultados
  7. Validación de resultados

La estimación del modelo se realiza mediante el procedimiento de Máxima Verosimilitud. Una vez estimados los coeficientes de Regresión Logística, es preciso calcular e error típico de cada uno de ellos y evaluar su significación estadística.

A continuación, se procede a la evaluación del ajuste del modelo en su conjunto, para lo que se recurre al contraste Chi-cuadrado , con el que se comprueba si la capacidad explicativa del modelo es significativamente distinta a cero. Como indicadores de la bondad de ajuste se utilizan la R 2 de Cox y Snell y el R 2 de Nagelkerke. Es posible también evaluar la eficacia predictiva del modelo, elaborando una tabla en la que se compara el grupo de pertenencia pronosticado con el grupo de pertenencia real para cada sujeto que compone la muestra, obteniendo así el porcentaje de sujetos correctamente clasificados.

Una vez que el modelo alcanza los niveles de ajuste deseados es el momento de proceder a su interpretación definitiva, informando de la importancia relativa de cada una de las VI que lo integran. Para conocer que VI son buenos predictores se recurre al estadístico de Wald , mediante el que se contrasta la hipótesis de que el coeficiente estimado a partir de los datos muestrales es significativamente distinto de cero en la población. Un coeficiente “b” positivo implica un aumento en la probabilidad de ocurrencia del evento y negativo una disminución. Un “b” positivo se corresponde con un ODD RATIO mayor que 1, mientras que si es negativo el ODD RATIO será menor que 1. El análisis finaliza con un estudio de los residuos y la identificación de posibles casos anómalos,

con la aplicación de un procedimiento de validación, como la Validación Cruzada.

FUNDAMENTO MATEMÁTICO

En este tipo de regresión la VD no es un valor numérico concreto que se atribuye a Y, sino que pasa a ser el logaritmo neperiano de la probabilidad de ocurrencia del evento estudiado, dividido