


















Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Análisis de Datos II, Profesor: Ricardo Olmos, Carrera: Psicología, Universidad: UAM
Tipo: Apuntes
1 / 26
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!



















i p p
0 1 1 2 2 i
Por ejemplo, supongamos que queremos pronosticar las calorías de unos tercios de cerveza a partir del % de alcohol. Estamos aquí ante un modelo de regresión lineal simple. Es simple porque únicamente tenemos una variable independiente. Representamos el diagrama de dispersión que relaciona ambas variables:
La ecuación de regresión es: La intersección o constante es 80,972, que es el número de calorías que pronosticamos que tendrá una cerveza cuando tiene 0,0% de alcohol. 21,027 es la pendiente o tasa de cambio. Por cada grado de alcohol que incrementamos en la cerveza pronosticamos un aumento medio de 21,027 calorías en la cerveza.
0 1 1
i
Calorias alcohol i
. Este coeficiente tiene la virtud de que oscila entre 0 y 1. Un valor R 2 = 0 significa que con las variables independientes no conseguimos explicar nada de la variable dependiente. Más concretamente que explicamos un 0% de la varianza de la VD. En el polo opuesto, una R 2 = 1 informa de que explicamos perfectamente la VD a partir de nuestras variables independientes. En el ejemplo de la cerveza tenemos un valor de 0,898, lo cual nos informa de que conociendo el % de alcohol podemos explicar un 89,8% de la varianza de las calorías. Se puede interpretar también como que conociendo el % de alcohol mejoramos los pronósticos de las calorías en un 89,8% respecto a si utilizamos la media de la VD (que es equivalente a no utilizar ninguna VI).
H 0 : 1 2 ..... p 0
H 0 : p 0
En el fichero Regresión rendimiento tratar de explicar/predecir la variable rendimiento_escolar a partir del resto de variables incluidas. En este primer modelo de regresión, ¿qué te parece el ajuste del modelo?, ¿te parece aceptable?, ¿de qué valor informarías? ________ El estadístico F de la tabla ANOVA junto con su nivel crítico, ¿de qué te está informando? ___________________________________________ Atendiendo ahora a las variables individualmente, ¿cuáles contribuyen significativamente a explicar el rendimiento? _____________________
¿Cuál es la variable más importante del modelo a la hora de explicar el rendimiento? _________________________ Interpreta los coeficientes de regresión de las variables significativas (las que contribuyen a explicar el rendimiento) _________________
Linealidad Este supuesto se refiere a que la relación entre la VD y cada VI debe ser de tipo lineal. Si no, el modelo de regresión lineal no sería adecuado. Por ejemplo, si detectamos una relación curvilínea (cuadrática) entre una VI y la VD, no debemos incluirla en el modelo, puesto que la regresión lineal detecta relaciones de tipo lineal (una solución ante esta situación es incluir un término cuadrático, pero esto no se ve en el curso). ¿Cómo observar esto? Con diagramas de dispersión simple como ya sabemos hacer, o bien con los diagramas de regresión parcial (botón Gráficos del procedimiento y seleccionamos la opción Generar todos los gráficos parciales ).
Independencia Este supuesto nos dice que las observaciones del modelo de regresión son independientes. Algo así como que el salario del caso 2 no depende del caso 1, el del 3 no depende del caso 2, etc. En modelos de regresión como los vistos se presupone independencia entre los casos y no tiene mucho sentido evaluarlo. En modelos de regresión donde los casos tienen alguna relación temporal sí que habría que evaluar la independencia (los modelos econométricos, típicamente). SPSS tiene el estadístico Durbin-Watson para valorar la independencia. Los casos son independientes (no autocorrelacionan) si los valores que da este estadístico están entre 1,5 y 2,5. Valores por debajo de 1,5 o por encima de 2,5 deberían hacernos sospechar de que este supuesto no se sostiene.