Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Práctica 6: Regresión Lineal Simple y Múltiple - Prof. perales, Ejercicios de Estadística

En este documento se presenta la práctica 6 de un curso relacionado con la regresión lineal simple y múltiple utilizando el software spss. Cómo analizar la dispersión de datos de la autoestima en función de la apariencia y cómo seleccionar el tipo de modelo de regresión adecuado. Además, se muestra cómo obtener el output de spss para obtener valores pronosticados, residuos, coeficientes de determinación y errores típicos. Se incluye un ejemplo de regresión múltiple con variables sociopersonales y académicas para analizar la ansiedad en los exámenes.

Tipo: Ejercicios

2016/2017

Subido el 04/12/2017

estcasan
estcasan 🇪🇸

3 documentos

1 / 13

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
PRÁCTICA 6…: Regresión lineal simple y múltiple.
Regresión lineal simple
Abre el fichero de datos “Subescalas regresión lineal simple” de Aula
Virtual y selecciona los datos del grupo VM.
MENU Datos Seleccionar casos Si se satisface la condición Grup=1
Pregunta: A partir del diagrama de dispersión de la Autoestima en función de la
Apariencia, indica qué tipo de modelo de regresión sería el más adecuado.
2 1
9 2
2 1
9 2
2 1
9 2
MENU Gráficos Generador de gráficos Dispersión/Puntos
Definir: Eje Y: autoest Eje X: aparien
Respuesta: Los puntos, aunque bastante desperdigados, parece que se sitúan en torno a
una línea recta, por lo que el modelo de regresión lineal parece el más adecuado.
Cuando no se está seguro de que la regresión lineal sea la mejor podemos probar con
varios modelos de regresión y utilizar el que presente mayor coeficiente de determinación.
2 1
9 2
2 1
9 2
2 1
9 2
MENU Analizar Regresión Estimación curvilínea
Dependientes: autoest Independientes: aparien
Modelo: Lineal, cuadrático, compuesto, crecimiento, logarítmico,
cúbico, G, exponencial, inverso, potencia, logística
pf3
pf4
pf5
pf8
pf9
pfa
pfd

Vista previa parcial del texto

¡Descarga Práctica 6: Regresión Lineal Simple y Múltiple - Prof. perales y más Ejercicios en PDF de Estadística solo en Docsity!

PRÁCTICA 6…: Regresión lineal simple y múltiple.

Regresión lineal simple

Abre el fichero de datos “Subescalas regresión lineal simple” de Aula Virtual y selecciona los datos del grupo VM.

MENU Datos Seleccionar casos Si se satisface la condición Grup=

Pregunta: A partir del diagrama de dispersión de la Autoestima en función de la Apariencia, indica qué tipo de modelo de regresión sería el más adecuado.

MENU^ 2 19 2 Gráficos 2 19 2 Generador de gráficos 2 19 2 Dispersión/Puntos Definir: Eje Y: autoest Eje X: aparien

Respuesta: Los puntos, aunque bastante desperdigados, parece que se sitúan en torno a una línea recta, por lo que el modelo de regresión lineal parece el más adecuado.

Cuando no se está seguro de que la regresión lineal sea la mejor podemos probar con varios modelos de regresión y utilizar el que presente mayor coeficiente de determinación.

MENU^ 2 19 2 Analizar 2 19 2 Regresión 2 19 2 Estimación curvilínea Dependientes: autoest Independientes: aparien Modelo: Lineal, cuadrático, compuesto, crecimiento, logarítmico, cúbico, G, exponencial, inverso, potencia, logística

Los mejores modelos son el logarítmico y el inverso con un coeficiente de determinación (R cuadrado) de 0,236. Pero por simplicidad elegiríamos el modelo lineal, porque la diferencia es solamente de 0,004 (R cuadrado 0,232).

Dada la importancia de los modelos de regresión lineales, el SPSS tiene la opción

específica de Regresión Lineal, donde podemos obtener un output mucho

más completo:

MENU^ 2 19 2 Analizar 2 19 2 Regresión 2 19 2 Lineales Dependiente: autoest Independientes: aparien

Los valores que aparecen remarcados son los mismos que aparecían en el primer output

cuando se comparaban todos los modelos.

La ecuación de la línea de regresión es:

Autoestima’ = 2,568 + 0,508Apariencia

MENU 2 19 2 Analizar 2 19 2 Regresión 2 19 2 Lineales Dependiente: autoest Independientes: aparien Guardar: Valores pronosticados no tipificados Residuos no tipificados

Respuesta: Hay que mirar tanto los valores pronosticados como los errores (residuos) en el fichero de datos (no en el de resultados), ya que los añade como variables nuevas al final del fichero de datos. Para la persona 5 de la muestra, el modelo pronostica una puntuación en autoestima de 4,515 con un error de estimación o residual de 0,515, ya que el valor real de esa persona en autoestima es de 4,00 puntos.

  • Pregunta: Comprueba con estos datos la descomposición de la varianza: Varianza total = Varianza explicada + Varianza no explicada. Varianza total (): Varianza de los datos en la variable Y, en este caso, autoestima. Varianza explicada (): Varianza de las puntuaciones pronosticadas Y’. Varianza no explicada o de error (): Varianza de los errores de estimación.

Simplemente debemos calcular la varianza de las tres columnas del fichero:

MENU^ 2 19 2 Analizar 2 19 2 Estadísticos descriptivos 2 19 2 Frecuencias Variables: autoest, unestandardized predicted value, unestandardized residual, Estadísticos: Media, desviación típica y varianza

Respuesta: Varianza total = Varianza explicada + Varianza no explicada 0,585 = 0,135 + 0,

  • Pregunta: Comprueba mediante las varianzas obtenidas el valor del coeficiente de determinación y el error típico de estimación: Respuesta: Coeficiente de Determinación: Proporción de varianza de Y explicada por el modelo.

1

Se puede apreciar que el valor coincide con el cuadrado del Coeficiente de Correlación:

Esto quiere decir que aproximadamente el 23% de las diferencias observadas en autoestima se pueden pronosticar o explicar a partir de la puntuación en apariencia física.

Respuesta: Error típico de estimación: Desviación típica de los errores de estimación Como a los errores de estimación el SPSS los llama “unstandardized residual”, la desviación típica de esa columna es el error típico → 0,67. Hay una pequeña diferencia de milésimas con el valor que saca el SPSS en la Tabla Resumen, porque utiliza una fórmula ligeramente modificada, ya que calcula la desviación típica dividiendo por N-2.

Si quisiéramos saber que porcentaje de varianza no es explicada por el modelo, lógicamente sería el error típico de estimación al cuadrado (varianza no explicada) y al dividir esta por la varianza total obtendríamos la proporción/porcentaje de la varianza Y que no es explicado por el modelo.

Hemos de mirar los coeficientes estandarizados (Beta), ya que nos indican el peso de cada variable dentro del model (en valor absoluto, no importa el signo). En este model el factor más importante es la Nota en Matemáticas ( F 06 2 = -0,874) y después los Cursos suspendidos ( F 06 2 =0,100).

  • ¿Qué puntuación directa en Ansiedad le pronosticará el modelo a una persona con una Nota de 4,3 puntos y con 1 Curso suspendido? Ansiedad’ = 33,596 + 0,713(1) - 2,303(4,3) = 24,4 puntos
  • ¿Es un buen modelo de regresión? Sí, porque explica casi el 90% de las diferencias observadas en ansiedad.
  • Si otro modelo de regresión permite explicar la ansiedad ante los exámenes con un Error Típico de 2,54, ¿cuál elegirías? Elegiría el nuestro, porque el error típico es 1,989 y por tanto menor que el de este otro.
  • ¿Cuál es el valor de la correlación entre Ansiedad y el conjunto formado por la Nota en matemáticas y los Cursos suspendidos? Coeficiente de Correlación Múltiple R (^) A.NC=0,
  • ¿Cuál es el valor de la relación entre Ansiedad y Nota en Matemáticas controlando la influencia de los Cursos suspendidos? Coeficiente de Correlación Parcial R (^) AN.C = -0,

ANALISIS DE CORRELACIÓN PARCIAL

MENU Analizar Regresión Lineales Dependiente: ansiedad Independientes: cursos.suspendidos, nota.matematicas Estadísticos: Correlaciones parciales y semiparciales

PRACTICA 6

Ejercicio 1:

Un psicólogo cree que el “Rendimiento en Estadística (R)” es función de las variables: Motivación (M), Inteligencia (I), Interés por las Matemáticas (IM) y Edad (E). Para investigarlo pasa un test de motivación y uno de inteligencia a una muestra de 10 estudiantes de Estadística del curso pasado, a los que pregunta también su nota, su edad y su interés por las matemáticas. Los datos están en el fichero “P9_ Rendimiento” de Aula Virtual:

  1. ¿Cuáles son las dos variables que correlacionan mejor con el Rendimiento?
  1. ¿Para cuál de los 10 alumnos el pronóstico del modelo de regresión es más acertado
  2. Indica el valor del Coeficiente de Correlación múltiple.

Aparece anteriormente, 0,797 / 0’

  1. ¿Qué porcentaje de varianza explica el modelo de regresión?
  1. Indica el orden de importancia de las dos variables en el modelo.

1-Interés (0,917)

2-Motivación (0,072)

  1. Imagina que a principio del curso siguiente un alumno que va a cursar la asignatura te pide que le pronostiques la nota que sacará. Sabiendo que en Motivación tiene 25 y que su Interés por las Matemáticas es de 3 puntos, ¿qué le pronosticarás?
  1. Si ese alumno saca a final de curso un 6,7, ¿cuál es el valor del error de estimación?
  1. Calcula la columna de las puntuaciones pronosticadas y residuales correspondientes a las 10 personas de la muestra e indica la media y la varianza de esas columnas. Comprueba que la suma de ambas es la varianza total (varianza del criterio).

Ejercicio 2: (VOLUNTARIO, solo para los que quieran sobresaliente)No es

necesario tener ninguna base de datos, las cuestiones se contestan a partir

de los datos de la tabla.

Un psicólogo cree que la habilidad para resolver problemas de matemáticas (Habilidad) está relacionada con la práctica (Práctica). Hace una investigación en la que manipula diferentes tiempos de práctica (horas) de unos sujetos que nunca habían hecho problemas de ese tipo. Después les pasaba una prueba de habilidad numérica (mayor puntuación indica mayor habilidad). Se obtiene este output del SPSS:

  1. ¿Cuál es el valor de la correlación lineal entre las dos variables?
  2. Indica el valor del Coeficiente de Determinación.
  3. ¿Qué porcentaje de la varianza del criterio NO explica el modelo de regresión?
  4. Indica la ecuación de regresión lineal para pronosticar la habilidad en función de las horas de práctica, en puntuaciones directas y típicas.
  5. ¿Cuál es el valor de la pendiente de la ecuación de regresión?
  6. ¿Deberías evaluar la posible existencia de colinealidad en esta investigación? ¿Porqué?