Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


regresión lineal, Apuntes de Estadística

Asignatura: Estadística, Profesor: , Carrera: Relaciones Laborales y Recursos Humanos, Universidad: URJC

Tipo: Apuntes

2015/2016

Subido el 31/08/2016

stephy_2829
stephy_2829 🇪🇸

3.4

(17)

41 documentos

1 / 24

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
11/20/2011
1
1. Introducción: la predicción de Y a partir de X
2. La ecuación de la recta o función lineal
3. La regresión lineal simple
4. Identificación del modelo: Construcción de la
ecuación de regresión
5. Otras fórmulas para el cálculo de
b
6. Otras expresiones para la ecuación de regresión
7. Relaciones importantes en el modelo de regresión
8. Valor predictivo del modelo
9. Aplicación del modelo
10. Regresión lineal con SPSS
11. La correlación parcial
En el coeficiente de correlación lineal se considera que
la relación entre las variables es
simétrica
.
Con frecuencia, cuando se encuentra una relación lineal
entre dos variables interesa predecir o pronosticar los
valores de una de ellas a partir de valores conocidos de
la otra. En este caso se utiliza el conocimiento de dicha
relación para la predicción, encontrándonos con un
estudio de tipo predictivo donde la relación es
asimétrica o direccional y los resultados son diferentes
según se trate de la ecuación de regresión de Y sobre X
(utilizando la información de la variable X para predecir
los valores de Y) o de la de X sobre Y (utilizando la
información de la variable Y para predecir valores de X).
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18

Vista previa parcial del texto

¡Descarga regresión lineal y más Apuntes en PDF de Estadística solo en Docsity!

  1. Introducción: la predicción de Y a partir de X
  2. La ecuación de la recta o función lineal
  3. La regresión lineal simple
  4. Identificación del modelo: Construcción de la

ecuación de regresión

5. Otras fórmulas para el cálculo de b

  1. Otras expresiones para la ecuación de regresión
  2. Relaciones importantes en el modelo de regresión
  3. Valor predictivo del modelo
  4. Aplicación del modelo
  5. Regresión lineal con SPSS
  6. La correlación parcial

 En el coeficiente de correlación lineal se considera que la relación entre las variables es simétrica.

 Con frecuencia, cuando se encuentra una relación lineal

entre dos variables interesa predecir o pronosticar los valores de una de ellas a partir de valores conocidos de la otra. En este caso se utiliza el conocimiento de dicha relación para la predicción, encontrándonos con un estudio de tipo predictivo donde la relación es

asimétrica o direccional y los resultados son diferentes según se trate de la ecuación de regresión de Y sobre X (utilizando la información de la variable X para predecir los valores de Y) o de la de X sobre Y (utilizando la información de la variable Y para predecir valores de X).

 Los ejemplos de estudios de predicción son

innumerables en las diferentes áreas de la psicología: ◦ Un psicólogo educativo puede predecir el rendimiento académico de un niño a final de curso a partir de las puntuaciones en un test de inteligencia aplicado al comienzo del curso; ◦ un psicólogo de recursos humanos utiliza un test para la selección de aspirantes a un puesto para predecir su rendimiento en dicho puesto a partir de información obtenida con el test en el momento de la selección; ◦ un psicólogo clínico puede predecir la adherencia del paciente a un tratamiento a partir de la información obtenida antes del tratamiento en una variable que muestra una relación lineal significativa con dicha adherencia.

 Las situaciones típicas a las que se aplican las

técnicas de regresión son aquellas en las que se

dispone de la medida de dos variables X e Y en una

muestra de sujetos y, en un momento posterior,

para alguno de los sujetos se conoce la

información en una de ellas (X o variable

predictora) y se predice cuáles serán los valores en

la otra (Y o variable criterio) desconocidos en ese

momento, mediante una ecuación o modelo

construida a partir de los dos conjuntos de

puntuaciones (X e Y) iniciales.

 Puede observarse que se utiliza una denominación

específica para denominar a las variables en los estudios predictivos: ◦ Variable predictora es la que se utiliza para hacer pronósticos (normalmente X), aunque a veces también se la denomina variable independiente (por ejemplo en el programa SPSS) ◦ Variable criterio es aquella sobre la que se hacen las predicciones o pronósticos (normalmente Y), también denominada a veces variable dependiente o resultado. ◦ Estas denominaciones diferentes para las dos variables se deben a que, como ya hemos dicho antes, en estos estudios la relación no es simétrica. Las regresiones de Y sobre X y de X sobre Y son, en general, diferentes.

 Los supuestos requeridos para la aplicación de la

regresión son muy parecidos a los presentados para el coeficiente de correlación lineal de Pearson: ◦ Linealidad de la relación

◦ Normalidad de la distribución de la variable Y (o de los residuos o errores de predicción). En la correlación se exigía el supuesto de la normalidad bivariante de la distribución conjunta de X e Y. en la regresión simple o múltiple, los valores de X normalmente se consideran fijados, no aleatorios, y el supuesto se aplica a la variable Y o a los que denominaremos residuos o errores. ◦ Homocedasticidad o igualdad de las varianzas error en los diferentes valores de X

 Ejemplos:

 a es la ordenada en el origen o valor que toma Y

cuando X toma el valor 0

 b es la pendiente de la recta o cambio

experimentado en Y por un incremento de una

unidad en X.

 Diámetro/Circunferencia

◦ Y = 3,14567 X (b = 3,141567, a = 0)

 Factura de teléfono/consumo

◦ Y = 1000+5X (b = 5, a = 1000)

 Ejemplo relación con pendiente negativa

◦ Y= 1000-5X (b = - 5, a = 1000)

 Pasos:

  1. Identificación del modelo (encontrar

constantes a y b): construir la ecuación de

regresión/predicción (Y’ = aX + b)

  1. Valoración del modelo (cumplimiento de supuesto y ver su poder predictivo)

3. Aplicación del modelo a casos de la misma

población

 La meta es encontrar los valores de las constantes

a y b que, en principio pueden ser infinitos pares,

de modo que se optimice algún criterio.

 Criterio de mínimos cuadrados: Minimiza la

siguiente función criterio:

 Proporciona las ecuaciones normales para la

determinación de las constantes a y b, que son las que minimizan la suma de los errores elevados al cuadrado (llamamos error de predicción E a la diferencia (Yi – Y’i) (^) : E = (Yi – Y’i)

2 '

1

min

n

i i i

Y Y imo

^ ^ 

 Puede demostrarse que las ecuaciones que

permiten obtener los valores de a y b que

hacen mínima la suma de los errores al

cuadrado son las siguientes;

  

 

1 1 1 1 2 2 2

(^1 1 )

n n n n

i i i i i i i i i i n (^) n n

i (^) i i i (^) i i

X X Y Y n X Y X Y

b

X X (^) n X X

   

 (^)  

 ^ 

   

 (^)  

aYbX

1

2

1

n

i i i n

i i

x y

b

x

  1 2 2 1

n

i i i xy^ y n xy x x i i

x y S s b r s s x

En puntuaciones diferenciales:

Si conocemos covarianza o correlación y desviaciones típicas:

 La puntuación del criterio Y puede escribirse como:

 La predicción que hacemos con el modelo no es

más que una transformación lineal de la variable

predictora, lo que explica algunas propiedades que

veremos a continuación:

 Media de las puntuaciones pronosticadas Y’

' ' ' YiYi  ( YiYi ) YiEi

YiabXi

'

_ 1   _ _ _ _ _

' a bX Y bX bX Y n

X a b n

a bX

n

Y Y

i i

n

i

i i        

  

 

 

 Varianza de las

puntuaciones

pronosticadas Y’ 2 2 2

2 2 2 2 ' x xy y x

y y x xy s r s s

s s bs r  

2 2 2 2 2 s (^) z '  Bszxrxy ( 1 ) rxy

 Media de los errores de predicción

 Varianza de los errores de predicción o

error cuadrático medio

 

'

1 1 1 1

n n n n

i i i i i i i i i i

Y Y Y a bX Y X na E b n n n n n

   

   

EY  ( YbX )  bX  0

2 2 ' 2

2 2 1 1 1 ( ')

n n n

i i i i i i i e y y

E E E Y Y

s s n n n

   

  

 Varianza de los errores de predicción o

error cuadrático medio (Cont.)

   

( 1 )

  1. 2 ( )

( ') 2

2 2

2

2 2

2 2

2

2 2 2 2 2 2 ( ')

y xy

xyx y x

y x xy x

y yx y xy

i yx

i

yx yx yx yy

s r

r ss s

s s r s

s s r n

xy b n

x b n

y

n

y yb x b x

n

y b x

n

y y s

  

 

 

   

 

 

    

  

 

 

  

   

 Covarianza entre los errores y la variable

predictora X

2

2

( ')

   

x x

y xy x y xy

xy y

s s

s r ss r

n

x b n

xy

n

x y bx S

 Coeficiente de determinación

2 2 2 '

2 s (^) ysysyr xy

2

2 2 '

y

y xy s

s r

2

2

2

2 .

2

2 '

2

2

1

y

yx xy

y

yx

y

y

y

y

s

s r

s

s

s

s

s

s

 

 

 Variación no explicada

 Variación explicada

2 2

2 . (^1) xy y

y x r s

s  

2

2

1 y

yx xy s

s r  

 Varianza de los errores

 Error típico de estimación

2 2 2 s (^) y. xsyrxy

2 s (^) y. xsyrxy

 Estadísticos para el ejemplo

0 , 8715

3 , 6667

3 , 2 , 2667 , 1 , 50

8 , 7 , 8667 , 2 , 805

2

2

  

  

xy

xy

y y

x x

r

s

Y s s

X s s

 

  

n X X

n XY X Y byx

x

xy byx

2

x

y yx xy

x

xy yx

s

s b r

s

s b

a =3-0.466*8 = - 0,

 Puntuaciones directas

Y’ = - 0,728 + 0,466 X

 Puntuaciones diferenciales

y’ = 0,466 x

 Puntuaciones típicas

z’y = 0,8715 zx

(Valores algo diferentes de los obtenidos con SPSS)

 Coeficiente de determinación o r^2 xy 0,7595,

y el % de variación explicada por el modelo

es 75,95%

 La proporción de variación no explicada es

de 0,2405, lo que representa un % del 24,05%

 Las correspondientes varianzas de las

puntuaciones pronosticadas y errores son:

◦ s^2 y’’ = 0,7595 x 2,6667 = 1, ◦ S^2 y.x= 0,2405 x 2,6667 = 0, ◦ Siendo la varianza total del criterio, la suma de las dos anteriores:  S^2 y = 1,7216 + 0,5451 = 2,

Estos resultados se han obtenido con el procedimiento Correlaciones. Difieren ligeramente de los cálculos con calculadora

porque SPSS utiliza n-1 en los denominadores de varianza y

covarianza