Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Introducció a la Regresió, Apuntes de Estadística

Asignatura: Estadística I, Profesor: Josep Allepús, Carrera: Ciències Empresarials, Universidad: URV

Tipo: Apuntes

Antes del 2010

Subido el 30/04/2008

raimonxu
raimonxu 🇪🇸

3.3

(12)

23 documentos

1 / 3

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
TRegresC.doc 3/26/2007
2
Relación entre variables
Sean las alturas y los pesos de 30 individuos representados en un diagrama
cartesiano
R
2
= 0,6458
30
40
50
60
70
80
90
100
140 150 160 170 180 190 200
cm
kg
El pesotiende aaumentarcon la altura
Residuals Graphically
(fitted value)
Y
(actual value)
e
YY =
==
=
ˆ
Y
ˆ
X
Y
X
1
X
2
X
3
X
4
e
1
e
2
e
3
e
4
Y
3
Y
4
Y
2
Y
1
ii
bXaY +=
ˆ
iii
eXbaY
+
+= ·
The discrepancies between the actual and fitted values of Y
are known
as the residuals.
1
ˆ
Y
2
ˆ
Y
3
ˆ
Y
4
ˆ
Y
Introducción al Tema de Regresión
1. Especificación del modelo lineal.
§265
§265§265
§265
Diagrama de dispersión de los datos (x
i
, y
j
).
Nos permite visualizar en un gráfico cartesiano la relación entre dos variables
Al incrementar los valores de X, observar cierta tendencia en la variable Y.
La dispersión de los puntos alrededor del modelo teórico
Permite detectar algunos puntos “anómalos”.
Usos del análisis de regresión:
a) Descripción del peso corporal
b) Predicción para una altura concreta
c) Control “peso ideal”
La relación entre las variables no es exacta. Es natural preguntarse entonces:
C Cuál es la mejor recta que sirve para predecir los valores de Y en función de los
de X
C Qué error cometemos con dicha aproximación (residual).
2. Especificación de las variables:
X: exógena, explicativa, o en matemáticas “independiente”
Y: endógena, explicada, o en matemáticas “variable dependiente”
Dos Tipos
de Variables
Variable
Independiente
(X)
Variable
Dependiente
(Y)
Dos Tipos
de Variables
Variable
Independiente
(X)
Variable
Dependiente
(Y)
A veces nos encontramos en Economía que la distinción entre variables dependientes
e independientes no es evidente debido a la complejidad de las interrelaciones.
X
Y X
Y X
Y X Y
Entonces la asignación debe basarse en fundamentos Z
teóricos, por la propia experiencia o por estudios anteriores (bibliografía).
pf3

Vista previa parcial del texto

¡Descarga Introducció a la Regresió y más Apuntes en PDF de Estadística solo en Docsity!

2

Relación entre variables

Sean las alturas y los pesos de 30 individuos representados en un diagrama cartesiano

R^2 = 0,

30

40

50

60

70

80

90

100

140 150 160 170 180 190 cm 200

kg

El peso

tiende a aumentar

con la

altura

Residuals Graphically

(fitte

Y (actu Y −−−− Y ˆ==== e

Y ˆ

X

Y

X 1 X 2 X 3 X 4

e 1

e 2

e 3 e^4

Y 3 Y 2^ Y^4

Y 1

Y ˆ i = a + bX i

Y i = a + b · Xi + e i

The discrepancies between the actual and fitted values of Y ar as the residuals.

Y ˆ 1

Y ˆ 2

Y ˆ 3

Y ˆ 4

Introducción al Tema de Regresión

1. Especificación del modelo lineal. §265§265§265§

Diagrama de dispersión de los datos (xi, yj). Nos permite visualizar en un gráfico cartesiano la relación entre dos variables Al incrementar los valores de X, observar cierta tendencia en la variable Y. La dispersión de los puntos alrededor del modelo teórico Permite detectar algunos puntos “anómalos”.

Usos del análisis de regresión: a) Descripción del peso corporal b) Predicción para una altura concreta c) Control “peso ideal” La relación entre las variables no es exacta. Es natural preguntarse entonces: C Cuál es la mejor recta que sirve para predecir los valores de Y en función de los de X C Qué error cometemos con dicha aproximación (residual).

  1. Especificación de las variables: X: exógena, explicativa, o en matemáticas “independiente” Y: endógena, explicada, o en matemáticas “variable dependiente”

Dos Tipos de Variables

Variable Independiente (X)

Variable Dependiente (Y)

Dos Tipos de Variables

Variable Independiente (X)

Variable Dependiente (Y)

A veces nos encontramos en Economía que la distinción entre variables dependientes e independientes no es evidente debido a la complejidad de las interrelaciones. X →→→→ Y X ←←←← Y X ↔↔↔↔ Y X Y

Entonces la asignación debe basarse en fundamentos Z teóricos, por la propia experiencia o por estudios anteriores (bibliografía).

3. Significado de los coeficientes de la regresión lineal simple: §258§258§258§

El objetivo de la técnica de regresión es establecer una relación estadística entre la variable endógena (Y) y la variable exógena (X). En primera instancia por su simplicidad analítica, postulamos la existencia de relación lineal

  • pendiente. Interpretación del signo de la pendiente b es la pendiente de la línea, o el incremento en la Y cuando la X incrementa en una unidad.
  • ordenada en el origen a es la intersección con el eje de ordenadas o el valor estimado de Y para X=

4. Criterios de ajuste de la nube de puntos: §245§245§245§

Entre diferentes posibilidades escogemos:

  • Suma de los cuadrados de esas discrepancias Σei^2 = EEEE(yi - ymodelo)² El modelo lineal de regresión MCO se construye utilizando la técnica de estimación mínimo cuadrática

5. y observada ( y i ), la y predita ( yˆ^ i ) i l' error ( e i ).

  • y observada (^ yi^ ): és el valor que pren la y per la i-èssima observació.
  • y predita , y estimada o y esperada (^ ^ i ): és el valor de y calculat a partir de la recta de regressió per la i-èssima observació: Proponemos un modelo lineal donde los valores “teóricos” vienen dados

y ˆ i = a + bx i

  • error ( e^ i^ ), residu, terme de perturbació: és la diferència entre la y

observada i la y predita per a la i-èssima observació ei = yi − y ˆ i

  1. Obtener la recta de ajuste aplicando el método de mínimos cuadrados a los

residuos. §201§201§201§

a) Obtención de las ecuaciones normales El método M.C.O. propone imponer la condición de mínimo a la suma de los cuadrados de los residuos

∑ e^ i =^ ∑ y^ i −^ a^ − bxi

Optimizar los parámetros a, b de tal manera que se minimice dicha expresión

C Minimizando respecto a

na + b ∑ x = ∑ y

C Minimizando respecto b

a ∑ x + b ∑ x^2 = ∑ xy

Surgen así las ecuaciones normales. b) Resolución del sistema de ecuaciones normales Proponemos el método de Cramer utilizando determinantes.