Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


modelos estadisticos, Apuntes de Estadística

Asignatura: estadistica 1, Profesor: . ., Carrera: Economía, Universidad: UCM

Tipo: Apuntes

2016/2017

Subido el 15/12/2017

mcikcir
mcikcir 🇪🇸

1 documento

1 / 7

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
10. Relaciones entre dos variables cuantitativas (Inferencia)
Ya revisamos la descripción de variables cuantitativas ahora veremos la manera de hacer inferencia a
partir de los resultados muestrales.
Problema: ¿Existe relación entre las notas en la Prueba Final Acumulativa y las notas de la Prueba 1 en
cursos de Estadística en la UTAL
Inferencia en Regresión Lineal Simple
Modelo de regresión lineal simple:
Se tienen n observaciones de una variable explicativa x y de una variable respuesta y,
el modelo estadístico de regresión lineal simple es:
donde
es la respuesta promedio para cada x.
representa el intercepto de la función lineal que usa todos los valores de la población y
representa la pendiente de la función lineal que usa todos los valores de la población. y son parámetros
El modelo estadístico de regresión lineal simple asume que para cada valor de x, los valores de la
respuesta y son normales con media (que depende de x) y desviación estándar F 0
7 3
que no depende de
x. Esta desviación estándar σ es la desviación estándar de todos los valores de y en la población para un
mismo valor de x.
Estos supuestos se pueden resumir como: Para cada x, donde
PAGE 3
* Adaptado de capítulo 21 del libro Bioestadística de Erica Taucher
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga modelos estadisticos y más Apuntes en PDF de Estadística solo en Docsity!

10. Relaciones entre dos variables cuantitativas (Inferencia) Ya revisamos la descripción de variables cuantitativas ahora veremos la manera de hacer inferencia a partir de los resultados muestrales.

Problema: ¿Existe relación entre las notas en la Prueba Final Acumulativa y las notas de la Prueba 1 en cursos de Estadística en la UTAL

Inferencia en Regresión Lineal Simple

Modelo de regresión lineal simple:

Se tienen n observaciones de una variable explicativa x y de una variable respuesta y ,

el modelo estadístico de regresión lineal simple es:

donde

es la respuesta promedio para cada x.

representa el intercepto de la función lineal que usa todos los valores de la población y representa la pendiente de la función lineal que usa todos los valores de la población. y son parámetros

El modelo estadístico de regresión lineal simple asume que para cada valor de x, los valores de la

respuesta y son normales con media (que depende de x) y desviación estándar F 07 3 que no depende de

x. Esta desviación estándar σ es la desviación estándar de todos los valores de y en la población para un mismo valor de x.

Estos supuestos se pueden resumir como: Para cada x , donde

  • Adaptado de capítulo 21 del libro Bioestadística de Erica Taucher

Podemos visualizar el modelo con la siguiente figura:

Los datos nos darán estimadores puntuales de los parámetros poblacionales.

Estimadores de los parámetros de regresión:

El estimador de la respuesta media está dado por El estimador del intercepto es: El estimador de la pendiente es: El estimador de la desviación estándar σ está dado por:

donde es la suma de cuadrados de los residuos =

El coeficiente de correlación muestral es un estimador puntual de la correlación poblacional ρ

Probando la hipótesis acerca de la existencia de relación lineal

En el modelo de regresión lineal simple =>. Si entonces las variables x e y no están asociadas linealmente y la respuesta es una constante E( Y ) =.

E( Y ) =

Es decir, conocer el valor de x no nos va a ayudar a conocer y.

Para docimar la significancia de la relación lineal realizamos el test de hipótesis:

H (^) o: = 0 (la pendiente de la recta de regresión en la población es cero) H (^) 1: F 0B 9 0

Existen hipótesis de una cola, donde H 1: < 0^ o^ H^ 1: > 0, pero lo usual es hacer el test bilateral.

Para docimar la hipótesis podemos usar el test t :

En el gráfico se muestran las fuentes de variación mencionadas: La variación total está dada por. La variación explicada por la inclinación de la recta, o en otras palabras, explicada por la relación entre las variables y y x , es. Por último, la variación no explicada, o residual es.

Podemos hacer una tabla, llamada tabla de análisis de varianza, para la regresión lineal simple y es la siguiente: Fuente de variación gl Grados de libertad

SC Suma de Cuadrados

CM Cuadrados Medios

Regresión 1

Residuo

Total

Ejemplo: Test 1 versus Test 2 re-revisitado

ANOVA(b) Modelo Suma de cuadrados

gl Media cuadrática

F Sig.

1 Regresión 48.400 1 48.400 40.333 .008(a) Residual 3.600 3 1. Total 52.000 4 a Variables predictoras: (Constante), Test 1 b Variable dependiente: Test 2

Coeficiente de determinación o bondad de ajuste (r 2 ) La correlación entre el test 1 y test 2 del ejemplo es de , este coeficiente de correlación cuantifica el grado de asociación lineal y la dirección de la asociación entre dos variables cuantitativas x y y. Se puede demostrar que:

este coeficiente se llama coeficiente de determinación, y representa la proporción de la variación total de y que es explicada por la relación lineal entre x e y. A este coeficiente se le usa entonces como medida de bondad de ajuste , es decir que tan buena es la variable explicativa x para explicar la respuesta y. El rango del coeficiente de determinación es naturalmente entre cero y uno (), lo que nos indica que mientras más cercano a uno sea el coeficiente de determinación (r^2 ) mejor es el ajuste de la regresión.

En el caso del ejemplo del test 1 y test 2, el , que nos indica que el test 1 explica el 93,1% de la variación total del test 2.

Verificando supuestos en la Regresión lineal simple

1. Examine el gráfico de dispersión de y versus x para decidir si el modelo lineal parece razonable.

2. Examine los residuos para verificar los supuestos acerca del término del error. Los residuos deben

ser una muestra aleatoria de una población normal con media 0 y desviación estándar σ.

Cuando examine los residuos verifique:

a) que provienen de una muestra aleatoria :

Grafique los residuos versus x. El supuesto de que provienen de una muestra aleatoria será razonable si el gráfico muestra los puntos al azar, sin una forma definida.

Ejemplo: Se conduce un experimento en 12 sujetos para analizar si la dosis de cierta droga (en ml) está relacionada con el tiempo de reacción a un estímulo en segundos.

Droga (ml) 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6, Tiempo (segs) 1,0 0,8 1,8 1,4 2,1 1,8 2,2 3,0 2,75 3,0 4,1 4,

Gráfico de dispersión del tiempo de reacción a estímulo versus dosis de droga:

Gráfico de residuos de la regresión versus dosis de droga:

Tallo y hoja de los residuos

Unstandardized Residual Stem-and-Leaf Plot

Frequency Stem & Leaf

1.00 -0. 5 5.00 -0. 12344 4.00 0. 1123 2.00 0. 57

Stem width: 1. Each leaf: 1 case(s)