Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Regresión Lineal Simple: Apuntes de Estadística, Apuntes de Estadística

CONCEPTOS RESPECTO A LA REGRESION SIMPLE Y CONTEXTUALIZACION

Tipo: Apuntes

2022/2023

Subido el 20/11/2023

eduardo-madero
eduardo-madero 🇲🇽

2 documentos

1 / 9

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Instituto tecnológico de Mérida.
Ingeniería industrial.
Tema 5
Integrantes:
Javier Eduardo Madero Chan
Lisandro Emir Dzul Bacab
Grupo: 3I1
pf3
pf4
pf5
pf8
pf9

Vista previa parcial del texto

¡Descarga Regresión Lineal Simple: Apuntes de Estadística y más Apuntes en PDF de Estadística solo en Docsity!

Instituto tecnológico de Mérida. Ingeniería industrial. Tema 5 Integrantes: Javier Eduardo Madero Chan Lisandro Emir Dzul Bacab Grupo: 3I

5.- Regresión lineal simple

La regresión lineal simple examina la relación lineal entre dos variables continuas: una respuesta (Y) y un predictor (X). Cuando las dos variables están relacionadas, es posible predecir un valor de respuesta a partir de un valor predictor con una exactitud mayor que la asociada únicamente a las probabilidades. La regresión proporciona la línea que "mejor" se ajusta a los datos. Esta línea se puede utilizar después para:

  • Examinar cómo cambia la variable de respuesta a medida que cambia la variable predictora.
  • Predecir el valor de una variable de respuesta (Y) para cualquier variable predictora (X). Uno de los principales problemas que trata la estadística consiste en proponer modelos que ayuden a compren-der un fenómeno aleatorio. En esta unidad tratamos un tipo de problema estadístico en el que deseamos conocer cómo influyen diferentes valores x1, x2, …, xn, que han sido seleccionados de forma independiente de una variable controlable (no aleatoria), para predecir o estimar un valor medio o uno futuro de una variable dependiente y, también conocida como variable de respuesta. Por ejemplo, el gerente de la empresa de juguetes A desea conocer cómo influye en sus ventas diarias el tiempo al aire en minutos, en el que se promociona el juguete en alguna televisora. Para tal efecto, decide contratar un espacio publicitario en el canal 5 de una importante televisora durante los siguientes n días, para que transmita x1, x2, …, xn minutos al día, respectivamente, la propaganda del juguete. Y obtiene los datos que se muestran en la tabla 6.1. Tabla 6.1 Tiempo diario en minutos de publicidad del juguete A y volumen de ventas

y) en términos gráficos. Así, con base en la correspondencia que muestre la gráfica será el tipo de modelo de regresión que se proponga, en esta parte de la unidad son de interés las relaciones lineales entre las variables x y y. 5.1 Prueba de hipótesis en la regresión lineal simple Prueba de hipótesis en la regresión lineal simple. En cualquier análisis de regresión no basta hacer los cálculos que se explicaron antes, sino que es necesario evaluar qué tan bien el modelo (la línea recta) explica la relación entre X y Y. Una primera forma de hacer esto es probar una serie hipótesis sobre el modelo. Para ello es necesario suponer una distribución de probabilidad para el término de error, ej. Es usual suponer normalidad: se distribuye en forma normal, independiente, con media cero y varianza. Por lo general, la hipótesis de mayor interés plantea que la pendiente es significativamente diferente de cero. Esto se logra al aprobar la siguiente hipótesis: El estadístico de prueba es: Si la hipótesis nula es verdadera él estadístico (1.10) tiene una distribución tstudent con n-2 grados de libertad. Se rechaza la Ho si el valor absoluto de este estadístico es mayor que el correspondiente valor crítico obtenido de tablas, es decir, se rechaza Ho si: En caso contrario no se rechaza Ho. No rechazar que , en el caso del modelo de regresión lineal simple, implica que no existe una relación lineal significativa entre X y Y ; por tanto, no existe relación entre estas variables o ésta es de otro tipo. La suma de cuadrados de los residuos o suma de cuadrados del error y se utiliza para estimar la varianza del error de ajuste de un modelo, y está dada por: A partir de la ecuación (1.12) se obtiene que el valor esperado de la suma de cuadrados , del error está dado por: Por lo tanto, un estimador insesgado de σ^2 está dado por:

En el caso de los datos de la tabla 1.1, datos de resistencia de la pulpa, el planteamiento de hipótesis sería el siguiente: Aplicando el estadístico de prueba El valor de -Student encontrado en tablas con n-2 grados de libertad y un 0, de nivel de significancia es Dado que el valor absoluto de es significativamente mayor que el valor encontrado en tablas con un nivel de significancia de 0,05 concluimos que rechazamos la hipótesis nula por lo tanto si existe una relación entre ambas variables. 0 bien, dado que el valor-p es menor que el nivel de significancia, se rechaza la hipótesis nula valor-p<a. En ocasiones, en lugar de probar que , puede ser de interés probar que es igual a cierta constante , en este caso en el numerador del estadístico de la expresión (1,10) se resta , es decir, el estadístico queda de la siguiente manera y el criterio de rechazo es el mismo. Si se utiliza como criterio de rechazo la comparación de la significancia observada (p-value o valor p) contra la significancia predefinida (a), entonces se rechaza Ho si el valor p < a. Por otro lado, con respecto del parámetro suele ser de interés probar la siguiente hipótesis: El estadístico de prueba es el siguiente: El cual tiene una distribución t-Student con n-2 grados de libertad, por lo que se rechaza Ho si:

Las pruebas de hipótesis para el ejemplo de las ventas contra clientes, el resumen que nos arroja Excel y Minitab incluye el cálculo del valor de t y el valor-p, optando por cualesquiera de ambos estadísticos las hipótesis quedarían de la siguiente manera: El valor de t-Student encontrado en tablas con n-2 grados de libertad y un 0,05 de nivel de significancia es Dado que el valor absoluto de t0 es significativamente mayor que el valor encontrado en tablas con un nivel de significancia de 0,05 concluimos que rechazamos la hipótesis nula por lo tanto si existe una relación entre ambas variables. 0 bien, dado que el valor-p es menor que el nivel de significancia, se rechaza la hipótesis nula en el caso de las hipótesis para la intercepción tenemos: Dado que el valor absoluto de t0 es significativamente mayor que el valor encontrado en tablas con un nivel de significancia de 0,05 concluimos que rechazamos la hipótesis nula por lo tanto el punto de corte de la línea recta no pasa por el origen, es decir, no pasa por (0, 0). O bien, dado que el valor-p es menor que el nivel de significancia, se rechaza la hipótesis nula.

5.2. Intervalos de confianza en la regresión lineal simple.

este manual fue generado por r markdown. la teoría mencionada puede revisarse en el capítulo 6 de mis notas de clase que aparecen en el siguiente documento: 1.2. estadística inferencial. al final de esta guía, usted encontrará una serie de: (a) ejercicios, y (b) enlaces y materiales relacionados con la temática que se explica aquí. usted encontrará otros documentos de posible interés en el siguiente enlace

6 Preliminares

  1. La relación más sencilla entre dos variables xx y yy es una relación lineal de la forma: y=δ+βxy=δ+βx El código para escribir la expresión anterior es: $$y = \delta + \beta x$$
  2. xx se llama variable independiente (predictora o explicativa).
  3. Para xx fija, yy se llama variable dependiente o de respuesta.
  4. Los parámetros del modelo son la pendiente ββ y el intercepto δδ (punto de corte con el eje YY), entre otros.
  5. En las figuras de abajo, se muestran algunas situaciones que se pueden presentar dependiendo del valor de la pendiente a) Cuando la pendiente es positiva, la relación entre $x$ y $y$ es creciente. Es decir, a medida que $x$ aumenta, entonces, $y$ también aumenta. b) Cuando la pendiente es negativa, la relación entre $x$ y $y$ es decreciente. Es decir, a medida que $x$ aumenta, entonces, $y$ disminuye.