Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Ejercicios de Regresión Lineal Simple y Múltiple: Aplicaciones y Análisis, Ejercicios de Estadística Social

aprenderás a desarrollar ejercicios de estadística

Tipo: Ejercicios

2020/2021
En oferta
30 Puntos
Discount

Oferta a tiempo limitado


Subido el 17/05/2021

gabriela-maldonado-16
gabriela-maldonado-16 🇲🇽

5

(1)

1 documento

1 / 15

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
3.3 Aplicaciones
1.
Identifica, en tu entorno, una relación que puedas representar por medio de dos
variables (respuesta y predictora), para la construcción de un modelo de regresión
lineal simple. La colección de datos puede ser experimental o de alguna base de
datos actual para que puedas realizar predicciones (INEGI, SHCP, Secretaría de
economía, Secretaría de salud, Banco mundial, etcétera). Realiza la validación del
modelo soportándolo con todo el material que se incluyó en los subtemas
correspondientes.
Entregar un reporte que incluya una introducción, el objetivo de tu estudio, la
justificación de las variables seleccionadas para elaborar tu estudio, la validación
del modelo de regresión construido y las conclusiones correspondientes al estudio
que contemplaste como tu trabajo de campo.
2.
Extiende el caso de estudio que desarrollaste en el problema anterior, en por lo
menos tres variables predictoras y su variable de respuesta (O desarrolla un
nuevo caso de estudio). Entrega un reporte similar al desarrollado en el modelo de
regresión lineal simple.
3.
12.8 Profesor Asimov. El profesor Isaac Asimov fue uno de los escritores más
prolíficos de todos los tiempos. Antes de su muerte, escribió casi 500 libros
durante una carrera de 40 años. De hecho, cuando su carrera avanzaba, fue
incluso más productivo en términos del
número de libros escritos en un periodo determinado. Los datos siguientes dan
el tiempo, en meses, necesario para escribir sus libros en incrementos de 100:
Número de libros, x 100 200 300 400 490
Tiempo en meses, y 237 350 419 465 507
a. Suponga que el número de libros x y el tiempo en meses y están
relacionados linealmente. Encuentre la recta de mínimos cuadrados que
relacione y con x.
b. Grafique el tiempo como función del número de libros escritos usando una
gráfica de dispersión y grafique la recta de mínimos cuadrados en el mismo
papel. ¿Le parece que la recta da un buen ajuste a los puntos?
c. Construya una tabla ANOVA para la regresión lineal.
[CITATION Men15 \p 512 \l 2058 ]
4.
En base al enunciado del ejercicio 3,
a. Escribe la interpretación del coeficiente de regresión muestral estimado
b1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
Discount

En oferta

Vista previa parcial del texto

¡Descarga Ejercicios de Regresión Lineal Simple y Múltiple: Aplicaciones y Análisis y más Ejercicios en PDF de Estadística Social solo en Docsity!

3.3 Aplicaciones

Identifica, en tu entorno, una relación que puedas representar por medio de dos

variables (respuesta y predictora), para la construcción de un modelo de regresión

lineal simple. La colección de datos puede ser experimental o de alguna base de

datos actual para que puedas realizar predicciones (INEGI, SHCP, Secretaría de

economía, Secretaría de salud, Banco mundial, etcétera). Realiza la validación del

modelo soportándolo con todo el material que se incluyó en los subtemas

correspondientes.

Entregar un reporte que incluya una introducción, el objetivo de tu estudio, la

justificación de las variables seleccionadas para elaborar tu estudio, la validación

del modelo de regresión construido y las conclusiones correspondientes al estudio

que contemplaste como tu trabajo de campo.

Extiende el caso de estudio que desarrollaste en el problema anterior, en por lo

menos tres variables predictoras y su variable de respuesta (O desarrolla un

nuevo caso de estudio). Entrega un reporte similar al desarrollado en el modelo de

regresión lineal simple.

12.8 Profesor Asimov. El profesor Isaac Asimov fue uno de los escritores más

prolíficos de todos los tiempos. Antes de su muerte, escribió casi 500 libros

durante una carrera de 40 años. De hecho, cuando su carrera avanzaba, fue

incluso más productivo en términos del

número de libros escritos en un periodo determinado. Los datos siguientes dan

el tiempo, en meses, necesario para escribir sus libros en incrementos de 100:

Número de libros, x 100 200 300 400 490

Tiempo en meses, y 237 350 419 465 507

a. Suponga que el número de libros x y el tiempo en meses y están

relacionados linealmente. Encuentre la recta de mínimos cuadrados que

relacione y con x.

b. Grafique el tiempo como función del número de libros escritos usando una

gráfica de dispersión y grafique la recta de mínimos cuadrados en el mismo

papel. ¿Le parece que la recta da un buen ajuste a los puntos?

c. Construya una tabla ANOVA para la regresión lineal.

[CITATION Men15 \p 512 \l 2058 ]

En base al enunciado del ejercicio 3,

a. Escribe la interpretación del coeficiente de regresión muestral estimado

b

1

b. Utiliza la fórmula 3.17, para calcular el coeficiente de determinación, e interpreta

el valor hallado.

c. Utiliza la fórmula 3.18, para calcular el coeficiente de correlación de Pearson, e

interpreta el valor hallado.

d. Con un nivel de significancia del 5%, prueba la hipótesis de que el modelo es

significativo, utiliza el estadístico de prueba dado en la fórmula 3.25. Escribe la

conclusión.

En base al enunciado del ejercicio 3,

a. Construye límites de confianza de 95% para la respuesta media

μ

Y / x

0

cuando

x

0

. Escribe la interpretación a tus resultados.

b. Construye un intervalo de predicción del 95% para la respuesta futura

y

0

cuando

x

0

Escribe la interpretación a tus resultados.

Recopila datos con 12 de tus compañeros, acerca de sus estaturas y sus

correspondientes pesos.

Estaturas, centímetros

Pesos, kilogramos

a. Traza el diagrama de dispersión de estos datos.

b. Calcula e interpreta los coeficientes de correlación y de determinación. Utiliza

3.17 y 3.

c. Determina la ecuación de regresión estimada calculando

b

0

y

b

1

. Utiliza 3.10 y

3.11. Interpreta el valor de

b

1

d. Si la estatura de uno de tus compañeros es de 168 centímetros, ¿cuál será su peso

estimado?

e. Calcula el error estándar de estimación. Utiliza 3.

En base al enunciado del ejercicio 6,

a. Construye límites de confianza de 95% para la respuesta media

μ

Y / x

0

para tu

tercer registro recabado de

x

0

. Escribe la interpretación a tus resultados.

b. Construye un intervalo de predicción del 95% para la respuesta futura

y

0

para tu

tercer registro recabado de

x

0

. Escribe la interpretación a tus resultados.

c. Compara los resultados de los incisos anteriores y realiza anotaciones al

respecto.

d. Construye un intervalo de predicción del 98% para la respuesta futura

y

0

cuando

x

0

Escribe la interpretación a tus resultados.

e. Utiliza el método del valor p, para pruebas de hipótesis, aplicándolo en el inciso

b.

  1. Una ecuación de regresión múltiple produce los siguientes resultados

parciales.

Fuente Suma de cuadrados gl

Regresión 750 4

Total 500 35

a) ¿Cuál es el tamaño total de la muestra?

b) ¿Cuántas variables independientes se consideraron?

c) Calcule el coeficiente de determinación.

d) Calcule el error estándar de estimación.

e) Pruebe la hipótesis de que ninguno de los coeficientes de regresión es igual

a cero. Suponga que α = 0.05.

[CITATION Lin08 \p 547 \l 2058 ]

12. 14. En una ecuación de regresión múltiple se consideran dos variables

independientes y el tamaño de la muestra es 25. Los coeficientes de regresión y

los errores estándar son los siguientes.

b

1

=2.676 s

b 1

b

2

=−0.880 s

b

2

Realice una prueba de hipótesis para determinar si alguna variable

independiente tiene un

coeficiente igual a cero. ¿Consideraría eliminar alguna variable de la ecuación

de regresión?

Utilice el nivel de significancia 0.05.

[CITATION Lin08 \p 548 \l 2058 ]

13. 15. Se obtuvo el siguiente resultado

Análisis de la varianza

FUENTE GL SS MS

REGRESION 5 100 20

ERROR 20 40 2

TOTAL 25 140

FACTOR DE

PREDICCION

COEFICIENTE

DESVIACION

ESTANDAR

RAZON T

CONSTANTE 1.

X1 4.00 3.00 1.

X2 3.00 0.20 15.

X3 0.20 0.05 4.

X4 -2.50 1.00 -2.

X5 3.00 4.00 0.

a) ¿Cuál es el tamaño de la muestra?

b) Calcule el valor de R

2

ajustado

c) Calcule el error estándar de estimación múltiple.

d) Realice una prueba global de hipótesis para determinar si algunos de los

coeficientes de

regresión son significativos. Utilice el nivel de significancia 0.05.

e) Pruebe los coeficientes de regresión de manera individual. ¿Consideraría

omitir alguna(s)

variable(s)? De ser así, ¿cuál o cuáles? Utilice el nivel de significancia 0.05.

[CITATION Lin08 \p 548 \l 2058 ]

  1. La gerente de distrito de Jasons, una cadena grande de productos

electrónicos, investiga por qué ciertas tiendas en su región tienen mejor

rendimiento que otras. La gerente considera que los tres factores se relacionan

con las ventas totales: el número de tiendas de la competencia en la región, la

población del área circundante y la cantidad gastada en publicidad. De su

distrito, que consiste en varios cientos de tiendas, selecciona una muestra

aleatoria de 30 tiendas. Por cada tienda reunió la siguiente información.

Y = ventas totales el año pasado (en miles de dólares)

X

1

= número de tiendas de la competencia en la región.

X

2

= población de la región (en millones).

X

3

= gastos en publicidad (en miles de dólares).

Los datos muestrales se corrieron en MINITAB, con los siguientes resultados.

Análisis de la varianza

FUENTE GL SS MS

REGRESION 3 3050.00 1016.

ERROR 26 2200.00 84.

TOTAL 29 5250.

FACTOR DE COEFICIENTE DESVIACION RAZON T

E CLAIFICACION

ES

BACHILLERA

TO

VERBA

L

CALIFICACION

ES

MATEMATICAS

EN EL

PROGRAMA

a) Considere la siguiente matriz de correlación. ¿Qué variable tiene la

correlación más fuerte

con la variable dependiente? Algunas correlaciones entre las variables

independientes son

fuertes. ¿Esto representaría un problema?

calificación

leyes promedio verbal

calificación

promedio 0.

verbal 0.616 0.

matemáticas 0.487 0.636 0.

b) Considere el siguiente resultado. Calcule el coeficiente de determinación

múltiple.

La ecuación de regresión es

leyes = –0.411 + 1.20 calificación + 0.00163 verbal – 0.00194 matemáticas

Factor de predicción Coef Desviación estándar Razón t

Constante –0.4111 0.7823 –0.

promedio de

calificaciones 1.2014 0.2955 4.

verbal 0.001629 0.002147 0.

matemáticas –0.001939 0.002074 –0.

Análisis de la varianza

FUENTE GL SS MS

Regresión 3 4.3595 1.

Error 5 0.7036 0.

Total 8 5.

c) Realice una prueba global de hipótesis a partir del resultado anterior.

¿Alguno de los coeficientes de regresión no es igual a cero?

d) Realice una prueba de hipótesis en cada variable independiente.

¿Consideraría eliminar

las variables “verbal” y “matemáticas”? Sea α = 0.05.

e) El análisis se vuelve a correr, pero ahora sin “verbal” y “matemáticas”.

Observe la siguiente

salida en pantalla. Calcule el coeficiente de determinación. ¿Cuánto cambió R

2

a partir del

análisis anterior?

La ecuación de regresión es

leyes = -0.454 + 1.16 calificación

Factor de Desviación

predicción Coef estándar Razón t

Constante -0.4542 0.5542 -0.

Promedio de

calificaciones 1.1589 0.1977 5.

Análisis de la varianza

FUENTE GL SS MS

Regresión 1 4.2061 4.

Error 7 0.8570 0.

Total 8 5.

f) A continuación se presenta un histograma y un diagrama de tallo y hojas de

las varianzas

residuales. ¿Parece razonable la suposición de normalidad para las varianzas

residuales?

Histograma de las varianzas

residuales N = 9

Punto medio Conteo

Tallo y hojas de las varianzas residuales N = 9

muestreada diarias la tienda estacionamiento de

dólares)

a) Determine la ecuación de regresión.

b) ¿Cuál es el valor de R

2

ajustada? Haga un comentario sobre su valor.

c) Realice una prueba global de hipótesis para determinar si alguna de las

variables independientes es diferente de cero.

d) Realice pruebas de hipótesis individuales para determinar si se puede

eliminar alguna de

las variables independientes.

e) Si se eliminan variables, calcule de nuevo la ecuación de regresión y R

2

Analice

[CITATION Lin08 \p 554 \l 2058 ]

  1. Great Plains Roofing and Siding Company, Inc., vende productos para

techos y recubrimientos de paredes a minoristas en reparación de casas, como

Lowe’s y Home Depot y a contratistas comerciales. El propietario desea

estudiar los efectos de diversas variables sobre el valor de las tejas americanas

vendidas (miles de dólares). El gerente de marketing argumenta que la

compañía debe gastar más dinero en publicidad, en tanto que un investigador

de mercado sugiere que se debe enfocar más en diferenciar su marca y su

producto de sus competidores. La compañía dividió a Estados Unidos en 26

distritos de marketing. En cada distrito reunió información sobre las siguientes

variables: volumen de ventas (en miles de dólares), dólares gastados en

publicidad, número de cuentas activas, número de marcas de competidores y

una calificación del potencial del distrito.

Ventas Dólares en Potencial

(miles de publicidad Número de Número de de

dólares) (miles) cuentas competidores mercado

Realice un análisis de regresión múltiple para encontrar los mejores factores de

predicción de

las ventas.

a) Trace un diagrama de dispersión donde se compare el volumen de ventas

con cada una

de las variables independientes. Haga un comentario sobre los resultados.

b) Formule una matriz de correlación. ¿Hay algún problema? ¿Hay alguna

variable independiente redundante?

c) Formule una ecuación de regresión. Realice una prueba global. ¿Se puede

concluir que

algunas de las variables independientes son útiles para explicar la variación en

la variable

dependiente?

d) Realice una prueba con cada una de las variables independientes. ¿Hay

alguna que se

deba eliminar?

e) Refine la ecuación de regresión de modo que las variables restantes sean

significativas.

f) Verifique la validez de los supuestos del modelo

[CITATION Lin08 \p 555 \l 2058 ]

  1. El presidente de Blitz Sales Entreprises, una compañía que vende

productos de cocina

mediante comerciales en televisión, con frecuencia denominados infomerciales,

reunió datos

de las últimas 15 semanas de ventas para determinar la relación entre las

ventas y el número de infomerciales.

Ventas (miles Ventas (miles

Infomerciales de dólares) Infomerciales de dólares)

a) Determine la ecuación de regresión. ¿Es posible predecir las ventas a partir

del número de

comerciales?

b) Determine los residuos y trace un histograma. ¿Parece razonable la

suposición de normalidad?

c) ¿En qué porcentaje se espera que el modelo construido no realice

estimaciones buenas? Explica.

d) Aplica las dos formas conocidas, para determinar la significatividad del

modelo. Anota tus conclusiones.

d) Construye límites de confianza de 98% para la respuesta media

μ

Y / x 0

cuando

x

0

. Escribe la interpretación a tus resultados.

e) Construye un intervalo de predicción del 98% para la respuesta futura

y

0

cuando

x

0

Escribe la interpretación a tus resultados.

f) Utiliza el método del valor p, para pruebas de hipótesis, aplicándolo en el

inciso d.

[CITATION Lin08 \p 560 \l 2058 ]

  1. Usted es un empleado nuevo en Laurel Woods Real State, que se especializa

en la venta de casas hipotecadas por medio de subastas públicas. Su jefe le pidió

aplicar los siguientes

datos (saldo de la hipoteca, pagos mensuales, pagos hechos antes de la hipoteca

y precio

final en la subasta) en una muestra aleatoria de ventas recientes con el fin de

estimar el precio real de la subasta.

P PM PH PS P PM PH PS

Donde

P = Préstamo

PM = Pagos mensuales

PH = Pagos hecho

PS = Precio en la subasta

a) Realice una prueba global de hipótesis para verificar si algunos de los

coeficientes de

regresión son diferentes de cero.

b) Realice una prueba individual de las variables independientes. ¿Eliminaría

alguna variable?