Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


ejercicios 8 estadistica, Ejercicios de Estadística

ejercicios de estadistica para la ingenieria

Tipo: Ejercicios

2015/2016

Subido el 24/10/2021

grethelfg
grethelfg 🇵🇪

1 documento

1 / 8

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
ESTADÍSTICA APLICADA A LA INGENIERÍA AMBIENTAL
EJERCICIOS PROPUESTOS – SESIÓN Nº 8
1. La siguiente tabla presenta los valores de dos muestras aleatorias provenientes de poblaciones
normales para comparar el contenido de nicotina de dos marcas de cigarrillos.
Suponiendo que los conjuntos de datos provienen de muestras tomadas al azar de poblaciones normales
con varianzas desconocidas e iguales. ¿Proveen estos datos suficiente evidencia que permita concluir que
las poblaciones muestreadas difieren a la media de contenido de nicotina? Sea α=0.05
Solución: caso 2: varianzas desconocidas e iguales. Además, n1+n2=18 <30
Datos:
Xi: contenido de nicotina (var. cuantitativa)
n1=10
n2=8
n1+n2=18 <30
Proceso:
1. Plantear la hipótesis
Ho:
μ1μ2=0
H1:
μ1μ20
2. Establecer el nivel de significancia
α=0.05
3. Seleccionar y calcular el estadístico de la prueba
Tc=11.66984
Marca A 3.00 2.90 3.10 3.10 3.00 3.10 3.10 3.00 3.00 2.90
Marca B 2.69 2.70 2.69 2.65 2.69 2.66 2.70 2.70
pf3
pf4
pf5
pf8

Vista previa parcial del texto

¡Descarga ejercicios 8 estadistica y más Ejercicios en PDF de Estadística solo en Docsity!

EJERCICIOS PROPUESTOS – SESIÓN Nº 8

1. La siguiente tabla presenta los valores de dos muestras aleatorias provenientes de poblaciones normales para comparar el contenido de nicotina de dos marcas de cigarrillos. Suponiendo que los conjuntos de datos provienen de muestras tomadas al azar de poblaciones normales con varianzas desconocidas e iguales. ¿Proveen estos datos suficiente evidencia que permita concluir que las poblaciones muestreadas difieren a la media de contenido de nicotina? Sea α=0.

Solución: caso 2: varianzas desconocidas e iguales. Además, n1+n2=18 <

Datos:

Xi: contenido de nicotina (var. cuantitativa)

n1=

n2=

n1+n2=18 <

Proceso:

1. Plantear la hipótesis

Ho: μ 1 − μ 2 =^0

H1: μ 1 − μ 2 ≠^^0

2. Establecer el nivel de significancia

3. Seleccionar y calcular el estadístico de la prueba

T c =11.

Marca A 3.00 2.90 3.10 3.10 3.00 3.10 3.10 3.00 3.00 2. Marca B 2.69 2.70 2.69 2.65 2.69 2.66 2.70 2.

4. Regla de decisión y conclusión

Si proveen estos datos suficiente evidencia que permita concluir que las poblaciones muestreadas difieren a la media de contenido de nicotina, YA QUE SE RECHAZA LA Ho y se concluye que la media de contenido de nicotina difiere entre la marca y la marca b. La marca que se debe preferir es A o B?

> m1<-mean(ma);m

[1] 3.

> m2<-mean(mb);m

[1] 2.

La marca B se debe preferir debido a que el promedio de nicotina es menor.

Si el p-vaslue < alfa, se rechaza la Ho.

p-value = 3.079e-09=0.000000003079 < 0.05. Por lo tanto, se rechaza la Ho y se concluye que

la media de contenido de nicotina difiere entre la marca y la marca b.

2. Cierto metal se produce, por lo común, mediante un proceso estándar. Se desarrolla un nuevo proceso en el que se añade una aleación a la producción del metal. Los fabricantes se encuentran interesados en estimar la verdadera diferencia entre las tensiones de ruptura de los metales producidos por los dos procesos. Para cada metal se seleccionan 12 ejemplares y cada uno de éstos se somete a una tensión hasta que se rompe. Se asumen varianzas diferentes. La siguiente tabla muestra las tensiones de ruptura de los ejemplares, en kilogramos por centímetro cuadrado: Proceso estánda r 446 401 476 421 459 438 481 411 456 427 459 445 Proceso nuevo 462 448 435 465 429 472 453 459 427 468 452 447 Si se supone que el muestreo se llevó a cabo sobre dos distribuciones normales e independientes ¿ofrecen estos datos suficiente evidencia que permita concluir que la media de la tensión de ruptura del proceso nuevo aumente con respecto a la media de la tensión de ruptura del proceso estándar? Sea α=0.01. 3. Una agencia estatal vigila la calidad del agua para la cría de peces. Esta agencia desea comparar la cantidad media de cierta sustancia tóxica en dos ríos contaminados por desperdicios industriales. Se seleccionaron 11 muestras en un río y 10 muestras en el otro. Los resultados de los análisis fueron: Río A 10 10 12 13 9 8 12 12 10 14 8

Ho: P 1 − P 2 =^0

H 1 : P 1 − P 2 ≠^^0

2. Establecer el nivel de significancia

3. Seleccionar y calcular el estadístico de la prueba

Z= 0.

4. Regla de decisión y conclusión

No es posible concluir que a partir de estos datos que en las poblaciones muestreadas existe diferencia en las proporciones de artículos defectuosos. Por lo tanto, la diferencia no es significativa y se concluye que la calidad de la línea de producción de A es igual a la de B.

Si pv0.05, no se rechaza la Ho

8. Se midieron las concentraciones de contenido de arsénico en dos ciudades mineras por excelencia en 16 muestras en diferentes turnos. Se registraron los siguientes valores: Ciudad A: 15.6, 14.8, 14.4, 16.6, 13.8, 14.0, 17.3, 17.4, 18.6, 16.2, 14.7, 15.7, 16.4, 13.9, 14.8, 17.

Ciudad B: 14.6, 13.8, 15.4, 17.6, 12.8, 13.0, 16.4, 19.2, 17.5, 15.2, 13.7, 16.8, 13.6, 15.9, 15.6, 16. Construya intervalo de confianza de 95% para la Razón de varianza y la razón desviación estándar poblacional. ¿Las varianzas son iguales? Con base a estos datos, ¿es posible concluir que la varianza de contenido de arsénico en la ciudad A es mayor que la varianza de contenido de arsénico en la ciudad B? Sea α=0.

9. En un estudio sobre obesidad se obtuvieron los siguientes resultados a partir de las muestras de hombres y mujeres entre las edades de 20 y 75 años. De una muestra de 150 hombres 21 tuvo sobrepeso y de una muestra de 200 mujeres 48 tuvo sobrepeso ¿Es posible concluir a partir de estos datos que en la población que en las poblaciones muestreadas existe diferencia en las proporciones de individuos con sobrepeso? Sea α=0. 10. Una empresa fabrica y ensambla cortadora de césped, que se envía a comerciantes de un país, se han propuesto dos procedimiento para instalar el motor en el armazón de una cortadora. La pregunta es ¿existe alguna diferencia en el tiempo medio para montar los motores en los armazones de las cortadoras? El primer método fue desarrollado por un empleado de la compañía y el otro lo desarrollo el sub director de ingeniería. Para evaluar los dos métodos propuestos se decidió efectuar un estudio en los tiempos y movimientos. Se consideró una muestra de cinco empleados que utilizaron el método 1 y otra de seis que aplicaron el método dos. Los resultados se muestran a continuación. ¿Existe diferencia en los tiempos medios de montaje? Procedimiento 1: 2 4 9 3 3 2 Procedimiento 2: 3 7 5 8 4 2 11. Veinte muestras de calidad del aire, tomadas antes y después de funcionar las empresas mineras en la región de Ancash, presentaron las siguientes cantidades de partículas suspendidas de materia (microgramos por metro cubico de aire): Antes:58, 32, 33, 22,32,22,38,28,20, 34,18,27,28,33,35,40,69, 64, 47, Después:68, 22, 36, 32,42,24,28,38,30, 44,28,27,28,43,45,50,79, 74, 57, Considere que estas mediciones constituyen muestras aleatorias a partir de dos poblaciones que sigue una distribución normal, con base a estos datos, ¿es posible concluir, con base a estos datos, que la media de la cantidad de partículas suspendidas de materia difiere de la media de la cantidad de partículas suspendidas de materia después de funcionar las empresas mineras? Sea α=0. Datos ejemplo 1 Li<-c(3.15,2.63,2.58,3.91,1.63,2.53,2.05,2.45,2.03,3.09) L2<-c(1.96,2.04,1.75,1.61,1.47,2.02,2.35,0.6,2.26,2.41,2.42) F test to compare two variances data: lb1 and lb F = 1.4866, num df = 9, denom df = 10,

Si el p-value =0.5445 > 0.04, no se rechaza la Ho,

como consecuencia la varianza del nivel de cloro en

el lab1 es igual al del lab2.

Ejemplo 2ª.

Prueba de hipótesis de la t student para poblaciones independientes

Varianzas iguales:

Fuente: https://www.youtube.com/watch?v=YhWSiuK8d9w

Base proteico menseñanz a tiempo A 7 B 9 A 8 B 9 A 9 B 9 A 10 B 9 A 11 B 12 **# cargar el paquete tidyverse install.packages("tidyverse") require(tidyverse) View(protesico1) names(protesico1) str(protesico1)

Convirtiendo menseñanza en var categóricas:

protesico1$menseñanza=factor(protesico1$menseñanza) str(protesico1)

análisis exploratorio**

grafico: ojo el xlim es el rango del

tiempo, el min=7 y max=12. xlim(5,15) cubre

grafico densidad

ggplot(protesico1, aes(tiempo, fill = menseñanza, colors=menseñanza))+ geom_density(alpha=0.2)+ xlim(5,15)

grafico q-q plot

**qqnorm(protesico1$tiempo) qqline(protesico1$tiempo,col="green")

para salir de dudas prueba hip.normalidad

supuesto de normalidad

shapiro.test(protesico1$tiempo)

supuesto de homogeneidad

var.test(tiempo~menseñanza,data=protesico1, alternative="two.sided",conf.level=0.99)**

crear un gráfico de cajas

Objetivo ver si existen diferencias significativas

ggplot(protesico1, aes(menseñanza, tiempo, fill = menseñanza, colors=menseñanza))+ geom_boxplot(alpha=0.8)+ theme(legend.position = "none")

hay un valor atipico 12 en B,

aparentementeno hay diferencia significativa

# tiempo promedio de A y B

protesico1 %>% group_by(menseñanza) %>% summarise(total= n(), tiempopromedio=mean(tiempo))

A=9 y B=9.6, No hay dif signif. Aparentemente

**# Cumple con los supuestos, normalidad y homocedasticidad

prueba t student var. desconocida pero iguales

t.test(tiempo~menseñanza, data=protesico1, paided=F, var.equal=T, mu=0, alternative= "g", conf.level=0.99)**

Prueba de hipótesis de la t student para poblaciones independientes

Varianzas diferentes:

t.test(tiempo~menseñanza, data=protesico1, paided=F, var.equal=F, mu=0, alternative= "t", conf.level=0.99)