Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Matematica - Matemática, Apuntes de Matemáticas

matemática para ingeniero2 matemática para ingeniero2 matemática para ingeniero2 matemática para ingeniero2

Tipo: Apuntes

2020/2021

Subido el 21/07/2021

walter-diaz-5
walter-diaz-5 🇵🇪

1 documento

1 / 96

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
UNIDAD III
TEORIA DE PEQUEÑAS MUESTRAS
Distribución t de student.
Intervalo de confianza para una media con varianza desconocida.
Prueba de hipótesis sobre la media de una distribución normal, varianza desconocida.
Error tipo II.
Distribución Ji-cuadrada.
Estimación de la varianza.
Ensayo de hipótesis para la varianza de una distribución normal.
Error tipo II.
Distribución Fisher.
Intervalo de confianza para el cociente de varianzas de dos distribuciones normales.
Ensayo de hipóstesis.
Error tipo II.
Intervalo de confianza para la diferencia de medias de dos distribuciones normales varianza desconocida.
Intervalo de confianza para la diferencia de medias de dos distribuciones normales varianza
desconocida pero iguales.
Prueba sobre dos medias, poblaciones normales, varianza desconocida pero iguales.
Intervalo de confianza para la diferencia de medias de dos distribuciones normales varianzas
desconocidas diferentes.
Prueba sobre dos medias, poblaciones normales varianzas desconocidas diferentes.
Muestras pequeñas dependientes o pruebas pareadas.
Ejercicios propuestos.
UNIDAD IV
PRUEBA CHI-CUADRADA Y ESTADISTICA NO PARAMETRICA
Ensayo de hipóstesis.
Prueba chi-cuadrada para la bondad de ajuste.
Tablas de contingencia.
Tablas de contingencia para probar homogeneidad.
Estadística no paramétrica.
Prueba del signo.
Prueba del signo para muestras pareadas.
Prueba del rango con signa de Wilcoxon.
Dos muestras con observaciones pareadas.
Aproximación normal para muestras grandes.
Ejercicios propuestos.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60

Vista previa parcial del texto

¡Descarga Matematica - Matemática y más Apuntes en PDF de Matemáticas solo en Docsity!

UNIDAD III

TEORIA DE PEQUEÑAS MUESTRAS Distribución t de student. Intervalo de confianza para una media con varianza desconocida. Prueba de hipótesis sobre la media de una distribución normal, varianza desconocida. Error tipo II. Distribución Ji-cuadrada. Estimación de la varianza. Ensayo de hipótesis para la varianza de una distribución normal. Error tipo II. Distribución Fisher. Intervalo de confianza para el cociente de varianzas de dos distribuciones normales. Ensayo de hipóstesis. Error tipo II. Intervalo de confianza para la diferencia de medias de dos distribuciones normales varianza desconocida. Intervalo de confianza para la diferencia de medias de dos distribuciones normales varianza desconocida pero iguales. Prueba sobre dos medias, poblaciones normales, varianza desconocida pero iguales. Intervalo de confianza para la diferencia de medias de dos distribuciones normales varianzas desconocidas diferentes. Prueba sobre dos medias, poblaciones normales varianzas desconocidas diferentes. Muestras pequeñas dependientes o pruebas pareadas. Ejercicios propuestos.

UNIDAD IV

PRUEBA CHI-CUADRADA Y ESTADISTICA NO PARAMETRICA Ensayo de hipóstesis. Prueba chi-cuadrada para la bondad de ajuste. Tablas de contingencia. Tablas de contingencia para probar homogeneidad. Estadística no paramétrica. Prueba del signo. Prueba del signo para muestras pareadas. Prueba del rango con signa de Wilcoxon. Dos muestras con observaciones pareadas. Aproximación normal para muestras grandes. Ejercicios propuestos.

Unidad III

TEORIA DE PEQUEÑAS MUESTRAS O TEORIA EXACTA DEL MUESTREO

En las unidades anteriores se manejó el uso de la distribución z, la cual se podía utilizar siempre y cuando los tamaños de las muestras fueran mayores o iguales a 30 ó en muestras más pequeñas si la distribución o las distribuciones de donde proviene la muestra o las muestras son normales.

En esta unidad se podrán utilizar muestras pequeñas siempre y cuando la distribución de donde proviene la muestra tenga un comportamiento normal. Esta es una condición para utilizar las tres distribuciones que se manejarán en esta unidad; t de student, X^2 ji-cuadrada y Fisher.

A la teoría de pequeñas muestras también se le llama teoría exacta del muestreo, ya que también la podemos utilizar con muestras aleatorias de tamaño grande.

En esta unidad se verá un nuevo concepto necesario para poder utilizar a las tres distribuciones mencionadas. Este concepto es “ grados de libertad”.

Para definir grados de libertad se hará referencia a la varianza muestral:

( )

1

1

2 2 −

n

x x s

n

i

i

Esta fórmula está basada en n-1 grados de libertad (degrees of freedom). Esta terminología resulta del hecho de que si bien s^2 está basada en n cantidades x 1 (^) − x , x 2 (^) − x ,... , xnx ,éstas suman cero, así que especificar los valores de

cualquier n-1 de las cantidades determina el valor restante. Por ejemplo, si n=4 y x 1 (^) − x = 8 ; x (^) 2 − x =− 6 y x (^) 4 − x =− 4 , entonces automáticamente tenemos x (^) 3 − x = 2 , así que sólo tres de los cuatro valores de xix están libremente

determinamos 3 grados de libertad.

Entonces, en esta unidad la fórmula de grados de libertad será n-1 y su simbología ν = nu.

DISTRIBUCION “t DE STUDENT”

Supóngase que se toma una muestra de una población normal con media μ y varianza σ^2. Si x es el promedio de las n observaciones que contiene la muestra

aleatoria, entonces la distribución

n

x z σ

μ = es una distribución normal estándar.

Supóngase que la varianza de la población σ^2 es desconocida. ¿Qué sucede con la distribución de esta estadística si se reemplaza σ por s? La distribución t proporciona la respuesta a esta pregunta.

La distribución de probabilidad de t se publicó por primera vez en 1908 en un artículo de W. S. Gosset. En esa época, Gosset era empleado de una cervecería irlandesa que desaprobaba la publicación de investigaciones de sus empleados. Para evadir esta prohibición, publicó su trabajo en secreto bajo el nombre de “Student”. En consecuencia, la distribución t normalmente se llama distribución t de Student , o simplemente distribución t. Para derivar la ecuación de esta distribución, Gosset supone que las muestras se seleccionan de una población normal. Aunque esto parecería una suposición muy restrictiva, se puede mostrar que las poblaciones no normales que poseen distribuciones en forma casi de campana aún proporcionan valores de t que se aproximan muy de cerca a la distribución t.

La distribución t difiere de la de Z en que la varianza de t depende del tamaño de la muestra y siempre es mayor a uno. Unicamente cuando el tamaño de la muestra tiende a infinito las dos distribuciones serán las mismas.

Se acostumbra representar con tα el valor t por arriba del cual se encuentra un área igual a α. Como la distribución t es simétrica alrededor de una media de cero, tenemos t1-α = -tα; es decir, el valor t que deja un área de 1-α a la derecha y por tanto un área de α a la izquierda, es igual al valor t negativo que deja un área de α en la cola derecha de la distribución. Esto es, t0.95 = -t0.05, t0.99=-t0.01,

etc.

Para encontrar los valores de t se utilizará la tabla de valores críticos de la distribución t del libro Probabilidad y Estadística para Ingenieros de los autores Walpole, Myers y Myers.

Ejemplo: El valor t con ν = 14 grados de libertad que deja un área de 0.025 a la izquierda, y por tanto un área de 0.975 a la derecha, es t0.975=-t0.025 = -2.

Si se observa la tabla, el área sombreada de la curva es de la cola derecha, es por esto que se tiene que hacer la resta de 1-α. La manera de encontrar el valor de t es buscar el valor de α en el primer renglón de la tabla y luego buscar los grados de libertad en la primer columna y donde se intercepten α y ν se

obtendrá el valor de t.

t0.975= -t0.025 = -2.

α = 0.

Ejemplo: Encuentre la probabilidad de –t0.025 < t < t0.05. Solución:

Como t0.05 deja un área de 0.05 a la derecha, y –t0.025 deja un área de 0.025 a la izquierda, encontramos un área total de 1-0.05-0.025 = 0.925. P( –t0.025 < t < t0.05) = 0. Ejemplo: Encuentre k tal que P(k < t < -1.761) = 0.045, para una muestra aleatoria de tamaño 15 que se selecciona de una distribución normal. Solución:

Si se busca en la tabla el valor de t =1.761 con 14 grados de libertad nos damos cuenta que a este valor le corresponde un área de 0.05 a la izquierda, por ser negativo el valor. Entonces si se resta 0.05 y 0.045 se tiene un valor de 0.005, que equivale a α. Luego se busca el valor de 0.005 en el primer renglón con 14 grados de libertad y se obtiene un valor de t = 2.977, pero como el valor de α está en el extremo izquierdo de la curva entonces la respuesta es t = -2.977 por lo tanto: P(-2.977 < t < -1.761) = 0.

Ejemplo: Un ingeniero químico afirma que el rendimiento medio de la población de cierto proceso en lotes es 500 gramos por milímetro de materia prima. Para verificar esta afirmación toma una muestra de 25 lotes cada mes. Si el valor de t calculado cae entre –t0.05 y t0.05, queda satisfecho con su afirmación. ¿Qué conclusión extraería de una muestra que tiene una media de 518 gramos por milímetro y una desviación estándar de 40 gramos? Suponga que la distribución de rendimientos es aproximadamente normal.

Solución:

k t = -1.

α = 0. α = 0.

t

Ejemplos:

  1. El contenido de siete contenedores similares de ácido sulfúrico son 9.8, 10.2, 10.4, 9.8, 10.0, 10.2, y 9.6 litros. Encuentre un intervalo de confianza del 95% para la media de todos los contenedores si se supone una distribución aproximadamente normal.

Solución: La media muestral y la desviación estándar para los datos dados son: x = 10 y s= 0. En la tabla se encuentra que t0.025=2.447 con 6 grados de libertad, de aquí, el intervalo de confianza de 95% para μ es:

  1. 0 ( 2. 477 ) μ

Con un nivel de confianza del 95% se sabe que el promedio del contenido de los contenedores está entre 9.47 y 10.26 litros.

  1. Un artículo publicado en el Journal of Testing and Evaluation presenta las siguientes 20 mediciones del tiempo de combustión residual en segundos de especímenes tratados de ropa de dormir para niños: 9.85 9.93 9.75 9.77 9. 9.87 9.67 9.94 9.85 9. 9.83 9.92 9.74 9.99 9. 9.95 9.95 9.93 9.92 9. Se desea encontrar un nivel de confianza del 95% para el tiempo de combustión residual promedio. Supóngase que el tiempo de combustión residual sigue una distribución normal.

Solución: La media muestral y la desviación estándar para los datos dados son: x =9.8525 y s= 0.

En la tabla se encuentra que t0.025=2.093 con 19 grados de libertad, de aquí, el intervalo de confianza de 95% para μ es:

  1. 8525 ( 2. 093 ) μ

μ min = 9. 47 μ max = 10. 26

Por lo tanto, se tiene una confianza del 95% de que el tiempo de combustión residual promedio se encuentra entre 9.8073 y 9.8977 segundos.

PRUEBA DE HIPOTESIS SOBRE LA MEDIA DE UNA DISTRIBUCION NORMAL, VARIANZA DESCONOCIDA

Ciertamente sospechamos que las pruebas sobre una media poblacional μ con σ^2 desconocida, debe incluir el uso de la distribución t de Student. La estructura de la prueba es idéntica a la del caso de σ conocida, con la excepción de que el valor σ en la estadística de prueba se reemplaza por la estimación de s

calculada y la distribución normal estándar se reemplaza con una distribución t.

Ejemplos:

  1. El Instituto Eléctrico Edison publica cifras del número anual de Kilowatt-hora que gastan varios aparatos eléctrodomésticos. Se afirma que una aspiradora gasta un promedio de 46 kilowatt-hora al año. Si una muestra aleatoria de 12 hogares que se incluye en un estudio planeado indica que las aspiradoras gastan un promedio de 42 kilowatt-hora al año con una desviación estándar de11.9 kilowatt-hora, ¿esto sugiere con un nivel de significancia de 0.05 que las aspiradoras gastan, en promedio, menos de 46 kilowatt-hora anualmente? Suponga que la población de kilowatt-hora es normal.

Solución:

  1. Datos: μ= 46 kilowatt-hora s= 11.9 kilowatt-hora x = 42 kilowatt-hora n = 12 α = 0.
  2. Ensayo de hipótesis Ho; μ = 46 kilowatt-hora H 1 ; μ < 46 kilowatt-hora
  3. Regla de decisión: Si tR ≥ -1.796 No se rechaza Ho Si tR < -1.796 Se rechaza Ho
  4. Cálculos:

α = 0.

μ min = 9. 8073 μ max = 9. 8977

tL= -1.796 μ = 46

Ho Región de rechazo

Región de aceptación

H 1

¿Sugieren los datos que la carga promedio de falla es mayor que 10Mpa? Supóngase que la carga donde se presenta la falla tiene una distribución normal, y utilicese α = 0.05. Calcule el valor de P.

Solución:

  1. Datos: μ= 10 s = 3. x = 13. n = 22 α = 0.

  2. Ensayo de hipótesis Ho; μ = 10 H 1 ; μ > 10

  3. Regla de decisión: Si tR≤ 1.721 no se rechaza Ho. Si tR> 1.721 se rechaza Ho.

  4. Cálculos:

  5. 90 22

n

s

x t (^) R R

μ

  1. Justificación y decisión. Como 4.90 >1.721 se rechaza Ho y se concluye con un nivel de significancia del 0.05 que la carga de falla promedio es mayor que 10Mpa.

Existe otra manera de resolver este ejercicio, tomando la decisión en base al estadístico real, en este caso la media de la muestra. De la fórmula de la distribución muestral de medias se despeja la media de la muestra:

α = 0.

tL = 1. μ = 10

Región de rechazo

Región de aceptación

Ho

H 1

n

s

x t (^) L L

μ = (^11). 30 22

n

ts x (^) L μ l

Regla de decisión: Si xR ≤ 11.30 No se rechaza Ho

Si xR > 11.30 Se rechaza Ho

Como la media de la muestral es de 13.71 MPa y es mayor al valor de la media muestral límite de 11.30 por lo tanto se rechaza Ho y se llega a la misma conclusión.

Para calcular el valor de P se va a la tabla y se busca en 21 grados de libertad el valor de t = 4.90. Se obseva que el valor mayor de t que se encuentra en la tabla con 21 grados de libertad es de 3.819 el cual le corresponde un área a la derecha de 0.0005, por lo que para el valor de 4.90 el valor de P es practicamente cero , y esto apoya la decisión de rechazar Ho.

  1. Los pesos en libras de una muestra aleatoria de bebés de seis meses son: 14.6, 12.5, 15.3, 16.1, 14.4, 12.9, 13.7 y 14.9. Haga una prueba con nivel de 5% de significancia para determinar si el peso promedio de todos los bebés de seis meses es distinto a 14 libras, suponga que sus pesos se distribuyen normalmente y calcule el valor de P.

Solución:

  1. Datos: μ= 14 libras s = 1.21 libras x = 14.3 libras n = 8 α = 0.
  2. Ensayo de hipótesis Ho; μ = 14 libras H 1 ; μ ≠ 14 libras
  3. Regla de Decisión: Si –2.365≤ tR≤ 2.365 No se rechaza Ho

μ = 10 xL = 11. 30

α = 0.

Región de rechazo

Región de aceptación

Ho

H 1

tL= -2. μ = 14

Ho

α/2 = 0.

Región de rechazo

Región de aceptación

H 1 H 1 Región de Rechazo α/2 = 0.

tL= 2.

El error tipo II se calcula de la misma forma en la que se calculó con la distribución z. Se realizarán algunos ejercicios en los cuales se determinará la probabilidad de cometer el error tipo II, utilizando la tabla de la distribución.

Existen curvas características de operación en los libros con diferentes grados de libertad para determinar los tamaños de muestra correspondientes según el grado de error que se quiera, recordando que entre mayor sea el tamaño de muestra menor será el error.

  1. Se sabe que los voltajes de una marca de pilas tamaño C se distribuyen normalmente, se probó una muestra aleatoria de 15 y se encontró que la media es de 1.4 volts con una desviación estándar de 0.21 volts. En el nivel de significancia de 0.01: a) ¿Indica esto que la media de los voltajes es menor que 1.5 volts? b) Calcular la probabilidad de cometer el error tipo II si el voltaje promedio real de las pilas es de 1.3 volts.

Solución:

  1. Datos: μ= 1.5 volts. s= 0.21 volts x = 1.4 volts. n = 15 α = 0.

  2. Ensayo de hipótesis Ho; μ = 1.5 volts H 1 ; μ < 1.5 volts

  3. Regla de decisión: Si tR ≥ -2.624 No se rechaza Ho Si tR < -2.624 Se rechaza Ho

  4. Cálculos:

  5. 84 15

n

s

x t (^) R R

μ

  1. Justificación y decisión: Como –1.84 > -2.624, por lo tanto no se rechaza Ho y se concluye con un nivel de significancia del 0.01 que los voltajes de las pilas tamaño C no son menores a 1.5.

Para calcular el error tipo II se tiene que obtener el valor de xl de la siguiente

forma:

  1. 357 15

n

ts x (^) L μ l

α = 0.

tL= -2.624 μ = 1.

Ho Región de rechazo

Región de aceptación

H 1

t =

Para encontrar el valor de β se busca en la tabla de la distribución t el valor de

1.05 con 14 grados de libertad. Como este valor no se encuentra en la tabla se interpola entre 0.868 y 1.076 con un área de 0.20 y 0.15 respectivamente. Al interpolar se obtiene un área de 0.15612 y esta es la probabilidad de cometer el error tipoII cuando la media verdadera es de 1.3 volts y un tamaño de muestra de 15.

  1. Para el ejercicio del peso de los bebés de 6 meses, calcular el error tipo II, si los pesos verdaderos hubieran sido de 11 y 14.5 libras.

Solución: Primero se calculan los valores de x (^) l :

n

ts x (^) L μ l 12.98 y 15.

μ = 1.

xl = 1. 357

α = 0.

μ = 1.

Ho Región de rechazo

Región de aceptación

H 1

β=0.

μ = 14

Ho

α/2 = 0.

Región de rechazo

Región de aceptación

H 1 H 1 Región de Rechazo α/2 = 0.

xL = 15. 01

t =

DISTRIBUCION JI-CUADRADA (X^2 )

En realidad la distribución ji-cuadrada es la distribución muestral de s^2. O sea que si se extraen todas las muestras posibles de una población normal y a cada muestra se le calcula su varianza, se obtendrá la distribución muestral de varianzas.

Para estimar la varianza poblacional o la desviación estándar, se necesita conocer el estadístico X^2. Si se elige una muestra de tamaño n de una población normal con varianza σ^2 , el estadístico:

2

( 1 )^2

σ

ns

tiene una distribución muestral que es una distribución ji-cuadrada con gl=n- grados de libertad y se denota X^2 (X es la minúscula de la letra griega ji). El estadístico ji-cuadrada esta dado por:

2

2 2 (^1 ) σ

n s X

donde n es el tamaño de la muestra, s^2 la varianza muestral y σ^2 la varianza de

la población de donde se extrajo la muestra. El estadístico ji-cuadrada también se puede dar con la siguiente expresión:

2

2 2 ( ) σ

x x X

Propiedades de las distribuciones ji-cuadrada

  1. Los valores de X^2 son mayores o iguales que 0.
  2. La forma de una distribución X^2 depende del gl=n-1. En consecuencia, hay un número infinito de distribuciones X^2.
  3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
  4. Las distribuciones X^2 no son simétricas. Tienen colas estrechas que se extienden a la derecha; esto es, están sesgadas a la derecha.
  5. Cuando n>2, la media de una distribución X^2 es n-1 y la varianza es 2(n-1).
  6. El valor modal de una distribución X^2 se da en el valor (n-3).

La siguiente figura ilustra tres distribuciones X^2. Note que el valor modal aparece en el valor (n-3) = (gl-2).

gl= gl=

1 2 3 4 5 6 7 8 9 10 11 12 13 14

gl=

El valor de 32 se busca adentro de la tabla en el renglón de 16 grados de libertad y se encuentra que a este valor le corresponde un área a la derecha de 0.01. En consecuencia, el valor de la probabilidad es P(s^2 >2)

b) Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una población normal con varianza σ^2 =6, tenga una varianza muestral: a) Mayor que 9. b) Entre 3.462 y 10.

Solución. a) Primero se procederá a calcular el valor de la ji-cuadrada:

  1. 4 6

2

2 (^2) = − = − = σ

n s X

Al buscar este número en el renglón de 24 grados de libertad nos da un área a la derecha de 0.05. Por lo que la P(s^2 >9.1) = 0.

b) Se calcularán dos valores de ji-cuadrada:

  1. 847 6

2

2 (^2) = − = − = σ

n s X y 42. 98 6

2 (^251 )(^10.^745 )

X =

Aquí se tienen que buscar los dos valores en el renglón de 24 grados de libertad. Al buscar el valor de 13.846 se encuentra un área a la derecha de 0.95. El valor de 42.98 da un área a la derecha de 0.01. Como se está pidiendo la probabilidad entre dos valores se resta el área de 0.95 menos 0.01 quedando 0.94. Por lo tanto la P(3.462 ≤ s^2 ≤ 10.745) = 0.

0 X^2 =

α=0.

0 X^2 =42.

α=0.

0 X^2 =13.

α=0.

X^2 =13.84 X (^2) = 0

Estimación de la Varianza Para poder estimar la varianza de una población normal se utilizará la distribución ji-cuadrada.

2

2 2 (^1 ) σ

n s X

Al despejar esta fórmula la varianza poblacional nos queda:

2

2 2 (^1 ) X

ns σ =

Los valores de X^2 dependerán de nivel de confianza que se quiera al cual le llamamos 1-α. Si nos ubicamos en la gráfica se tiene:

Ejemplos:

  1. Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de pasto distribuidas por cierta compañía: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2 y 46. Encuentre un intervalo de confianza de 95% para la varianza de todos los paquetes de semillas de pasto que distribuye esta compañía, suponga una población normal.

Solución: Primero se calcula la desviación estándar de la muestra:

( ) (^) ( ) ( )

  1. 5347 10 1

(^2222)

= ∑^ n

x x s i

al elevar este resultado al cuadrado se obtiene la varianza de la muestra s^2 = 0.286.

Para obtener un intervalo de confianza de 95% se elige un α= 0.05. Despues con el uso de la tabla con 9 grados de libertad se obtienen los valores de X^2.

X^2 1-α/2 X^2 α/

1-α

α/

α/

X^2 (0.975,9)= 2.7 X^2 (0.025,9)= 19.

1-α

α/2=0.

α/2= 0.