
























































































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
matemática para ingeniero2 matemática para ingeniero2 matemática para ingeniero2 matemática para ingeniero2
Tipo: Apuntes
1 / 96
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!

























































































TEORIA DE PEQUEÑAS MUESTRAS Distribución t de student. Intervalo de confianza para una media con varianza desconocida. Prueba de hipótesis sobre la media de una distribución normal, varianza desconocida. Error tipo II. Distribución Ji-cuadrada. Estimación de la varianza. Ensayo de hipótesis para la varianza de una distribución normal. Error tipo II. Distribución Fisher. Intervalo de confianza para el cociente de varianzas de dos distribuciones normales. Ensayo de hipóstesis. Error tipo II. Intervalo de confianza para la diferencia de medias de dos distribuciones normales varianza desconocida. Intervalo de confianza para la diferencia de medias de dos distribuciones normales varianza desconocida pero iguales. Prueba sobre dos medias, poblaciones normales, varianza desconocida pero iguales. Intervalo de confianza para la diferencia de medias de dos distribuciones normales varianzas desconocidas diferentes. Prueba sobre dos medias, poblaciones normales varianzas desconocidas diferentes. Muestras pequeñas dependientes o pruebas pareadas. Ejercicios propuestos.
PRUEBA CHI-CUADRADA Y ESTADISTICA NO PARAMETRICA Ensayo de hipóstesis. Prueba chi-cuadrada para la bondad de ajuste. Tablas de contingencia. Tablas de contingencia para probar homogeneidad. Estadística no paramétrica. Prueba del signo. Prueba del signo para muestras pareadas. Prueba del rango con signa de Wilcoxon. Dos muestras con observaciones pareadas. Aproximación normal para muestras grandes. Ejercicios propuestos.
En las unidades anteriores se manejó el uso de la distribución z, la cual se podía utilizar siempre y cuando los tamaños de las muestras fueran mayores o iguales a 30 ó en muestras más pequeñas si la distribución o las distribuciones de donde proviene la muestra o las muestras son normales.
En esta unidad se podrán utilizar muestras pequeñas siempre y cuando la distribución de donde proviene la muestra tenga un comportamiento normal. Esta es una condición para utilizar las tres distribuciones que se manejarán en esta unidad; t de student, X^2 ji-cuadrada y Fisher.
A la teoría de pequeñas muestras también se le llama teoría exacta del muestreo, ya que también la podemos utilizar con muestras aleatorias de tamaño grande.
En esta unidad se verá un nuevo concepto necesario para poder utilizar a las tres distribuciones mencionadas. Este concepto es “ grados de libertad”.
Para definir grados de libertad se hará referencia a la varianza muestral:
( )
1
1
2 2 −
n
x x s
n
i
i
Esta fórmula está basada en n-1 grados de libertad (degrees of freedom). Esta terminología resulta del hecho de que si bien s^2 está basada en n cantidades x 1 (^) − x , x 2 (^) − x ,... , xn − x ,éstas suman cero, así que especificar los valores de
cualquier n-1 de las cantidades determina el valor restante. Por ejemplo, si n=4 y x 1 (^) − x = 8 ; x (^) 2 − x =− 6 y x (^) 4 − x =− 4 , entonces automáticamente tenemos x (^) 3 − x = 2 , así que sólo tres de los cuatro valores de xi − x están libremente
determinamos 3 grados de libertad.
Entonces, en esta unidad la fórmula de grados de libertad será n-1 y su simbología ν = nu.
DISTRIBUCION “t DE STUDENT”
Supóngase que se toma una muestra de una población normal con media μ y varianza σ^2. Si x es el promedio de las n observaciones que contiene la muestra
aleatoria, entonces la distribución
n
x z σ
− μ = es una distribución normal estándar.
Supóngase que la varianza de la población σ^2 es desconocida. ¿Qué sucede con la distribución de esta estadística si se reemplaza σ por s? La distribución t proporciona la respuesta a esta pregunta.
La distribución de probabilidad de t se publicó por primera vez en 1908 en un artículo de W. S. Gosset. En esa época, Gosset era empleado de una cervecería irlandesa que desaprobaba la publicación de investigaciones de sus empleados. Para evadir esta prohibición, publicó su trabajo en secreto bajo el nombre de “Student”. En consecuencia, la distribución t normalmente se llama distribución t de Student , o simplemente distribución t. Para derivar la ecuación de esta distribución, Gosset supone que las muestras se seleccionan de una población normal. Aunque esto parecería una suposición muy restrictiva, se puede mostrar que las poblaciones no normales que poseen distribuciones en forma casi de campana aún proporcionan valores de t que se aproximan muy de cerca a la distribución t.
La distribución t difiere de la de Z en que la varianza de t depende del tamaño de la muestra y siempre es mayor a uno. Unicamente cuando el tamaño de la muestra tiende a infinito las dos distribuciones serán las mismas.
Se acostumbra representar con tα el valor t por arriba del cual se encuentra un área igual a α. Como la distribución t es simétrica alrededor de una media de cero, tenemos t1-α = -tα; es decir, el valor t que deja un área de 1-α a la derecha y por tanto un área de α a la izquierda, es igual al valor t negativo que deja un área de α en la cola derecha de la distribución. Esto es, t0.95 = -t0.05, t0.99=-t0.01,
etc.
Para encontrar los valores de t se utilizará la tabla de valores críticos de la distribución t del libro Probabilidad y Estadística para Ingenieros de los autores Walpole, Myers y Myers.
Ejemplo: El valor t con ν = 14 grados de libertad que deja un área de 0.025 a la izquierda, y por tanto un área de 0.975 a la derecha, es t0.975=-t0.025 = -2.
Si se observa la tabla, el área sombreada de la curva es de la cola derecha, es por esto que se tiene que hacer la resta de 1-α. La manera de encontrar el valor de t es buscar el valor de α en el primer renglón de la tabla y luego buscar los grados de libertad en la primer columna y donde se intercepten α y ν se
obtendrá el valor de t.
t0.975= -t0.025 = -2.
α = 0.
Ejemplo: Encuentre la probabilidad de –t0.025 < t < t0.05. Solución:
Como t0.05 deja un área de 0.05 a la derecha, y –t0.025 deja un área de 0.025 a la izquierda, encontramos un área total de 1-0.05-0.025 = 0.925. P( –t0.025 < t < t0.05) = 0. Ejemplo: Encuentre k tal que P(k < t < -1.761) = 0.045, para una muestra aleatoria de tamaño 15 que se selecciona de una distribución normal. Solución:
Si se busca en la tabla el valor de t =1.761 con 14 grados de libertad nos damos cuenta que a este valor le corresponde un área de 0.05 a la izquierda, por ser negativo el valor. Entonces si se resta 0.05 y 0.045 se tiene un valor de 0.005, que equivale a α. Luego se busca el valor de 0.005 en el primer renglón con 14 grados de libertad y se obtiene un valor de t = 2.977, pero como el valor de α está en el extremo izquierdo de la curva entonces la respuesta es t = -2.977 por lo tanto: P(-2.977 < t < -1.761) = 0.
Ejemplo: Un ingeniero químico afirma que el rendimiento medio de la población de cierto proceso en lotes es 500 gramos por milímetro de materia prima. Para verificar esta afirmación toma una muestra de 25 lotes cada mes. Si el valor de t calculado cae entre –t0.05 y t0.05, queda satisfecho con su afirmación. ¿Qué conclusión extraería de una muestra que tiene una media de 518 gramos por milímetro y una desviación estándar de 40 gramos? Suponga que la distribución de rendimientos es aproximadamente normal.
Solución:
k t = -1.
α = 0. α = 0.
t
Ejemplos:
Solución: La media muestral y la desviación estándar para los datos dados son: x = 10 y s= 0. En la tabla se encuentra que t0.025=2.447 con 6 grados de libertad, de aquí, el intervalo de confianza de 95% para μ es:
Con un nivel de confianza del 95% se sabe que el promedio del contenido de los contenedores está entre 9.47 y 10.26 litros.
Solución: La media muestral y la desviación estándar para los datos dados son: x =9.8525 y s= 0.
En la tabla se encuentra que t0.025=2.093 con 19 grados de libertad, de aquí, el intervalo de confianza de 95% para μ es:
μ min = 9. 47 μ max = 10. 26
Por lo tanto, se tiene una confianza del 95% de que el tiempo de combustión residual promedio se encuentra entre 9.8073 y 9.8977 segundos.
PRUEBA DE HIPOTESIS SOBRE LA MEDIA DE UNA DISTRIBUCION NORMAL, VARIANZA DESCONOCIDA
Ciertamente sospechamos que las pruebas sobre una media poblacional μ con σ^2 desconocida, debe incluir el uso de la distribución t de Student. La estructura de la prueba es idéntica a la del caso de σ conocida, con la excepción de que el valor σ en la estadística de prueba se reemplaza por la estimación de s
calculada y la distribución normal estándar se reemplaza con una distribución t.
Ejemplos:
Solución:
α = 0.
μ min = 9. 8073 μ max = 9. 8977
tL= -1.796 μ = 46
Ho Región de rechazo
Región de aceptación
H 1
¿Sugieren los datos que la carga promedio de falla es mayor que 10Mpa? Supóngase que la carga donde se presenta la falla tiene una distribución normal, y utilicese α = 0.05. Calcule el valor de P.
Solución:
Datos: μ= 10 s = 3. x = 13. n = 22 α = 0.
Ensayo de hipótesis Ho; μ = 10 H 1 ; μ > 10
Regla de decisión: Si tR≤ 1.721 no se rechaza Ho. Si tR> 1.721 se rechaza Ho.
Cálculos:
90 22
n
s
x t (^) R R
μ
Existe otra manera de resolver este ejercicio, tomando la decisión en base al estadístico real, en este caso la media de la muestra. De la fórmula de la distribución muestral de medias se despeja la media de la muestra:
α = 0.
tL = 1. μ = 10
Región de rechazo
Región de aceptación
Ho
H 1
n
s
x t (^) L L
− μ = (^11). 30 22
n
ts x (^) L μ l
Regla de decisión: Si xR ≤ 11.30 No se rechaza Ho
Si xR > 11.30 Se rechaza Ho
Como la media de la muestral es de 13.71 MPa y es mayor al valor de la media muestral límite de 11.30 por lo tanto se rechaza Ho y se llega a la misma conclusión.
Para calcular el valor de P se va a la tabla y se busca en 21 grados de libertad el valor de t = 4.90. Se obseva que el valor mayor de t que se encuentra en la tabla con 21 grados de libertad es de 3.819 el cual le corresponde un área a la derecha de 0.0005, por lo que para el valor de 4.90 el valor de P es practicamente cero , y esto apoya la decisión de rechazar Ho.
Solución:
μ = 10 xL = 11. 30
α = 0.
Región de rechazo
Región de aceptación
Ho
H 1
tL= -2. μ = 14
Ho
α/2 = 0.
Región de rechazo
Región de aceptación
H 1 H 1 Región de Rechazo α/2 = 0.
tL= 2.
El error tipo II se calcula de la misma forma en la que se calculó con la distribución z. Se realizarán algunos ejercicios en los cuales se determinará la probabilidad de cometer el error tipo II, utilizando la tabla de la distribución.
Existen curvas características de operación en los libros con diferentes grados de libertad para determinar los tamaños de muestra correspondientes según el grado de error que se quiera, recordando que entre mayor sea el tamaño de muestra menor será el error.
Solución:
Datos: μ= 1.5 volts. s= 0.21 volts x = 1.4 volts. n = 15 α = 0.
Ensayo de hipótesis Ho; μ = 1.5 volts H 1 ; μ < 1.5 volts
Regla de decisión: Si tR ≥ -2.624 No se rechaza Ho Si tR < -2.624 Se rechaza Ho
Cálculos:
84 15
n
s
x t (^) R R
μ
Para calcular el error tipo II se tiene que obtener el valor de xl de la siguiente
forma:
n
ts x (^) L μ l
α = 0.
tL= -2.624 μ = 1.
Ho Región de rechazo
Región de aceptación
H 1
t =
Para encontrar el valor de β se busca en la tabla de la distribución t el valor de
1.05 con 14 grados de libertad. Como este valor no se encuentra en la tabla se interpola entre 0.868 y 1.076 con un área de 0.20 y 0.15 respectivamente. Al interpolar se obtiene un área de 0.15612 y esta es la probabilidad de cometer el error tipoII cuando la media verdadera es de 1.3 volts y un tamaño de muestra de 15.
Solución: Primero se calculan los valores de x (^) l :
n
ts x (^) L μ l 12.98 y 15.
μ = 1.
xl = 1. 357
α = 0.
μ = 1.
Ho Región de rechazo
Región de aceptación
H 1
β=0.
μ = 14
Ho
α/2 = 0.
Región de rechazo
Región de aceptación
H 1 H 1 Región de Rechazo α/2 = 0.
xL = 15. 01
t =
En realidad la distribución ji-cuadrada es la distribución muestral de s^2. O sea que si se extraen todas las muestras posibles de una población normal y a cada muestra se le calcula su varianza, se obtendrá la distribución muestral de varianzas.
Para estimar la varianza poblacional o la desviación estándar, se necesita conocer el estadístico X^2. Si se elige una muestra de tamaño n de una población normal con varianza σ^2 , el estadístico:
2
σ
n − s
tiene una distribución muestral que es una distribución ji-cuadrada con gl=n- grados de libertad y se denota X^2 (X es la minúscula de la letra griega ji). El estadístico ji-cuadrada esta dado por:
2
2 2 (^1 ) σ
n s X
donde n es el tamaño de la muestra, s^2 la varianza muestral y σ^2 la varianza de
la población de donde se extrajo la muestra. El estadístico ji-cuadrada también se puede dar con la siguiente expresión:
2
2 2 ( ) σ
x x X
∑
Propiedades de las distribuciones ji-cuadrada
La siguiente figura ilustra tres distribuciones X^2. Note que el valor modal aparece en el valor (n-3) = (gl-2).
gl= gl=
1 2 3 4 5 6 7 8 9 10 11 12 13 14
gl=
El valor de 32 se busca adentro de la tabla en el renglón de 16 grados de libertad y se encuentra que a este valor le corresponde un área a la derecha de 0.01. En consecuencia, el valor de la probabilidad es P(s^2 >2)
b) Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una población normal con varianza σ^2 =6, tenga una varianza muestral: a) Mayor que 9. b) Entre 3.462 y 10.
Solución. a) Primero se procederá a calcular el valor de la ji-cuadrada:
2
2 (^2) = − = − = σ
n s X
Al buscar este número en el renglón de 24 grados de libertad nos da un área a la derecha de 0.05. Por lo que la P(s^2 >9.1) = 0.
b) Se calcularán dos valores de ji-cuadrada:
2
2 (^2) = − = − = σ
n s X y 42. 98 6
Aquí se tienen que buscar los dos valores en el renglón de 24 grados de libertad. Al buscar el valor de 13.846 se encuentra un área a la derecha de 0.95. El valor de 42.98 da un área a la derecha de 0.01. Como se está pidiendo la probabilidad entre dos valores se resta el área de 0.95 menos 0.01 quedando 0.94. Por lo tanto la P(3.462 ≤ s^2 ≤ 10.745) = 0.
0 X^2 =
α=0.
0 X^2 =42.
α=0.
0 X^2 =13.
α=0.
X^2 =13.84 X (^2) = 0
Estimación de la Varianza Para poder estimar la varianza de una población normal se utilizará la distribución ji-cuadrada.
2
2 2 (^1 ) σ
n s X
Al despejar esta fórmula la varianza poblacional nos queda:
2
2 2 (^1 ) X
n − s σ =
Los valores de X^2 dependerán de nivel de confianza que se quiera al cual le llamamos 1-α. Si nos ubicamos en la gráfica se tiene:
Ejemplos:
Solución: Primero se calcula la desviación estándar de la muestra:
( ) (^) ( ) ( )
−
= ∑^ n
x x s i
al elevar este resultado al cuadrado se obtiene la varianza de la muestra s^2 = 0.286.
Para obtener un intervalo de confianza de 95% se elige un α= 0.05. Despues con el uso de la tabla con 9 grados de libertad se obtienen los valores de X^2.
X^2 1-α/2 X^2 α/
1-α
α/
α/
X^2 (0.975,9)= 2.7 X^2 (0.025,9)= 19.
1-α
α/2=0.
α/2= 0.