












Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Estadistica empresarial, Profesor: , Carrera: Turismo + Administración y Dirección de Empresas, Universidad: URJC
Tipo: Ejercicios
1 / 20
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!













En oferta
Proyecto e-Math 1
Autores: Juan Francisco Monge Ivars ([email protected]), Ángel A. Juan Pérez ([email protected])
Prueba CHI-CUADRADO
Prueba de Bondad del Ajuste
Prueba de Homogeneidad Prueba de Independencia
Proyecto e-Math 2
El objetivo de este e-block es el estudio de varias cuestiones en relación con v.a. cualitativas ó cuantitativas cuyos datos están recogidos en forma de tabla de frecuencias. El denominador común a todas ellas es que su tratamiento estadístico está basado en la misma distribución teórica: la distribución χ^2 (chi-cuadrado ó ji-cuadrado). En esencia se van a abordar tres tipos de problemas:
a) Prueba de Bondad de Ajuste, consiste en determinar si los datos de cierta muestra corresponden a cierta distribución poblacional. En este caso es necesario que los valores de la variable en la muestra y sobre la cual queremos realizar la inferencia esté dividida en clases de ocurrencia, o equivalentemente, sea cual sea la variable de estudio, deberemos categorizar los datos asignado sus valores a diferentes clases o grupos.
b) Prueba de Homogeneidad de varias muestras cualitativas, consiste en comprobar si varias muestras de una carácter cualitativo proceden de la misma población (por ejemplo: ¿estas tres muestras de alumnos provienen de poblaciones con igual distribución de aprobados?. Es necesario que las dos variables medibles estén representadas mediante categorías con las cuales construiremos una tabla de contingencia.
c) Prueba de Independencia, consistente en comprobar si dos características cualitativas están relacionadas entre sí (por ejemplo: ¿el color de ojos está relacionado con el color de los cabellos?). Aunque conceptualmente difiere del anterior, operativamente proporciona los mismos resultados. Este tipo de contrastes se aplica cuando deseamos comparar una variable en dos situaciones o poblaciones diferentes, i.e., deseamos estudiar si existen diferencias en las dos poblaciones respecto a la variable de estudio.
Este math-block supone ciertos conocimientos básicos de estadística (inferencia y probabilidad), así como conocimientos básicos del software estadístico MINITAB.
Proyecto e-Math 4
PRUEBA DE BONDAD DE AJUSTE
Estamos interesados en determinar si los datos disponibles de una muestra aleatoria simple de tamaño n corresponden a cierta distribución teórica. El primer paso a realizar consiste en descomponer el recorrido de la distribución teórica en un número finito de subconjuntos: A 1 , A 2 , ..., Ak. Después, clasificar las observaciones muestrales, según el subconjunto a que pertenezcan. Y, por último, comparar las frecuencias observadas de cada A (^) i con las probabilidades que les corresponderían con la distribución teórica a contrastar.
Supongamos que tenemos un número k de clases en las cuales se han ido registrado un total de n observaciones (n será pues el tamaño muestral). Denotaremos las frecuencias observadas en cada clase por O 1 , O 2 , ..., O (^) k (O (^) i es el número de valores en la clase A (^) i ). Se cumplirá:
O 1 + O 2 + ... + O (^) k = n
Lo que queremos es comparar las frecuencias observadas con las frecuencias esperadas (teóricas), a las que denotaremos por E 1 , E 2 , ..., E (^) k. Se cumplirá:
E 1 + E 2 + ... + E (^) k = n
Se tratará ahora de decidir si las frecuencias observadas están o no en concordancia con las frecuencias esperadas (es decir, si el número de resultados observados en cada clase corresponde
Proyecto e-Math 5
aproximadamente al número esperado). Para comprobarlo, haremos uso de un contraste de hipótesis usando la distribución Chi-cuadrado:
El estadístico de contraste será
( )
=
χ =
k
i 1 i
2 2 i i E
Observar que este valor será la suma de k números no negativos. El numerador de cada término es la diferencia entre la frecuencia observada y la frecuencia esperada. Por tanto, cuanto más cerca estén entre sí ambos valores más pequeño será el numerador, y viceversa. El denominador permite relativizar el tamaño del numerador.
Las ideas anteriores sugieren que, cuanto menor sean el valor del estadístico χ^2 ∗^ , más coherentes
serán las observaciones obtenidas con los valores esperados. Por el contrario, valores grandes de este estadístico indicarán falta de concordancia entre las observaciones y lo esperado. En este tipo de contraste se suele rechazar la hipótesis nula (los valores observados son coherentes con los esperados) cuando el estadístico es mayor que un determinado valor crítico.
Notas:
(1) El valor del estadístico χ^2 ∗^ se podrá aproximar por una distribución Chi-cuadrado cuando el tamaño muestral n sea grande (n > 30), y todas las frecuencias esperadas sean iguales o mayores a 5 (en ocasiones deberemos agrupar varias categorías a fin de que se cumpla este requisito).
(2) Las observaciones son obtenidas mediante muestreo aleatorio a partir de una población particionada en categorías.
Un experimento multinomial es la generalización de un experimento binomial:
En ocasiones estaremos interesados en comparar los resultados obtenidos al realizar un experimento multinomial con los resultados esperados (teóricos). Ello nos permitirá saber si nuestro modelo teórico se ajusta bien o no a las observaciones. Para ello, recurriremos a la distribución Chi-cuadrado, la cual nos permitirá realizar un contraste sobre la bondad del ajuste.
Concretamente, usaremos el estadístico
( )
=
χ =
k
i 1 i
2 2 i i E
con k – 1 grados de libertad.
Podemos calcular cada frecuencia esperada (teórica) multiplicando el número total de pruebas n por la probabilidad de ocurrencia asociada, es decir:
Ei = n * p (^) i i = 1, ..., k
Proyecto e-Math 7
Si el dado estuviera equilibrado, en el resultado de lanzarlo sucesivamente se deberían obtener aproximadamente el mismo número de veces cada una de las caras del dado. En este ejercicio debemos contrastar si la distribución del dado es una distribución uniforme, con probabilidad de obtener cada una de las caras igual a 1/6.
Podemos calcular de una forma muy sencilla el número esperado de resultados obtenidos en cada clase multiplicando la probabilidad de obtener cada una de las caras (p = 1/6) por el número de lanzamientos (n = 100).
Podemos observa que los valores observados y esperados no parecen coincidir, por lo tanto, a priori
parece haber evidencias de irregularidades en el dado. Calculemos el estadístico χ 2 con ayuda del
Calculator de MINITAB.
Proyecto e-Math 8
Calc > Calculator
Proyecto e-Math 10
Chi-Square with 5 DF
x P( X <= x) 6,4675 0,
Así pues, p-valor = 1 – 0,7367 = 0, 2633. Por tanto, podemos considerar que el p-valor no es significativo. Concluiremos, a pesar de las evidencias que habían en un principio, que no hay evidencias para rechazar que el dato fuera correcto, i.e., no podemos rechazar la distribución uniforme para los posibles resultados del dado.
Proyecto e-Math 11
PRUEBA DE HOMOGENEIDAD
Estamos interesados en determinar si los datos correspondientes a dos o más muestras aleatorias provienen de la misma población. Nuevamente el conjunto de posibles valores de las observaciones se divide en k conjuntos disjuntos: A 1 , A 2 , ..., Ak.; clasificando en ellos las observaciones de cada muestra. Si n (^) ij representa el número de observaciones de la muestra i que pertenecen al conjunto Aj , los datos pueden tabularse en lo que se denomina una tabla de contingencia.
Muestra A 1 A 2 ... Ak. Total 1
n
...
Total
La hipótesis de que las m poblaciones son homogéneas, se traduce en que cada conjunto Aj debe tener una probabilidad teórica p (^) j , desconocida, pero que no varia de la población i a la población i’. Esto debe verificarse para todas las categorías, i.e., las categorías deben ser homogéneas en las diversas muestras.
Proyecto e-Math 13
Estamos interesados en estudiar la fiabilidad de cierto componente informático con relación al distribuidor que nos lo suministra. Para realizar esto, tomamos una muestra de 100 componentes de cada uno de los 3 distribuidores que nos sirven el producto comprobando el número de defectuosos en cada lote. La siguiente tabla muestra el número de defectuosos en para cada uno de los distribuidores.
Componentes Defectuosos
Componentes correctos Distribuidor 1 16 94 100 Distribuidor 2 24 76 100 Distribuidor 3 9 81 100 49 251 300
Debemos realizar un contraste de homogeneidad para concluir si entre los distribuidores existen diferencias de fiabilidad referente al mismo componente.
Componentes Defectuosos
Componentes correctos Distribuidor 1 16 (16.33) 94 (83.66) 100 Distribuidor 2 24 (16.33) 76 (83.66) 100 Distribuidor 3 9 (16.33) 81 (83.66) 100 49 251 300
Las frecuencias esperadas bajo homogeneidad son las representadas entre paréntesis.
El estadístico del contraste será:
2 2 2
2 2 2 2
Este valor del estadístico Ji-cuadrado es mayor que el valor para el nivel de significación del 5%, por lo tanto debemos concluir que no existe homogeneidad y por lo tanto que hay diferencias
Proyecto e-Math 14
Estamos interesados en estudiar la relación entre cierta enfermedad y la adicción al tabaco. Para realizar esto seleccionamos una muestra de 150 individuos, 100 individuos no fumadores y 50 fumadores. La siguiente tabla muestra las frecuencias de enfermedad en cada grupo (Completar la tabla).
Padecen la Enfermedad
No Padecen la enfermedad Fumadores 12 88 100 No Fumadores 25 25 50 37 113 150
Realizar un contraste de homogeneidad y obtener las conclusiones sobre la relación entre las variables.
SOLUCIÓN:
Para considerar este contraste como un contraste de Homogeneidad suponemos que las personas fumadoras y las personas no fumadoras constituyen dos poblaciones diferenciadas. Un estudio similar consistiría en considerar a los fumadores y no fumadores como una característica de una población y por lo tanto este ejemplo podría plantearse como un contraste de independencia, ver PRUEBA DE INDEPENDENCIA.
En este ejemplo queremos contrastar la hipótesis de que las proporciones de enfermos en ambas poblaciones ( Fumadores y No Fumadores) es la misma.
La representación de la tabla de contingencia en Minitab debe ser la misma que la anterior:
Proyecto e-Math 16
PRUEBA DE INDEPENDENCIA
Estamos interesados en determinar si dos cualidades o variables referidas a individuos de una población están relacionadas. Se diferencia de los contrastes anteriores en que en este caso estamos interesados en ver la relación existente entre dos variables de una misma población, no queremos contrastar la distribución teórica de una variable (prueba de bondad de ajuste) ni en comparar la distribución de una única variable en dos poblaciones (prueba de homogeneidad).
Supongamos que de n elementos de una población se han observado dos características X e Y , obteniéndose una muestra aleatoria simple bidimensional ( X 1 ,Y 1 ),(X 2 ,Y 2 ),...,(Xn,Yn) (^). Sobre la base de dichas observaciones se desea contrastar si las características poblacionales X e Y son independientes o no. Para ello se dividirá el conjunto de posibles valores de X en k conjuntos disjuntos A 1 ,A 2 ,...,Ak ; mientras que el conjunto de posibles valores Y será descompuesto en r conjuntos disjuntos: B 1 ,B 2 ,...,Br. Al clasificar os elementos de la muestra, aparecerá un cierto número
contingencia de la forma:
Proyecto e-Math 17
Al igual que para el Test de homogeneidad, el estadístico del contraste será
= =
k
j (^) ij
ij ij r
1
2
1
2 χ con (k-1)(r-1) grados de libertad.
Para estudiar la dependencia entre la práctica de algún deporte y la depresión, se seleccionó una muestra aleatoria simple de 100 jóvenes, con los siguientes resultados:
Sin depresión
Con depresión Deportista 38 9 No deportista 31 22
Determinar si existe independencia entre la actividad del sujeto y su estado de ánimo. Nivel de significación (5%)
SOLUCIÓN:
Debemos primero calcular las frecuencias esperadas bajo el supuesto de independencia. La tabla de frecuencias esperadas sería:
Sin depresión
Con depresión Deportista 32.43 14.57 47 No deportista 36.57 16.43 53 69 31 100
Calculamos ahora el estadístico del contraste:
χ 5.
Este valor debemos compararlo con el percentil de la distribución χ 2 con (2-1)(2-1)=1 grado de
Por lo tanto como el valor del estadístico es superior al valor crítico, concluimos que debemos rechazar la hipótesis de independencia y por lo tanto asumir que existe relación entre la depresión e los hábitos deportistas del individuo.
Proyecto e-Math 19
Stat > Tables > Chi-Square Test:
Expected counts are printed below observed counts
16-34 34-55 55 ó más Total 1 8 12 21 41 13,16 13,67 14,
2 18 15 7 40 12,84 13,33 13,
Total 26 27 28 81
Chi-Sq = 2,024 + 0,203 + 3,289 + 2,074 + 0,208 + 3,371 = 11, DF = 2, P-Value = 0,
El valor del estadístico del contraste es 11,169. El p-valor asociado a este valor es 0,004. Por lo tanto a un nivel de significación del 0.005 deberemos rechazar la hipótesis nula de independencia, y por lo tanto concluir que existe diferencias entre el tipo de televisión consumida y la edad del televidente.
Proyecto e-Math 20
[1] Baró, J. y Alemany, R. (2000): “Estadística II”. Ed. Fundació per a la Universitat Oberta de Catalunya. Barcelona.
[2] Peña Sánchez de Rivera, D. (1987): “Estadística. Modelos y Métodos. Volumen 2”. Alianza Editorial. Madrid. ISBN: 84-206-8110-
[3] Johnson, R. R. (1996): “Elementary statistics”. Belmont, etc. : Duxbury, cop
[4] R. Vélez y A. García: “Cálculo de Probabilidades y Estadística Matemática”. Ciencias Matemáticas. UNED.
Norma.