¡Descarga guia de estudio de probabilidad y más Guías, Proyectos, Investigaciones en PDF de Probabilidad solo en Docsity!
O B J E T I V O S
Al concluir el capítulo,
será capaz de:
1. Explicar la razón por la que una
muestra es con frecuencia la única
forma viable para conocer algo sobre
una población.
2. Describir métodos para
seleccionar una muestra.
3. Definir y construir una
distribución muestral de la media de
la muestra.
4. Comprender y explicar el teorema
del límite central.
5. Aplicar el teorema del límite
central para calcular probabilidades
de seleccionar posibles medias
muestrales de una población
específica.
Métodos de muestreo y teorema del límite central
El informe anual de Nike indica que el estadounidense promedio compra
6.5 pares de zapatos deportivos al año. Suponga que la desviación estándar
de la población es de 2.1 y que se analizará una muestra de 81 clientes el
siguiente año. ¿Cuál es el error estándar de la media en este experimento?
(Véase el objetivo 5 y el ejercicio 45.)
Métodos de muestreo y teorema del límite central 261
Introducción
De los capítulos 2 a 4 se hizo hincapié en las técnicas para describir datos. Con el fin
de ilustrar dichas técnicas, se organizaron los precios de 80 vehículos vendidos el mes
pasado en Whitner Autoplex en una distribución de frecuencias para calcular las diver-
sas medidas de ubicación y dispersión. Dichas medidas, como la media y la desviación
estándar, describen el precio de venta habitual y la dispersión de los precios de venta.
En estos capítulos se destacó la descripción de la condición de los datos: se describió
algo que ya había sucedido.
El capítulo 5 comienza a establecer el fundamento de la inferencia estadística con
el estudio de la probabilidad. Recuerde que, en la inferencia estadística, el objetivo es
determinar algo sobre una población a partir sólo de una muestra. La población es todo
el grupo de individuos u objetos en estudio, y la muestra es una parte o subconjunto de
dicha población. El capítulo 6 amplía los conceptos de probabilidad al describir tres dis-
tribuciones de probabilidad discreta: binomial, hipergeométrica y de Poisson. El capítulo
7 describe la distribución de probabilidad uniforme y la distribución de probabilidad nor-
mal. Ambas son distribuciones continuas. Las distribuciones de probabilidad abarcan
todos los posibles resultados de un experimento, así como la probabilidad asociada con
cada resultado. Mediante las distribuciones de probabilidad se evaluó la probabilidad
de que ocurra algo en el futuro.
Este capítulo inicia el estudio del muestreo, herramienta para inferir algo sobre una
población. Primero se analizan los métodos para seleccionar una muestra de una pobla-
ción. Después se construye una distribución de la media de la muestra para entender
la forma como las medias muestrales tienden a acumularse en torno a la media de la
población. Por último, se demuestra que, para cualquier población, la forma de esta
distribución de muestreo tiende a seguir la distribución de probabilidad normal.
Métodos de muestreo
Ya se mencionó en el capítulo 1 que el propósito de la estadística inferencial consiste
en determinar algo sobre una población a partir de una muestra. Una muestra es una
porción o parte de la población de interés. En muchos casos, el muestreo resulta más
accesible que el estudio de toda la población. En esta sección se explican las razones
principales para muestrear y, enseguida, diversos métodos para elegir una muestra.
Razones para muestrear
Cuando se estudian las características de una población, existen diversas razones prác-
ticas para preferir la selección de porciones o muestras de una población para observar
y medir. He aquí algunas razones para muestrear:
1. &TUBCMFDFS DPOUBDUP DPO UPEB MB QPCMBDJÓO SFRVFSJSÎB NVDIP UJFNQP Un can-
didato para un puesto federal quizá desee determinar las posibilidades que tiene
de resultar electo. Una encuesta de muestreo en la que se utiliza el personal y las
entrevistas de campo convencionales de una empresa especializada en encuestas
tardaría de uno o dos días. Con el mismo personal y los mismos entrevistadores, y
laborando siete días a la semana, se requerirían 200 años para ponerse en contacto
con toda la población en edad de votar. Aunque fuera posible reunir a un numeroso
equipo de encuestadores, quizá no valdría la pena entrar en contacto con todos los
votantes.
2. &M DPTUP EF FTUVEJBS UPEPT MPT FMFNFOUPT EF VOB QPCMBDJÓO SFTVMUBSÎB QSPIJCJUJ
WP Las organizaciones que realizan encuestas de opinión pública y pruebas entre
consumidores, como Gallup Polls y Roper ASW, normalmente entran en contacto
con menos de 2 000 de las casi 60 millones de familias en Estados Unidos. Una
organización que entrevista a consumidores en panel cobra cerca de $40 000 por
enviar muestras por correo y tabular las respuestas con el fin de probar un producto
(como un cereal para el desayuno, alimento para gato o algún perfume). La misma
prueba del producto con los 60 millones de familias tendría un costo de aproxima-
damente $1 000 000 000.
Estadística en acción
Con el importante papel que desempeña la estadística inferencial en todas las ra- mas de la ciencia, es ya una necesidad la disponibilidad de fuentes copiosas de nú- meros aleatorios. En 1927 se publicó el primer libro de números aleatorios, con 41 600 dígitos aleatorios, generados por L. Tippett. En 1938, R. A. Fisher y E. Yates publicaron 15 000 dígitos aleatorios, generados con dos barajas. En 1955, RAND Corporation publicó un millón de dígitos aleato- rios, generados por pulsos de frecuencia aleatorios de una ruleta electrónica. Para 1970, las aplicaciones del muestreo requerían miles de millones de números aleatorios. Desde entonces se han creado métodos para generar, con ayuda de computadoras, dígitos “casi” aleatorios, por lo que se les llama seudoaleatorios. Aún es motivo de debate la pregunta acerca de si un programa de computadora sirve para generar números aleatorios que de verdad sean aleatorios.
Métodos de muestreo y teorema del límite central 263
La probabilidad de 0, 1, 2, …, 9 es la misma para cada dígito de un número. Por
consiguiente, la probabilidad de que se seleccione el empleado 011 es la misma que
para los empleados 722 o 382. Al emplear números aleatorios para seleccionar emplea-
dos, se elimina la influencia o sesgo del proceso de selección.
En la siguiente ilustración aparece parte de una tabla de números aleatorios. Para
seleccionar una muestra de empleados, elija primero un punto de partida en la tabla;
cualquier punto sirve. Ahora suponga que el reloj marca las 3:04. Puede observar la
tercera columna y enseguida desplazarse hacia abajo hasta el cuarto conjunto de núme-
ros. El número es 03759. Como sólo hay 845 empleados, utilizará los tres primeros dígi-
tos de un número aleatorio de cinco dígitos. Por tanto, 037 es el número del primer
empleado que se convertirá en miembro de la muestra. Otra forma de elegir el punto
de partida consiste en cerrar los ojos y señalar un número de la tabla. Para continuar,
puede desplazarse en cualquier sentido. Suponga que lo hace hacia la derecha. Los
primeros tres dígitos del número a la derecha de 03759 son 447, el número del siguiente
empleado seleccionado para integrar la muestra. El siguiente número de tres dígitos a la
derecha es 961. Omita 961, pues sólo hay 845 empleados. Continúe hacia la derecha y
seleccione al empleado 784; después el 189 y así en lo sucesivo.
Estadística en acción
¿Es discriminación sacar ventaja del físico? Antes de contestar, considere un artículo reciente que apa- reció en Personnel Journal. Estos hallazgos indican que los hombres y mujeres atrac- tivos ganan alrededor de 5% más que los que tienen una apariencia promedio, quie- nes, a su vez, ganan 5% más que sus compañeros poco agraciados. Esto se aplica tanto en hombres como en mujeres. También es cierto en el caso de gran variedad de ocupaciones, desde la construcción hasta la repa- ración de automóviles y los empleos de telemarketing, ocupaciones para las que, según se cree, la apariencia no es importante.
La mayoría de los paquetes de software contienen una rutina para seleccionar una
muestra aleatoria simple. En el siguiente ejemplo se emplea el sistema Excel para elegir
una muestra aleatoria.
Punto de Segundo Tercer Cuarto partida empleado empleado empleado Ejemplo Solución
Jane y Joe Millar administran el Foxtrot Inn, una pensión donde dan alojamiento y
desayuno, localizada en Tryon, Carolina del Norte. Se rentan ocho habitaciones en
esta pensión. A continuación aparece el número de estas ocho habitaciones renta-
das diariamente durante junio de 2006. Utilice Excel para seleccionar una muestra
de cinco noches de junio.
Excel seleccionará la muestra aleatoria y arrojará los resultados. En la primera fecha
muestreada había cuatro habitaciones rentadas de las ocho. En la segunda fecha
muestreada de junio, se rentaron siete de las ocho habitaciones. La información apa-
rece en la columna D de la hoja de cálculo de Excel. Los pasos en Excel se incluyen
Habitaciones Junio en renta 1 0 2 2 3 3 4 2 5 3 6 4 7 2 8 3 9 4 10 7 Habitaciones Junio en renta 11 3 12 4 13 4 14 4 15 7 16 0 17 5 18 3 19 6 20 2 Habitaciones Junio en renta 21 3 22 2 23 3 24 6 25 0 26 4 27 1 28 1 29 3 30 3
264 Capítulo 8
en la sección $PNBOEPT EF TPGUXBSF , al final del capítulo. El sistema Excel lleva a
cabo el muestreo con reemplazo. Esto significa que tal vez el mismo día aparezca
más de una vez en una muestra.
Autoevaluación 8.1 La siguiente lista incluye a los estudiantes que se matricularon en un curso de introducción a la
estadística administrativa. Se elige al azar a tres estudiantes, a quienes se formulan varias pregun- tas relacionadas con el contenido del curso y el método de enseñanza. a) Se escriben a mano los números 00 a 45 en papeletas y se colocan en un recipiente. Los tres números seleccionados son 31, 7 y 25. ¿Qué estudiantes se van a incluir en la muestra? b) Ahora utilice la tabla de dígitos aleatorios, apéndice B.6, para seleccionar su propia muestra. c) ¿Qué haría si localizara el número 59 en la tabla de números aleatorios? CSPM 264 01 BUSINESS & ECONOMIC STAT 8:00 AM 9:40 AM MW ST 118 LIND D RANDOM CLASS NUMBER NAME RANK 00 ANDERSON, RAYMOND SO 01 ANGER, CHERYL RENEE SO 02 BALL, CLAIRE JEANETTE FR 03 BERRY, CHRISTOPHER G FR 04 BOBAK, JAMES PATRICK SO 05 BRIGHT, M. STARR JR 06 CHONTOS, PAUL JOSEPH SO 07 DETLEY, BRIAN HANS JR 08 DUDAS, VIOLA SO 09 DULBS, RICHARD ZALFA JR 10 EDINGER, SUSAN KEE SR 11 FINK, FRANK JAMES SR 12 FRANCIS, JAMES P JR 13 GAGHEN, PAMELA LYNN JR 14 GOULD, ROBYN KAY SO 15 GROSENBACHER, SCOTT ALAN SO 16 HEETFIELD, DIANE MARIE SO 17 KABAT, JAMES DAVID JR 18 KEMP, LISA ADRIANE FR 19 KILLION, MICHELLE A SO 20 KOPERSKI, MARY ELLEN SO 21 KOPP, BRIDGETTE ANN SO 22 LEHMANN, KRISTINA MARIE JR
RANDOM CLASS
NUMBER NAME RANK
23 MEDLEY, CHERYL ANN SO
24 MITCHELL, GREG R FR
25 MOLTER, KRISTI MARIE SO
26 MULCAHY, STEPHEN ROBERT SO
27 NICHOLAS, ROBERT CHARLES JR
28 NICKENS, VIRGINIA SO
29 PENNYWITT, SEAN PATRICK SO
30 POTEAU, KRIS E JR
31 PRICE, MARY LYNETTE SO
32 RISTAS, JAMES SR
33 SAGER, ANNE MARIE SO
34 SMILLIE, HEATHER MICHELLE SO
35 SNYDER, LEISHA KAY SR
36 STAHL, MARIA TASHERY SO
37 ST. JOHN, AMY J SO
38 STURDEVANT, RICHARD K SO
39 SWETYE, LYNN MICHELE SO
40 WALASINSKI, MICHAEL SO
41 WALKER, DIANE ELAINE SO
42 WARNOCK, JENNIFER MARY SO
43 WILLIAMS, WENDY A SO
44 YAP, HOCK BAN SO
45 YODER, ARLAN JAY JR
266 Capítulo 8
de que, en algunos casos, refleja con mayor fidelidad las características de la población
que el muestreo aleatorio simple o el muestreo aleatorio sistemático.
Muchos métodos más de
muestreo
Muestreo por conglomerados
Otro tipo común de muestreo es el NVFTUSFPQPSDPOHMPNFSBEPT. Éste se emplea a menu-
do para reducir el costo de muestrear una población dispersa en cierta área geográfica.
Suponga que desea determinar la opinión de los residentes de algún estado con
referencia a las políticas federales y estatales de protección ambiental. Seleccionar una
muestra aleatoria de residentes y ponerse en contacto con cada persona requeriría
mucho tiempo y resultaría muy costoso. Sería mejor aplicar el muestreo por conglomera-
dos y subdividir el estado en pequeñas unidades: condados o regiones. Con frecuencia,
se les conoce como unidades primarias.
Suponga que dividió el estado en 12 unidades primarias, seleccionó al azar cua-
tro regiones, 2, 7, 4 y 12, y concentró su atención en estas unidades primarias. Usted
puede tomar una muestra aleatoria de los residentes de cada una de estas regiones y
entrevistarse con ellos (observe que se trata de una combinación de un muestreo por
conglomerados y un muestreo aleatorio simple).
El estudio de los métodos de muestreo de las secciones anteriores no incluye todos
los métodos de muestreo disponibles para el investigador. Si usted emprendiera un pro-
yecto de investigación importante de marketing, finanzas, contabilidad u otras áreas,
necesitaría consultar libros dedicados exclusivamente a la teoría del muestreo y al dise-
ño de muestras.
TABLA 8.1 Número seleccionado para una muestra aleatoria estratificada proporcional
MUESTREO ACUMULADO Una población se divide en conglomerados a partir de
los límites naturales geográficos o de otra clase. A continuación se seleccionan
los conglomerados al azar y se toma una muestra de forma aleatoria con
elementos de cada grupo.
Autoevaluación 8.2 Consulte la autoevaluación 8.1 y la lista de alumnos de la página 264. Suponga que en un mues-
treo aleatorio sistemático se elegirá a cada noveno estudiante de la clase. Al principio se elige al azar al cuarto estudiante de la lista. Dicho estudiante es el número 03. Recuerde que los números aleatorios comienzan con 00, entonces, ¿qué estudiantes se elegirán como miembros de la mues- tra? Probabilidad Número de Frecuencia Número Estrato (recuperación de capital) empresas relativa muestreado 1 30% y más 8 0.02 1* 2 De 20% a 30% 35 0.10 5* 3 De 10% a 20% 189 0.54 27 4 De 0% a 10% 115 0.33 16 5 Déficit 5 0.01 1 Total 352 1.00 50 *0.02 de 50 â 1, 0.10 de 50 â 5, etcétera.
Métodos de muestreo y teorema del límite central 267
Ejercicios La siguiente lista incluye las tiendas de Marco’s Pizza en el condado de Lucas. También se indica si la tienda es propiedad de alguna corporación (C) o del administrador (A). Se selec- cionará e inspeccionará una muestra de cuatro establecimientos en relación con la conve- niencia para el cliente, la seguridad, la higiene y otras características. B Los números aleatorios seleccionados son 08, 18, 11, 02, 41 y 54. ¿Qué tiendas se eligieron? C Utilice la tabla de números aleatorios para seleccionar su propia muestra de establecimientos. D Una muestra consta de cada séptimo establecimiento. El número 03 es el punto de partida. ¿Qué establecimientos se incluirán en la muestra? E Suponga que una muestra consta de tres establecimientos, de los cuales dos son propie- dad corporativa y uno del administrador. Seleccione una muestra adecuada. La siguiente lista incluye hospitales localizados en las regiones de Cincinnati (Ohio) y la región norte de Kentucky. También indica si se trata de un hospital general médico o quirúrgico (M/ Q), o de especialidades (E). Interesa calcular el promedio de enfermeras que trabaja medio tiempo en los hospitales del área. B Se va a seleccionar de forma aleatoria una muestra de cinco hospitales. Los números alea- torios son 09, 16, 00, 49, 54, 12 y 04. ¿Qué hospitales se incluyen en la muestra? C Utilice una tabla de números aleatorios para formar su propia muestra de cinco hospitales. Número Número de identi- de identi- ficación Dirección Tipo ficación Dirección Tipo 00 2607 Starr Av C 12 2040 Ottawa River Rd C 01 309 W Alexis Rd C 13 2116 N Reynolds Rd C 02 2652 W Central Av C 14 3678 Rugby Dr C 03 630 Dixie Hwy A 15 1419 South Av C 04 3510 Dorr St C 16 1234 W Sylvania Av C 05 5055 Glendale Av C 17 4624 Woodville Rd A 06 3382 Lagrange St A 18 5155 S Main A 07 2525 W Laskey Rd C 19 106 E Airport Hwy C 08 303 Louisiana Av C 20 6725 W Central A 09 149 Main St C 21 4252 Monroe C 10 835 S McCord Rd A 22 2036 Woodville Rd C 11 3501 Monroe St A 23 1316 Michigan Av A Número de identi- ficación Nombre Dirección Tipo 10 Christ Hospital 2139 Auburn Avenue M/Q Cincinnati, Ohio 45219 11 Deaconess 311 Straight Street M/Q Hospital Cincinnati, Ohio 45219 12 Good Samaritan 375 Dixmyth Avenue M/Q Hospital Cincinnati, Ohio 45220 13 Jewish Hospital 3200 Burnet Avenue M/Q Cincinnati, Ohio 45229 14 University Hospital 234 Goodman Street M/Q Cincinnati, Ohio 45267 15 Providence Hospital 2446 Kipling Avenue M/Q Cincinnati, Ohio 45239 16 St. Francis- 3131 Queen City Avenue M/Q St. George Hospital Cincinnati, Ohio 45238 17 St. Elizabeth Medical 401 E. 20th Street M/Q Center, North Unit Covington, Kentucky 41014 18 St. Elizabeth Medical One Medical Village M/Q Center, South Unit Edgewood, Kentucky 41017 19 St. Luke’s Hospital 7380 Turfway Drive M/Q West Florence, Kentucky 41075 Número de identi- ficación Nombre Dirección Tipo 00 Bethesda North 10500 Montgomery M/Q Cincinnati, Ohio 45242 01 Ft. Hamilton-Hughes 630 Eaton Avenue M/Q Hamilton, Ohio 45013 02 Jewish Hospital- 4700 East Galbraith Rd. M/Q Kenwood Cincinnati, Ohio 45236 03 Mercy Hospital- 3000 Mack Road M/Q Fairfield Fairfield, Ohio 45014 04 Mercy Hospital- 100 Riverfront Plaza M/Q Hamilton Hamilton, Ohio 45011 05 Middletown 105 McKnight Drive M/Q Regional Middletown, Ohio 45044 06 Clermont Mercy 3000 Hospital Drive M/Q Hospital Batavia, Ohio 45103 07 Mercy Hospital- 7500 State Road M/Q Anderson Cincinnati, Ohio 45255 08 Bethesda Oak 619 Oak Street M/Q Hospital Cincinnati, Ohio 45206 09 Children’s Hospital 3333 Burnet Avenue M/Q Medical Center Cincinnati, Ohio 45229
Métodos de muestreo y teorema del límite central 269
B Seleccione una muestra aleatoria de cuatro agentes. Los números aleatorios son: 02, 59, 51, 25, 14, 29, 77, 69 y 18. ¿Qué distribuidores se incluirán en la muestra? C Utilice la tabla de números aleatorios para seleccionar su propia muestra de cuatro agentes. D Una muestra consta de cada séptimo distribuidor. El número 04 se selecciona como punto de partida. ¿Qué agentes se incluirán en la muestra? “Error” de muestreo
En la sección anterior se estudiaron métodos de muestreo útiles para seleccionar una
muestra que constituya una representación imparcial o sin sesgos de la población. Es
importante señalar que, en cada método, la selección de cualquier posible muestra de
determinado tamaño de una población tiene una posibilidad o probabilidad conocidas.
Ésta constituye otra forma de describir un método de muestreo sin sesgo.
Las muestras se emplean para determinar características de la población. Por ejem-
plo, con la media de una muestra se calcula la media de la población. No obstante,
como la muestra forma parte o es una porción representativa de la población, es poco
probable que la media de la muestra sea exactamente igual a la media poblacional.
Asimismo, es poco probable que la desviación estándar de la muestra sea exactamente
igual a la desviación estándar de la población. Por tanto, puede esperar una diferencia
entre un estadístico de la muestra y el parámetro de la población correspondiente. Esta
diferencia recibe el nombre de
El siguiente ejemplo aclara el concepto de error de muestreo.
ERROR DE MUESTREO Diferencia entre el estadístico de una muestra y el
parámetro de la población correspondiente.
Ejemplo Solución
Revise el ejemplo anterior de la página 263, en el que estudió el número de habita-
ciones rentadas en Foxtrot Inn, en Tryon, Carolina del Norte. La población se refie-
re al número de habitaciones rentadas cada uno de los 30 días de junio de 2006.
Determine la media de la población. Utilice Excel u otro software de estadística para
seleccionar tres muestras aleatorias de cinco días. Calcule la media de cada muestra
y compárela con la media poblacional. ¿Cuál es el error de muestreo en cada caso?
Durante el mes se rentaron un total de 94 habitaciones. Así, la media de las unidades
rentadas por noche es de 3.13. Ésta es la media de la población. Este valor se desig-
na con la letra griega N.
ΣX
N
La primera muestra aleatoria de cinco noches dio como resultado el siguiente núme-
ro de habitaciones rentadas: 4, 7, 4, 3 y 1. La media de esta muestra de cinco noches
es de 3.8 habitaciones, que se representa como X
_
1. La barra sobre la^ X^ recuerda que
se trata de una media muestral, y el subíndice 1 indica que se trata de la media de
la primera muestra.
X
X
1 n
El error de muestreo para la primera muestra es la diferencia entre la media poblacio-
nal (3.13) y la media muestral (3.80). De ahí que el error muestral sea (X
_
1 –^ N^ = 3.
- 3.13 = 0.67). La segunda muestra aleatoria de cinco días de la población de 30 días
de junio arrojó el siguiente número de habitaciones rentadas: 3, 3, 2, 3 y 6. La media
de estos cinco valores es de 3.4, que se calcula de la siguiente manera:
X
X
2 n
El error de muestreo es (X
_
2 –^ N^ = 3.4 – 3.13 = 0.27).
270 Capítulo 8
Distribución muestral de la media
Ahora que aparece la posibilidad de que se presente un error de muestreo cuando se
emplean los resultados del muestreo para aproximar un parámetro poblacional, ¿cómo
hacer un pronóstico preciso relacionado con el posible éxito de un nuevo dentífrico u
otro producto sobre la única base de los resultados del muestreo? ¿Cómo puede el
departamento de control de calidad, de una compañía de producción en serie, enviar
un cargamento de microchips a partir de una muestra de 10 chips? ¿Cómo pueden las
organizaciones electorales de CNN-USA Today o ABC News-Washington Post hacer
pronósticos precisos sobre la elección presidencial con base en una muestra de 1 200
electores registrados de una población de cerca de 90 millones? Para responder estas
preguntas, primero hay que precisar el concepto de distribución muestral de la media.
Las medias muestrales del ejemplo anterior varían de una muestra a la siguiente. La
media de la primera muestra de 5 días fue de 3.80 habitaciones, y la media de la segun-
da muestra fue de 3.40 habitaciones. La media poblacional fue de 3.13 habitaciones.
Si organiza las medias de todas las muestras posibles de 5 días en una distribución de
probabilidad, el resultado recibe el nombre de
Las medias muestrales varían de
muestra en muestra
En la tercera muestra aleatoria, la media fue de 1.8, y el error de muestro fue de
Cada una de estas diferencias, 0.67, 0.27 y –1.33, representa el error de mues-
treo cometido al calcular la media de la población. A veces estos errores son valores
positivos, lo cual indica que la media muestral sobreexcedió la media poblacional;
otras veces son valores negativos, lo cual indica que la media muestral resultó inferior
a la media poblacional.
DISTRIBUCIÓN MUESTRAL DE LA MEDIA Distribución de probabilidad de todas las
posibles medias de las muestras de un determinado tamaño muestra de la
población.
En este caso, con una población de 30 valores y muestras de 5 valores, existe
una gran cantidad de posibles muestras, 142 506, para ser exactos. Para calcular
este valor se aplica la fórmula de las combinaciones 5.10, de la página 168. Cada
una de las 142 506 diferentes muestras cuenta con las mismas posibilidades de que
se le seleccione. Cada muestra puede tener una media muestral diferente y, por con-
siguiente, un error de muestreo distinto. El valor del error de muestreo se basa en el
valor particular de las 142 506 posibles muestras seleccionadas. Por consiguiente,
los errores de muestreo son aleatorios y se presentan al azar. Si determinara la suma
de estos errores de muestreo en una gran cantidad de muestras, el resultado se
aproximaría mucho a cero. Sucede así porque la media de la muestra constituye un
estimador sin sesgo de la media de la población.
272 Capítulo 8
En resumen, tome todas las posibles muestras aleatorias de una población y calcule
un estadístico muestral (la media de los ingresos percibidos) para cada una. Este ejem-
plo ilustra las importantes relaciones entre la distribución poblacional y la distribución
muestral de la media:
1. La media de las medias de las muestras es exactamente igual a la media de la
población.
2. La dispersión de la distribución muestral de la media es más estrecha que la distri-
bución poblacional.
3. La distribución muestral de la media suele tener forma de campana y se aproxima a
la distribución de probabilidad normal.
3. La media de la distribución muestral de la media se obtiene al sumar las medias
muestrales y dividir la suma entre el número de muestras. La media de todas las
medias muestrales se representa mediante NX^ _. La N recuerda que se trata de un
valor poblacional, pues tomó en cuenta todas las muestras posibles. El subíndi-
ce X
_
indica que se trata de la distribución muestral de la media.
μX =
Suma de todas las medias muestrales
Total de muestras
4. Consulte la gráfica 8.1, donde aparecen las dos distribuciones poblacionales y
la distribución muestral de la media. Caben las siguientes observaciones:
a) La media de la distribución muestral de la media ($7.71) es igual a la media
de la población: N = NX^ _.
b) La dispersión de la distribución muestral de las medias es menor que la
dispersión de los valores de población. La media de las muestras varía de
$7.00 a $8.50, mientras que los valores de población varían de $7.00 a $9.00.
Observe que, conforme se incrementa el tamaño de la muestra, se reduce la
dispersión de la distribución muestral de las medias.
c) La forma de la distribución muestral de la media y la forma de la distribu-
ción de frecuencias de los valores de población son diferentes. La distribución
muestral de las medias tiende a adoptar más forma de campana y a aproxi-
marse a la distribución de probabilidad normal.
TABLA 8.4 Distribución muestral de la media para n = 2
La media de la población
es igual a la media de las
medias muestrales
GRÁFICA 8.1 Distribución de los valores de población y distribución muestral de las medias
8 9 7 7.5 8 8.5 9 X
X
Probabilidad Probabilidad Distribución de población Distribución muestral de las medias Ingresos por hora Media de la muestra o ingresos por hora Media muestral Número de medias Probabilidad $7.00 3. 7.50 9. 8.00 6. 8.50 3. 21 1.
Métodos de muestreo y teorema del límite central 273
Dada una distribución de probabilidad normal o de forma de campana, se aplican
los conceptos del capítulo 7 para determinar la probabilidad de seleccionar una muestra
con una media muestral específica. En la siguiente sección resalta la importancia del
tamaño de una muestra en relación con la distribución muestral de la media.
Ejercicios Una población consta de los siguientes cuatro valores: 12, 12, 14 y 16. B Enumere todas las muestras de tamaño 2 y calcule la media de cada muestra. C Calcule la media de la distribución muestral de la media y la media de la población. Com- pare los dos valores. D Compare la dispersión en la población con la de las medias de las muestras. Una población consta de los siguientes cinco valores: 2, 2, 4, 4 y 8. B Enumere todas las muestras de tamaño 2 y calcule la media de cada muestra. C Calcule la media de la distribución muestral de las medias y la media de la población. Compare los dos valores. D Compare la dispersión en la población con la de las medias de las muestras. Una población consta de los siguientes cinco valores: 12, 12, 14, 15 y 20. B Enumere todas las muestras de tamaño 3 y calcule la media de cada muestra. C Calcule la media de la distribución muestral de las medias y la media de la población. Compare los dos valores. D Compare la dispersión en la población con la de las medias de las muestras. Una población consta de los siguientes cinco valores: 0, 0, 1, 3 y 6. B Enumere todas las muestras de tamaño 3 y calcule la media de cada muestra. C Calcule la media de la distribución muestral de las medias y la media de la población. Compare los dos valores. D Compare la dispersión en la población con la de las medias de las muestras. En el despacho de abogados Tybo and Associates, hay seis socios. En la siguiente tabla se incluye el número de casos que en realidad atendió cada socio en los tribunales durante el mes pasado.
Autoevaluación 8.3 Los tiempos de servicio de los ejecutivos que laboran en Standard Chemicals son los siguientes:
a) De acuerdo con la fórmula de las combinaciones, ¿cuántas muestras de tamaño 2 son posi- bles? b) Elabore una lista de todas las muestras posibles de 2 ejecutivos de la población y calcule las medias. c) Organice las medias en una distribución muestral. d) Compare la media poblacional y la media de las medias de las muestras. e) Compare la dispersión en la población con la dispersión de la distribución muestral de la media. f) A continuación se muestra una gráfica con los valores de la población. ¿Tienen los valores de población una distribución normal (en forma de campana)? g) ¿Comienza la distribución muestral de la media que se calculó en el inciso c) a indicar una tendencia a adoptar forma de campana? Nombre Años Señor Snow 20 Señora Tolson 22 Señor Kraft 26 Señora Irwin 24 Señor Jones 28 1 0 20 22 24 26 28 Tiempo de servicio Frecuencia
Métodos de muestreo y teorema del límite central 275
población. Observe la convergencia hacia una distribución normal sin importar la forma
de la distribución de población. La mayoría de los especialistas en estadística conside-
ran que una muestra de 30 o mayor es lo bastante grande para aplicar el teorema del
límite central.
La idea de que la distribución muestral de las medias de una población que no es
normal converge hacia la normalidad se ilustra en las gráficas 8.3, 8.4 y 8.5. En breve se
analiza este ejemplo con más detalles, pero la gráfica 8.3 es la gráfica de una distribu-
ción de probabilidad discreta con sesgo positivo. Hay varias posibles muestras de 5 que
puede seleccionar de esta población. Suponga que selecciona al azar 25 muestras de
tamaño 5 cada una y calcula la media de cada muestra. Estos resultados se muestran
en la gráfica 8.4. Observe que la forma de la distribución muestral de las medias cambió
la forma de la población original aunque sólo seleccionó 25 de las diversas posibles
muestras. En otras palabras, eligió 25 muestras al azar de tamaño 5 de una población
positivamente sesgada, y encontró que la distribución muestral de las medias cambió en
lo que se refiere a la forma de la población. A medida que toma muestras más grandes,
es decir, n = 20 en lugar de n = 5, la distribución muestral de las medias se aproximará
a la distribución normal. La gráfica 8.5 muestra los resultados de 25 muestras aleatorias
de 20 observaciones cada una tomadas de la misma población. Note la clara tendencia
hacia la distribución de probabilidad normal. Ésta es la esencia del teorema del límite
central. El siguiente ejemplo pondrá de relieve esta condición.
n 2 n 6 n 30 n 2 n 6 n 30 n 2 n 6 n 30 n 2 n 6 n 30 x x x x _ x _ x _ x _ x
_
x
_
x
_
x
_
x
_
x
_
x
_
x
_
x
Poblaciones
Distribuciones muestrales
GRÁFICA 8.2 Resultados del teorema del límite central para diversas poblaciones
276 Capítulo 8
Ejemplo Solución
Ed Spence dio inicio a su negocio de engranes hace 20 años. El negocio creció a lo
largo del tiempo y ahora cuenta con 40 empleados. Spence Sprockets, Inc., encara
algunas decisiones importantes relacionadas con la atención médica de sus emplea-
dos. Antes de tomar una decisión definitiva sobre el programa de atención médica
que va a comprar, Ed decide formar un comité de cinco empleados. Se pedirá al
comité que estudie el tema del cuidado de la salud y haga alguna recomendación
sobre el plan que mejor convenga a los empleados. Ed cree que el punto de vista
de los empleados más recientes en relación con el cuidado de la salud difiere de los
empleados con más experiencia. Si Ed selecciona al azar este comité, ¿qué puede
esperar en términos del promedio de años que llevan con Spence Sprockets los
miembros del comité? ¿Cuál es la forma de la distribución de años de experiencia de
todos los empleados (la población) en comparación con la forma de la distribución
muestral de las medias? Los tiempos de servicio (redondeados al año inmediato) de
los 40 empleados que actualmente están en nómina en Spence Sprockers, Inc., son
los siguientes:
La gráfica 8.3 muestra la distribución de los años de experiencia de la población de
40 empleados actuales. La distribución de tiempos de servicio tiene un sesgo positi-
vo, pues unos cuantos empleados han laborado en Spence Sprockets por un periodo
extenso. En específico, seis empleados han laborado en la compañía 10 años o más.
Sin embargo, como el negocio creció, el número de empleados se incrementó en los
últimos cinco años. De los 40 empleados, 18 han laborado en la compañía dos años
o menos.
Considere el primero de los problemas de Ed Spence. A él le gustaría formar un
comité de cinco empleados con el objeto de que estudien la cuestión del cuidado
de la salud y sugieran el tipo de cobertura de gastos médicos más adecuada para la
mayoría de los trabajadores. ¿Cómo elegiría al comité? Si lo selecciona al azar, ¿qué
puede esperar respecto del tiempo medio de servicio de quienes forman parte del
comité?
Años de servicio
Frecuencia
GRÁFICA 8.3 Tiempo de servicio en Spence Sprockets, Inc., de los empleados
278 Capítulo 8
tral de medias. La población de tiempos de servicio de los empleados (gráfica 8.3)
tiene un sesgo positivo, y la distribución de estas 25 medias muestrales no refleja
el mismo sesgo positivo. También existe una diferencia en el rango de las medias
muestrales en comparación con el rango de la población. La población varía de 0 a
19 años, mientras que las medias muestrales varían de 1.6 a 8.6 años.
La tabla 8.6 contiene los resultados de seleccionar 25 muestras de 20 emplea-
dos cada una y el cálculo de las medias muestrales. Estas medias muestrales apare-
cen en la gráfica 8.5. Compare la forma de esta distribución con la población (gráfica
8.3) y con la distribución muestral de medias si la muestra es de n = 5 (gráfica 8.4).
Observe dos importantes características:
Tiempo medio de servicio
Frecuencia
GRÁFICA 8.4 Histograma de tiempos de servicio medios para 25 muestras de cinco
empleados
TABLA 8.6 Muestras aleatorias y medias muestrales de 25 muestras de 20 empleados de Spence Sprockets, Inc.
Número de Media muestra Datos de la muestra (tiempo de servicio) muestral A 3 8 3 0 2 1 2 3 11 5 1 3 4 2 7 1 1 2 4 16 3. B 2 3 8 2 1 5 2 0 3 1 0 7 1 4 3 11 4 4 3 1 3. C 14 5 0 3 2 14 11 9 2 2 1 2 19 1 0 1 4 2 19 8 5. D 9 2 1 1 4 10 0 8 4 3 2 1 0 8 1 14 5 10 1 3 4. E 18 1 2 2 4 3 2 8 2 1 0 19 4 19 0 1 4 0 3 14 5. F 10 4 4 18 3 3 1 0 0 2 2 4 7 10 2 0 3 4 2 1 4. G 5 7 11 8 11 18 1 1 16 2 2 16 2 3 2 16 2 2 2 4 6. H 3 0 2 0 5 4 5 3 8 3 2 5 1 1 2 9 8 3 16 5 4. I 0 0 18 2 1 7 4 1 3 0 3 2 11 7 2 8 5 1 2 3 4. J 2 7 2 4 1 3 3 2 5 10 0 1 1 2 9 3 2 19 3 2 4. K 7 4 5 3 3 0 18 2 0 4 2 7 2 7 4 2 10 1 1 2 4. L 0 3 10 5 9 2 1 4 1 2 1 8 18 1 4 3 3 2 0 4 4. M 4 1 2 1 7 3 9 14 8 19 4 4 1 2 0 3 1 2 1 2 4. N 3 16 1 2 4 4 4 2 1 5 2 3 5 3 4 7 16 1 11 1 4. O 2 19 2 0 2 2 16 2 3 11 9 2 8 0 8 2 7 3 2 2 5. P 2 18 16 5 2 2 19 0 1 2 11 4 2 2 1 4 2 0 4 3 5. Q 3 2 3 11 10 1 1 5 19 16 7 10 3 1 1 1 2 2 3 1 5. R 2 3 1 2 7 4 3 19 9 2 2 1 1 2 2 2 1 8 0 2 3. S 2 14 19 1 19 2 8 4 2 2 14 2 8 16 4 7 2 9 0 7 7. T 0 1 3 3 2 2 3 1 1 0 3 2 3 5 2 10 14 4 2 0 3. U 1 0 1 2 16 1 1 2 5 1 4 1 2 2 2 2 2 8 9 3 3. V 1 9 4 4 2 8 7 1 14 18 1 5 10 11 19 0 3 7 2 11 6. W 8 1 9 19 3 19 0 5 2 1 5 3 3 4 1 5 3 1 8 7 5. X 4 2 0 3 1 16 1 11 3 3 2 18 2 0 1 5 0 7 2 5 4. Y 1 2 1 2 0 2 7 2 4 8 19 2 5 3 3 0 19 2 1 18 5.
Métodos de muestreo y teorema del límite central 279
¿Qué concluye de este ejemplo? El teorema del límite central indica que, sin impor-
tar la forma de la distribución de población, la distribución muestral de la media se
aproximará a la distribución de probabilidad normal. Cuanto mayor sea el número de
observaciones en cada muestra, más evidente será la convergencia. El ejemplo de
Spence Sprockets, Inc., demuestra el mecanismo del teorema del límite central. Comen-
zó con una población con sesgo positivo (gráfica 8.3). Después seleccionó 25 muestras
aleatorias de 5 observaciones; calculó la media de cada muestra y, por último, organizó
las 25 medias de muestra en una gráfica (gráfica 8.4). Observó un cambio en la forma
de la distribución muestral de las medias respecto de la propia de la población. El des-
plazamiento va de una distribución con sesgo positivo a una que tiene la forma de la
distribución de probabilidad normal.
Para aclarar más los efectos del teorema del límite central, incremente el número de
observaciones en cada muestra de 5 a 20. Seleccione 25 muestras de 20 observaciones
cada una y calcule la media de cada muestra. Por último, organice estas medias mues-
trales en una gráfica (gráfica 8.5). La forma del histograma de la gráfica 8.5 se desplaza
claramente hacia la distribución de probabilidad normal.
1. La forma de la distribución muestral de las medias es diferente a la de la pobla-
ción. En la gráfica 8.3, la distribución de empleados tiene un sesgo positivo. No
obstante, conforme selecciona muestras aleatorias de la población, cambia la
forma de la distribución muestral de las medias. A medida que incrementa el
tamaño de la muestra, la distribución muestral de las medias se aproxima a la
distribución de probabilidad normal. Este hecho se ilustra con el teorema del
límite central.
2. Hay menos dispersión en la distribución muestral de las medias que en la distri-
bución de la población. En la población, los periodos de servicio variaron de 0 a
19 años. Cuando seleccionó muestras de tamaño 5, las medias de las muestras
variaron de 1.6 a 8.6 años, y cuando seleccionó muestras de 20, las medias
variaron de 3.05 a 7.10 años.
También puede comparar la media de las medias de la muestra con la media de
la población. La media de las 25 muestras de los 20 empleados de la tabla 8.6 es de
4.676 años.
μX =
Emplee el símbolo NX^ _^ para identificar la media de la distribución muestral de las
medias. El subíndice recuerda que la distribución se refiere a la media muestral. Se
lee mu subíndice X barra. Observe que la media de las medias muestrales, 4.
años, se encuentra muy próxima a la media de la población de 4.80.
Tiempo medio de servicio
Frecuencia
GRÁFICA 8.5 Histograma del tiempo medio de servicio de 25 muestras de 20 empleados