Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


guia de estudio de probabilidad, Guías, Proyectos, Investigaciones de Probabilidad

Contiene un fragmento de lo que se observo en la materia

Tipo: Guías, Proyectos, Investigaciones

2016/2017

Subido el 31/05/2023

malisoy451
malisoy451 🇲🇽

4 documentos

1 / 33

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
8
OBJETIVOS
Al concluir el capítulo,
será capaz de:
1. Explicar la razón por la que una
muestra es con frecuencia la única
forma viable para conocer algo sobre
una población.
2. Describir métodos para
seleccionar una muestra.
3. Definir y construir una
distribución muestral de la media de
la muestra.
4. Comprender y explicar el
teorema
del límite central
.
5. Aplicar el teorema del límite
central para calcular probabilidades
de seleccionar posibles medias
muestrales de una población
específica.
Métodos de muestreo
y teorema del límite
central
El informe anual de Nike indica que el estadounidense promedio compra
6.5 pares de zapatos deportivos al año. Suponga que la desviación estándar
de la población es de 2.1 y que se analizará una muestra de 81 clientes el
siguiente año. ¿Cuál es el error estándar de la media en este experimento?
(Véase el objetivo 5 y el ejercicio 45.)

pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21

Vista previa parcial del texto

¡Descarga guia de estudio de probabilidad y más Guías, Proyectos, Investigaciones en PDF de Probabilidad solo en Docsity!

O B J E T I V O S

Al concluir el capítulo,

será capaz de:

1. Explicar la razón por la que una

muestra es con frecuencia la única

forma viable para conocer algo sobre

una población.

2. Describir métodos para

seleccionar una muestra.

3. Definir y construir una

distribución muestral de la media de

la muestra.

4. Comprender y explicar el teorema

del límite central.

5. Aplicar el teorema del límite

central para calcular probabilidades

de seleccionar posibles medias

muestrales de una población

específica.

Métodos de muestreo y teorema del límite central

El informe anual de Nike indica que el estadounidense promedio compra

6.5 pares de zapatos deportivos al año. Suponga que la desviación estándar

de la población es de 2.1 y que se analizará una muestra de 81 clientes el

siguiente año. ¿Cuál es el error estándar de la media en este experimento?

(Véase el objetivo 5 y el ejercicio 45.)

Métodos de muestreo y teorema del límite central 261

Introducción

De los capítulos 2 a 4 se hizo hincapié en las técnicas para describir datos. Con el fin

de ilustrar dichas técnicas, se organizaron los precios de 80 vehículos vendidos el mes

pasado en Whitner Autoplex en una distribución de frecuencias para calcular las diver-

sas medidas de ubicación y dispersión. Dichas medidas, como la media y la desviación

estándar, describen el precio de venta habitual y la dispersión de los precios de venta.

En estos capítulos se destacó la descripción de la condición de los datos: se describió

algo que ya había sucedido.

El capítulo 5 comienza a establecer el fundamento de la inferencia estadística con

el estudio de la probabilidad. Recuerde que, en la inferencia estadística, el objetivo es

determinar algo sobre una población a partir sólo de una muestra. La población es todo

el grupo de individuos u objetos en estudio, y la muestra es una parte o subconjunto de

dicha población. El capítulo 6 amplía los conceptos de probabilidad al describir tres dis-

tribuciones de probabilidad discreta: binomial, hipergeométrica y de Poisson. El capítulo

7 describe la distribución de probabilidad uniforme y la distribución de probabilidad nor-

mal. Ambas son distribuciones continuas. Las distribuciones de probabilidad abarcan

todos los posibles resultados de un experimento, así como la probabilidad asociada con

cada resultado. Mediante las distribuciones de probabilidad se evaluó la probabilidad

de que ocurra algo en el futuro.

Este capítulo inicia el estudio del muestreo, herramienta para inferir algo sobre una

población. Primero se analizan los métodos para seleccionar una muestra de una pobla-

ción. Después se construye una distribución de la media de la muestra para entender

la forma como las medias muestrales tienden a acumularse en torno a la media de la

población. Por último, se demuestra que, para cualquier población, la forma de esta

distribución de muestreo tiende a seguir la distribución de probabilidad normal.

Métodos de muestreo

Ya se mencionó en el capítulo 1 que el propósito de la estadística inferencial consiste

en determinar algo sobre una población a partir de una muestra. Una muestra es una

porción o parte de la población de interés. En muchos casos, el muestreo resulta más

accesible que el estudio de toda la población. En esta sección se explican las razones

principales para muestrear y, enseguida, diversos métodos para elegir una muestra.

Razones para muestrear

Cuando se estudian las características de una población, existen diversas razones prác-

ticas para preferir la selección de porciones o muestras de una población para observar

y medir. He aquí algunas razones para muestrear:

1.  &TUBCMFDFS DPOUBDUP DPO UPEB MB QPCMBDJÓO SFRVFSJSÎB NVDIP UJFNQP Un can-

didato para un puesto federal quizá desee determinar las posibilidades que tiene

de resultar electo. Una encuesta de muestreo en la que se utiliza el personal y las

entrevistas de campo convencionales de una empresa especializada en encuestas

tardaría de uno o dos días. Con el mismo personal y los mismos entrevistadores, y

laborando siete días a la semana, se requerirían 200 años para ponerse en contacto

con toda la población en edad de votar. Aunque fuera posible reunir a un numeroso

equipo de encuestadores, quizá no valdría la pena entrar en contacto con todos los

votantes.

2.  &M DPTUP EF FTUVEJBS UPEPT MPT FMFNFOUPT EF VOB QPCMBDJÓO SFTVMUBSÎB QSPIJCJUJ

WP Las organizaciones que realizan encuestas de opinión pública y pruebas entre

consumidores, como Gallup Polls y Roper ASW, normalmente entran en contacto

con menos de 2 000 de las casi 60 millones de familias en Estados Unidos. Una

organización que entrevista a consumidores en panel cobra cerca de $40 000 por

enviar muestras por correo y tabular las respuestas con el fin de probar un producto

(como un cereal para el desayuno, alimento para gato o algún perfume). La misma

prueba del producto con los 60 millones de familias tendría un costo de aproxima-

damente $1 000 000 000.

Estadística en acción

Con el importante papel que desempeña la estadística inferencial en todas las ra- mas de la ciencia, es ya una necesidad la disponibilidad de fuentes copiosas de nú- meros aleatorios. En 1927 se publicó el primer libro de números aleatorios, con 41 600 dígitos aleatorios, generados por L. Tippett. En 1938, R. A. Fisher y E. Yates publicaron 15 000 dígitos aleatorios, generados con dos barajas. En 1955, RAND Corporation publicó un millón de dígitos aleato- rios, generados por pulsos de frecuencia aleatorios de una ruleta electrónica. Para 1970, las aplicaciones del muestreo requerían miles de millones de números aleatorios. Desde entonces se han creado métodos para generar, con ayuda de computadoras, dígitos “casi” aleatorios, por lo que se les llama seudoaleatorios. Aún es motivo de debate la pregunta acerca de si un programa de computadora sirve para generar números aleatorios que de verdad sean aleatorios.

Métodos de muestreo y teorema del límite central 263

La probabilidad de 0, 1, 2, …, 9 es la misma para cada dígito de un número. Por

consiguiente, la probabilidad de que se seleccione el empleado 011 es la misma que

para los empleados 722 o 382. Al emplear números aleatorios para seleccionar emplea-

dos, se elimina la influencia o sesgo del proceso de selección.

En la siguiente ilustración aparece parte de una tabla de números aleatorios. Para

seleccionar una muestra de empleados, elija primero un punto de partida en la tabla;

cualquier punto sirve. Ahora suponga que el reloj marca las 3:04. Puede observar la

tercera columna y enseguida desplazarse hacia abajo hasta el cuarto conjunto de núme-

ros. El número es 03759. Como sólo hay 845 empleados, utilizará los tres primeros dígi-

tos de un número aleatorio de cinco dígitos. Por tanto, 037 es el número del primer

empleado que se convertirá en miembro de la muestra. Otra forma de elegir el punto

de partida consiste en cerrar los ojos y señalar un número de la tabla. Para continuar,

puede desplazarse en cualquier sentido. Suponga que lo hace hacia la derecha. Los

primeros tres dígitos del número a la derecha de 03759 son 447, el número del siguiente

empleado seleccionado para integrar la muestra. El siguiente número de tres dígitos a la

derecha es 961. Omita 961, pues sólo hay 845 empleados. Continúe hacia la derecha y

seleccione al empleado 784; después el 189 y así en lo sucesivo.

Estadística en acción

¿Es discriminación sacar ventaja del físico? Antes de contestar, considere un artículo reciente que apa- reció en Personnel Journal. Estos hallazgos indican que los hombres y mujeres atrac- tivos ganan alrededor de 5% más que los que tienen una apariencia promedio, quie- nes, a su vez, ganan 5% más que sus compañeros poco agraciados. Esto se aplica tanto en hombres como en mujeres. También es cierto en el caso de gran variedad de ocupaciones, desde la construcción hasta la repa- ración de automóviles y los empleos de telemarketing, ocupaciones para las que, según se cree, la apariencia no es importante.

La mayoría de los paquetes de software contienen una rutina para seleccionar una

muestra aleatoria simple. En el siguiente ejemplo se emplea el sistema Excel para elegir

una muestra aleatoria.

Punto de Segundo Tercer Cuarto partida empleado empleado empleado Ejemplo Solución

Jane y Joe Millar administran el Foxtrot Inn, una pensión donde dan alojamiento y

desayuno, localizada en Tryon, Carolina del Norte. Se rentan ocho habitaciones en

esta pensión. A continuación aparece el número de estas ocho habitaciones renta-

das diariamente durante junio de 2006. Utilice Excel para seleccionar una muestra

de cinco noches de junio.

Excel seleccionará la muestra aleatoria y arrojará los resultados. En la primera fecha

muestreada había cuatro habitaciones rentadas de las ocho. En la segunda fecha

muestreada de junio, se rentaron siete de las ocho habitaciones. La información apa-

rece en la columna D de la hoja de cálculo de Excel. Los pasos en Excel se incluyen

Habitaciones Junio en renta 1 0 2 2 3 3 4 2 5 3 6 4 7 2 8 3 9 4 10 7 Habitaciones Junio en renta 11 3 12 4 13 4 14 4 15 7 16 0 17 5 18 3 19 6 20 2 Habitaciones Junio en renta 21 3 22 2 23 3 24 6 25 0 26 4 27 1 28 1 29 3 30 3

264 Capítulo 8

en la sección $PNBOEPT EF TPGUXBSF ,  al final del capítulo. El sistema Excel lleva a

cabo el muestreo con reemplazo. Esto significa que tal vez el mismo día aparezca

más de una vez en una muestra.

Autoevaluación 8.1 La siguiente lista incluye a los estudiantes que se matricularon en un curso de introducción a la

estadística administrativa. Se elige al azar a tres estudiantes, a quienes se formulan varias pregun- tas relacionadas con el contenido del curso y el método de enseñanza. a) Se escriben a mano los números 00 a 45 en papeletas y se colocan en un recipiente. Los tres números seleccionados son 31, 7 y 25. ¿Qué estudiantes se van a incluir en la muestra? b) Ahora utilice la tabla de dígitos aleatorios, apéndice B.6, para seleccionar su propia muestra. c) ¿Qué haría si localizara el número 59 en la tabla de números aleatorios? CSPM 264 01 BUSINESS & ECONOMIC STAT 8:00 AM 9:40 AM MW ST 118 LIND D RANDOM CLASS NUMBER NAME RANK 00 ANDERSON, RAYMOND SO 01 ANGER, CHERYL RENEE SO 02 BALL, CLAIRE JEANETTE FR 03 BERRY, CHRISTOPHER G FR 04 BOBAK, JAMES PATRICK SO 05 BRIGHT, M. STARR JR 06 CHONTOS, PAUL JOSEPH SO 07 DETLEY, BRIAN HANS JR 08 DUDAS, VIOLA SO 09 DULBS, RICHARD ZALFA JR 10 EDINGER, SUSAN KEE SR 11 FINK, FRANK JAMES SR 12 FRANCIS, JAMES P JR 13 GAGHEN, PAMELA LYNN JR 14 GOULD, ROBYN KAY SO 15 GROSENBACHER, SCOTT ALAN SO 16 HEETFIELD, DIANE MARIE SO 17 KABAT, JAMES DAVID JR 18 KEMP, LISA ADRIANE FR 19 KILLION, MICHELLE A SO 20 KOPERSKI, MARY ELLEN SO 21 KOPP, BRIDGETTE ANN SO 22 LEHMANN, KRISTINA MARIE JR

RANDOM CLASS
NUMBER NAME RANK
23 MEDLEY, CHERYL ANN SO
24 MITCHELL, GREG R FR
25 MOLTER, KRISTI MARIE SO
26 MULCAHY, STEPHEN ROBERT SO
27 NICHOLAS, ROBERT CHARLES JR
28 NICKENS, VIRGINIA SO
29 PENNYWITT, SEAN PATRICK SO
30 POTEAU, KRIS E JR
31 PRICE, MARY LYNETTE SO
32 RISTAS, JAMES SR
33 SAGER, ANNE MARIE SO
34 SMILLIE, HEATHER MICHELLE SO
35 SNYDER, LEISHA KAY SR
36 STAHL, MARIA TASHERY SO
37 ST. JOHN, AMY J SO
38 STURDEVANT, RICHARD K SO
39 SWETYE, LYNN MICHELE SO
40 WALASINSKI, MICHAEL SO
41 WALKER, DIANE ELAINE SO
42 WARNOCK, JENNIFER MARY SO
43 WILLIAMS, WENDY A SO
44 YAP, HOCK BAN SO
45 YODER, ARLAN JAY JR

266 Capítulo 8

de que, en algunos casos, refleja con mayor fidelidad las características de la población

que el muestreo aleatorio simple o el muestreo aleatorio sistemático.

Muchos métodos más de

muestreo

Muestreo por conglomerados

Otro tipo común de muestreo es el NVFTUSFPQPSDPOHMPNFSBEPT.  Éste se emplea a menu-

do para reducir el costo de muestrear una población dispersa en cierta área geográfica.

Suponga que desea determinar la opinión de los residentes de algún estado con

referencia a las políticas federales y estatales de protección ambiental. Seleccionar una

muestra aleatoria de residentes y ponerse en contacto con cada persona requeriría

mucho tiempo y resultaría muy costoso. Sería mejor aplicar el muestreo por conglomera-

dos y subdividir el estado en pequeñas unidades: condados o regiones. Con frecuencia,

se les conoce como unidades primarias.

Suponga que dividió el estado en 12 unidades primarias, seleccionó al azar cua-

tro regiones, 2, 7, 4 y 12, y concentró su atención en estas unidades primarias. Usted

puede tomar una muestra aleatoria de los residentes de cada una de estas regiones y

entrevistarse con ellos (observe que se trata de una combinación de un muestreo por

conglomerados y un muestreo aleatorio simple).

El estudio de los métodos de muestreo de las secciones anteriores no incluye todos

los métodos de muestreo disponibles para el investigador. Si usted emprendiera un pro-

yecto de investigación importante de marketing, finanzas, contabilidad u otras áreas,

necesitaría consultar libros dedicados exclusivamente a la teoría del muestreo y al dise-

ño de muestras.

TABLA 8.1 Número seleccionado para una muestra aleatoria estratificada proporcional

MUESTREO ACUMULADO Una población se divide en conglomerados a partir de

los límites naturales geográficos o de otra clase. A continuación se seleccionan

los conglomerados al azar y se toma una muestra de forma aleatoria con

elementos de cada grupo.

Autoevaluación 8.2 Consulte la autoevaluación 8.1 y la lista de alumnos de la página 264. Suponga que en un mues-

treo aleatorio sistemático se elegirá a cada noveno estudiante de la clase. Al principio se elige al azar al cuarto estudiante de la lista. Dicho estudiante es el número 03. Recuerde que los números aleatorios comienzan con 00, entonces, ¿qué estudiantes se elegirán como miembros de la mues- tra? Probabilidad Número de Frecuencia Número Estrato (recuperación de capital) empresas relativa muestreado 1 30% y más 8 0.02 1* 2 De 20% a 30% 35 0.10 5* 3 De 10% a 20% 189 0.54 27 4 De 0% a 10% 115 0.33 16 5 Déficit 5 0.01 1 Total 352 1.00 50 *0.02 de 50 â 1, 0.10 de 50 â 5, etcétera.

Métodos de muestreo y teorema del límite central 267

Ejercicios  La siguiente lista incluye las tiendas de Marco’s Pizza en el condado de Lucas. También se indica si la tienda es propiedad de alguna corporación (C) o del administrador (A). Se selec- cionará e inspeccionará una muestra de cuatro establecimientos en relación con la conve- niencia para el cliente, la seguridad, la higiene y otras características.  B Los números aleatorios seleccionados son 08, 18, 11, 02, 41 y 54. ¿Qué tiendas se eligieron?  C Utilice la tabla de números aleatorios para seleccionar su propia muestra de establecimientos.  D Una muestra consta de cada séptimo establecimiento. El número 03 es el punto de partida. ¿Qué establecimientos se incluirán en la muestra?  E Suponga que una muestra consta de tres establecimientos, de los cuales dos son propie- dad corporativa y uno del administrador. Seleccione una muestra adecuada.  La siguiente lista incluye hospitales localizados en las regiones de Cincinnati (Ohio) y la región norte de Kentucky. También indica si se trata de un hospital general médico o quirúrgico (M/ Q), o de especialidades (E). Interesa calcular el promedio de enfermeras que trabaja medio tiempo en los hospitales del área.  B Se va a seleccionar de forma aleatoria una muestra de cinco hospitales. Los números alea- torios son 09, 16, 00, 49, 54, 12 y 04. ¿Qué hospitales se incluyen en la muestra?  C Utilice una tabla de números aleatorios para formar su propia muestra de cinco hospitales. Número Número de identi- de identi- ficación Dirección Tipo ficación Dirección Tipo 00 2607 Starr Av C 12 2040 Ottawa River Rd C 01 309 W Alexis Rd C 13 2116 N Reynolds Rd C 02 2652 W Central Av C 14 3678 Rugby Dr C 03 630 Dixie Hwy A 15 1419 South Av C 04 3510 Dorr St C 16 1234 W Sylvania Av C 05 5055 Glendale Av C 17 4624 Woodville Rd A 06 3382 Lagrange St A 18 5155 S Main A 07 2525 W Laskey Rd C 19 106 E Airport Hwy C 08 303 Louisiana Av C 20 6725 W Central A 09 149 Main St C 21 4252 Monroe C 10 835 S McCord Rd A 22 2036 Woodville Rd C 11 3501 Monroe St A 23 1316 Michigan Av A Número de identi- ficación Nombre Dirección Tipo 10 Christ Hospital 2139 Auburn Avenue M/Q Cincinnati, Ohio 45219 11 Deaconess 311 Straight Street M/Q Hospital Cincinnati, Ohio 45219 12 Good Samaritan 375 Dixmyth Avenue M/Q Hospital Cincinnati, Ohio 45220 13 Jewish Hospital 3200 Burnet Avenue M/Q Cincinnati, Ohio 45229 14 University Hospital 234 Goodman Street M/Q Cincinnati, Ohio 45267 15 Providence Hospital 2446 Kipling Avenue M/Q Cincinnati, Ohio 45239 16 St. Francis- 3131 Queen City Avenue M/Q St. George Hospital Cincinnati, Ohio 45238 17 St. Elizabeth Medical 401 E. 20th Street M/Q Center, North Unit Covington, Kentucky 41014 18 St. Elizabeth Medical One Medical Village M/Q Center, South Unit Edgewood, Kentucky 41017 19 St. Luke’s Hospital 7380 Turfway Drive M/Q West Florence, Kentucky 41075 Número de identi- ficación Nombre Dirección Tipo 00 Bethesda North 10500 Montgomery M/Q Cincinnati, Ohio 45242 01 Ft. Hamilton-Hughes 630 Eaton Avenue M/Q Hamilton, Ohio 45013 02 Jewish Hospital- 4700 East Galbraith Rd. M/Q Kenwood Cincinnati, Ohio 45236 03 Mercy Hospital- 3000 Mack Road M/Q Fairfield Fairfield, Ohio 45014 04 Mercy Hospital- 100 Riverfront Plaza M/Q Hamilton Hamilton, Ohio 45011 05 Middletown 105 McKnight Drive M/Q Regional Middletown, Ohio 45044 06 Clermont Mercy 3000 Hospital Drive M/Q Hospital Batavia, Ohio 45103 07 Mercy Hospital- 7500 State Road M/Q Anderson Cincinnati, Ohio 45255 08 Bethesda Oak 619 Oak Street M/Q Hospital Cincinnati, Ohio 45206 09 Children’s Hospital 3333 Burnet Avenue M/Q Medical Center Cincinnati, Ohio 45229

Métodos de muestreo y teorema del límite central 269

 B Seleccione una muestra aleatoria de cuatro agentes. Los números aleatorios son: 02, 59, 51, 25, 14, 29, 77, 69 y 18. ¿Qué distribuidores se incluirán en la muestra?  C Utilice la tabla de números aleatorios para seleccionar su propia muestra de cuatro agentes.  D Una muestra consta de cada séptimo distribuidor. El número 04 se selecciona como punto de partida. ¿Qué agentes se incluirán en la muestra? “Error” de muestreo

En la sección anterior se estudiaron métodos de muestreo útiles para seleccionar una

muestra que constituya una representación imparcial o sin sesgos de la población. Es

importante señalar que, en cada método, la selección de cualquier posible muestra de

determinado tamaño de una población tiene una posibilidad o probabilidad conocidas.

Ésta constituye otra forma de describir un método de muestreo sin sesgo.

Las muestras se emplean para determinar características de la población. Por ejem-

plo, con la media de una muestra se calcula la media de la población. No obstante,

como la muestra forma parte o es una porción representativa de la población, es poco

probable que la media de la muestra sea exactamente igual a la media poblacional.

Asimismo, es poco probable que la desviación estándar de la muestra sea exactamente

igual a la desviación estándar de la población. Por tanto, puede esperar una diferencia

entre un estadístico de la muestra y el parámetro de la población correspondiente. Esta

diferencia recibe el nombre de

El siguiente ejemplo aclara el concepto de error de muestreo.

ERROR DE MUESTREO Diferencia entre el estadístico de una muestra y el

parámetro de la población correspondiente.

Ejemplo Solución

Revise el ejemplo anterior de la página 263, en el que estudió el número de habita-

ciones rentadas en Foxtrot Inn, en Tryon, Carolina del Norte. La población se refie-

re al número de habitaciones rentadas cada uno de los 30 días de junio de 2006.

Determine la media de la población. Utilice Excel u otro software de estadística para

seleccionar tres muestras aleatorias de cinco días. Calcule la media de cada muestra

y compárela con la media poblacional. ¿Cuál es el error de muestreo en cada caso?

Durante el mes se rentaron un total de 94 habitaciones. Así, la media de las unidades

rentadas por noche es de 3.13. Ésta es la media de la población. Este valor se desig-

na con la letra griega N.

ΣX

N

La primera muestra aleatoria de cinco noches dio como resultado el siguiente núme-

ro de habitaciones rentadas: 4, 7, 4, 3 y 1. La media de esta muestra de cinco noches

es de 3.8 habitaciones, que se representa como X

_

1. La barra sobre la^ X^ recuerda que

se trata de una media muestral, y el subíndice 1 indica que se trata de la media de

la primera muestra.

X

X

1 n

El error de muestreo para la primera muestra es la diferencia entre la media poblacio-

nal (3.13) y la media muestral (3.80). De ahí que el error muestral sea (X

_

1 –^ N^ = 3.

  • 3.13 = 0.67). La segunda muestra aleatoria de cinco días de la población de 30 días

de junio arrojó el siguiente número de habitaciones rentadas: 3, 3, 2, 3 y 6. La media

de estos cinco valores es de 3.4, que se calcula de la siguiente manera:

X

X

2 n

El error de muestreo es (X

_

2 –^ N^ = 3.4 – 3.13 = 0.27).

270 Capítulo 8

Distribución muestral de la media

Ahora que aparece la posibilidad de que se presente un error de muestreo cuando se

emplean los resultados del muestreo para aproximar un parámetro poblacional, ¿cómo

hacer un pronóstico preciso relacionado con el posible éxito de un nuevo dentífrico u

otro producto sobre la única base de los resultados del muestreo? ¿Cómo puede el

departamento de control de calidad, de una compañía de producción en serie, enviar

un cargamento de microchips a partir de una muestra de 10 chips? ¿Cómo pueden las

organizaciones electorales de CNN-USA Today o ABC News-Washington Post hacer

pronósticos precisos sobre la elección presidencial con base en una muestra de 1 200

electores registrados de una población de cerca de 90 millones? Para responder estas

preguntas, primero hay que precisar el concepto de distribución muestral de la media.

Las medias muestrales del ejemplo anterior varían de una muestra a la siguiente. La

media de la primera muestra de 5 días fue de 3.80 habitaciones, y la media de la segun-

da muestra fue de 3.40 habitaciones. La media poblacional fue de 3.13 habitaciones.

Si organiza las medias de todas las muestras posibles de 5 días en una distribución de

probabilidad, el resultado recibe el nombre de

Las medias muestrales varían de

muestra en muestra

En la tercera muestra aleatoria, la media fue de 1.8, y el error de muestro fue de

Cada una de estas diferencias, 0.67, 0.27 y –1.33, representa el error de mues-

treo cometido al calcular la media de la población. A veces estos errores son valores

positivos, lo cual indica que la media muestral sobreexcedió la media poblacional;

otras veces son valores negativos, lo cual indica que la media muestral resultó inferior

a la media poblacional.

DISTRIBUCIÓN MUESTRAL DE LA MEDIA Distribución de probabilidad de todas las

posibles medias de las muestras de un determinado tamaño muestra de la

población.

En este caso, con una población de 30 valores y muestras de 5 valores, existe

una gran cantidad de posibles muestras, 142 506, para ser exactos. Para calcular

este valor se aplica la fórmula de las combinaciones 5.10, de la página 168. Cada

una de las 142 506 diferentes muestras cuenta con las mismas posibilidades de que

se le seleccione. Cada muestra puede tener una media muestral diferente y, por con-

siguiente, un error de muestreo distinto. El valor del error de muestreo se basa en el

valor particular de las 142 506 posibles muestras seleccionadas. Por consiguiente,

los errores de muestreo son aleatorios y se presentan al azar. Si determinara la suma

de estos errores de muestreo en una gran cantidad de muestras, el resultado se

aproximaría mucho a cero. Sucede así porque la media de la muestra constituye un

estimador sin sesgo de la media de la población.

272 Capítulo 8

En resumen, tome todas las posibles muestras aleatorias de una población y calcule

un estadístico muestral (la media de los ingresos percibidos) para cada una. Este ejem-

plo ilustra las importantes relaciones entre la distribución poblacional y la distribución

muestral de la media:

1. La media de las medias de las muestras es exactamente igual a la media de la

población.

2. La dispersión de la distribución muestral de la media es más estrecha que la distri-

bución poblacional.

3. La distribución muestral de la media suele tener forma de campana y se aproxima a

la distribución de probabilidad normal.

3. La media de la distribución muestral de la media se obtiene al sumar las medias

muestrales y dividir la suma entre el número de muestras. La media de todas las

medias muestrales se representa mediante NX^ _. La N recuerda que se trata de un

valor poblacional, pues tomó en cuenta todas las muestras posibles. El subíndi-

ce X

_

indica que se trata de la distribución muestral de la media.

μX =

Suma de todas las medias muestrales

Total de muestras

4. Consulte la gráfica 8.1, donde aparecen las dos distribuciones poblacionales y

la distribución muestral de la media. Caben las siguientes observaciones:

a) La media de la distribución muestral de la media ($7.71) es igual a la media

de la población: N = NX^ _.

b) La dispersión de la distribución muestral de las medias es menor que la

dispersión de los valores de población. La media de las muestras varía de

$7.00 a $8.50, mientras que los valores de población varían de $7.00 a $9.00.

Observe que, conforme se incrementa el tamaño de la muestra, se reduce la

dispersión de la distribución muestral de las medias.

c) La forma de la distribución muestral de la media y la forma de la distribu-

ción de frecuencias de los valores de población son diferentes. La distribución

muestral de las medias tiende a adoptar más forma de campana y a aproxi-

marse a la distribución de probabilidad normal.

TABLA 8.4 Distribución muestral de la media para n = 2

La media de la población

es igual a la media de las

medias muestrales

GRÁFICA 8.1 Distribución de los valores de población y distribución muestral de las medias

 8 9 7 7.5 8 8.5 9 X
 X

Probabilidad Probabilidad Distribución de población Distribución muestral de las medias Ingresos por hora Media de la muestra o ingresos por hora Media muestral Número de medias Probabilidad $7.00 3. 7.50 9. 8.00 6. 8.50 3. 21 1.

Métodos de muestreo y teorema del límite central 273

Dada una distribución de probabilidad normal o de forma de campana, se aplican

los conceptos del capítulo 7 para determinar la probabilidad de seleccionar una muestra

con una media muestral específica. En la siguiente sección resalta la importancia del

tamaño de una muestra en relación con la distribución muestral de la media.

Ejercicios  Una población consta de los siguientes cuatro valores: 12, 12, 14 y 16.  B Enumere todas las muestras de tamaño 2 y calcule la media de cada muestra.  C Calcule la media de la distribución muestral de la media y la media de la población. Com- pare los dos valores.  D Compare la dispersión en la población con la de las medias de las muestras.  Una población consta de los siguientes cinco valores: 2, 2, 4, 4 y 8.  B Enumere todas las muestras de tamaño 2 y calcule la media de cada muestra.  C Calcule la media de la distribución muestral de las medias y la media de la población. Compare los dos valores.  D Compare la dispersión en la población con la de las medias de las muestras.  Una población consta de los siguientes cinco valores: 12, 12, 14, 15 y 20.  B Enumere todas las muestras de tamaño 3 y calcule la media de cada muestra.  C Calcule la media de la distribución muestral de las medias y la media de la población. Compare los dos valores.  D Compare la dispersión en la población con la de las medias de las muestras.  Una población consta de los siguientes cinco valores: 0, 0, 1, 3 y 6.  B Enumere todas las muestras de tamaño 3 y calcule la media de cada muestra.  C Calcule la media de la distribución muestral de las medias y la media de la población. Compare los dos valores.  D Compare la dispersión en la población con la de las medias de las muestras.  En el despacho de abogados Tybo and Associates, hay seis socios. En la siguiente tabla se incluye el número de casos que en realidad atendió cada socio en los tribunales durante el mes pasado.

Autoevaluación 8.3 Los tiempos de servicio de los ejecutivos que laboran en Standard Chemicals son los siguientes:

a) De acuerdo con la fórmula de las combinaciones, ¿cuántas muestras de tamaño 2 son posi- bles? b) Elabore una lista de todas las muestras posibles de 2 ejecutivos de la población y calcule las medias. c) Organice las medias en una distribución muestral. d) Compare la media poblacional y la media de las medias de las muestras. e) Compare la dispersión en la población con la dispersión de la distribución muestral de la media. f) A continuación se muestra una gráfica con los valores de la población. ¿Tienen los valores de población una distribución normal (en forma de campana)? g) ¿Comienza la distribución muestral de la media que se calculó en el inciso c) a indicar una tendencia a adoptar forma de campana? Nombre Años Señor Snow 20 Señora Tolson 22 Señor Kraft 26 Señora Irwin 24 Señor Jones 28 1 0 20 22 24 26 28 Tiempo de servicio Frecuencia

Métodos de muestreo y teorema del límite central 275

población. Observe la convergencia hacia una distribución normal sin importar la forma

de la distribución de población. La mayoría de los especialistas en estadística conside-

ran que una muestra de 30 o mayor es lo bastante grande para aplicar el teorema del

límite central.

La idea de que la distribución muestral de las medias de una población que no es

normal converge hacia la normalidad se ilustra en las gráficas 8.3, 8.4 y 8.5. En breve se

analiza este ejemplo con más detalles, pero la gráfica 8.3 es la gráfica de una distribu-

ción de probabilidad discreta con sesgo positivo. Hay varias posibles muestras de 5 que

puede seleccionar de esta población. Suponga que selecciona al azar 25 muestras de

tamaño 5 cada una y calcula la media de cada muestra. Estos resultados se muestran

en la gráfica 8.4. Observe que la forma de la distribución muestral de las medias cambió

la forma de la población original aunque sólo seleccionó 25 de las diversas posibles

muestras. En otras palabras, eligió 25 muestras al azar de tamaño 5 de una población

positivamente sesgada, y encontró que la distribución muestral de las medias cambió en

lo que se refiere a la forma de la población. A medida que toma muestras más grandes,

es decir, n = 20 en lugar de n = 5, la distribución muestral de las medias se aproximará

a la distribución normal. La gráfica 8.5 muestra los resultados de 25 muestras aleatorias

de 20 observaciones cada una tomadas de la misma población. Note la clara tendencia

hacia la distribución de probabilidad normal. Ésta es la esencia del teorema del límite

central. El siguiente ejemplo pondrá de relieve esta condición.

n  2 n  6 n  30 n  2 n  6 n  30 n  2 n  6 n  30 n  2 n  6 n  30 x x x x _ x _ x _ x _ x

_

x

_

x

_

x

_

x

_

x

_

x

_

x

_

x

Poblaciones

Distribuciones muestrales

GRÁFICA 8.2 Resultados del teorema del límite central para diversas poblaciones

276 Capítulo 8

Ejemplo Solución

Ed Spence dio inicio a su negocio de engranes hace 20 años. El negocio creció a lo

largo del tiempo y ahora cuenta con 40 empleados. Spence Sprockets, Inc., encara

algunas decisiones importantes relacionadas con la atención médica de sus emplea-

dos. Antes de tomar una decisión definitiva sobre el programa de atención médica

que va a comprar, Ed decide formar un comité de cinco empleados. Se pedirá al

comité que estudie el tema del cuidado de la salud y haga alguna recomendación

sobre el plan que mejor convenga a los empleados. Ed cree que el punto de vista

de los empleados más recientes en relación con el cuidado de la salud difiere de los

empleados con más experiencia. Si Ed selecciona al azar este comité, ¿qué puede

esperar en términos del promedio de años que llevan con Spence Sprockets los

miembros del comité? ¿Cuál es la forma de la distribución de años de experiencia de

todos los empleados (la población) en comparación con la forma de la distribución

muestral de las medias? Los tiempos de servicio (redondeados al año inmediato) de

los 40 empleados que actualmente están en nómina en Spence Sprockers, Inc., son

los siguientes:

La gráfica 8.3 muestra la distribución de los años de experiencia de la población de

40 empleados actuales. La distribución de tiempos de servicio tiene un sesgo positi-

vo, pues unos cuantos empleados han laborado en Spence Sprockets por un periodo

extenso. En específico, seis empleados han laborado en la compañía 10 años o más.

Sin embargo, como el negocio creció, el número de empleados se incrementó en los

últimos cinco años. De los 40 empleados, 18 han laborado en la compañía dos años

o menos.

Considere el primero de los problemas de Ed Spence. A él le gustaría formar un

comité de cinco empleados con el objeto de que estudien la cuestión del cuidado

de la salud y sugieran el tipo de cobertura de gastos médicos más adecuada para la

mayoría de los trabajadores. ¿Cómo elegiría al comité? Si lo selecciona al azar, ¿qué

puede esperar respecto del tiempo medio de servicio de quienes forman parte del

comité?

Años de servicio

Frecuencia

GRÁFICA 8.3 Tiempo de servicio en Spence Sprockets, Inc., de los empleados

278 Capítulo 8

tral de medias. La población de tiempos de servicio de los empleados (gráfica 8.3)

tiene un sesgo positivo, y la distribución de estas 25 medias muestrales no refleja

el mismo sesgo positivo. También existe una diferencia en el rango de las medias

muestrales en comparación con el rango de la población. La población varía de 0 a

19 años, mientras que las medias muestrales varían de 1.6 a 8.6 años.

La tabla 8.6 contiene los resultados de seleccionar 25 muestras de 20 emplea-

dos cada una y el cálculo de las medias muestrales. Estas medias muestrales apare-

cen en la gráfica 8.5. Compare la forma de esta distribución con la población (gráfica

8.3) y con la distribución muestral de medias si la muestra es de n = 5 (gráfica 8.4).

Observe dos importantes características:

Tiempo medio de servicio

Frecuencia

GRÁFICA 8.4 Histograma de tiempos de servicio medios para 25 muestras de cinco

empleados

TABLA 8.6 Muestras aleatorias y medias muestrales de 25 muestras de 20 empleados de Spence Sprockets, Inc.

Número de Media muestra Datos de la muestra (tiempo de servicio) muestral A 3 8 3 0 2 1 2 3 11 5 1 3 4 2 7 1 1 2 4 16 3. B 2 3 8 2 1 5 2 0 3 1 0 7 1 4 3 11 4 4 3 1 3. C 14 5 0 3 2 14 11 9 2 2 1 2 19 1 0 1 4 2 19 8 5. D 9 2 1 1 4 10 0 8 4 3 2 1 0 8 1 14 5 10 1 3 4. E 18 1 2 2 4 3 2 8 2 1 0 19 4 19 0 1 4 0 3 14 5. F 10 4 4 18 3 3 1 0 0 2 2 4 7 10 2 0 3 4 2 1 4. G 5 7 11 8 11 18 1 1 16 2 2 16 2 3 2 16 2 2 2 4 6. H 3 0 2 0 5 4 5 3 8 3 2 5 1 1 2 9 8 3 16 5 4. I 0 0 18 2 1 7 4 1 3 0 3 2 11 7 2 8 5 1 2 3 4. J 2 7 2 4 1 3 3 2 5 10 0 1 1 2 9 3 2 19 3 2 4. K 7 4 5 3 3 0 18 2 0 4 2 7 2 7 4 2 10 1 1 2 4. L 0 3 10 5 9 2 1 4 1 2 1 8 18 1 4 3 3 2 0 4 4. M 4 1 2 1 7 3 9 14 8 19 4 4 1 2 0 3 1 2 1 2 4. N 3 16 1 2 4 4 4 2 1 5 2 3 5 3 4 7 16 1 11 1 4. O 2 19 2 0 2 2 16 2 3 11 9 2 8 0 8 2 7 3 2 2 5. P 2 18 16 5 2 2 19 0 1 2 11 4 2 2 1 4 2 0 4 3 5. Q 3 2 3 11 10 1 1 5 19 16 7 10 3 1 1 1 2 2 3 1 5. R 2 3 1 2 7 4 3 19 9 2 2 1 1 2 2 2 1 8 0 2 3. S 2 14 19 1 19 2 8 4 2 2 14 2 8 16 4 7 2 9 0 7 7. T 0 1 3 3 2 2 3 1 1 0 3 2 3 5 2 10 14 4 2 0 3. U 1 0 1 2 16 1 1 2 5 1 4 1 2 2 2 2 2 8 9 3 3. V 1 9 4 4 2 8 7 1 14 18 1 5 10 11 19 0 3 7 2 11 6. W 8 1 9 19 3 19 0 5 2 1 5 3 3 4 1 5 3 1 8 7 5. X 4 2 0 3 1 16 1 11 3 3 2 18 2 0 1 5 0 7 2 5 4. Y 1 2 1 2 0 2 7 2 4 8 19 2 5 3 3 0 19 2 1 18 5.

Métodos de muestreo y teorema del límite central 279

¿Qué concluye de este ejemplo? El teorema del límite central indica que, sin impor-

tar la forma de la distribución de población, la distribución muestral de la media se

aproximará a la distribución de probabilidad normal. Cuanto mayor sea el número de

observaciones en cada muestra, más evidente será la convergencia. El ejemplo de

Spence Sprockets, Inc., demuestra el mecanismo del teorema del límite central. Comen-

zó con una población con sesgo positivo (gráfica 8.3). Después seleccionó 25 muestras

aleatorias de 5 observaciones; calculó la media de cada muestra y, por último, organizó

las 25 medias de muestra en una gráfica (gráfica 8.4). Observó un cambio en la forma

de la distribución muestral de las medias respecto de la propia de la población. El des-

plazamiento va de una distribución con sesgo positivo a una que tiene la forma de la

distribución de probabilidad normal.

Para aclarar más los efectos del teorema del límite central, incremente el número de

observaciones en cada muestra de 5 a 20. Seleccione 25 muestras de 20 observaciones

cada una y calcule la media de cada muestra. Por último, organice estas medias mues-

trales en una gráfica (gráfica 8.5). La forma del histograma de la gráfica 8.5 se desplaza

claramente hacia la distribución de probabilidad normal.

1. La forma de la distribución muestral de las medias es diferente a la de la pobla-

ción. En la gráfica 8.3, la distribución de empleados tiene un sesgo positivo. No

obstante, conforme selecciona muestras aleatorias de la población, cambia la

forma de la distribución muestral de las medias. A medida que incrementa el

tamaño de la muestra, la distribución muestral de las medias se aproxima a la

distribución de probabilidad normal. Este hecho se ilustra con el teorema del

límite central.

2. Hay menos dispersión en la distribución muestral de las medias que en la distri-

bución de la población. En la población, los periodos de servicio variaron de 0 a

19 años. Cuando seleccionó muestras de tamaño 5, las medias de las muestras

variaron de 1.6 a 8.6 años, y cuando seleccionó muestras de 20, las medias

variaron de 3.05 a 7.10 años.

También puede comparar la media de las medias de la muestra con la media de

la población. La media de las 25 muestras de los 20 empleados de la tabla 8.6 es de

4.676 años.

μX =

Emplee el símbolo NX^ _^ para identificar la media de la distribución muestral de las

medias. El subíndice recuerda que la distribución se refiere a la media muestral. Se

lee mu subíndice X barra. Observe que la media de las medias muestrales, 4.

años, se encuentra muy próxima a la media de la población de 4.80.

Tiempo medio de servicio

Frecuencia

GRÁFICA 8.5 Histograma del tiempo medio de servicio de 25 muestras de 20 empleados