
















Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: analisis de datos II, Profesor: Ricardo Olmos, Carrera: Psicología, Universidad: UAM
Tipo: Apuntes
1 / 24
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!

















Ya hemos señalado que el análisis de datos es un proceso que se desarrolla en fases: comienza con la selección y recopilación de los datos, continúa con la aplicación de herramientas descriptivas para explorar, organizar y resumir la información contenida en los datos y termina (no necesariamente, pero sí habitualmente) con la aplicación de herramientas inferenciales para llevar a cabo comparaciones y estudiar relaciones. En los capítulos previos hemos estudiado ya lo relativo a la selección de casos (brevemente, pues esta parte es más bien objeto de los diseños de investigación) y a las herramientas disponibles para abordar la fase descriptiva. Éste y los siguientes capítulos se ocupan de la fase inferencial. La inferencia estadística es un tipo de razonamiento que procede de lo particular a lo general: intenta extraer conclusiones de tipo general a partir de unos pocos datos particulares. Ha llegado el momento de concretar que al hablar de conclusiones de tipo general nos estamos refiriendo a conclusiones sobre la forma de una población o sobre alguno de sus parámetros , y al hablar de datos particulares nos estamos refiriendo a una muestra de esa población y a alguno de sus estadísticos. Y esto, en la práctica, sig- nifica, según tendremos ocasión de comprobar repetidamente, realizar comparaciones y estudiar relaciones.
Estas inferencias (comparaciones, relaciones) pueden realizarse utilizando dos es- trategias distintas: la estimación de parámetros y el contraste de hipótesis. Ambas formas de inferencia son equivalentes en el sentido de que ambas permiten abordar el mismo tipo de problemas y llegar a las mismas conclusiones (podría pensarse en ellas como en las dos caras de una misma moneda), pero, puesto que la información que ofre- cen no es exactamente la misma, conviene prestar atención a ambas. El contraste de hipótesis ha constituido tradicionalmente la esencia de lo que hoy llamamos análisis estadístico; sin embargo, raramente se ha visto libre de críticas (ver, por ejemplo, Morrison y Henkel, 1970). Las críticas dirigidas al contraste de hipótesis han alcanzado su máxima expresión en la pasada década de los noventa, la cual ha sido testigo de un agrio debate promovido por una corriente muy crítica con el uso y abuso de esta estrategia (ver, por ejemplo, Chow, 1996; Hagen, 1997; Harlow, Mulaik y Steiger, 1997; Nikerson, 2000). Algunos autores han llegado a proponer, incluso, el abandono del contraste de hipótesis como es- trategia de análisis de datos por no considerarlo un método válido para generar conoci- miento científico (Cohen, 1990, 1994; Gigerenzer, 1993; Oakes, 1986; Schmidt, 1996). Dejando a un lado estos puntos de vista extremos (difícilmente sostenibles; ver, por ejemplo, Cortina y Dunlap, 1997), las conclusiones de este debate podrían resumirse, quizá, en la recomendación de acompañar todo contraste con su correspondiente esti- mación. Porque lo cierto es que la estimación y el contraste se complementan. A pesar de que son equivalentes en muchos aspectos, la información que ofrecen es algo distinta: mientras que el contraste de hipótesis pone el énfasis en intentar detectar la presencia de un efecto significativo (una diferencia entre grupos, una relación entre variables), la estimación de parámetros pone el énfasis en intentar cuantificar el tamaño de ese efecto (cómo de grande es la diferencia entre los grupos, cómo de intensa es la relación entre las variables). En este capítulo se explica la lógica de la estimación de parámetros; en el próximo, la del contraste de hipótesis. Ambas estrategias son posibles gracias a las distribuciones muestrales (ver capítulo anterior). Tanto el contraste de hipótesis como la estimación de parámetros se basan en la variabilidad inherente a todo estadístico (recordemos que un estadístico no es una constante , sino una variable ; en caso necesario, revisar el con- cepto de estadístico en el Capítulo 2). Y son las distribuciones muestrales las que in- forman sobre esa variabilidad.
La estimación de parámetros se refiere al proceso mediante el cual la información muestral es utilizada para inferir valores poblacionales. Los valores poblacionales que se estiman son, lógicamente, parámetros y, es obvio decirlo, la estimación únicamente tiene sentido con parámetros desconocidos (pues, si se conoce un parámetro, no es ne- cesario estimarlo).
(^1) Otras propiedades deseables en un estimador son la consistencia , la suficiencia y la robustez. Un estadístico es
un estimador consistente del parámetro si, para n tendiendo a infinito, se verifica < k ) ÷ 1 (para una cantidad k infinitamente pequeña). La consistencia garantiza que, a medida que el tamaño muestral va aumentando, también va aumentando la probabilidad de que el valor del estimador coincida exactamente con el parámetro esti- mado. Los estadísticos media , varianza (la sesgada y la insesgada) y proporción son, todos ellos, estimadores con- sistentes de sus respectivos parámetros; para constatar esto basta considerar que el tamaño muestral forma parte del denominador de sus respectivas varianzas. Un estadístico es un estimador suficiente si, al estimar el parámetro , utiliza toda la información muestral rela- cionada con. Es decir, si es un estimador suficiente de , la estimación obtenida no puede mejorarse conside- rando información muestral no incluida en. Los estadísticos media , varianza (la sesgada y la insesgada) y pro- porción son estimadores suficientes de sus respectivos parámetros, pues en todos ellos se utiliza toda la informa- ción muestral (una simple inspección de sus fórmulas permite comprobar que todos ellos se obtienen a partir de todos los elementos muestrales). La moda, sin embargo, se basa en un único valor (el que más se repite); y la mediana se basa sólo en los valores centrales. La robustez se refiere al grado en que un estimador se ve afectado cuando no se dan las condiciones óptimas para su aplicación. Decimos que un estadístico es robusto cuando ofrece buenas estimaciones incluso cuando no se dan las condiciones que en teoría deberían darse para ello. Tendremos ocasión de volver sobre esta propiedad. (^2) (ver Apéndice 6, ecuación [6.10]); (ver Apéndice 6, ecuación [6.15]); y (ver
Capítulo 6, ecuación [6.7]).
Propiedades de un buen estimador
Entre las propiedades que debe tener un buen estimador cabe destacar dos 1 : carencia de sesgo y eficiencia. Lo primero que debe exigirse a un estimador es que ofrezca esti- maciones correctas. No obstante, dado que un estimador (un estadístico) no siempre toma el mismo valor (su valor, ya lo sabemos, depende de la muestra concreta en la que se calcula), no todos los valores que puede tomar coincidirán con el del parámetro esti- mado. Aun así, de un buen estimador cabe esperar que ofrezca estimaciones correctas al menos en promedio. A esta propiedad de ofrecer, en promedio, estimaciones correc- tas se le llama carencia de sesgo y, se dice, por tanto, que un estimador es insesgado si su valor esperado (su media) coincide con el parámetro que estima, es decir, si
= [7.1]
Por ejemplo, los estadísticos Y
, y P 1 son estimadores insesgados 2 de sus corres- pondientes parámetros , y 1 (de ahí que al estadístico se le llame varianza in- sesgada ). Por el contrario, el estadístico es un estimador sesgado de (ver, por ejemplo, Pardo y San Martín, 1998, págs. 72-73). Y el coeficiente de correlación de Pearson (un estadístico muy útil que estudiaremos en el Capítulo 11) es otro ejemplo de estimador sesgado, pues su valor esperado solamente coincide con el parámetro que estima cuando éste vale cero. La segunda propiedad deseable en un estimador es la eficiencia. Un estimador es tanto más eficiente cuanto menor es su varianza. Supongamos que, para estimar , con- tamos con dos estadísticos distintos y. Decimos que es más eficiente que si se verifica:
[7.2]
(^3) Por ejemplo, en el caso concreto de una distribución normal:. Es decir, la varianza
del estadístico media es menor que la del estadístico mediana. (^4) Sabemos que y que (ver, por ejemplo, Pardo y San
Martín, 1998, págs. 72-73). Ahora bien, puesto que ( n! 1) / n^2 es menor que ( n! 1) / ( n! 1) 2 , puede afirmarse que la varianza sesgada es un estimador de más eficiente que la varianza insesgada (no obstante, esta diferencia en la eficiencia de ambos estimadores va disminuyendo hasta anularse conforme el tamaño muestral va aumentando).
Sabemos, por ejemplo, que en una distribución simétrica la media y la mediana toman el mismo valor. Por tanto, para estimar el centro de una distribución simétrica podría utilizarse indistintamente la media ( Y
) o la mediana ( Mdn ). Sin embargo, en general, es preferible utilizar Y
porque, además de ser un estimador insesgado, es más eficiente 3 que Mdn. También sabemos que el parámetro puede estimarse utilizando dos estadísticos distintos: y. De los dos, solamente es insesgado; pero es más eficiente 4 que. Una mayor eficiencia indica que el estadístico en cuestión varía menos de una muestra a otra, por lo que las estimaciones que pueden hacerse con él son más precisas que las que se hacen con un estimador menos eficiente. Lo cierto es que, aunque un esti- mador insesgado ofrece, en promedio, estimaciones correctas, si ese estimador no es efi- ciente (es decir, si su varianza es muy grande), muchas de sus estimaciones estarán muy por encima del verdadero valor del parámetro y otras muchas muy por debajo. Aunque unas y otras se contrarresten para ofrecer una estimación promedio correcta (hemos di- cho que es insesgado), al elegir al azar una de esas estimaciones se estará corriendo el riesgo de cometer un error muy grande. De ahí la conveniencia de que un estimador sea, además de insesgado, eficiente. La Figura 7.1 puede ayudar a comprender el significado de estas dos propiedades. Los cuadros de la figura representan dianas sobre las que se han efectuado 10 disparos. Lógicamente, los disparos se han hecho intentando acertar en el centro de la diana. La situación puede extrapolarse fácilmente a la estimación de parámetros si se considera que el centro de la diana representa el parámetro que se desea estimar y que los 10 dis- paros corresponden a 10 estimaciones efectuadas con un estimador calculado en 10 muestras distintas. En la diana A , los disparos están muy concentrados en torno al blanco; todas las distancias al blanco son bastante cortas y no existe ninguna desviación sistemática del mismo; se trata de un estimador insesgado y eficiente. En la diana B , todos los dispa- ros están muy alejados del blanco; aun no existiendo una desviación sistemática en nin- guna dirección, el acierto es bastante escaso; se trata de un estimador insesgado pero poco eficiente. En la diana C , los disparos están concentrados en un punto alejado del blanco; aunque podría decirse que la puntería es bastante alta (los disparos van siem- pre casi al mismo sitio), existe una desviación sistemática (sesgo) del blanco; se trata de un estimador eficiente pero sesgado. En la diana D , por último, los disparos se en- cuentran dispersos y alejados del blanco, al igual que en la diana B , pero además existe una desviación sistemática (sesgo) del blanco; se trata de un estimador sesgado y poco eficiente.
El error máximo representa la diferencia máxima que, con una determinada probabi- lidad, cabe esperar encontrar entre el verdadero valor del parámetro estimado, , y el valor concreto del estadístico utilizado para estimarlo,. La utilidad de esta estrategia radica justamente en que permite conocer la proba- bilidad con la que cabe esperar que el intervalo construido incluya el verdadero valor del parámetro estimado. A esa probabilidad se le llama nivel de confianza y se repre- senta mediante 1! :
P ( L (^) i <$ <$ L (^) s ) = 1! [7.5]
(esta expresión se lee así: la probabilidad de que el parámetro se encuentre entre L (^) i y L (^) s vale 1! ). Es claro que para conocer el nivel de confianza es necesario que la can- tidad E máx esté referida a alguna distribución de probabilidad conocida, en concreto, a la distribución muestral del estadístico utilizado como estimador. Por tanto, para poder construir intervalos de confianza es necesario utilizar estimadores con distribución muestral conocida. Según veremos enseguida, en la estimación por intervalos se co- mienza fijando el nivel de confianza con el que se desea trabajar (condición de partida) y se continúa calculando la cantidad ( E máx ) que permite construir el intervalo que satis- face la condición impuesta. Consideremos una población Y (^) i formada por los elementos {1, 2, 3, 4, 5}. Si ex- traemos de esa población, con reposición, todas las posibles muestras aleatorias de ta- maño n = 2 y en cada una de ellas calculamos el estadístico Y
, podemos obtener la distribución muestral de la media que recoge la Tabla 7.1 (esta población de N = 5 elementos ya la hemos estudiado en el capítulo anterior, en el apartado Distribuciones muestrales: un caso concreto ). La tabla incluye las 25 muestras de tamaño n = 2 que es posible extraer de la población Y (^) i = {1, 2, 3, 4, 5}, los distintos valores que puede to- mar el estadístico Y
y la frecuencia relativa asociada a cada uno de ellos. Haciendo los cálculos oportunos se obtiene
= = 3 y = = = 1
Aunque conocemos el valor del parámetro y, por tanto, no es necesario estimarlo, vamos a ver qué ocurre al intentar estimarlo. Al seleccionar una muestra de la población definida puede resultar elegida una cualquiera de las 25 posibles. Sabemos que el valor de Y
va a depender de la muestra concreta elegida. La estimación por intervalos consis- te en considerar que el verdadero valor de no se alejará del estadístico Y
en más de una determinada cantidad ( E máx ). Comencemos suponiendo que esa cantidad es 1 error típico ( ), es decir,
L (^) i = y L (^) s =
Al atribuir al parámetro un rango de valores comprendidos entre L (^) i y L (^) s , el error má- ximo que estamos dispuestos a admitir es de 1 error típico: E máx =. Ahora bien, ¿qué garantía tenemos de que nuestra estimación es correcta? Veamos lo que ocurre con cada una de las 25 muestras posibles. Si la muestra que resulta elegida es (1, 1), la media arit-
mética Y
valdrá 1, y al construir el intervalo de confianza para efectuar la estimación, como E máx = = 1, obtendremos,
L (^) i = 1! 1 = 0 y L (^) s = 1 + 1 = 2
lo que nos llevará a inferir que el verdadero valor del parámetro se encuentra entre 0 y 2. Como el valor del parámetro es 3, con la muestra (1, 1) estaríamos construyendo un intervalo incorrecto, es decir, estaríamos asignado al parámetro un rango de valores entre los que, de hecho, no se encuentra su verdadero valor.
Tabla 7.1. Distribución muestral de la media ( Y
) formada a partir de las muestras de tamaño n = 2 que es posible extraer con reposición de la población Y = {1, 2, 3, 4, 5}
Muestras posibles Y
_ f ( Y
_ ) -1,1 1 1/ 25 (1,2) (2,1) 1,5 2/ 25 (1,3) (2,2) (3,1) 2 3/ 25 (1,4) (2,3) (3,2) (4,1) 2,5 4/ 25 (1,5) (2,4) (3,3) (4,2) (5,1) 3 5/ 25 (2,5) (3,4) (4,3) (5,2) 3,5 4/ 25 (3,5) (4,4) (5,3) 4 3/ 25 (4,5) (5,4) 4,5 2/ 25 -5,5 5 1/ 25 1 ;
Si en lugar de la muestra (1, 1) resultara elegida la muestra (1, 2) o la muestra (2, 1), el intervalo de confianza se construiría a partir de Y
= 1,5 y los límites de confianza resul- tantes serían
L (^) i = 1,5! 1 = 0,5 y L (^) s = 1,5 + 1 = 2,
Por tanto, ahora estaríamos afirmando que el verdadero valor de se encuentra entre 0,5 y 2,5, lo cual es, de nuevo, una estimación incorrecta pues el verdadero valor de es 3. Si resultaran elegidas las muestras (1, 3), (2, 2) o (3, 1), el intervalo de confianza se construiría a partir de Y
= 2 y los límites de confianza resultantes serían
L (^) i = 2! 1 = 1 y L (^) s = 2 + 1 = 3
Con estas tres muestras sí estaríamos construyendo un intervalo correcto, pues el verda- dero valor del parámetro ( = 3) se encuentra entre los valores 1 y 3. Y también esta- ríamos construyendo intervalos correctos con las muestras: (1, 4), (1, 5), (2, 3), (2, 4), (2, 5), (3, 2), (3, 3), (3, 4), (3, 5), (4, 1), (4, 2), (4, 3), (4, 4), (5, 1), (5, 2) y (5, 3), pues
0,0228 0,
0,
^
0,0228 0,
0,
^
0,
0,
^
0,1587 0,
0,
^
0,
Esto significa que, de todos los intervalos que es posible construir en el escenario des- crito, el 76 % de ellos incluirá el verdadero valor de (el 24 % no lo incluirá). Por tan- to, trabajando con E máx = puede afirmarse con una confianza de 0,76 (o del 76 %) que el intervalo resultante incluye el valor del parámetro. Por supuesto, en lugar de tomar E máx = = 1, podríamos adoptar cualquier otro va- lor para E máx. Si, en lugar de un solo error típico, tomáramos, por ejemplo, 1,5 errores típicos, es decir,
E máx = 1,5 = 1,5 (1) = 1,
el porcentaje de intervalos que captarían el verdadero valor de sería distinto. En con- creto, habría 23 muestras de las 25 posibles que llevarían a construir intervalos co- rrectos. Únicamente las muestras (1, 1) y (5, 5) (es decir, 2 muestras de las 25 posibles) llevarían a construir intervalos incorrectos (intervalos que no incluirían el valor de ). Por tanto,
P ( Y
Por supuesto, el razonamiento utilizado con E máx = y con E máx = 1,5 sigue sien- do válido para cualquier otro valor de E máx ; por ejemplo, para 1,96 , o 2 , o 2,58 , etc.). El número de errores típicos que se elija determinará el tamaño de E máx ; y el ta- maño de E máx determinará el nivel de confianza del intervalo resultante. Es claro que cuanto mayor sea E máx , mayor será la amplitud del intervalo y mayor también la probabilidad de que el intervalo construido incluya el verdadero valor de θ. Pero debe tenerse en cuenta que, cuanto mayor sea E máx , menor será la precisión de la estimación, pues se estará atribuyendo al parámetro un rango más amplio de valores. La Figura 7.3 puede ayudar a entender esto con un estadístico distribuido normalmente. La parte del eje horizontal correspondiente a la zona no rayada equivale a la amplitud del intervalo de confianza. Obviamente, si se adopta E máx = (curva de la izquierda), el intervalo es sensiblemente más estrecho (más preciso) que si se adopta E máx = 2 (curva de la derecha), pero ese aumento en la precisión implica una disminución del nivel de confianza.
Figura 7.3. Probabilidades asociadas a los valores ± y ±2 en la distribución muestral de un estimador distribuido normalmente
Estas consideraciones sugieren la necesidad buscar un equilibrio entre dos objetivos contrapuestos: (1) que el intervalo construido sea lo bastante amplio como para garan- tizar que la probabilidad de incluir el parámetro sea alta y, al mismo tiempo, (2) lo bas- tante estrecho como para ofrecer una precisión aceptable. Este equilibrio se ha buscado tradicionalmente utilizando un nivel de confianza de 0,95 y, por tanto, un nivel de riesgo de 0,05. Se consiguen así intervalos de confianza con una precisión aceptable al tiempo que se mantiene un nivel de riesgo razonable- mente pequeño. Por supuesto, no hay nada que impida utilizar niveles de confianza co- mo 0,90 o 0,99, pero debe tenerse en cuenta que el nivel de confianza elegido determina el número de errores típicos que es necesario utilizar y, con ello, el tamaño de E máx y la amplitud o precisión del intervalo. Dado que las poblaciones con las que se suele trabajar son más grandes que la de este sencillo ejemplo, se comprenderá que no es tarea fácil (ni, muchas veces, posible) encontrar todas las muestras de tamaño n que es posible extraer de ellas. Pero en rea- lidad esto no es un problema porque, para construir intervalos de confianza, todo lo que se necesita es conocer la distribución muestral del estadístico utilizado como estima- dor: la distribución muestral de un estimador informa de la probabilidad asociada a cada uno de sus valores y eso es todo lo que hace falta para seguir la estrategia descrita. Y ya sabemos (ver capítulo anterior) que para conocer la distribución muestral de un es- tadístico no es necesario seleccionar una sola muestra; existen procedimientos mate- máticos que permiten conocer con exactitud el valor esperado, el error típico y la forma de muchas distribuciones muestrales.
Cómo interpretar un intervalo de confianza
Tras calcular un intervalo con un nivel de confianza de 0,95 se suele caer en la tentación de concluir que el parámetro estimado se encuentra entre los límites obtenidos con una probabilidad de 0,95. Pero esta afirmación no es del agrado de muchos estadísticos. La razón es que el concepto probabilidad debe ir asociado a variables, no a constantes. Y, una vez construido un intervalo, ya no existe ninguna variable: los límites del intervalo son dos valores concretos, dos constantes, y el parámetro estimado también lo es. Por tanto, al interpretar un intervalo de confianza hay que evitar la palabra probabilidad. Antes de construir el intervalo sí puede hablarse de probabilidad: existe una pro- babilidad de 0,95 de que la expresión incluya el verdadero valor del pará- metro. Una vez construido el intervalo ya no tiene sentido hablar de probabilidad: el valor del parámetro se encontrará o no dentro de los límites concretos del intervalo. Por tanto, un intervalo construido con una confianza de 0,95 puede interpretarse de la siguiente manera: estimamos, con una confianza del 95 %, que el verdadero valor del parámetro estimado se encuentra entre los límites del intervalo construido (hemos evi- tado la palabra probabilidad ). Y lo que esto significa realmente es que se ha utilizado un procedimiento que permite afirmar que de cada 100 intervalos que se construyan en las mismas condiciones, 95 de ellos incluirán el verdadero valor del parámetro (cinco de ellos no lo harán). Por supuesto, creemos (tenemos una confianza del 95%) que nues- tro intervalo es uno de los correctos.
(^5) En todo momento se está asumiendo población infinita o muestreo aleatorio con reposición en población finita.
Recordemos que, en condiciones de muestreo aleatorio sin reposición en población finita, el error típico de la dis- tribución muestral de la media (tanto si se conoce como si no) necesita ser corregido:
[7.10]
El procedimiento para construir un intervalo de confianza para la media sigue siendo el mismo. Solamente debe te- nerse en cuenta que, al trabajar con una población finita de tamaño N y muestreo sin reposición, el error típico de la distribución muestral de la media debe corregirse según acabamos de señalar. Por supuesto, a medida que vaya aumentando N , el término corrector ( N! n ) / ( n !1) irá tendiendo a 1, lo que significa que muestrear sin reposición una población finita grande será equivalente a muestrearla con reposición.
Y
_ _
Y
_ _
Figura 7.4. Curva normal tipificada N (0, 1). Valores relevantes en la estimación por intervalos
Si no se conoce el valor de , no es posible transformar Y
en Z. Pero sí es posible sus- tituir por su valor muestral para obtener la transformación (ver ecuación [6.4]):
T (^) = (con (^) =
que sabemos que se distribuye según el modelo de probabilidad t de Student con n! 1 grados de libertad (ver, en el Capítulo 6, el apartado Distribución muestral del esta- dístico media ) 5. Y, al igual que ocurre en una distribución normal, en una distribución t de Student se verifica (siguiendo el mismo razonamiento que con la transformación Z y la curva normal):
L (^) i L (^) s
Por tanto, haciendo E máx = , puede afirmarse, con un nivel de confianza de 1! , que el valor del parámetro no se alejará del estimador Y
en más de la canti-
0,
0,
Y
0,025 (^) _
0,
Y
0,025 (^) _
dad E máx. En consecuencia, si se desconoce el valor de , el intervalo de confianza para el parámetro puede construirse mediante
Con muestras grandes, las distribuciones t y normal son muy parecidas; en esos casos, utilizar una u otra no hace cambiar mucho las cosas (ver Apéndice 5). El Apéndice 9 incluye un apartado sobre la relación entre las transformaciones Z y T.
Ejemplo. Intervalo de confianza para el parámetro media
Una muestra aleatoria de 100 estudiantes universitarios responde a una prueba de inte- ligencia espacial ( Y ) en la que obtiene una media de 80 y una desviación típica insesga- da de 10. ¿Entre qué límites cabe esperar que se encuentre la verdadera inteligencia espacial media de los estudiantes universitarios, con un nivel de confianza de 0,95? Puesto que se desconoce el valor de Y , no es posible utilizar la estrategia propuesta en [7.8] basada en la transformación Z ; es necesario recurrir a la estrategia propuesta en [7.11] basada en la transformación T. Además, es necesario asumir que la distribución de la variable Y es normal, lo cual no representa ningún problema porque el tamaño muestral ( n = 100) es grande:
Aunque se desconoce el valor de Y , puesto que el tamaño muestral es grande, también puede utilizarse la estrategia propuesta en [7.8] basada en la transformación Z :
Puede comprobarse que, efectivamente, cuando n es grande, el resultado que se obtiene con la distribución normal es muy parecido al que se obtiene con la distribución t de Student.
Ejemplo. Intervalo de confianza para el parámetro proporción
En una muestra aleatoria de 320 madrileños mayores de 15 años se ha encontrado un 32 % de fumadores. A partir de este dato, ¿entre qué límites cabe esperar que se encuen- tre, con una confianza del 95 %, la verdadera proporción de fumadores en la población de madrileños mayores de 15 años? Tenemos una variable dicotómica (fumadores-no fumadores) de la que se han rea- lizado n = 320 ensayos con proporción de fumadores P 1 = 0,32. Por tanto,
Podemos afirmar, con una confianza del 95 %, que la proporción de fumadores en la población de madrileños mayores de 15 años se encuentra entre 0,27 y 0,37. ¿Qué amplitud tendría el intervalo con una muestra de mayor tamaño? Ya hemos señalado que, al aumentar el tamaño muestral, disminuye la amplitud del intervalo. Con n = 500, por ejemplo, se obtienen unos límites de 0,28 y 0,36.
Un intervalo de confianza suele ser tanto más útil e informativo cuanto menor es su amplitud. Ahora bien, la amplitud de un intervalo depende de dos factores: el nivel de confianza utilizado y el error típico del estimador. Si disminuye el nivel de confianza, también lo hace la amplitud del intervalo, pero a costa de incrementar el riesgo, lo cual no parece una solución razonable. La reducción de la amplitud del intervalo hay que intentar conseguirla sin alterar el nivel de confian- za; y eso pasa, necesariamente, por la reducción del error típico del estimador: cualquier acción que pueda llevarse a cabo para reducir el error típico tendrá como consecuencia una reducción de la amplitud del intervalo. En el caso de la media, su error típico depende tanto de la varianza de la población como del tamaño de la muestra, pues. Por lo que se refiere a la varianza poblacional, aun- que es cierto que no es posible eliminarla por completo porque las fuentes de error en un estudio empírico son muchas y de muy diversa índole, una cuidadosa elaboración del diseño de inves- tigación puede contribuir de forma eficaz a conseguir una importante reducción de la misma. Por lo que se refiere al tamaño de la muestra, está claro que un incremento del mismo tiene como consecuencia directa una disminución del error típico. Lo cual implica que, modificando el tamaño de la muestra, es posible controlar el grado de precisión del intervalo.
Veamos qué puede hacerse con el tamaño de la muestra para conseguir disminuir el error típico y obtener, como consecuencia de ello, una mayor precisión en la estimación. De acuerdo con el teorema de Tchebychev (ver, por ejemplo, Amón, 1984, págs. 130-131):
Conocida la distribución muestral del estimador y siendo k un valor estandarizado de la misma:
=
de donde, para un nivel de confianza 1! dado, tendremos
A partir de estas ecuaciones es posible determinar cuál ha de ser el tamaño de la muestra para alcanzar una determinada precisión. Consideraremos el caso de la media y el de la proporción.
El caso de la media
Sabemos que =. Haciendo k = Z , se obtiene
que, para un nivel de riesgo dado, indica el tamaño muestral necesario ( n ) para obtener una preci- sión concreta ( E ). Si se desconoce ^2 , sabemos que la tipificación del estadístico media no sigue la distribución normal, sino la distribución t de Student. En tal caso, haciendo k = t , se obtiene
Recordemos el ejemplo utilizado anteriormente en el apartado sobre el intervalo de confianza para el parámetro Y. Con una muestra de 100 estudiantes universitarios, una media muestral de 80, una desviación típica insesgada de 10 y un nivel de confianza de 0,95, se construyó un intervalo de confianza con límites 78,02 y 81,98, es decir un intervalo con una amplitud de 81, ! 78,02 = 3,96 puntos. Sin cambiar el nivel de confianza (0,95), ¿qué tamaño muestral sería necesario para que el intervalo construido tuviera una amplitud de 2 puntos (es decir, un error máximo de 1 punto)? Con la muestra de 100 sujetos, el intervalo tiene una amplitud de 3,96 puntos. El tamaño muestral necesario para conseguir una amplitud de 2 puntos es
= = = = (es decir, 394 sujetos)
Este método de estimación puede ser fácilmente ilustrado utilizando la distribución bino- mial. Supongamos que, de una determinada población, extraemos una muestra aleatoria de tama- ño n = 20 y que cada sujeto es clasificado como hombre o como mujer. Llamemos H a la pro- porción de hombres en la población. La variable aleatoria nH = «número de hombres en la mues- tra» será una variable distribuida binomialmente con parámetros n y H. Aunque conocemos el valor de n , desconocemos el valor de H. ¿Cómo estimarlo? Supongamos que, en la muestra elegida, la variable nH toma el valor 6. ¿Cuál es el valor de H que hace más probable el resul- tado muestral nH = 6? La respuesta a esta pregunta es la estimación de máxima verosimilitud para el parámetro H. Puesto que la variable nH se distribuye binomialmente, la probabilidad de obtener nH = 6 con los posibles diferentes valores de H , puede calcularse de la siguiente manera:
P ( nH ) = [7.23]
Por supuesto, también podemos utilizar la tabla de la distribución binomial (ver Tabla B del Apéndice final). De una u otra forma obtendremos, para H = 0,10:
P ( nH = 6 | H = 0,10) = (0,10) 6 (0,90) 20!^6 = 0,0089.
Para H = 0,20,
P ( nH = 6 | H = 0,20) = (0,20) 6 (0,80) 20!^6 = 0,1091.
Para H = 0,30,
P ( nH = 6 | H = 0,30) = (0,30) 6 (0,70) 20!^6 = 0,1916.
Podemos seguir calculando, para cada posible valor de H , la probabilidad de obtener el resultado muestral concreto nH = 6. Pero a partir de H = 0,30 esas probabilidades comienzan a disminuir (puede comprobarse fácilmente). De modo que el principio de máxima verosimilitud nos llevará a concluir que el parámetro H = 0,30 es el que hace más probable el resultado muestral nH = 6. Por tanto, decidiremos utilizar (^) H = 0,30 como estimación maximoverosímil del parámetro H = «proporción de hombres en la población ». Este sencillo ejemplo sirve para formarnos una idea de cómo funciona el método de estima- ción de máxima verosimilitud. Pero para conocer cuál es el valor del parámetro que maximiza la probabilidad de un resultado muestral concreto no necesitamos calcular una a una todas las probabilidades de ese resultado muestral bajo todos los posibles valores asumibles por el pará- metro en cuestión. Podemos maximizar V utilizando procedimientos matemáticos mucho más directos (ver, por ejemplo, Ríos, 1985, págs. 328-330; o Amón, 1984, págs. 249-254). Sin embargo, no pretendemos que el lector conozca la forma concreta de obtener una estima- ción por el método de máxima verosimilitud. Lo que nos interesa destacar aquí es el importante punto de vista general sobre el que descansa el principio o método de máxima verosimilitud. Este punto de vista se refiere a que las características poblacionales verdaderas deberán ser aquellas que hagan probables nuestros resultados muestrales. Si una situación teórica convierte en impro- bables los resultados empíricos obtenidos, deberemos dudar de ella. La razón es fácil de entender: si una situación teórica hace improbable la aparición de un resultado empírico concreto y, sin
embargo, ese resultado empírico se produce, habrá que pensar que la situación teórica planteada no puede ser verdadera. Las afirmaciones teóricas son creíbles en la medida en que los datos empíricos se muestran compatibles con ellas. Por supuesto, los datos de un único experimento nunca deben considerarse definitivos a la hora de confirmar o no una teoría; se requieren varias réplicas, variaciones en el diseño, diferentes tipos de mediciones, etc., y, aun así, la confirmación de una teoría difícilmente se convierte en definitiva; sin embargo, el punto de vista implícito en el principio de máxima verosimilitud siempre está presente en los diferentes procedimientos de análisis de datos y, consecuentemente, en la propia metodología científica.
Otro importante método de estimación (muy útil en ciertos casos; ver capítulo 9) consiste en uti- lizar como estimación de un parámetro aquel valor que hace mínimas las distancias al cuadrado entre ese valor estimado y los resultados muestrales observados. Este método no requiere conocer la forma de la distribución de probabilidad con la que se está trabajando (como ocurría con el método de máxima verosimilitud) pero no es válido para obtener estimaciones con todo tipo de parámetros. Consideremos el caso de la media. Extraigamos de una población cualquiera una muestra aleatoria de tamaño n. Llamemos ( Y 1 , Y 2 , ..., Y (^) n ) al resultado muestral concreto obtenido. Siguien- do el método de mínimos cuadrados utilizaremos como estimador de el valor que haga mínima la expresión
[7.24]
Es decir, utilizaremos como estimador de el valor que consiga hacer mínimas las distancias al cuadrado respecto a los n elementos del resultado muestral obtenido. Sumando y restando Y
en [7.24], agrupando y desarrollando, obtenemos
= = =
= = [7.25]
=
Teniendo en cuenta que
= = 0 , [7.26]
la expresión [7.25] se reduce a
= [7.27]
Ahora bien, el término
[7.28]