




Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Los conceptos básicos de estimadores y estimación por intervalos en estadística. Se define el proceso de estimación y los estimadores, su distribución en el muestreo y las propiedades de los mismos, como la insesgadez y la eficiencia. También se introduce el concepto de estimación por intervalos, su definición y cómo calcular un intervalo de confianza para la media de una población normal.
Tipo: Ejercicios
1 / 8
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!





Estimador y Estimación
Sea una variable aleatoria X que sigue una distribución con Función de
muestra (^) ( x 1 (^) , x (^) 2 ,... x (^) n )y a partir de esos datos intentamos acotar o conocer el valor del
parámetro θ que nos es desconocido. Al proceso de obtener un valor aproximado del parámetro a partir de los datos de la muestra se le llama estimación.
En esta asignatura, nos plantearemos la estimación dentro del Modelo Paramétrico , es decir suponiendo que conocemos o podemos suponer la forma de la distribución de la población, y que el elemento desconocido es el parámetro de esa distribución. Por ejemplo, ese sería el caso si consideramos que el C.I. sigue una distribución Normal en una población y extraemos una muestra de esa población para intentar conocer cuanto vale la media de los Cocientes Intelectuales de todos los individuos de esa población. Cuando nos referimos a situaciones caracterizadas por este modelo también decimos que estamos en un esquema de Inferencia Paramétrica. En este tema abordaremos el problema de asignar un único valor al parámetro desconocido, lo que se denomina Estimación Puntual. En las condiciones enunciadas definimos:
Estimador
función de los valores de la muestra
θ$ = θ$ (^ x 1 (^) , x (^) 2 ,... x (^) n )
cuyo valor se asigna al parámetro.
Estimación
Es el valor numérico concreto que toma el estimador para una muestra determinada. Por ejemplo, si en la situación planteada anteriormente decidimos estimar el Cociente Intelectual medio de la población, mediante la semisuma de los valores extremos de la muestra, dicha función sería el estimador:
$ {^ ,^ ,...^ }^ {^ ,^ ,... }
max x (^) 1 x (^) 2 x (^) n + min x (^) 1 x (^) 2 xn 2
Si ahora extraemos una muestra y obtenemos las siguientes puntuaciones:
95, 103, 110, 98, 102, 93, 92, 112, 108, 97, 105, 111, 82, 115, 97, 104, 98, 99.
La estimación correspondiente a esa muestra sería:
115 82 2
Distribución en el muestreo de un estimador
Como hemos definido anteriormente, un estimador es una función de los valores de la muestra, en consecuencia por ser esta un conjunto de n variables aleatorias el estimador también es una variable aleatoria. Reforzando esta idea, también podemos advertir que en general, para cada muestra el estimador proporcionará un valor distinto. Pues bien el conjunto de diferentes valores que puede tomar el estimador, junto con las probabilidades de que tome esos valores, constituye la distribución en el muestreo del estimador.
Propiedades de los estimadores
La definición que se ha dado de estimador es tan general que para estimar un parámetro existen infinitos estimadores potenciales en consecuencia necesitamos criterios que nos permitan seleccionar los estimadores adecuados a una situación dada. Como quiera que los estimadores son variables aleatorias en el muestreo estos criterios harán referencia propiedades de su distribución.
Estimador Insesgado
Se dice que un estimador es insesgado o centrado si la media o esperanza matemática del estimador coincide con el verdadero valor del parámetro. Es decir si:
Se llama sesgo de un estimador a la diferencia entre su media y el verdadero valor:
Estimador Eficiente
Aunque la propiedad de ser insesgado es deseable, no es un criterio suficiente para seleccionar un estimador, ya que pueden existir estimadores centrados con distribuciones muy diferentes, para complementar la anterior propiedad se introduce el concepto de eficiencia.
En términos absolutos establecemos que:
Se dice que un estimador es eficiente si es insesgado y de mínima varianza.
Obviamente si existe un estimador eficiente éste será el más adecuado, de acuerdo con los criterios tradicionales. Sin embargo, no siempre es posible determinar la existencia de un estimador eficiente.
n
x →
seguirá una distribución Normal (0, 1). No obstante, la inferencia estadística tiene sentido cuando los parámetros de la población son desconocidos, por lo que a efectos prácticos la desviación típica deberá ser estimada. Si la muestra es suficientemente grande, bastará sustituir en la anterior expresión y el resultado seguirá siendo válido. No obstante , Gosset encontró que en el caso de muestras pequeñas, la distribución de este cociente no era la Normal (0, 1) sino otra distribución que denominamos t de Student. En consecuencia, si las muestras son pequeñas al sustituir σ por su estimador insesgado tenemos que el cociente
t
x S n
sigue una distribución t de Student con n-1 grados de libertad.
Otro resultado que en lo sucesivo nos será de utilidad, indica que el cociente
n S n
2 2 1
2
sigue una distribución Ji- cuadrado con n-1 grados de libertad.
Estimación por intervalos. Precisión de las estimaciones
Como hemos visto en los apartados anteriores, la estimación puntual aborda el problema de conocer el valor de un parámetro desconocido asignándole un único valor, a partir de los datos de una muestra. Sin embargo las propiedades de los estimadores hacen referencia a su comportamiento probabilístico, es decir a lo que ocurre cuando se extrae un gran número de muestras, y no resuelven el problema de determinar la precisión de una estimación concreta.
Clarifiquemos este problema de la precisión de una estimación con un ejemplo. Supongamos que el C.I. de los alumnos de 4º de E.G.B. sigue una distribución Normal y queremos conocer su media a partir de los datos de una muestra de 10 alumnos que ha arrojado los siguientes valores:
88, 95, 111, 82, 119, 105, 91, 100, 102, 98.
Calculamos la media de esta muestra, lo cual nos proporciona el valor 99,1 como estimación para el cociente intelectual medio de los alumnos de 4º de E.G.B.. Será muy difícil que el valor 99.1 coincida con el verdadero valor de la media de la población, es más es prácticamente imposible que coincida con el valor exacto. Es decir, cuando realizamos una estimación estamos casi seguros de que cometemos un error, pero no es
eso lo peor, lo más grave es que desconocemos la magnitud de nuestro error, no sabemos si nos equivocamos en una unidad en cinco o en diez.
Se comprende que en estas condiciones, aunque la estimación proporciona información acerca del valor del parámetro resuelve poco nuestra incertidumbre y difícilmente nos permitirá tomar una decisión transcendente acerca de la población. Para paliar estas dificultades de la estimación puntual, se recurre a la estimación por intervalos, la cual, a partir de los datos de la muestra, proporciona un intervalo de valores dentro del cual se encuentra con una determinada "probabilidad" que llamaremos nivel de confianza, el verdadero valor del parámetro. De esta forma considerando el nivel de confianza y la amplitud del intervalo podremos evaluar la magnitud máxima de nuestro error y el riesgo que conllevan nuestras decisiones basadas en la información de la muestra.
Por ejemplo, si por los procedimientos que veremos posteriormente, calculásemos un intervalo de confianza para la media del Cociente Intelectual de los alumnos de 4º de E.G.B., a un nivel de confianza del 95%, a partir de los datos de la muestra anterior obtendríamos que dicha media se encuentra comprendida entre 91,26 y 106,94, lo que nos indica que a ese nivel de confianza, nuestra estimación inicial de 99,1 puede desviarse, por exceso o por defecto, hasta 7,84 puntos de la verdadera media de la población. Error que puede ser excesivo o no, dependiendo del grado de precisión que se requiera para cumplir nuestros objetivos.
Ahora bien, si a partir de una muestra de 500 individuos hubiésemos obtenido la misma media de 99,1 y la misma dispersión, nuestra estimación puntual no variaría, pero si la precisión de la misma. En efecto calculando a partir de esa muestra de 500 alumnos el intervalo de confianza para la media de la población, con igual nivel de confianza, se obtiene que la media de la población debe de estar comprendida entre 98,18 y 100,02 lo que nos muestra que con un nivel de confianza del 95% la media de la población diferirá de la estimación realizada, a lo sumo, en 0,92 unidades. Vemos así que los intervalos de confianza proporcionan un rango de valores plausibles para el verdadero valor del parámetro que tiene en consideración la precisión de las estimaciones obtenidas con la información que contiene la muestra.
Intervalos de Confianza. Definiciones
Una vez planteado como la estimación por intervalos surge para abordar el problema de acotar la precisión de las estimaciones vamos a dar las definiciones de los elementos que han ido apareciendo en la anterior introducción.
Estimación por intervalos
Es el procedimiento de la Inferencia Estadística que asigna al parámetro o parámetros de una población, un intervalo de valores donde se encontrará este con una "probabilidad" previamente fijada y que habitualmente será alta. Esa "probabilidad" a la que hemos hecho referencia, se denomina nivel de confianza y los valores mas empleados para ella son: 0,9, 0,95 y 0,99.
Intervalo de Confianza
Pr ob t (^) / /
x S n
− < t
α α^1
como puede verse, se han elegido los valores que dejan por debajo y por encima, respectivamente, una probabilidad de α/2. Esta no es la única elección posible, pero es la mejor, en el sentido de que proporciona de entre todos los intervalos de nivel de confianza 1-α el de menor amplitud. Haciendo operaciones, obtenemos la siguiente expresión que proporciona un intervalo de confianza para la media de la población a un nivel de confianza 1-α:
x t
n
x t
n
α/ 1 α/ 1
En lo sucesivo no tendremos más que sustituir los valores muestrales, en la expresión anterior, para obtener las correspondientes estimaciones.
Intervalo para la varianza
Sea nuevamente una variable aleatoria X que sigue una distribución Normal de media μ y desviación típica σ, de la cual se extrae una muestra aleatoria simple de tamaño n. Conocemos que el estadístico:
nS n
2 2 1
2
sigue una distribución Ji-cuadrado con n-1 grados de libertad. Por consiguiente en las tablas de la distribución Ji-cuadrado, podré determinar dos números a y b, tales que la probabilidad de que el estadístico se encuentre entre ambos sea igual al nivel de confianza fijado 1-α.
Por las mismas razones que en el caso anterior, estos números serán aquellos que dejen por debajo y por encima, respectivamente, una probabilidad de α/2. Por tanto, podemos escribir: A partir de este resultado se deduce que la expresión del intervalo de confianza para la varianza de una población normal es:
nS b
nS a
2 2 , ,
Intervalo de confianza para una proporción
Sea una población, en la que una determinada proporción de individuos P presentan una característica. De esta población se extrae una muestra aleatoria simple de tamaño n, en la cual una proporción p presentan la característica en cuestión. La proporción muestral sigue aproximadamente una distribución Normal:
n
p N P ,
por consiguiente el estadístico:
p P P Q n
sigue una distribución Normal tipificada. Entonces fijado un nivel de confianza 1-α podemos encontrar en las tablas de la Normal dos números que verifiquen:
Pr ob (^) / /
p P P Q n
operando de forma análoga a los casos anteriores y despreciando los términos menos significativos se obtiene la siguiente expresión aproximada:
p
p q n
p
p q n
que es la empleada habitualmente.