Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Estimadores y estimación por intervalos en estadística - Prof. Porras Chavarino, Ejercicios de Psicología

Los conceptos básicos de estimadores y estimación por intervalos en estadística. Se define el proceso de estimación y los estimadores, su distribución en el muestreo y las propiedades de los mismos, como la insesgadez y la eficiencia. También se introduce el concepto de estimación por intervalos, su definición y cómo calcular un intervalo de confianza para la media de una población normal.

Tipo: Ejercicios

2017/2018

Subido el 12/03/2018

mariibeel
mariibeel 🇪🇸

3.2

(6)

9 documentos

1 / 8

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Estimación Puntual
Estimador y Estimación
Sea una variable aleatoria X que sigue una distribución con Función de
Distribución
()
Fx;
θ
y Función de Densidad
(
)
fx;
θ
. De esa población extraemos una
muestra
()
xx x
n12
, ,... y a partir de esos datos intentamos acotar o conocer el valor del
parámetro θ que nos es desconocido. Al proceso de obtener un valor aproximado del
parámetro a partir de los datos de la muestra se le llama estimación.
En esta asignatura, nos plantearemos la estimación dentro del Modelo
Paramétrico, es decir suponiendo que conocemos o podemos suponer la forma de la
distribución de la población, y que el elemento desconocido es el parámetro de esa
distribución. Por ejemplo, ese sería el caso si consideramos que el C.I. sigue una
distribución Normal en una población y extraemos una muestra de esa población para
intentar conocer cuanto vale la media de los Cocientes Intelectuales de todos los
individuos de esa población. Cuando nos referimos a situaciones caracterizadas por este
modelo también decimos que estamos en un esquema de Inferencia Paramétrica. En
este tema abordaremos el problema de asignar un único valor al parámetro desconocido,
lo que se denomina Estimación Puntual. En las condiciones enunciadas definimos:
Estimador
Llamaremos estimador del parámetro θ y lo designaremos por $
θ
a cualquier
función de los valores de la muestra
(
)
$$
,,...
θθ
=xx x
n12
cuyo valor se asigna al parámetro.
Estimación
Es el valor numérico concreto que toma el estimador para una muestra
determinada. Por ejemplo, si en la situación planteada anteriormente decidimos estimar
el Cociente Intelectual medio de la población, mediante la semisuma de los valores
extremos de la muestra, dicha función sería el estimador:
{
}
{
}
$, ,... , ,...
θ
=+max x x x min x x x
nn12 12
2
Si ahora extraemos una muestra y obtenemos las siguientes puntuaciones:
95, 103, 110, 98, 102, 93, 92, 112, 108, 97, 105, 111, 82, 115, 97, 104, 98, 99.
La estimación correspondiente a esa muestra sería:
115 82
298 5
+
=,
pf3
pf4
pf5
pf8

Vista previa parcial del texto

¡Descarga Estimadores y estimación por intervalos en estadística - Prof. Porras Chavarino y más Ejercicios en PDF de Psicología solo en Docsity!

Estimación Puntual

Estimador y Estimación

Sea una variable aleatoria X que sigue una distribución con Función de

Distribución F x ( ; θ )y Función de Densidad f ( x ; θ ). De esa población extraemos una

muestra (^) ( x 1 (^) , x (^) 2 ,... x (^) n )y a partir de esos datos intentamos acotar o conocer el valor del

parámetro θ que nos es desconocido. Al proceso de obtener un valor aproximado del parámetro a partir de los datos de la muestra se le llama estimación.

En esta asignatura, nos plantearemos la estimación dentro del Modelo Paramétrico , es decir suponiendo que conocemos o podemos suponer la forma de la distribución de la población, y que el elemento desconocido es el parámetro de esa distribución. Por ejemplo, ese sería el caso si consideramos que el C.I. sigue una distribución Normal en una población y extraemos una muestra de esa población para intentar conocer cuanto vale la media de los Cocientes Intelectuales de todos los individuos de esa población. Cuando nos referimos a situaciones caracterizadas por este modelo también decimos que estamos en un esquema de Inferencia Paramétrica. En este tema abordaremos el problema de asignar un único valor al parámetro desconocido, lo que se denomina Estimación Puntual. En las condiciones enunciadas definimos:

Estimador

Llamaremos estimador del parámetro θ y lo designaremos por θ$ a cualquier

función de los valores de la muestra

θ$ = θ$ (^ x 1 (^) , x (^) 2 ,... x (^) n )

cuyo valor se asigna al parámetro.

Estimación

Es el valor numérico concreto que toma el estimador para una muestra determinada. Por ejemplo, si en la situación planteada anteriormente decidimos estimar el Cociente Intelectual medio de la población, mediante la semisuma de los valores extremos de la muestra, dicha función sería el estimador:

$ {^ ,^ ,...^ }^ {^ ,^ ,... }

max x (^) 1 x (^) 2 x (^) n + min x (^) 1 x (^) 2 xn 2

Si ahora extraemos una muestra y obtenemos las siguientes puntuaciones:

95, 103, 110, 98, 102, 93, 92, 112, 108, 97, 105, 111, 82, 115, 97, 104, 98, 99.

La estimación correspondiente a esa muestra sería:

115 82 2

Distribución en el muestreo de un estimador

Como hemos definido anteriormente, un estimador es una función de los valores de la muestra, en consecuencia por ser esta un conjunto de n variables aleatorias el estimador también es una variable aleatoria. Reforzando esta idea, también podemos advertir que en general, para cada muestra el estimador proporcionará un valor distinto. Pues bien el conjunto de diferentes valores que puede tomar el estimador, junto con las probabilidades de que tome esos valores, constituye la distribución en el muestreo del estimador.

Propiedades de los estimadores

La definición que se ha dado de estimador es tan general que para estimar un parámetro existen infinitos estimadores potenciales en consecuencia necesitamos criterios que nos permitan seleccionar los estimadores adecuados a una situación dada. Como quiera que los estimadores son variables aleatorias en el muestreo estos criterios harán referencia propiedades de su distribución.

Estimador Insesgado

Se dice que un estimador es insesgado o centrado si la media o esperanza matemática del estimador coincide con el verdadero valor del parámetro. Es decir si:

E [ θ $ ] = θ

Se llama sesgo de un estimador a la diferencia entre su media y el verdadero valor:

sesgo ( θ$)^ = E [θ $ ]−θ

Estimador Eficiente

Aunque la propiedad de ser insesgado es deseable, no es un criterio suficiente para seleccionar un estimador, ya que pueden existir estimadores centrados con distribuciones muy diferentes, para complementar la anterior propiedad se introduce el concepto de eficiencia.

Dados dos estimadores de un mismo parámetro θ$ 1 θ$ 2 diremos que θ$ 1 es más

eficiente que θ$ 2 si teniendo ambos la misma media, θ$ 1 tiene una varianza menor que

θ^ $ 2. Esta propiedad nos permite decidir entre dos estimadores cual es mas conveniente.

En términos absolutos establecemos que:

Se dice que un estimador es eficiente si es insesgado y de mínima varianza.

Obviamente si existe un estimador eficiente éste será el más adecuado, de acuerdo con los criterios tradicionales. Sin embargo, no siempre es posible determinar la existencia de un estimador eficiente.

N ( 0 , 1 )

n

x

seguirá una distribución Normal (0, 1). No obstante, la inferencia estadística tiene sentido cuando los parámetros de la población son desconocidos, por lo que a efectos prácticos la desviación típica deberá ser estimada. Si la muestra es suficientemente grande, bastará sustituir en la anterior expresión y el resultado seguirá siendo válido. No obstante , Gosset encontró que en el caso de muestras pequeñas, la distribución de este cociente no era la Normal (0, 1) sino otra distribución que denominamos t de Student. En consecuencia, si las muestras son pequeñas al sustituir σ por su estimador insesgado tenemos que el cociente

t

x S n

sigue una distribución t de Student con n-1 grados de libertad.

Otro resultado que en lo sucesivo nos será de utilidad, indica que el cociente

n S n

2 2 1

2

sigue una distribución Ji- cuadrado con n-1 grados de libertad.

Estimación por intervalos. Precisión de las estimaciones

Como hemos visto en los apartados anteriores, la estimación puntual aborda el problema de conocer el valor de un parámetro desconocido asignándole un único valor, a partir de los datos de una muestra. Sin embargo las propiedades de los estimadores hacen referencia a su comportamiento probabilístico, es decir a lo que ocurre cuando se extrae un gran número de muestras, y no resuelven el problema de determinar la precisión de una estimación concreta.

Clarifiquemos este problema de la precisión de una estimación con un ejemplo. Supongamos que el C.I. de los alumnos de 4º de E.G.B. sigue una distribución Normal y queremos conocer su media a partir de los datos de una muestra de 10 alumnos que ha arrojado los siguientes valores:

88, 95, 111, 82, 119, 105, 91, 100, 102, 98.

Calculamos la media de esta muestra, lo cual nos proporciona el valor 99,1 como estimación para el cociente intelectual medio de los alumnos de 4º de E.G.B.. Será muy difícil que el valor 99.1 coincida con el verdadero valor de la media de la población, es más es prácticamente imposible que coincida con el valor exacto. Es decir, cuando realizamos una estimación estamos casi seguros de que cometemos un error, pero no es

eso lo peor, lo más grave es que desconocemos la magnitud de nuestro error, no sabemos si nos equivocamos en una unidad en cinco o en diez.

Se comprende que en estas condiciones, aunque la estimación proporciona información acerca del valor del parámetro resuelve poco nuestra incertidumbre y difícilmente nos permitirá tomar una decisión transcendente acerca de la población. Para paliar estas dificultades de la estimación puntual, se recurre a la estimación por intervalos, la cual, a partir de los datos de la muestra, proporciona un intervalo de valores dentro del cual se encuentra con una determinada "probabilidad" que llamaremos nivel de confianza, el verdadero valor del parámetro. De esta forma considerando el nivel de confianza y la amplitud del intervalo podremos evaluar la magnitud máxima de nuestro error y el riesgo que conllevan nuestras decisiones basadas en la información de la muestra.

Por ejemplo, si por los procedimientos que veremos posteriormente, calculásemos un intervalo de confianza para la media del Cociente Intelectual de los alumnos de 4º de E.G.B., a un nivel de confianza del 95%, a partir de los datos de la muestra anterior obtendríamos que dicha media se encuentra comprendida entre 91,26 y 106,94, lo que nos indica que a ese nivel de confianza, nuestra estimación inicial de 99,1 puede desviarse, por exceso o por defecto, hasta 7,84 puntos de la verdadera media de la población. Error que puede ser excesivo o no, dependiendo del grado de precisión que se requiera para cumplir nuestros objetivos.

Ahora bien, si a partir de una muestra de 500 individuos hubiésemos obtenido la misma media de 99,1 y la misma dispersión, nuestra estimación puntual no variaría, pero si la precisión de la misma. En efecto calculando a partir de esa muestra de 500 alumnos el intervalo de confianza para la media de la población, con igual nivel de confianza, se obtiene que la media de la población debe de estar comprendida entre 98,18 y 100,02 lo que nos muestra que con un nivel de confianza del 95% la media de la población diferirá de la estimación realizada, a lo sumo, en 0,92 unidades. Vemos así que los intervalos de confianza proporcionan un rango de valores plausibles para el verdadero valor del parámetro que tiene en consideración la precisión de las estimaciones obtenidas con la información que contiene la muestra.

Intervalos de Confianza. Definiciones

Una vez planteado como la estimación por intervalos surge para abordar el problema de acotar la precisión de las estimaciones vamos a dar las definiciones de los elementos que han ido apareciendo en la anterior introducción.

Estimación por intervalos

Es el procedimiento de la Inferencia Estadística que asigna al parámetro o parámetros de una población, un intervalo de valores donde se encontrará este con una "probabilidad" previamente fijada y que habitualmente será alta. Esa "probabilidad" a la que hemos hecho referencia, se denomina nivel de confianza y los valores mas empleados para ella son: 0,9, 0,95 y 0,99.

Intervalo de Confianza

Pr ob t (^) / /

x S n

− < t

1 − 2 1 − 2 =^ −

α α^1

como puede verse, se han elegido los valores que dejan por debajo y por encima, respectivamente, una probabilidad de α/2. Esta no es la única elección posible, pero es la mejor, en el sentido de que proporciona de entre todos los intervalos de nivel de confianza 1-α el de menor amplitud. Haciendo operaciones, obtenemos la siguiente expresión que proporciona un intervalo de confianza para la media de la población a un nivel de confianza 1-α:

x t

S

n

x t

S

n

α/ 1 α/ 1

En lo sucesivo no tendremos más que sustituir los valores muestrales, en la expresión anterior, para obtener las correspondientes estimaciones.

Intervalo para la varianza

Sea nuevamente una variable aleatoria X que sigue una distribución Normal de media μ y desviación típica σ, de la cual se extrae una muestra aleatoria simple de tamaño n. Conocemos que el estadístico:

nS n

2 2 1

2

sigue una distribución Ji-cuadrado con n-1 grados de libertad. Por consiguiente en las tablas de la distribución Ji-cuadrado, podré determinar dos números a y b, tales que la probabilidad de que el estadístico se encuentre entre ambos sea igual al nivel de confianza fijado 1-α.

Por las mismas razones que en el caso anterior, estos números serán aquellos que dejen por debajo y por encima, respectivamente, una probabilidad de α/2. Por tanto, podemos escribir: A partir de este resultado se deduce que la expresión del intervalo de confianza para la varianza de una población normal es:

nS b

nS a

2 2 , ,

Intervalo de confianza para una proporción

Sea una población, en la que una determinada proporción de individuos P presentan una característica. De esta población se extrae una muestra aleatoria simple de tamaño n, en la cual una proporción p presentan la característica en cuestión. La proporción muestral sigue aproximadamente una distribución Normal:

n

P Q

p N P ,

por consiguiente el estadístico:

p P P Q n

N

sigue una distribución Normal tipificada. Entonces fijado un nivel de confianza 1-α podemos encontrar en las tablas de la Normal dos números que verifiquen:

Pr ob (^) / /

p P P Q n

operando de forma análoga a los casos anteriores y despreciando los términos menos significativos se obtiene la siguiente expresión aproximada:

p

p q n

p

p q n

que es la empleada habitualmente.