Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Estimación de parametros, Ejercicios de Estadística

Guía unidad 2 sobre parametros.

Tipo: Ejercicios

2019/2020
En oferta
30 Puntos
Discount

Oferta a tiempo limitado


Subido el 25/04/2020

allan-cruz
allan-cruz 🇸🇻

1 documento

1 / 31

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
i
UNIVERSIDAD DE EL SALVADOR
FACULTAD DE CIENCIAS ECONÓMICAS
DEPARTAMENTO DE MATEMÁTICA Y ESTADÍSTICA
Asignatura:
Estadística II
Unidad II:
Estimación parámetros
Objetivo General de la Asignatura:
El propósito de este curso es que los participantes desarrollen capacidades de investigación y análisis de problemas
en el ámbito socioeconómico, a través del manejo adecuado de herramientas y técnicas estadísticas asociando el uso
de Tecnologías de la Información y la Comunicación.
Objetivos específicos de la unidad II:
a) Describir la media y la proporción de una población usando estimaciones puntuales y de intervalo.
b) Construir e interpretar estimaciones de intervalo para una media poblacional y una proporción poblacional.
c) Determinar el efecto del tamaño de la muestra sobre la estimación del intervalo.
d) Calcular tamaños de muestras.
e) Calcular el error tolerable máximo para un tamaño de muestra específico.
Noé Cortez
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
Discount

En oferta

Vista previa parcial del texto

¡Descarga Estimación de parametros y más Ejercicios en PDF de Estadística solo en Docsity!

i

UNIVERSIDAD DE EL SALVADOR

FACULTAD DE CIENCIAS ECONÓMICAS

DEPARTAMENTO DE MATEMÁTICA Y ESTADÍSTICA

Asignatura:

Estadística II

Unidad II:

Estimación parámetros

Objetivo General de la Asignatura:

El propósito de este curso es que los participantes desarrollen capacidades de investigación y análisis de problemas en el ámbito socioeconómico, a través del manejo adecuado de herramientas y técnicas estadísticas asociando el uso de Tecnologías de la Información y la Comunicación.

Objetivos específicos de la unidad II:

a) Describir la media y la proporción de una población usando estimaciones puntuales y de intervalo.

b) Construir e interpretar estimaciones de intervalo para una media poblacional y una proporción poblacional. c) Determinar el efecto del tamaño de la muestra sobre la estimación del intervalo. d) Calcular tamaños de muestras.

e) Calcular el error tolerable máximo para un tamaño de muestra específico.

Noé Cortez

ii

Esta propiedad, se demuestra cuando a medida el tamaño de muestra va en aumento el sesgo del error particular del^4 estimador tiende a desaparecer. En general si el tamaño de muestra (n) fuera tan grande como el tamaño de la población (N) el estimador sería el mismo parámetro con diferencia cero.

Imagen 2.1: Propiedad de consistencia

Fuente: Elaboración propia

2.2 Estimaciones Puntuales y de Intervalo para Media Poblacional

2.2.1 Estimación puntual para una media poblacional. El estimador puntual de la media poblacional, μ, es la media de la muestra, 𝑥̅.

Ejemplo 2.

Se quiere estimar las ventas diarias de una empresa comercial, para ello se toma una muestra de 30 días. La suma de las ventas en los 30 días resultó $115,000. ¿Cuánto es la estimación para las ventas diarias promedio diarias?

Desarrollo:

𝛴𝑥 𝑛 =^

$ 30 =^ $3833.^33 𝑐𝑎𝑑𝑎^ 𝑑í𝑎 Por tanto, la estimación puntual para la media poblacional es de μ = $3833.33 cada día

2.2.2 Estimación por intervalo para la media poblacional. (Muestra grande n≥30) En ocasiones será necesario contar con una estimación por intervalo para una media poblacional, en lugar de una estimación puntual.

¿Qué tan confiables son las estimaciones por intervalo?

Las estimaciones por intervalo se generan con un nivel de confianza específico, normalmente se usa el 90%, 95% o 99%.^5

Imagen 2.2: Interpretación gráfica de los intervalos de confianza

Fuente: Elaboración propia

Si suponemos previamente que el parámetro es conocido, por ejemplo μ = 90, en el diagrama anterior, se observa que para cada muestra extraída de la población se genera una estimación por intervalo que podría incluir al parámetro o no incluirlo.

De acuerdo al nivel de confianza:

Si 1-α = 0.90; según la teoría; 90 de cada 100 estimaciones por intervalos incluirán al parámetro y 10 quedan fuera. Si 1-α = 0.95; según la teoría; 95 de cada 100 estimaciones por intervalos incluirán al parámetro y 5 quedan fuera. Si 1-α = 0.99; según la teoría; 99 de cada 100 estimaciones por intervalos incluirán al parámetro y 1 quedan fuera.

Por tanto, la teoría estadístico-matemática garantiza el uso confiable de tales estimaciones, para la toma de decisiones.

Intervalo de confianza para la media poblacional:

𝑰𝒄( 𝒙̅ − 𝒁𝜶⁄ (^) 𝟐 ∗ 𝝈𝒙̅ < μ < 𝒙̅ + 𝒁𝜶 (^) ⁄𝟐 ∗ 𝝈𝒙̅ ) = 1- α

Donde: 𝑥̅ : Media muestral 1- α : Nivel de confianza 𝑍𝛼 (^) ⁄ 2 : Valor del estadístico Z-normal

σ : Desviación estándar de los datos poblacionales n : tamaño de la muestra 𝜎𝑥̅ : Error estándar o desviación estándar de la distribución de 𝑥̅

resumir los datos se tiene una media aritmética de $850. En estudios anteriores, se ha observado una desviación estándar^7 de $45. Establezca una estimación por intervalo con una confianza del 90%.

Desarrollo:

VA𝑥̅ : Ingresos familiares promedio

Datos: n = 250 familias 𝑥̅ = $ Desviación estándar poblacional: σ = $

Desviación estándar de 𝑥̅ : 𝜎𝑥̅ = 𝜎 √𝑛 =^

$ √ 250 =^ $2.^8460

Nivel de confianza: 1- α = 0. En tabla Z-normal: 𝑍𝛼⁄ 2 = 1.

Fórmula:

𝑰𝒄( 𝒙̅ − 𝒁𝜶 (^) ⁄𝟐 ∗ 𝝈𝒙̅ < μ < 𝒙̅ + 𝒁𝜶⁄ (^) 𝟐 ∗ 𝝈𝒙̅ ) = 1- α

Sustituyendo:

𝐼𝑐($850 − 1. 645 ∗ $2. 8460 < μ < $850 + 1. 645 ∗ $2. 8460 ) = 0.

𝐼𝑐($850 − $4. 6817 < μ < $850 + 4. 6817 ) = 0.

𝐼𝑐($845. 32 < μ < $854. 68 ) = 0.

Interpretación:

Con una confianza del 90%, el promedio de ingresos familiares en la población completa del municipio de Nuevo Cuscatlán está en el intervalo de $845.32 a $854.68.

Ejemplo 2.

El gerente de control de calidad de una fábrica de focos necesita estimar por intervalo de confianza del 95%, la vida

promedio de focos en un gran embarque. Se sabe que la desviación estándar del proceso es de 100 horas. Una muestra

aleatoria de 50 focos mostró una vida promedio de 350 horas.

Tendría distribución normal las medias muestrales de la vida de los focos? Si__ No____ Por qué?___

Desarrollo:

VA𝑥̅ : Horas promedio de duración

Datos:

n = 50 focos 𝑥̅ = 350 horas Desviación estándar poblacional: σ = 100 horas

Desviación estándar de 𝑥̅ : 𝜎𝑥̅ = 𝜎 √𝑛^

100 √^50

Nivel de confianza: 1- α = 0. En tabla Z-normal: 𝑍𝛼^ ⁄ 2 = 1.

Fórmula:^8

𝑰𝒄( 𝒙̅ − 𝒁𝜶 (^) ⁄𝟐 ∗ 𝝈𝒙̅ < μ < 𝒙̅ + 𝒁𝜶⁄ (^) 𝟐 ∗ 𝝈𝒙̅ ) = 1- α

Sustituyendo:

𝐼𝑐( 350 − 1. 96 ∗ 14. 1421 < μ < 350 + 1. 96 ∗ 14. 1421 ) = 0.

𝐼𝑐( 350 − 27. 7185 < μ < 350 + 27. 7185 ) = 0.

𝐼𝑐( 322. 2815 horas< μ < 377.7185 horas ) = 0.

Interpretación:

Con una confianza del 95%, el promedio de vida útil de todos los bombillos fabricados está entre 322.3 horas hasta 377.7 horas.

¿Tendría distribución normal las medias muestrales de la vida de los focos?

R/ Basados en el Teorema del Límite Central, las muestras superiores a 30 generan distribuciones de medias muestrales con comportamiento simétrico o normal.

2.3 Estimaciones Puntuales y de Intervalo para las Proporciones

2.3.1 Estimación puntual para una proporción poblacional. El estimador puntual de la proporción poblacional, P, es la proporción de la muestra 𝑝.

Ejemplo 2.

Se desea estimar en la población de votantes de un país, el porcentaje (proporción) de votos que favorecen al Partido Renovador (PR). Para ello se elabora una muestra a escala nacional de 1,250 personas en edad de votar. En la encuesta se consulta la intención de voto para el referido partido. Los resultados indican que 80, personas estarían dipuestos(as) a votar por el PR. Elabore una estimación puntual del porcentaje de votos que tendría el PR a escala nacional

Desarrollo:

𝑥 𝑛 =^

80 1250 =^0.^064 ;^ 𝑒𝑙^6 .4%^ 𝑑𝑒^ 𝑙𝑎^ 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛^ 𝑓𝑎𝑣𝑜𝑟𝑒𝑐𝑒^ 𝑎𝑙^ 𝑃𝑅

Por tanto la estimación puntual para la proporción poblacional es de 6.4% de votos favorables para el PR

2.3.2 Estimación por intervalo para una proporción poblacional. En ocasiones será necesario contar con una estimación por intervalo para una proporción poblacional, en lugar de una estimación puntual.

.¿Qué tan confiables son las estimaciones por intervalo para la proporción poblacional?

Las estimaciones por intervalo se generan con un nivel de confianza específico, normalmente se usa el 90%, 95% o 99%. Imagen 2.4: Interpretación gráfica de los intervalos de confianza

Donde:

𝑝: proporción de éxito en la muestra q: proporción de fracaso en la muestra

P :proporción de éxito en la población Q : proporción de fracaso en la población

1- α : Nivel de confianza 𝑍𝛼 (^) ⁄ 2 : Valor del estadístico Z-normal n : Tamaño de la muestra N: Tamaño de la población 𝝈𝒑 :Error estándar de la distribución de proporciones

Para obtener el error estándar de la proporción, se podría utilizar una de las siguientes fórmulas, según el tipo de información disponible:

𝑃𝑄 𝑛 ;^ Se desconoce N, o la fracción de muestreo es inferior al 5%, además el valor de P, es conocido. En este caso, es obvio que no procede una estimación para P, por ser conocido.

𝜎𝑝 = √𝑃𝑄 𝑛. (^) √( (𝑁𝑁−−𝑛 1 )) ;La fracción de muestreo es mayor al 5% y P, es conocido. Nuevamente no procede

una estimación para P, por ser conocido.

El error estándar para hacer estimaciones por intervalo , utilizan la “p” y “q” muestrales

𝜎𝑝 = (^) √ 𝑝 𝑞 𝑛 ; Se desconoce N y P, por lo que se utilizan los estadísticos de la muestra “p” y “q”, para estimar el error estándar.

𝑝 𝑞 𝑛.^ √

(𝑁−𝑛) (𝑁− 1 ) ; La fracción de muestreo es mayor al 5% y P, es desconocido.

Ejemplo 2.

Un estudio de muestreo sobre consumo de agua purificada envasada en la región metropolitana, reportó que 148 personas consumen agua purificada envasada de una muestra de 185 personas. Elabore una estimación con intervalo de confianza del 95% para estimar el porcentaje de la población de la región metropolitana que consume agua purificada envasada?

Desarrollo:

VA𝑝 : Porcentaje de personas que consumen agua purificada envasada.

Datos:

n = 185 persona 𝑥= 148 consumen agua purificada envasada

𝑝 = 𝑥 𝑛 =^

148 185 =^0.^80

Desviación estándar de la proporción:

𝜎𝑝 = (^) √ 𝑝 𝑞 𝑛 =^ √

( 0. 80 )∗( 0. 20 ) 185 =^0.^0294

Nivel de confianza: 1- α = 0. En tabla Z-normal: 𝑍𝛼⁄ 2 = 1.

Intervalo de confianza:

Sustituyendo:

Interpretación:

Con una confianza del 95%, el porcentaje de la población de la región metropolitana que consume agua purificada envasada está entre el 74.24% a 85.75%.

Ejemplo 2.

Una compañía de autobuses urbanos está interesada en establecer una ruta de autobús, desde el municipio de Mejicanos hasta Santa Tecla. Se seleccionó una muestra aleatoria de 50 ciudadanos de ambos lugares y 18 manifestaron que utilizarán la nueva ruta. Establezca un intervalo de confianza del 99% para la proporción poblacional de potenciales usuarios de la nueva ruta de autobuses?

Desarrollo:

VA𝑝 : Porcentaje de personas que usarían la nueva ruta de autobuses

Datos:

n = 50 personas 𝑥= 18 dispuestos a usar la nueva ruta

𝑝 = 𝑥 𝑛 =^

18 50 =^0.^36

Desviación estándar de la proporción:

𝜎𝑝 = √ 𝑝 𝑞 𝑛 =^

( 0. 36 )∗( 0. 64 ) 50 =^0.^0679

1 - α = 0. En tabla Z-normal: 𝑍𝛼 (^) ⁄ 2 = 2.

Intervalo de confianza:

𝑰𝒄 ( 𝒑 − 𝒁𝜶⁄^ 𝟐 ∗ 𝝈𝒑 < 𝐏 < 𝒑 + 𝒁𝜶^ ⁄𝟐 ∗ 𝝈𝒑) = 𝟏 − 𝛂

Sustituyendo:

𝐼𝑐( 0. 36 − 2. 575 ∗ 0. 0679 < 𝐏 < 0. 36 + 2. 575 ∗ 0. 0679 ) = 0. 99

𝐼𝑐( 0. 36 − 0. 1748 < 𝐏 < 0. 36 + 0. 1748 ) = 0. 99

𝐼𝑐( 0. 1852 < 𝐏 < 0. 5348 ) = 0. 99

Interpretación:

Con una confianza del 99%, el porcentaje de la población dispuestos a usar la nueva ruta está entre 18.52% a 53.48%.

Este valor se busca en la tabla de distribución t, con 𝛼^13 ⁄ 2 y con grados de libertad n-1.

Por ejemplo si la muestra es de 15 y la confianza del 95%, el valor en tablas corresponde a buscar en la intersección de 𝛼 ⁄ 2 =^

⁄ 2 = 0. 025 y gl=n-1= 15-1=14: Es decir se busca con 0.05 y 14 en tabla. El valor corresponde a 2.145. Es

decir, 𝑡𝛼 (^) ⁄ 2 = 2. 145

S(x): Desviación estándar de los datos muestrales

La fórmula para desviación estándar de la muestra es

√(𝑥−𝑥̅ )^2 𝑛− 1 ; donde x, son los datos de la muestra^ y^ n^ es el^ tamaño de la muestra

Ejemplo 2.

Un estudio recolecta datos sobre el número de horas semanales en que trabajan las personas de una ciudad. Las horas semanales que reporta una muestra de 10 personas son las siguientes: 39, 42, 25, 51, 50, 55, 45, 53, 30, 60. Elabore una estimación por intervalo de confianza del 90%, para el promedio de horas semanales trabajadas por la población.

Desarrollo:

( 39 − 45 )^2 +( 42 − 45 )^2 +( 25 − 45 )^2 +( 51 − 45 )^2 +( 50 − 45 )^2 +( 55 − 45 )^2 +( 45 − 45 )^2 +( 53 − 45 )^2 +( 30 − 45 )^2 +( 60 − 45 )^2 10 − 1 =

𝑆(𝑥) = √^11209 = 11. 1555

Luego de haber calculado las medidas resumen descriptivas, sustituimos en la fórmula; Intervalo de confianza para la media poblacional con muestra pequeña:

𝐼𝑐 ( 𝑥̅ − 𝑡𝛼⁄^2 ∗

√𝑛^

< μ < 𝑥̅ + 𝑡𝛼⁄^2 ∗

√𝑛^

) = 1 − α

El valor de t, en tabla, se busca con α⁄^2 = 0. 05 y con gl=n-1=10-1=9. El valor es 1. Sustituyendo:

𝐼𝑐 ( 45 − 1. 8331 ∗

< μ < 45 + 1. 8331 ∗

𝐼𝑐 ( 45 − 6. 4666 < μ < 45 + 6. 4666 ) = 0. 90

𝐼𝑐 (^38. 5 < μ < 51. 5 )^ = 0. 90

Interpretación: Con una confianza del 90%, el verdadero promedio de horas trabajadas por la población está entre 38.5 horas hasta 51. horas semanales.

2.5 Estimación del tamaño de muestra

Determinar el tamaño de una muestra representa una parte esencial en el diseño muestral. Para ello, es necesario relacionar de manera directa las variables de la investigación y basándose en una de ellas (la más general o la más importante) se identifican parámetros que se sustituirán en la fórmula apropiada de tamaño de muestra.

Las ventajas de hacer un muestreo en relación a un censo son obvias, para el caso de las encuestas de opinión efectuadas para las elecciones presidenciales de un país con una población de 109 millones de habitantes, un censo evidentemente es inviable. O, en el caso de las pruebas de duración de un producto industrial que normalmente son destructivas para verificar su calidad.

El muestreo debe garantizar la representatividad, ya que en lugar de investigar el total de la población, se investiga tan sólo una parte de ella, proporcionando con esto la información en forma más oportuna, eficiente y exacta, eliminando con ello recurrir a encuestar a toda la población.

Los factores que determinan el tamaño de muestra son:

  1. El error estándar (𝜎𝑥̅ , σp ). Este indicador normalmente no está disponible, ya que debe ser resultado del censo o de una estimación por muestreo. Por lo que frecuentemente se obtiene usando la desviación estándar de estudios pasados; o, mediante una prueba piloto que proporcione una idea de este parámetro. En caso de la fórmula para proporciones se utilizará p=0.50 y q= 0.50, en caso de que no exista una información fiable para p y q.
  2. El Tamaño de la población (cuando es finita) (N)
  3. El nivel de confianza (1- α )
  4. El error de estimación, (E). Es decisión de la parte investigadora imponer el deseo de cuánto error se permite en la investigación, dependerá del nivel de rigurosidad personal. Ejemplo: a. Si se quiere estimar el ingreso promedio de los habitantes del Municipio de Soyapango, podría ser razonable un error de $30, $40, $60 o hasta donde la rigurosidad del estudio lo permita. b. Si se quiere estimar el porcentaje de la población que prefiere la marca de jabón “Olorsito”; sería razonable pensar en un 5%, 8% o un 10%.

Las fórmulas utilizadas para tal estimación, son las siguientes:

Tamaño de muestra para estimar la media, μ, en poblaciones finitas

2 (N-1)E

N 2 / 2

2

2 / 2

2

z

z

 

n

Donde: n: tamaño de muestra N: tamaño de población

/ 2

2 z  : Valor de Z-normal, para un valor especifico de nivel de confianza (1-α) 2  : Varianza poblacional de la VA de la distribución muestral de medias E: Error de estimación (error máximo permitido)

Error de estimación, E = 45 gramos^16

Dado que se quiere estimar la media poblacional del peso en una población infinita, se dispone de la siguiente fórmula:

E^2

2 / 2 z^2   n  sustituyendo: 452

  1. 812 4002 (^) n = = 2 45

2 2

  1. 81 400 = 259

Interpretación: Con un nivel de confianza del 93%, el tamaño de muestra para estimar el peso promedio de libras al nacer, es de 259 nacimientos

Ejemplo 2.

La empresa Compañía de Electricidad de Santa María (CESM) requiere llevar a cabo un estudio de mercado para determinar la aceptación de los usuarios sobre el servicio que presta, para ello, se obtuvo la siguiente información: Usuarios residenciales 25. Usuarios industriales 45. Otros usuarios 1. Encuentre el tamaño de muestra para cada categoría de usuario, si se desea una confiabilidad del 95% y un error del 6%, además, se sabe que la proporción de usuarios satisfechos en el último estudio fue de 0.75.

Desarrollo:

VA𝑋̅ : Porcentaje de aceptación de los usuarios sobre el servicio de electricidad en la población de Santa María

Datos: p = 0.

Nivel de confianza: 1- α = 0.95 ~ 95% → /^2 z^2  = 1. Error de estimación, E = 0. N = 171,500 usuarios

Dado que se quiere estimar la proporción poblacional de usuarios que satisfechos con el servicio de electricidad y que se tiene una población finita, la fórmula a utilizar es:

𝑍 2 𝛼^ / 2 𝑃𝑄𝑁

𝑍 2 𝛼^ / 2 𝑃𝑄 + (𝑁 − 1 )𝐸^2

Sustituyendo:

1. 962 ∗ 0. 75 ∗ 0. 25 + ( 171500 − 1 )( 0. 06 )^2

Interpretación: Con un nivel de confianza del 95%, el tamaño de muestra para estimar el porcentaje de aceptación de los usuarios sobre el servicio de electricidad es de 200, distribuido en forma proporcional así:

Anexo 1: Tabla de probabilidad normal t-student^19

Fuente: Allen L.Webster. (2000). Estadística aplicada a los negocios y la economía. Colombia: Mc Graw Hill.

i (^) Anderson Sweeney Williams. (2012). Estadística para negocios y economía.(p.295). México: Cengage Learning Editores,

S.A. de C.V.. ii (^) Anderson Sweeney Williams. (2012). Estadística para negocios y economía.(p.296). México: Cengage Learning Editores,

S.A. de C.V..

iii (^) Anderson Sweeney Williams. (2012). Estadística para negocios y economía.(p.297). México: Cengage Learning Editores,

S.A. de C.V..

iv (^) Javier Gordas García. (2011). Capítulo III: Inferencia Estadística. En Estadística Básica(114). España: Universidad

Complutense de Madrid.