Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


estadistica, Apuntes de Estadística Aplicada

Asignatura: Estadística aplicada, Profesor: , Carrera: Màrqueting i Investigacions de Mercat, Universidad: UOC

Tipo: Apuntes

2016/2017

Subido el 23/12/2017

danielllk
danielllk 🇪🇸

2 documentos

1 / 9

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
1. Sabemos que la distribución de las puntuaciones de un examen de estadística de la población de los
estudiantes de Grado de Administración y Dirección de Empresas se puede modelar a partir de una
distribución normal con desviación estándar igual a 3. Seleccionamos una muestra aleatoria simple de
la población y obtenemos una media de 6,25. El tamaño muestral es de 22 alumnos.
Encontrad el intervalo de confianza para la media poblacional con una confianza del 95%.
1.- Al ser conocida la desviación poblacional, y saber que la distribución de nuestra variable es Normal,
obtenemos:
)50,7;99,4(
22
3
96,125,6
22
3
25,6 025,02/ Z
n
ZXIC
2. Repetidlo, con la misma confianza pero suponiendo que la muestra tiene una medida de n=88. Al
multiplicar por 4 la medida de la muestra, ¿por qué factor se ha dividido la anchura del intervalo?
En este caso tenemos:
)87,6;62,5(
88
3
96,125,6
88
3
25,6 025,02/ Z
n
ZXIC
Ahora la amplitud es igual a 1,25, mientras que en el apartado anterior era de 2,51, por lo que
podemos concluir que la amplitud del intervalo se reduce sustancialmente (se divide por dos, de
hecho).
3. Volvemos al caso original en el que teníamos una muestra de 22 alumnos. Ahora dudamos de que
el valor que nos aporta el ejercicio respecto a la desviación estándar sea realmente el valor poblacional.
Así pues, entendemos que el valor de la desviación estándar igual a 3 es un resultado de la muestra
de 22 alumnos. Volved a calcular el intervalo de confianza para la media poblacional con una confianza
del 95%.
En el caso en el cual no disponemos de la desviación estándar poblacional, sino tan solo de la
muestral, entonces en lugar de trabajar con la distribución normal, lo haremos con los valores que
nos proporciona la t de Student.
𝐼𝐶=𝑋
±𝑡𝑁−1;𝛼/2 𝜎
𝑁= 6,25±2,08·3
22=6,25±2,08·0,6396=
6,25±1,3304=(𝟒,𝟗𝟏𝟗𝟔;𝟕,𝟓𝟖𝟎𝟒)
Comprobamos como aumenta la amplitud del intervalo ya que perdemos fiabilidad al trabajar con
resultados muestrales.
pf3
pf4
pf5
pf8
pf9

Vista previa parcial del texto

¡Descarga estadistica y más Apuntes en PDF de Estadística Aplicada solo en Docsity!

1. Sabemos que la distribución de las puntuaciones de un examen de estadística de la población de los estudiantes de Grado de Administración y Dirección de Empresas se puede modelar a partir de una distribución normal con desviación estándar igual a 3. Seleccionamos una muestra aleatoria simple de la población y obtenemos una media de 6,25. El tamaño muestral es de 22 alumnos.

Encontrad el intervalo de confianza para la media poblacional con una confianza del 95%.

1.- Al ser conocida la desviación poblacional, y saber que la distribución de nuestra variable es Normal, obtenemos:

  / 2  6 , 25  Z 0 , 025   

n

IC X Z

2. Repetidlo, con la misma confianza pero suponiendo que la muestra tiene una medida de n=88. Al multiplicar por 4 la medida de la muestra, ¿por qué factor se ha dividido la anchura del intervalo?

En este caso tenemos:

  / 2  6 , 25  Z 0 , 025   

n

IC X Z

Ahora la amplitud es igual a 1,25, mientras que en el apartado anterior era de 2,51, por lo que podemos concluir que la amplitud del intervalo se reduce sustancialmente (se divide por dos, de hecho).

3. Volvemos al caso original en el que teníamos una muestra de 22 alumnos. Ahora dudamos de que el valor que nos aporta el ejercicio respecto a la desviación estándar sea realmente el valor poblacional. Así pues, entendemos que el valor de la desviación estándar igual a 3 es un resultado de la muestra de 22 alumnos. Volved a calcular el intervalo de confianza para la media poblacional con una confianza del 95%.

En el caso en el cual no disponemos de la desviación estándar poblacional, sino tan solo de la muestral, entonces en lugar de trabajar con la distribución normal, lo haremos con los valores que nos proporciona la t de Student.

𝐼𝐶 = 𝑋̅ ± 𝑡𝑁−1;𝛼/

Comprobamos como aumenta la amplitud del intervalo ya que perdemos fiabilidad al trabajar con resultados muestrales.

4. Un estudio sobre los estudiantes de una universidad mostró que 870 de los 1100 estudiantes que formaron parte de la muestra apoyaron un aumento de tasas para financiar mejoras en los servicios a los estudiantes. Utilizando el nivel de confianza del 95%, ¿cuál es el intervalo de confianza para la proporción de estudiantes que apoyan al aumento de las tasas?

La proporción muestral es:

p =

y el intervalo de confianza será:

p ± z√

p(1-p) n

5. El gasto anual en publicidad de las empresas que se dedican al alquiler de bicicletas es una variable aleatoria con distribución desconocida, con una desviación estándar de 1.400 €. Calculad el tamaño muestral necesario para que la media muestral se encuentre como máximo a 300 € de la media poblacional con una probabilidad del 95%.

La variable aleatoria es 𝑋̅ ≈ 𝑁 (𝜇𝑋, (^1400) √𝑛 ), la confianza del 95% y el error máximo de estimación es E =

La expresión que nos da el error máximo de estimación es 𝐸 = 𝑧𝛼 2⁄ √𝑛𝜎, y de aquí, despejando n obtenemos:

𝑛 = (𝑧𝛼 2⁄

2 = (1,96 ∙

2 = 83,

Por lo tanto, el tamaño muestral necesario para garantizar un error máximo de estimación de 300 € es de 84 empresas.

El p-valor es prácticamente igual a cero: 5,262e- 12 <0,01, en consecuencia, rechazaremos la hipótesis nula al 1% de significación y podremos decir que la duración media de la estancia de los turistas en la Costa Brava es diferente de 7 días.

La duración será mayor porque, tal y como podemos observar el estadístico de contraste es positivo ( EC = 7,3723 ).

Por otra parte, también podemos afirmar a partir del IC que la duración media con una confianza del 99% se encuentra dentro del intervalo [ 15,89; 25,60 ]. Por lo tanto, con un 99% de confianza podemos decir que la duración media de los turistas de la Costa Brava es mayor que 7 días.

7. Consideramos ahora la variable "disfrutar de la vida nocturna" ( act_disc ). Con un nivel de significación del 5%, ¿podemos afirmar que más del 35 % de los turistas que visitan la Costa Brava les gustaría disfrutar de la vida nocturna?

Detalla cuáles son la hipótesis nula y la alternativa del contraste. Calcula el estadístico de contraste. Calcula e interpreta el p-valor asociado al EC.

Empezamos calculando la proporción de turistas que dicen que les gustaría disfrutar de la vida nocturna, con R-Commander: Estadísticos> Resúmenes> Resúmenes numéricos ... y seleccionamos la variable act_disc , con el resultado:

Por lo tanto la proporción de turistas que dicen que les gustaría disfrutar de la vida nocturna es del 36 ,17% y el error estándar de la proporción muestral será:

p(1-p) n

El intervalo de confianza del 95% será:

0,3617 ± 1,96 · 0,0350  [0,2931 ; 0,4303]

Las hipótesis nula y alternativa del contraste son:

H 0 :  = 0, 35 H 1 :  > 0, 35

El estadístico de contraste toma el valor:

EC= 0,3617-0,

√^0 ,^35 ∗(^1 −^0 ,^35 )/^188

El p-valor lo buscamos teniendo en cuenta que trabajamos con un contraste unilateral (la hipótesis nula sólo la miramos en una de las colas de la distribución):

pt(c(0.336), df=187, lower.tail=FALSE) [1] 0.

mean sd IQR 0% 25% 50% 75% 100% n 0.3617021 0.4817762 1 0 0 0 1 1 188

p-valor= P(Z> 0,336) = 0 , 369

El p-valor es la probabilidad del resultado del estadístico de contraste observado o de uno más alejado cuando la hipótesis nula es cierta. En nuestro caso es igual a un valor muy elevado, 0, 369 , lo que indica que el valor muestral es un valor razonablemente probable bajo la hipótesis nula (H0) y, por tanto, es lógico que la aceptemos. Por tanto, no podemos rechazar la hipótesis nula y no podemos afirmar taxativamente que a más del 35 % de los turistas que visitan la Costa Brava les gusta disfrutar de la vida nocturna.

Este mismo resultado lo podíamos haber obtenido con R Commander:

One Sample t-test

data: act_disc t = 0.33304, df = 187, p-value = 0. alternative hypothesis: true mean is greater than 0. 95 percent confidence interval: 0.3036189 Inf sample estimates: mean of x

Los estadísticos desciptivos indican que efectivamente en promedio hay una disminución de empleo:

mean sd IQR 0% 25% 50% 75% 100% n antes 54.446429 28.109474 45.5 10 28.75 54.5 74.25 104 56 despues 49.500000 28.535783 45.0 5 25.00 49.0 70.00 104 56 diferencia - 4.946429 2.617561 4.0 - 10 - 7.00 - 5.0 - 3.00 0 56

La cuestión es si esta disminución es significativamente menor a cero:

One Sample t-test

data: diferencia

t = - 14.141 , df = 55 , p-value < 2.2e- 16

alternative hypothesis: true mean is less than 0

95 percent confidence interval:

  • Inf - 4.

sample estimates:

mean of x

Los resultados muestran que claramente rechazamos la hipótesis nula de igualdad entre antes y después, de modo que efectivamente se ha dado una disminución en el volumen de empleo.

Este procedimiento se puede simplificar, ya que R Commander ofrece la posibilidad de contrastar directamente la diferencia en ambas situaciones.

Paired t-test

data: despues and antes

t = - 14.141 , df = 55, p-value < 2.2e- 16

alternative hypothesis: true difference in means is less than 0

95 percent confidence interval:

  • Inf - 4.

sample estimates:

mean of the differences