Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


estadistica ejercicios, Ejercicios de Estadística

Asignatura: Estadistica, Profesor: , Carrera: Derecho + ADE, Universidad: UAM

Tipo: Ejercicios

2017/2018

Subido el 26/05/2018

rubrexito
rubrexito 🇪🇸

4.5

(2)

1 documento

1 / 61

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
GradoAdministraciónyGestión
FacultadCienciasEconómicasyEmpresariales
DepartamentodeEconomíaAplicada
Profesor:SantiagodelaFuenteFernández
RESOLUCIÓN DE EXÁMENES
ESTADÍSTICA DESCRIPTIVA
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d

Vista previa parcial del texto

¡Descarga estadistica ejercicios y más Ejercicios en PDF de Estadística solo en Docsity!

Grado Administración y Gestión Facultad Ciencias Económicas y Empresariales Departamento de Economía Aplicada Profesor: Santiago de la Fuente Fernández

RESOLUCIÓN DE EXÁMENES

ESTADÍSTICA DESCRIPTIVA

Estadística Descriptiva Facultad Ciencias Económicas y Empresariales Departamento de Economía Aplicada Profesor: Santiago de la Fuente Fernández

1. Se ha realizado un estudio sobre el consumo de gas (en m

3 ) en las viviendas de una urbanización

durante el mes de enero, obteniéndose los datos que se muestran en la tabla.

Consumo de gas (m

3 ) Viviendas

50 ‐ 100 10

100 ‐ 200 40

200 ‐ 400 60

400 ‐ 500 10

a) Represente el histograma de esta distribución.

b) Calcule el consumo medio de gas de las viviendas. ¿El valor hallado es representativo de la

distribución?

c) Calcule el consumo más frecuente.

d) Averigüe el valor del tercer cuartil de la distribución del consumo de gas y explique su significado

e) Si la factura del gas consiste en una cantidad fija de 20€ más 0,5€ por cada m

3 consumido, calcule

la factura media de las viviendas y determine si la factura es más dispersa que el consumo.

Solución:

a)

Consumo gas

amplitud

ci

ni

densidad

i

i i c

n h  i

N xi xi ni x^2 i ni

b) El consumo medio de gas de las viviendas:

3

4

i 1

i i

1 243 ,^75 m 120

29250

N

xn

a x  

 

 E(y)  E(a  bx)  y  a b x

La media se ve afectada por el mismo cambio de origen y de escala efectuada sobre la variable.

k k k k 2 2 2 2 i i i i i i i i (^2) i 1 i 1 i 1 2 i 1 2 2 y x

(y y) .n (a b x (a b x). n (b x b x). n (x x). n

s b b s N N N N

   

 ^      

2 2  Var(a  b x) b. sx

La varianza no se ve afectada por el cambio de origen pero si por el cambio de escala efectuado sobre

la variable.

2. De una distribución bidimensional (X,Y) se sabe que al aumentar los valores de X aumentan los de

Y. Se ha obtenido la recta de regresión lineal mínimo cuadrática de Y sobre X y se ha comprobado

que la varianza residual, Sry

2 vale cero. Se tienen además los valores de los siguientes momentos

respecto al origen:

a 10  2 a 20  40 a 01  10 a 02  125

a) Determine la varianza debida a la regresión en la recta de Y/X y el valor de la covarianza.

b) Se hace un cambio de variable de la forma X’= 2X. Si se obtiene la nueva recta de regresión de

Y/X´, ¿será bueno el ajuste? Razone su respuesta.

c) Se decide cambiar la función de ajuste de Y sobre X por una constante, Y = c. Utilizando el método

de mínimos cuadrados, determine el valor de esta constante para nuestro caso.

Solución:

a) Las varianzas de las variables X e Y, respectivamente, son:

2 2 2 x 20 10 2 2 2 y 02 01

s a a 40 2 36

s a a 125 10 25

 ^ ^ ^ ^ 

Siendo

2 2 2 2 2 sry  sy (1  R )  0  1  R  0  R  1 , existe una dependencia funcional , el ajuste es

perfecto.

Para calcular la covarianza sxy tenemos en cuenta que

2 xy xy 2 2 2 2 2 xy^ x^ y^ xy x y

s s R b. b'. 1 s s. s 36. 25 900 s 900 30 s s

b) El coeficiente de determinación

2 R es invariante ante un cambio de origen y de escala, con lo que

la bondad del ajuste será idéntico.

c) E(y)  E(c)  y c

INVARIABILIDAD DEL COEFICIENTE DE CORRELACIÓN LINEAL R

2 : X' k X

 CAMBIO DE ORIGEN:  CAMBIO DE ESCALA:

 

10

11 11

x'y 11 11 11 xy 2 2 20 x' x

a' x ' E(X') E(m X) m E(X) m x

a' E(X'Y) E (m X)Y E(mY) E(X Y) m y a

s a' x 'y m y a (m x) y a x y s

a' s Var (m X) s

       

      

        

   

x'y xy x'y xy 2 2 2 2 x' x y y

s s s s c c' s s s s

2 2 xy^ xy^ xy 2 2 2 2 2 x y x y

s s s R' c. c'. R s s s. s

10

11 11

x'y 11 11 11 xy 2 2 2 2 20 x' x

a' x ' E(X') E(k X) kE(X) k x

a' E(X'Y) E(k X Y) kE(X Y) ka

s a' x 'y ka k x y k(a x y) ks

a' s Var (k X) k Var(X) k s

x'y xy x'y xy 2 2 2 2 2 x' x y y

s ks s ks c c' s k s s s

2 2 xy^ xy^ xy 2 2 2 2 2 2 x y x y

ks ks s R' c. c'. R k s s s. s

El coeficiente de determinación R

2 es invariante ante un cambio de origen y de escala

3. Abel Grandes Pistado preguntó a sus 31 compañeros de clase qué calificación obtuvieron en el

último examen de estadística. Sólo recuerda que él aprobó con la nota mediana de 5,6667 y su

tocayo Escasi Lopasa tuvo un 4,6 (una de las notas más frecuentes habidas). Y, haciendo memoria,

ha podido completar los siguientes datos:

Nota de

estadística

Número de

alumnos

0 ‐ 4 8

4 ‐ 5 n (^2)

5 ‐ 7 n (^3)

7 ‐ 9 6

9 ‐ 10 6

Calcule:

a) ¿Qué proporción de alumnos ha obtenido una nota superior a 5? ¿Cómo es la distribución

respecto a la moda?

b) Estudie la dispersión relativa de las notas a partir del coeficiente de variación de Pearson.

Interprete los resultados.

c) ¿Cómo afecta a la homogeneidad de la distribución que este examen sea un 60 por ciento de la

calificación final?

d) Comente, con base estadística, el grado de concentración de las notas de este examen.

Solución:

CAMBIO DE ESCALA DEL COEFICIENTE DE VARIACIÓN DE PEARSON C.V: y k. x

x x 2 2 2 2 2 y^ X x y x x

E(y) E(k. x) k. E(x) k. x (^) k. s s C.V C.V Var (y) Var (k. x) k .Var(x) k. s s k. s k. s k. x^ x

El Coeficiente de Variación de Pearson es invariante ante un cambio de escala.

final x final final

s 2. s C.V 0,4730 (47,30%) x 2. x

d) Grado de concentración de las notas de este examen.

El índice de concentración de Gini: 0 , 32 ( 32 %) 212 , 5

68 , 48

p

(p q)

I (^51)

i 1

i

51

i 1

i i

G  

La concentración es medio‐baja.

4. Se han obtenido las siguientes expresiones para las rectas de regresión mínimo cuadráticas de una

variable bidimensional (X,Y), donde X es el gasto mensual en ocio e Y el gasto mensual en

transporte de un grupo de amigos:

Y 4X 2

Y 2X 10

^ ^ 

 ^ 

Sabiendo además que la covarianza entre ambas variables sxy  60. Se pide:

a) Identifique cuál es la recta de regresión de Y/X y de X/Y.

b) Interprete los coeficientes de las rectas de regresión.

c) Porcentaje de variabilidad explicada y no explicada por la recta.

d) Calcule la varianza residual en la regresión Y/X. ¿Coincidirá con la varianza residual en la regresión

X/Y? Justifique su respuesta.

Solución:

a) Recta de regresión Y/X: Y  2X  10 , pendiente b  2

Recta de regresión X/Y:

Y 4 X 2 4 X Y 2 X Y

        , pendiente

b' 4

La otra opción no puede ocurrir:

Recta de regresión Y/X: Y  4 X  2

Recta de regresión X/Y:

Y 2X 10 2X Y 10 X Y 5

puesto que

R b. b' 4. 2 2

   cuando se sabe que

2 0  R  1

b) Como las dos pendientes son positivas (2 y 1/4), la recta de regresión de Y/X tiene mayor

pendiente en valor absoluto que la de X/Y

c) El coeficiente de determinación lineal

R b. b' 2. 0, 4 2

La recta de regresión de Y sobre X explica el 50% de la variabilidad de la variable dependiente y el

otro 50% es no explicado.

d)

xy (^2) 2 2 x x x

xy 2 2 2 y y y

s (^60) b 2 s 30 s s

s (^1 ) b' s 240 s 4 s

 ^ ^ ^ 

Las varianzas residuales:

2 2 2 2 ry x ry 2 2 2 2 rx y rx

s s .(1 R ) s 30. (1 0,5) 15

s s .(1 R ) s 240. (1 0,5) 120

 ^ ^ ^ ^ 

5. Sabiendo que

2 2 x  3 , s (^) x  6 , sy  8 y que la recta de regresión de Y sobre X es y  4 0,667. x

Obtener la recta de regresión de X sobre Y.

Solución:

Y/X: y  4  0,667. x xy xy

2 xy x

y 4 0,667. x 4 0,667. 3 2

s s b 0,667 s 0,667. 6 4 s 6

X/Y: x  a' b'y

xy 2 y

s (^4) b' 0, s 8

x a' b' y 3 a' 0,5. 2 a' 4

 ^ ^  

 ^ ^ ^ ^ 

x  4 0,5. y

6. Hallar la recta de regresión de Y sobre X sabiendo que x  4,1 , y  2,3 y la recta pasa por el

punto (5,9 , 3,5)

Solución:

Y/X: y  a  b x

y a b x 2,3 a 4,1. b

por pasar por (5,9 , 3,5) 3,5 a 5,9. b

^ ^ ^ ^ 

 ^ 

 En el Grupo B:

k

k. 30 11

  1. (0,3. k 11) 49,5^ 2,1. k^77 P 19 13,5 100. 7 19 13, 20 11 9 k^ 126,5 / 2,1^ 60,

 ^ 

 ^ 

El 39,76% (^)  100  60,24  39,76tiene una buena comprensión lectora en el Grupo B.

En consecuencia, el Grupo A tiene una mejor comprensión lectora.

b) La quinta parte representa el 20%. Con relación al centro (50%), cubrirán desde el 40% al 60%, se

tendrá que calcular el Percentil 40 y el Percentil 60 de la distribución de comprensión lectora del

Grupo A.

40

P 13,5. 7 13,5. 7 18,

60

P 20,5. 7 20,5. 7 23,

La quinta parte central del Grupo A se encuentra entre los valores [18,17 ‐ 23,42]

c) Los 12 valores representa el(12 / 30  40%). Con relación al centro (50%), cubrirán desde el 30% al

70%, teniendo que calcular el Percentil 30 y el Percentil 70 de la distribución de comprensión

lectora del Grupo B.

30

P 6,5. 7 6,5. 7 11,

70

P 20,5. 7 20,5. 7 21,

Los 12 centrales valores centrales de comprensión del Grupo B se encuentran entre

[11,5 ‐ 21,375]

d) Mayor variabilidad tendrá aquel grupo que posea mayor dispersión entre sus valores, es decir, si

la media aritmética es representativa de las observaciones (no existen valores extremos

exageradamente distanciados de la mayoría).

El estadístico más adecuado para medir la variabilidad relativa entre dos series es el Coeficiente de

Variación de Pearson, entendiendo que un valor mayor indica menor homogeneidad, un valor

menor refleja menor dispersión o variabilidad.

2 2 A A A

x 19,8 s 19,8 77,91 s 77,91 8, 40 40

2 2 B B B

x 16,3 s 16,3 63,21 s 63,21 7, 30 30

A B

CV. 100 44,59% CV. 100 48,77%

El Grupo B presenta mayor variabilidad relativa, en contra de lo obtenido comparando la

desviación típica.

8. A partir de la tabla adjunta, donde N  11 , Y  0

X \ Y ‐ 2 0 1

1 3 n 22 n 23

2 0 1 0

a) ¿Son independientes las variables estadísticamente?

b) Rectas de regresión de Y/X e X/Y

c) ¿Qué parte de la varianza calculada Y es explicada por la regresión? ¿Qué parte es debida a

causas ajenas?.

Solución:

a)

X \ Y ‐ (^2 0 1) ni (^) 

1 3 n 22 n 23 3  n 22 n 23

2 0 1 0 1

n j 3 2  n 22 n 23 5  n 22  n 23  11

De otra parte, (^2323)

  1. 3 0 n Y 0 n 6 11

5  n 22  6  11  n 22  0

X \ Y ‐ (^2 0 1) ni (^) 

n j 3 2 6 11

Las variables X e Y son independientes

cuando se verifica

nij (^) ni nj i, j N N N

  ^  

No son independientes porque no se verifica la relación:

x 11 11 11

n 12 n 1 n 2

N N N

 ^  ^ 

9. La variable X tiene x  4 y

2 sx  1. Determinar el coeficiente de variación de Pearson de las

variables:

(X 3) (X 2)

W , Z

Solución:

2 2 x W x

E(W) E X. E(X) w. x 2 2 2 2 2 2 2

Var (W) Var X. Var(X). s s. s 2 2 2 4 2 2

 ^ ^ ^ ^ ^ ^ 

 ^ 

 ^  ^ ^ 

w w

s (^) 1 / 2 C.V 1 w 1 / 2

2 2 x z x

E(Z) E X. E(X) z. x 3 3 3 3 3 3 3

Var (Z) Var X. Var(X). s s. s 3 3 3 9 3 3

 ^  ^ ^ ^ ^ ^ 

 ^ 

 ^  ^ ^ 

 ^ ^ ^ 

 ^  ^ 

z z

s 1 / 3 1 C.V z 2 / 3 2

COEFICIENTE DE VARIACIÓN DE PEARSON : CAMBIO DE ORIGEN Y DE ESCALA

 

2 2 2 x y x

E(Y) E (a b. X) a b. E(X) a b. X

Var (Y) Var a b. X b. Var(X) b. s s b. s

x x y

b. s s C.V a b. X a X b

El Coeficiente de Variación de Pearson se encuentra afectado ante un cambio de origen.

10. Si sy  sxy r  0 ¿La recta de regresión Y/X tiene mayor pendiente que la de X/Y?

Solución:

RELACIÓN ENTRE LOS COEFICIENTES DE REGRESIÓN Y CORRELACIÓN

xy (^2) 2 xy^ x x (^2) y x x y xy (^2) x 2 xy^ y y (^2) x y x y xy y xy x y x y

s b s b. s s (^) s b. s r. s. s b r. s (^) s b' s b. s s (^) s b'. s r. s. s b' r. s s r s r. s. s s. s

Si

y (^) x y x x y

s (^) s s s , r 0 r. r. b b' s s

11. Sean dos variables X e Y, tipificadas e incorreladas. Escribir la recta de regresión de Y sobre X

Solución:

Por ser (X, Y) variables tipificadas:

x

y

x 0 s 1

y 0 s 1

^ ^ 

 ^ 

Por ser (X, Y) variables incorreladas:

2 xy

b 0 s 0 r 0 b' 0

^ 

Y/X:

y a b. x a y 0 y a b. x b 0

^ ^ ^ ^ 

Y/X: y  0

12. En una regresión lineal las varianza explicada por la regresión y residual son iguales. ¿Cuánto

vale el coeficiente de determinación?.

Solución:

2 2 2 2 s (^) y  sry  sRy 2sry

2 2 2 ry 2 ry 2 y ry

s s (^1 ) r 1 r 1 1 s 2s 2 2

14. Dada la siguiente distribución:

x (^) i 5 10 15 20 25

ni (^3 7 5 3 )

a) Calcular la media armónica, geométrica y aritmética

b) Calcular la varianza, desviación típica y coeficiente de variación de Pearson

c) Hallar la media aritmética y la desviación típica de la variable X tipificada

d) Mediante la transformación

x 15 y 5

 , hallar la media, varianza y desviación típica

Solución:

a)

x (^) i 5 10 15 20 25

ni (^3 7 5 3 5 )

x ni i (^15 70 75 60 125 )

i

i

n x 125 10000000 759375 8000 9765625 7,415771484^.^10

25

i

i

n

x

2 x ni i 75 700 1125 1200 3125 6225

A (^5) i 1 2 3 4 5 i 1 (^) i 1 2 3 4 5

N N 23

x 11, n n n n n n 1,

x x x x x x

 ^ ^ ^ 

i 1 2 3 4 5

(^5) n n 23 n^23 n^ n^ n^2325 G i 1 2 3 4 5 i 1

x x x. x. x. x. x 7,415771484. 10 13, 

5 i i i 1 1

x n 345 a x 15 N 23

La relación entre las diferentes medias es: xA  xG x

b)

(^5 ) i i i 1^2 2 2 x 2 1

x n 6225 a 270,652 s a a 270,652 15 45, N 23

s (^) x 45,652 6,

x x

s 6, CV 0, x 15

   [45% de dispersión de los datos]

c) La variable X tipifica:

i i x

x x z s

x (^) i 5 10 15 20 25

ni (^3 7 5 3 5 )

i i x

x x z s

z ni i (^) ‐4,438 ‐5,178 0 2,219 7,396 0

2 z ni i 6,565 3,830 0 1,641 10,941 23

yi (^) ‐ 2 ‐ 1 0 1 2

y ni i (^) ‐ 6 ‐ 7 0 3 10 0

2 y ni i (^12 7 0 3 20 )

5 i i i 1

z n 0 z 0 N 23

5 2 i i (^2) i 1 2 z

z n 23 s (z) 0 1 N 23

Toda variable tipificada tiene

media 0 y varianza 1

 ^ 

d) Con la transformación

x 15 y 5

5 i i i 1

y n 0 y 0 N 23

(^5 ) i i 2 i 1 2 y

y n 42 42 s (y) 0 1, N 23 23

      (^) y

s 1, 23

No son necesarios los cálculos, se conoce:

 

 

2 2 y 2 x

x 15 1 1 15 y E E x 3 3 x 3 0 5 5 5 5

x 15 1 1 45, s Var Var x s 1, 5 5 25 25

 ^ ^ ^  ^ ^  ^ ^ 

2 2 2 sy  a 02  a 01  22,125  3,75  8,0625  sy  8,0625 2,

covarianza: s (^) xy  a 11  a 10. a 01  20,75  4,25. 3,75 4,

 El coeficiente de regresión de Y sobre X (pendiente de la recta):

xy 2 x

s (^) 4, b 1, s 4,

Y  a  b X  3,75  a  1,055. 4,25  a  0,

Y / X : Y   0,734 1,055 X

 El coeficiente de regresión de X sobre Y (pendiente de la recta):

xy 2 Y

s (^) 4, b' 0, s 8,

X  a'  b' Y  4,25  a'  0,597. 3,75  a' 2,

X / Y : X  2,011 0,597 Y

c) COEFICIENTE DETERMINACIÓN:

2 r  b. b'  1,055. 0,597 0,

VARIANZA RESIDUAL DE X:

2 2 2 2 srx  s (^) x (1  r )  srx  4,5625 (1  0,6298) 1,689NO EXPLICADA

2 2 2 x rx Rx varianza residual varianza regresión no explicada explicada

s  s  s  

2 2 2 2  sRx  sx  srx  sRx  8,0625  1,689  6,3735 EXPLICADA

16. El salario medio mensual en cientos de euros de 160 obreros se distribuye de la siguiente forma:

Intervalos 4 ‐ 8 8 ‐ 12 12 ‐ 16 16 ‐ 20 20 ‐ 24 24 ‐ 28 28 ‐ 32 32 ‐ 36

ni (^3 12 40 47 32 13 9 )

a) Media aritmética, mediana, moda y percentil 75.

b) Coeficiente de asimetría de Fisher.

c) Realizar una redistribución en la que los intervalos tengan una amplitud de 8, y con estos nuevos

intervalos calcular la media aritmética y el coeficiente de variación de Pearson. Comparar los

resultados obtenidos en el apartado (a)

Solución:

a)

Intervalos 4 ‐ 8 8 ‐ 12 12 ‐ 16 16 ‐ 20 20 ‐ 24 24 ‐ 28 28 ‐ 32 32 ‐ 36

xi 6 10 14 18 22 26 30 34

ni (^3 12 40 47 32 13 9 4 )

Ni 3 15 55 102 134 147 156 160

hi  n / ci i 0,75 3 10 11,75 8 3,25 2,25 1 40

x. ni i 18 120 560 846 704 338 270 136 2992

(xi  x) ‐12,7 ‐8,7 ‐4,7 ‐0,7 3,3 7,3 11,3 15,

(x (^) i  x) ni ‐38,1 ‐104,4 ‐ 188 ‐32,9 105,6 94,9 101,7 61,2 0

2 (xi  x) ni 483,87 908,28 883,6 23,03 348,48 692,77 1149,21 936,36 5425,

3 (xi  x) ni ‐6145,149 ‐7902,036 ‐4152,92 ‐16,121 1149,984 5057,221 12986,073 14326,308 15303,

8 i i i 1 1

x. n 2992 a x 18, N 160

i 1

e i i e i i 1

N

N

M L c M 16. 4 18, N N 102 55

i i 1 d i i d i i 1 i i 1

h h (^) 11,75 10 M L c M 16. 4 17, (h h ) (h h ) (11,75 10) (11,75 8)

 

Se verifica la relación x  Me  Md  Distribución asimétrica a la derecha o positiva

Adviértase que para calcular la moda, cuando la amplitud de los intervalos es igual, para trabajar con

una escala más pequeña, se puede emplear la expresión:

i i 1 d i i d i i 1 i i 1

n n (^47 ) M L c M 16. 4 17, (n n ) (n n ) (47 40) (47 32)

 

i 1

75 i i 3 75 i i 1

75 N

N

P L c Q P 20. 4 22, N N 134 102