





















































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Estadistica, Profesor: , Carrera: Derecho + ADE, Universidad: UAM
Tipo: Ejercicios
1 / 61
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!






















































Grado Administración y Gestión Facultad Ciencias Económicas y Empresariales Departamento de Economía Aplicada Profesor: Santiago de la Fuente Fernández
Estadística Descriptiva Facultad Ciencias Económicas y Empresariales Departamento de Economía Aplicada Profesor: Santiago de la Fuente Fernández
1. Se ha realizado un estudio sobre el consumo de gas (en m
3 ) en las viviendas de una urbanización
durante el mes de enero, obteniéndose los datos que se muestran en la tabla.
Consumo de gas (m
3 ) Viviendas
50 ‐ 100 10
100 ‐ 200 40
200 ‐ 400 60
400 ‐ 500 10
a) Represente el histograma de esta distribución.
b) Calcule el consumo medio de gas de las viviendas. ¿El valor hallado es representativo de la
distribución?
c) Calcule el consumo más frecuente.
d) Averigüe el valor del tercer cuartil de la distribución del consumo de gas y explique su significado
e) Si la factura del gas consiste en una cantidad fija de 20€ más 0,5€ por cada m
3 consumido, calcule
la factura media de las viviendas y determine si la factura es más dispersa que el consumo.
Solución:
a)
Consumo gas
amplitud
ci
ni
densidad
i
i i c
n h i
N xi xi ni x^2 i ni
b) El consumo medio de gas de las viviendas:
3
4
i 1
i i
1 243 ,^75 m 120
29250
N
xn
a x
E(y) E(a bx) y a b x
La media se ve afectada por el mismo cambio de origen y de escala efectuada sobre la variable.
k k k k 2 2 2 2 i i i i i i i i (^2) i 1 i 1 i 1 2 i 1 2 2 y x
(y y) .n (a b x (a b x). n (b x b x). n (x x). n
s b b s N N N N
2 2 Var(a b x) b. sx
La varianza no se ve afectada por el cambio de origen pero si por el cambio de escala efectuado sobre
la variable.
2. De una distribución bidimensional (X,Y) se sabe que al aumentar los valores de X aumentan los de
Y. Se ha obtenido la recta de regresión lineal mínimo cuadrática de Y sobre X y se ha comprobado
que la varianza residual, Sry
2 vale cero. Se tienen además los valores de los siguientes momentos
respecto al origen:
a 10 2 a 20 40 a 01 10 a 02 125
a) Determine la varianza debida a la regresión en la recta de Y/X y el valor de la covarianza.
b) Se hace un cambio de variable de la forma X’= 2X. Si se obtiene la nueva recta de regresión de
Y/X´, ¿será bueno el ajuste? Razone su respuesta.
c) Se decide cambiar la función de ajuste de Y sobre X por una constante, Y = c. Utilizando el método
de mínimos cuadrados, determine el valor de esta constante para nuestro caso.
Solución:
a) Las varianzas de las variables X e Y, respectivamente, son:
2 2 2 x 20 10 2 2 2 y 02 01
s a a 40 2 36
s a a 125 10 25
Siendo
2 2 2 2 2 sry sy (1 R ) 0 1 R 0 R 1 , existe una dependencia funcional , el ajuste es
perfecto.
Para calcular la covarianza sxy tenemos en cuenta que
2 xy xy 2 2 2 2 2 xy^ x^ y^ xy x y
s s R b. b'. 1 s s. s 36. 25 900 s 900 30 s s
b) El coeficiente de determinación
2 R es invariante ante un cambio de origen y de escala, con lo que
la bondad del ajuste será idéntico.
c) E(y) E(c) y c
2 : X' k X
10
11 11
x'y 11 11 11 xy 2 2 20 x' x
a' x ' E(X') E(m X) m E(X) m x
a' E(X'Y) E (m X)Y E(mY) E(X Y) m y a
s a' x 'y m y a (m x) y a x y s
a' s Var (m X) s
x'y xy x'y xy 2 2 2 2 x' x y y
s s s s c c' s s s s
2 2 xy^ xy^ xy 2 2 2 2 2 x y x y
s s s R' c. c'. R s s s. s
10
11 11
x'y 11 11 11 xy 2 2 2 2 20 x' x
a' x ' E(X') E(k X) kE(X) k x
a' E(X'Y) E(k X Y) kE(X Y) ka
s a' x 'y ka k x y k(a x y) ks
a' s Var (k X) k Var(X) k s
x'y xy x'y xy 2 2 2 2 2 x' x y y
s ks s ks c c' s k s s s
2 2 xy^ xy^ xy 2 2 2 2 2 2 x y x y
ks ks s R' c. c'. R k s s s. s
El coeficiente de determinación R
2 es invariante ante un cambio de origen y de escala
3. Abel Grandes Pistado preguntó a sus 31 compañeros de clase qué calificación obtuvieron en el
último examen de estadística. Sólo recuerda que él aprobó con la nota mediana de 5,6667 y su
tocayo Escasi Lopasa tuvo un 4,6 (una de las notas más frecuentes habidas). Y, haciendo memoria,
ha podido completar los siguientes datos:
Nota de
estadística
Número de
alumnos
0 ‐ 4 8
4 ‐ 5 n (^2)
5 ‐ 7 n (^3)
7 ‐ 9 6
9 ‐ 10 6
Calcule:
a) ¿Qué proporción de alumnos ha obtenido una nota superior a 5? ¿Cómo es la distribución
respecto a la moda?
b) Estudie la dispersión relativa de las notas a partir del coeficiente de variación de Pearson.
Interprete los resultados.
c) ¿Cómo afecta a la homogeneidad de la distribución que este examen sea un 60 por ciento de la
calificación final?
d) Comente, con base estadística, el grado de concentración de las notas de este examen.
Solución:
CAMBIO DE ESCALA DEL COEFICIENTE DE VARIACIÓN DE PEARSON C.V: y k. x
x x 2 2 2 2 2 y^ X x y x x
E(y) E(k. x) k. E(x) k. x (^) k. s s C.V C.V Var (y) Var (k. x) k .Var(x) k. s s k. s k. s k. x^ x
El Coeficiente de Variación de Pearson es invariante ante un cambio de escala.
final x final final
s 2. s C.V 0,4730 (47,30%) x 2. x
d) Grado de concentración de las notas de este examen.
El índice de concentración de Gini: 0 , 32 ( 32 %) 212 , 5
68 , 48
p
(p q)
I (^51)
i 1
i
51
i 1
i i
G
La concentración es medio‐baja.
4. Se han obtenido las siguientes expresiones para las rectas de regresión mínimo cuadráticas de una
variable bidimensional (X,Y), donde X es el gasto mensual en ocio e Y el gasto mensual en
transporte de un grupo de amigos:
Sabiendo además que la covarianza entre ambas variables sxy 60. Se pide:
a) Identifique cuál es la recta de regresión de Y/X y de X/Y.
b) Interprete los coeficientes de las rectas de regresión.
c) Porcentaje de variabilidad explicada y no explicada por la recta.
d) Calcule la varianza residual en la regresión Y/X. ¿Coincidirá con la varianza residual en la regresión
X/Y? Justifique su respuesta.
Solución:
a) Recta de regresión Y/X: Y 2X 10 , pendiente b 2
Recta de regresión X/Y:
, pendiente
b' 4
La otra opción no puede ocurrir:
Recta de regresión Y/X: Y 4 X 2
Recta de regresión X/Y:
puesto que
R b. b' 4. 2 2
cuando se sabe que
2 0 R 1
b) Como las dos pendientes son positivas (2 y 1/4), la recta de regresión de Y/X tiene mayor
pendiente en valor absoluto que la de X/Y
c) El coeficiente de determinación lineal
R b. b' 2. 0, 4 2
La recta de regresión de Y sobre X explica el 50% de la variabilidad de la variable dependiente y el
otro 50% es no explicado.
d)
xy (^2) 2 2 x x x
xy 2 2 2 y y y
s (^60) b 2 s 30 s s
s (^1 ) b' s 240 s 4 s
Las varianzas residuales:
2 2 2 2 ry x ry 2 2 2 2 rx y rx
s s .(1 R ) s 30. (1 0,5) 15
s s .(1 R ) s 240. (1 0,5) 120
5. Sabiendo que
2 2 x 3 , s (^) x 6 , sy 8 y que la recta de regresión de Y sobre X es y 4 0,667. x
Obtener la recta de regresión de X sobre Y.
Solución:
Y/X: y 4 0,667. x xy xy
2 xy x
y 4 0,667. x 4 0,667. 3 2
s s b 0,667 s 0,667. 6 4 s 6
X/Y: x a' b'y
xy 2 y
s (^4) b' 0, s 8
x a' b' y 3 a' 0,5. 2 a' 4
x 4 0,5. y
6. Hallar la recta de regresión de Y sobre X sabiendo que x 4,1 , y 2,3 y la recta pasa por el
punto (5,9 , 3,5)
Solución:
Y/X: y a b x
y a b x 2,3 a 4,1. b
por pasar por (5,9 , 3,5) 3,5 a 5,9. b
En el Grupo B:
k
k. 30 11
El 39,76% (^) 100 60,24 39,76tiene una buena comprensión lectora en el Grupo B.
En consecuencia, el Grupo A tiene una mejor comprensión lectora.
b) La quinta parte representa el 20%. Con relación al centro (50%), cubrirán desde el 40% al 60%, se
tendrá que calcular el Percentil 40 y el Percentil 60 de la distribución de comprensión lectora del
Grupo A.
40
60
La quinta parte central del Grupo A se encuentra entre los valores [18,17 ‐ 23,42]
c) Los 12 valores representa el(12 / 30 40%). Con relación al centro (50%), cubrirán desde el 30% al
70%, teniendo que calcular el Percentil 30 y el Percentil 70 de la distribución de comprensión
lectora del Grupo B.
30
70
Los 12 centrales valores centrales de comprensión del Grupo B se encuentran entre
[11,5 ‐ 21,375]
d) Mayor variabilidad tendrá aquel grupo que posea mayor dispersión entre sus valores, es decir, si
la media aritmética es representativa de las observaciones (no existen valores extremos
exageradamente distanciados de la mayoría).
El estadístico más adecuado para medir la variabilidad relativa entre dos series es el Coeficiente de
Variación de Pearson, entendiendo que un valor mayor indica menor homogeneidad, un valor
menor refleja menor dispersión o variabilidad.
2 2 A A A
x 19,8 s 19,8 77,91 s 77,91 8, 40 40
2 2 B B B
x 16,3 s 16,3 63,21 s 63,21 7, 30 30
A B
El Grupo B presenta mayor variabilidad relativa, en contra de lo obtenido comparando la
desviación típica.
8. A partir de la tabla adjunta, donde N 11 , Y 0
1 3 n 22 n 23
2 0 1 0
a) ¿Son independientes las variables estadísticamente?
b) Rectas de regresión de Y/X e X/Y
c) ¿Qué parte de la varianza calculada Y es explicada por la regresión? ¿Qué parte es debida a
causas ajenas?.
Solución:
a)
X \ Y ‐ (^2 0 1) ni (^)
1 3 n 22 n 23 3 n 22 n 23
2 0 1 0 1
n j 3 2 n 22 n 23 5 n 22 n 23 11
De otra parte, (^2323)
5 n 22 6 11 n 22 0
X \ Y ‐ (^2 0 1) ni (^)
n j 3 2 6 11
Las variables X e Y son independientes
cuando se verifica
nij (^) ni nj i, j N N N
No son independientes porque no se verifica la relación:
x 11 11 11
n 12 n 1 n 2
N N N
9. La variable X tiene x 4 y
2 sx 1. Determinar el coeficiente de variación de Pearson de las
variables:
Solución:
2 2 x W x
E(W) E X. E(X) w. x 2 2 2 2 2 2 2
Var (W) Var X. Var(X). s s. s 2 2 2 4 2 2
w w
s (^) 1 / 2 C.V 1 w 1 / 2
2 2 x z x
E(Z) E X. E(X) z. x 3 3 3 3 3 3 3
Var (Z) Var X. Var(X). s s. s 3 3 3 9 3 3
z z
s 1 / 3 1 C.V z 2 / 3 2
2 2 2 x y x
E(Y) E (a b. X) a b. E(X) a b. X
Var (Y) Var a b. X b. Var(X) b. s s b. s
x x y
b. s s C.V a b. X a X b
El Coeficiente de Variación de Pearson se encuentra afectado ante un cambio de origen.
10. Si sy sxy r 0 ¿La recta de regresión Y/X tiene mayor pendiente que la de X/Y?
Solución:
xy (^2) 2 xy^ x x (^2) y x x y xy (^2) x 2 xy^ y y (^2) x y x y xy y xy x y x y
s b s b. s s (^) s b. s r. s. s b r. s (^) s b' s b. s s (^) s b'. s r. s. s b' r. s s r s r. s. s s. s
Si
y (^) x y x x y
s (^) s s s , r 0 r. r. b b' s s
11. Sean dos variables X e Y, tipificadas e incorreladas. Escribir la recta de regresión de Y sobre X
Solución:
Por ser (X, Y) variables tipificadas:
x
y
x 0 s 1
y 0 s 1
Por ser (X, Y) variables incorreladas:
2 xy
b 0 s 0 r 0 b' 0
y a b. x a y 0 y a b. x b 0
Y/X: y 0
12. En una regresión lineal las varianza explicada por la regresión y residual son iguales. ¿Cuánto
vale el coeficiente de determinación?.
Solución:
2 2 2 2 s (^) y sry sRy 2sry
2 2 2 ry 2 ry 2 y ry
s s (^1 ) r 1 r 1 1 s 2s 2 2
14. Dada la siguiente distribución:
x (^) i 5 10 15 20 25
ni (^3 7 5 3 )
a) Calcular la media armónica, geométrica y aritmética
b) Calcular la varianza, desviación típica y coeficiente de variación de Pearson
c) Hallar la media aritmética y la desviación típica de la variable X tipificada
d) Mediante la transformación
x 15 y 5
, hallar la media, varianza y desviación típica
Solución:
a)
x (^) i 5 10 15 20 25
ni (^3 7 5 3 5 )
x ni i (^15 70 75 60 125 )
i
i
n x 125 10000000 759375 8000 9765625 7,415771484^.^10
25
i
i
n
x
2 x ni i 75 700 1125 1200 3125 6225
A (^5) i 1 2 3 4 5 i 1 (^) i 1 2 3 4 5
x 11, n n n n n n 1,
x x x x x x
i 1 2 3 4 5
(^5) n n 23 n^23 n^ n^ n^2325 G i 1 2 3 4 5 i 1
x x x. x. x. x. x 7,415771484. 10 13,
5 i i i 1 1
x n 345 a x 15 N 23
La relación entre las diferentes medias es: xA xG x
b)
(^5 ) i i i 1^2 2 2 x 2 1
x n 6225 a 270,652 s a a 270,652 15 45, N 23
s (^) x 45,652 6,
x x
s 6, CV 0, x 15
[45% de dispersión de los datos]
c) La variable X tipifica:
i i x
x x z s
x (^) i 5 10 15 20 25
ni (^3 7 5 3 5 )
i i x
x x z s
z ni i (^) ‐4,438 ‐5,178 0 2,219 7,396 0
2 z ni i 6,565 3,830 0 1,641 10,941 23
yi (^) ‐ 2 ‐ 1 0 1 2
y ni i (^) ‐ 6 ‐ 7 0 3 10 0
2 y ni i (^12 7 0 3 20 )
5 i i i 1
z n 0 z 0 N 23
5 2 i i (^2) i 1 2 z
z n 23 s (z) 0 1 N 23
Toda variable tipificada tiene
media 0 y varianza 1
d) Con la transformación
x 15 y 5
5 i i i 1
y n 0 y 0 N 23
(^5 ) i i 2 i 1 2 y
y n 42 42 s (y) 0 1, N 23 23
(^) y
s 1, 23
No son necesarios los cálculos, se conoce:
2 2 y 2 x
x 15 1 1 15 y E E x 3 3 x 3 0 5 5 5 5
x 15 1 1 45, s Var Var x s 1, 5 5 25 25
2 2 2 sy a 02 a 01 22,125 3,75 8,0625 sy 8,0625 2,
covarianza: s (^) xy a 11 a 10. a 01 20,75 4,25. 3,75 4,
El coeficiente de regresión de Y sobre X (pendiente de la recta):
xy 2 x
s (^) 4, b 1, s 4,
Y a b X 3,75 a 1,055. 4,25 a 0,
El coeficiente de regresión de X sobre Y (pendiente de la recta):
xy 2 Y
s (^) 4, b' 0, s 8,
X a' b' Y 4,25 a' 0,597. 3,75 a' 2,
c) COEFICIENTE DETERMINACIÓN:
2 r b. b' 1,055. 0,597 0,
2 2 2 2 srx s (^) x (1 r ) srx 4,5625 (1 0,6298) 1,689NO EXPLICADA
2 2 2 x rx Rx varianza residual varianza regresión no explicada explicada
s s s
2 2 2 2 sRx sx srx sRx 8,0625 1,689 6,3735 EXPLICADA
16. El salario medio mensual en cientos de euros de 160 obreros se distribuye de la siguiente forma:
Intervalos 4 ‐ 8 8 ‐ 12 12 ‐ 16 16 ‐ 20 20 ‐ 24 24 ‐ 28 28 ‐ 32 32 ‐ 36
ni (^3 12 40 47 32 13 9 )
a) Media aritmética, mediana, moda y percentil 75.
b) Coeficiente de asimetría de Fisher.
c) Realizar una redistribución en la que los intervalos tengan una amplitud de 8, y con estos nuevos
intervalos calcular la media aritmética y el coeficiente de variación de Pearson. Comparar los
resultados obtenidos en el apartado (a)
Solución:
a)
Intervalos 4 ‐ 8 8 ‐ 12 12 ‐ 16 16 ‐ 20 20 ‐ 24 24 ‐ 28 28 ‐ 32 32 ‐ 36
xi 6 10 14 18 22 26 30 34
ni (^3 12 40 47 32 13 9 4 )
Ni 3 15 55 102 134 147 156 160
hi n / ci i 0,75 3 10 11,75 8 3,25 2,25 1 40
x. ni i 18 120 560 846 704 338 270 136 2992
(xi x) ‐12,7 ‐8,7 ‐4,7 ‐0,7 3,3 7,3 11,3 15,
(x (^) i x) ni ‐38,1 ‐104,4 ‐ 188 ‐32,9 105,6 94,9 101,7 61,2 0
2 (xi x) ni 483,87 908,28 883,6 23,03 348,48 692,77 1149,21 936,36 5425,
3 (xi x) ni ‐6145,149 ‐7902,036 ‐4152,92 ‐16,121 1149,984 5057,221 12986,073 14326,308 15303,
8 i i i 1 1
x. n 2992 a x 18, N 160
i 1
e i i e i i 1
M L c M 16. 4 18, N N 102 55
i i 1 d i i d i i 1 i i 1
h h (^) 11,75 10 M L c M 16. 4 17, (h h ) (h h ) (11,75 10) (11,75 8)
Se verifica la relación x Me Md Distribución asimétrica a la derecha o positiva
Adviértase que para calcular la moda, cuando la amplitud de los intervalos es igual, para trabajar con
una escala más pequeña, se puede emplear la expresión:
i i 1 d i i d i i 1 i i 1
n n (^47 ) M L c M 16. 4 17, (n n ) (n n ) (47 40) (47 32)
i 1
75 i i 3 75 i i 1
P L c Q P 20. 4 22, N N 134 102