Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Parcial estadistica aplicada, Ejercicios de Estadística Aplicada

Examen Estadística Aplicada a Ciencias sociales (Evaluable) Correlación bidimensional Estadistica 1º RR.LL y RR.HH

Tipo: Ejercicios

2019/2020

Subido el 03/06/2020

CrissB06
CrissB06 🇪🇸

5

(1)

5 documentos

1 / 6

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Problema 1
En una muestra de 150 empresas del sector servicio se recogen datos sobre el número de
trabajadores de la empresa (variable X) y la facturación anual (variable Y) en millones de euros. Los
resultados se muestran resumidos en los siguientes datos estadísticos:
𝑋=14 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑑𝑜𝑟𝑒𝑠 𝑌=100 𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠 𝑆𝑋= 2 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑑𝑜𝑟𝑒𝑠
𝑆𝑌=25 𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠 𝑆𝑋𝑌=45 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑑𝑜𝑟𝑒𝑠 × 𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠
a) Calcular el coeficiente de correlación lineal e interprétalo
b) Calcula el modelo de regresión lineal que mejor aproxima la facturación en función del
número de trabajadores
c) En función de este ajuste, calcula de forma aproximada la cantidad que se espera que
facture una empresa con 15 trabajadores. ¿Es fiable esta predicción? Razone la respuesta
d) Calcula el modelo de regresión lineal que mejor aproxima el número de trabajadores en
función de la facturación.
e) En función de este nuevo ajuste calcula de forma aproximada el número de trabajadores
que se espera que tenga una empresa que factura 105 millones. ¿Es fiable esta
predicción?
Solución:
a) 𝑟𝑋𝑌= 𝑆𝑋𝑌
𝑆𝑋 ×𝑆𝑌= 45
25 ×2= 45
50=0,9
La relación lineal es bastante fuerte
b) 𝑌 =𝑎 + 𝑏 𝑋 donde 𝑎 = 𝑌 𝑏 𝑋=𝑌 𝑆𝑋𝑌
𝑆𝑋
2 𝑋 y 𝑏=𝑆𝑋𝑌
𝑆𝑋
2
𝑎=100 45
4 × 14=10022,7 × 7 =100157,5 = 57,5
𝑏 = 𝑆𝑋𝑌
𝑆𝑋2= 45
4=11,25
La recta de regresión es: 𝒀=11,25 𝑿 57,5
En términos de las variables del problema, la ecuación es:
𝒇𝒂𝒄𝒕𝒖𝒓𝒂𝒄𝒊ó𝒏=11,25 × 𝒕𝒓𝒂𝒃𝒂𝒋𝒂𝒅𝒐𝒓𝒆𝒔 57,5
c) Para 15 trabajadores, se espera una facturación de: 𝒇𝒂𝒄𝒕𝒖𝒓𝒂𝒄𝒊ó𝒏=11,25 × 15
57,5=111,25
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga Parcial estadistica aplicada y más Ejercicios en PDF de Estadística Aplicada solo en Docsity!

Problema 1

En una muestra de 150 empresas del sector servicio se recogen datos sobre el número de trabajadores de la empresa (variable X) y la facturación anual (variable Y) en millones de euros. Los resultados se muestran resumidos en los siguientes datos estadísticos:

𝑋̅ = 14 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑑𝑜𝑟𝑒𝑠 𝑌̅ = 100 𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠 𝑆𝑋 = 2 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑑𝑜𝑟𝑒𝑠

𝑆𝑌 = 25 𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠 𝑆𝑋𝑌 = 45 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑑𝑜𝑟𝑒𝑠 × 𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠

a) Calcular el coeficiente de correlación lineal e interprétalo b) Calcula el modelo de regresión lineal que mejor aproxima la facturación en función del número de trabajadores c) En función de este ajuste, calcula de forma aproximada la cantidad que se espera que facture una empresa con 15 trabajadores. ¿Es fiable esta predicción? Razone la respuesta d) Calcula el modelo de regresión lineal que mejor aproxima el número de trabajadores en función de la facturación. e) En función de este nuevo ajuste calcula de forma aproximada el número de trabajadores que se espera que tenga una empresa que factura 105 millones. ¿Es fiable esta predicción?

Solución:

a) 𝑟𝑋𝑌 = (^) 𝑆𝑋𝑆 𝑋𝑌×𝑆𝑌 = (^2545) × 2 = 4550 = 0 , 9

La relación lineal es bastante fuerte

b) 𝑌 = 𝑎 + 𝑏 𝑋 donde 𝑎 = 𝑌̅ − 𝑏 𝑋̅ = 𝑌̅ − 𝑆 𝑆𝑋𝑌 𝑋^2

𝑋̅ y 𝑏 = 𝑆 𝑆𝑋𝑌 𝑋^2

𝑎 = 100 −

× 14 = 100 − 22 , 7 × 7 = 100 − 157 , 5 = − 57 , 5

𝑆𝑋^2

4 =^11 ,^25

La recta de regresión es: 𝒀 = 11 , 25 𝑿 − 57 , 5 En términos de las variables del problema, la ecuación es: 𝒇𝒂𝒄𝒕𝒖𝒓𝒂𝒄𝒊ó𝒏 = 11 , 25 × 𝒕𝒓𝒂𝒃𝒂𝒋𝒂𝒅𝒐𝒓𝒆𝒔 − 57 , 5

c) Para 15 trabajadores, se espera una facturación de: 𝒇𝒂𝒄𝒕𝒖𝒓𝒂𝒄𝒊ó𝒏 = 11 , 25 × 15 − 57 , 5 = 111 , 25

Se espera una facturación de 111,25 millones de euros.

Para concluir si el modelo es fiable, se requiere calcular el coeficiente de determinación ( ó bondad de ajuste).

𝑅^2 =

𝑆𝑋𝑌^2

𝑆𝑋^2 × 𝑆𝑌^2

= 𝑟𝑋𝑌^2 = ( 0 , 9 )^2 = 0 , 81

La fiabilidad es bastante elevada.

d) El modelo de regresión lineal que se requiere es del tipo II, es decir: 𝑋 = 𝑎′^ + 𝑏′𝑌

𝑎′^ = 𝑋̅ −

𝑆𝑌^2

× 𝑌̅ = 14 −

( 25 )^2 ×^100 =^14 −^

× 100 = 14 − 7 , 2 = 6 , 8

𝑏′^ =

625 =^0 ,^072

𝑋 = 0 , 072 × 𝑌 + 6 , 8

𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑑𝑜𝑟𝑒𝑠 = 0 , 072 × 𝑓𝑎𝑐𝑡𝑢𝑟𝑎𝑐𝑖ó𝑛 + 6 , 8 Para una facturación de 105 millones, se espera el siguiente número de trabajadores: 𝑵ú𝒎. 𝒕𝒓𝒂𝒃𝒂𝒋𝒂𝒅𝒐𝒓𝒆𝒔 = 0 , 072 × 105 + 6 , 8 = 14 , 36 El coeficiente de determinación es igual a 0,81 (como en el primero modelo), por lo que la fiabilidad es bastante elevada.

Problema 2

El siguiente histograma representa la distribución que durante el último mes se han gastado los trabajadores de una empresa en dietas_._

b) Para determinar la media, primero se calcula la marca de clase como representante de cada

intervalo. Luego aplicamos la fórmula de la media: 𝑋̅ =

∑ 𝑛 𝑖=𝑐 1 𝑥𝑖^ 𝑐^ ×𝑛𝑖 𝑁

La media se obtiene sumando la columna de productos de la marca por la frecuencia y dividiendo

ente le total de observaciones: 𝑿̅ =

∑ 𝒏 𝒊=𝒄 1 𝒙𝒊^ 𝒄^ ×𝒏𝒊 𝑵 =^

36400 200 =^182

El intervalo modal es él de mayor frecuencia absoluta ya que se trata de datos grupos agrupados con intervalos constantes. En este caso, el intervalo modal coincide con el último intervalo, por lo

que se elige la marca de clase como valor modal. Pues, la moda es igual a 𝑴𝒐 = 230 + 2 250 = 240

La cantidad que tenía el 50% de los trabajadores representa la median.

Observando la frecuencia acumulada, la mediana cae en el intervalo [190 --- 210).

Para el cálculo, usamos la fórmula: 𝑴𝒆 = 𝑳𝒊− 1 +

(𝑵 2 −𝑵𝒊− 1 ) ×𝒄𝒊 𝒏𝒊^ =^190 +^

( 100 − 94 ) × 20 32 =^100 + 120 32 =^193 ,^75

Li-1 Li ni Ni fi Fi 70 90 16 16 0,08 0, 90 110 12 28 0,06 0, 110 130 8 36 0,04 0, 130 150 14 50 0,07 0, 150 170 20 70 0,1 0, 170 190 24 94 0,12 0, 190 210 32 126 0,16 0, 210 230 34 160 0,17 0, 230 250 40 200 0,2 1

ni Ni fi Fi Marca nIMarca* 70 90 16 16 0,08 0,08 80 1280 90 110 12 28 0,06 0,14 100 1200 110 130 8 36 0,04 0,18 120 960 130 150 14 50 0,07 0,25 140 1960 150 170 20 70 0,1 0,35 160 3200 170 190 24 94 0,12 0,47 180 4320 190 210 32 126 0,16 0,63 200 6400 210 230 34 160 0,17 0,8 220 7480 230 250 40 200 0,2 1 240 9600

c) El rango es igual a : 𝑹𝒂𝒏𝒈𝒐 = 𝑿𝒎𝒂𝒙 − 𝑿𝒎𝒊𝒏 = 250 − 70 = 180

Para calcular el rango intercuartílico, se requiere calcular el cuartil 1 y el cuartil 3. El rango intercuartílico se obtiene por la diferencia.

Posición de C1 es igual a 𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝐶 1 = 2004 = 50

C1 cae en el intervalo [130 – 150)

𝑪 1 = 130 +

( 50 − 36 ) × 20

14 =^130 +^

14 × 20

14 =^130 +^20 =^150

𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒 𝐶 3 =

200 × 3

4 =^150

El cuartil C3 cae en el intervalo [210 --- 250)

𝑪 3 = 210 +

( 150 − 126 ) × 20

14 × 20

d) El mínimo del 20% de los empleados con mayor cantidad de dietas corresponde al percentil 80. Pues, la posición del percentil 80 es: 𝑃 80 = 0 , 8 × 200 = 160 Esto cae en el intervalo [210 --- 230)

Valor de P80: 𝑷 80 = 210 + (^160 −^12634 )^ ×^20 = 210 + 20 = 230

e) Aquí aplicamos la regla empírica de Tchebyshev: 𝑝𝑜𝑟𝑡𝑒𝑛𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑒𝑛𝑡𝑟𝑒 𝜇 ± 𝑘𝑠 = 100 × ( 1 − (^) 𝑘^12 )

Aquí buscamos el valor que corresponde con el 75%.

75 = 100 × ( 1 −

𝑘^2 )

100 =^1 −^

𝑘^2 ⟹^

4 =^1 −^

𝑘^2 ⟹^3 =^4 (

𝑘^2 − 1

𝑘^2 )

3 𝑘^2 = 4 (𝑘^2 − 1 )^ ⟹ 𝑘^2 = 4 ⟹ 𝑘 = ± 2

Ahora calculamos la desviación típica: