



Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Examen Estadística Aplicada a Ciencias sociales (Evaluable) Correlación bidimensional Estadistica 1º RR.LL y RR.HH
Tipo: Ejercicios
1 / 6
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!




Problema 1
En una muestra de 150 empresas del sector servicio se recogen datos sobre el número de trabajadores de la empresa (variable X) y la facturación anual (variable Y) en millones de euros. Los resultados se muestran resumidos en los siguientes datos estadísticos:
𝑋̅ = 14 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑑𝑜𝑟𝑒𝑠 𝑌̅ = 100 𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠 𝑆𝑋 = 2 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑑𝑜𝑟𝑒𝑠
𝑆𝑌 = 25 𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠 𝑆𝑋𝑌 = 45 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑑𝑜𝑟𝑒𝑠 × 𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠
a) Calcular el coeficiente de correlación lineal e interprétalo b) Calcula el modelo de regresión lineal que mejor aproxima la facturación en función del número de trabajadores c) En función de este ajuste, calcula de forma aproximada la cantidad que se espera que facture una empresa con 15 trabajadores. ¿Es fiable esta predicción? Razone la respuesta d) Calcula el modelo de regresión lineal que mejor aproxima el número de trabajadores en función de la facturación. e) En función de este nuevo ajuste calcula de forma aproximada el número de trabajadores que se espera que tenga una empresa que factura 105 millones. ¿Es fiable esta predicción?
Solución:
a) 𝑟𝑋𝑌 = (^) 𝑆𝑋𝑆 𝑋𝑌×𝑆𝑌 = (^2545) × 2 = 4550 = 0 , 9
La relación lineal es bastante fuerte
b) 𝑌 = 𝑎 + 𝑏 𝑋 donde 𝑎 = 𝑌̅ − 𝑏 𝑋̅ = 𝑌̅ − 𝑆 𝑆𝑋𝑌 𝑋^2
𝑋̅ y 𝑏 = 𝑆 𝑆𝑋𝑌 𝑋^2
𝑎 = 100 −
La recta de regresión es: 𝒀 = 11 , 25 𝑿 − 57 , 5 En términos de las variables del problema, la ecuación es: 𝒇𝒂𝒄𝒕𝒖𝒓𝒂𝒄𝒊ó𝒏 = 11 , 25 × 𝒕𝒓𝒂𝒃𝒂𝒋𝒂𝒅𝒐𝒓𝒆𝒔 − 57 , 5
c) Para 15 trabajadores, se espera una facturación de: 𝒇𝒂𝒄𝒕𝒖𝒓𝒂𝒄𝒊ó𝒏 = 11 , 25 × 15 − 57 , 5 = 111 , 25
Se espera una facturación de 111,25 millones de euros.
Para concluir si el modelo es fiable, se requiere calcular el coeficiente de determinación ( ó bondad de ajuste).
La fiabilidad es bastante elevada.
d) El modelo de regresión lineal que se requiere es del tipo II, es decir: 𝑋 = 𝑎′^ + 𝑏′𝑌
𝑎′^ = 𝑋̅ −
𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑑𝑜𝑟𝑒𝑠 = 0 , 072 × 𝑓𝑎𝑐𝑡𝑢𝑟𝑎𝑐𝑖ó𝑛 + 6 , 8 Para una facturación de 105 millones, se espera el siguiente número de trabajadores: 𝑵ú𝒎. 𝒕𝒓𝒂𝒃𝒂𝒋𝒂𝒅𝒐𝒓𝒆𝒔 = 0 , 072 × 105 + 6 , 8 = 14 , 36 El coeficiente de determinación es igual a 0,81 (como en el primero modelo), por lo que la fiabilidad es bastante elevada.
Problema 2
El siguiente histograma representa la distribución que durante el último mes se han gastado los trabajadores de una empresa en dietas_._
b) Para determinar la media, primero se calcula la marca de clase como representante de cada
intervalo. Luego aplicamos la fórmula de la media: 𝑋̅ =
∑ 𝑛 𝑖=𝑐 1 𝑥𝑖^ 𝑐^ ×𝑛𝑖 𝑁
La media se obtiene sumando la columna de productos de la marca por la frecuencia y dividiendo
ente le total de observaciones: 𝑿̅ =
∑ 𝒏 𝒊=𝒄 1 𝒙𝒊^ 𝒄^ ×𝒏𝒊 𝑵 =^
36400 200 =^182
El intervalo modal es él de mayor frecuencia absoluta ya que se trata de datos grupos agrupados con intervalos constantes. En este caso, el intervalo modal coincide con el último intervalo, por lo
que se elige la marca de clase como valor modal. Pues, la moda es igual a 𝑴𝒐 = 230 + 2 250 = 240
La cantidad que tenía el 50% de los trabajadores representa la median.
Observando la frecuencia acumulada, la mediana cae en el intervalo [190 --- 210).
Para el cálculo, usamos la fórmula: 𝑴𝒆 = 𝑳𝒊− 1 +
(𝑵 2 −𝑵𝒊− 1 ) ×𝒄𝒊 𝒏𝒊^ =^190 +^
( 100 − 94 ) × 20 32 =^100 + 120 32 =^193 ,^75
Li-1 Li ni Ni fi Fi 70 90 16 16 0,08 0, 90 110 12 28 0,06 0, 110 130 8 36 0,04 0, 130 150 14 50 0,07 0, 150 170 20 70 0,1 0, 170 190 24 94 0,12 0, 190 210 32 126 0,16 0, 210 230 34 160 0,17 0, 230 250 40 200 0,2 1
ni Ni fi Fi Marca nIMarca* 70 90 16 16 0,08 0,08 80 1280 90 110 12 28 0,06 0,14 100 1200 110 130 8 36 0,04 0,18 120 960 130 150 14 50 0,07 0,25 140 1960 150 170 20 70 0,1 0,35 160 3200 170 190 24 94 0,12 0,47 180 4320 190 210 32 126 0,16 0,63 200 6400 210 230 34 160 0,17 0,8 220 7480 230 250 40 200 0,2 1 240 9600
c) El rango es igual a : 𝑹𝒂𝒏𝒈𝒐 = 𝑿𝒎𝒂𝒙 − 𝑿𝒎𝒊𝒏 = 250 − 70 = 180
Para calcular el rango intercuartílico, se requiere calcular el cuartil 1 y el cuartil 3. El rango intercuartílico se obtiene por la diferencia.
Posición de C1 es igual a 𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝐶 1 = 2004 = 50
C1 cae en el intervalo [130 – 150)
𝑪 1 = 130 +
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒 𝐶 3 =
El cuartil C3 cae en el intervalo [210 --- 250)
𝑪 3 = 210 +
d) El mínimo del 20% de los empleados con mayor cantidad de dietas corresponde al percentil 80. Pues, la posición del percentil 80 es: 𝑃 80 = 0 , 8 × 200 = 160 Esto cae en el intervalo [210 --- 230)
Valor de P80: 𝑷 80 = 210 + (^160 −^12634 )^ ×^20 = 210 + 20 = 230
e) Aquí aplicamos la regla empírica de Tchebyshev: 𝑝𝑜𝑟𝑡𝑒𝑛𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑒𝑛𝑡𝑟𝑒 𝜇 ± 𝑘𝑠 = 100 × ( 1 − (^) 𝑘^12 )
Aquí buscamos el valor que corresponde con el 75%.
Ahora calculamos la desviación típica: