Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


distribución bidimensional, Apuntes de Estadística Empresarial

Asignatura: Estadística Empresarial, Profesor: , Carrera: Administración y Dirección de Empresas, Universidad: UAX

Tipo: Apuntes

2013/2014

Subido el 08/10/2014

perco-14
perco-14 🇪🇸

4.2

(5)

27 documentos

1 / 10

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
D I S T R I B U C I O N E S B I D I M E N S I O N A L E S
1. VARIABLES ESTADÍSTICAS BIDIMENSIONALES
En numerosas ocasiones interesa estudiar simultáneamente dos (o más) caracteres de una población. En el
caso de dos (o más) variables estudiadas conjuntamente se habla de variable bidimensional (multidimensional );
si se trata de dos caracteres cualitativos, de par de atributos.
Si de un cierta población se estudian dos caracteres simultáneamente se obtienen dos series de datos.
Individuos A B C .......
Carácter X x1 x2 x3........
Carácter Y y1 y2 y3...........
La lista de pares de datos correspondientes a cada individuo de la población (repetidos o no), es lo que
llamamos variable estadística bidimensional.
Ejemplos
1. A cada uno de los reclutas de un reemplazo se les talla y pesa. Se trata de dos variables cuantitativas.
xi 1,70
( tallas en m )
1,70 1,69 1,68 ........
yi 67
( peso en kg )
75 70 66 .......
2. Entre los empleados de una empresa se ha realizado una encuesta sobre el consumo del tábaco, que ha
arrojado los siguientes resultados:
Hábito
Sexo
Fumadores No fumadores Totales de filas
Varones
Mujeres
49
43
64
37
113
80
Totales de columnas 92 101 Total general 193
Nota. En este tema nos limitaremos al estudio de caracteres cuantitativos discretos, puesto que si el carácter
es continuo o discreto agrupado en intervalos, se trabajará con las marcas de clase.
2. DISTRIBUCIONES DE FRECUENCIAS
Se disponen las frecuencias en una tabla de doble entrada donde las xi y la yj están ordenadas en forma
creciente. Recibe el nombre de tabla de frecuencias o tabla de correlación.
Si hay pares que se repiten se agrupan siendo nij la frecuencia absoluta del par (xi, yj).
Las sumas
F 0 E 5nij = ni , frecuencia absoluta de xi.
j
F 0 E 5nij = n’j , frecuencia absoluta de yj
i
se llaman frecuencias absolutas marginales de las variables X e Y respectivamente.
F 0 E 5F 0 E 5nij = N=número total de pares.
j y
Quedando la siguiente tabla de doble entrada:
Xx1x2....... xkFrec. absolutas
pf3
pf4
pf5
pf8
pf9
pfa

Vista previa parcial del texto

¡Descarga distribución bidimensional y más Apuntes en PDF de Estadística Empresarial solo en Docsity!

D I S T R I B U C I O N E S B I D I M E N S I O N A L E S

1. VARIABLES ESTADÍSTICAS BIDIMENSIONALES

En numerosas ocasiones interesa estudiar simultáneamente dos (o más) caracteres de una población. En el caso de dos (o más) variables estudiadas conjuntamente se habla de variable bidimensional (multidimensional ); si se trata de dos caracteres cualitativos, de par de atributos. Si de un cierta población se estudian dos caracteres simultáneamente se obtienen dos series de datos.

Individuos A B C ....... Carácter X (^) x 1 x 2 x 3 ........ Carácter Y y1 y2 y 3. ..........

La lista de pares de datos correspondientes a cada individuo de la población (repetidos o no), es lo que llamamos variable estadística bidimensional. Ejemplos

  1. A cada uno de los reclutas de un reemplazo se les talla y pesa. Se trata de dos variables cuantitativas. x (^) i 1, ( tallas en m )

yi 67 ( peso en kg )

  1. Entre los empleados de una empresa se ha realizado una encuesta sobre el consumo del tábaco, que ha arrojado los siguientes resultados: Hábito Sexo

Fumadores No fumadores Totales de filas

Varones Mujeres

Totales de columnas 92 101 Total general 193

Nota. En este tema nos limitaremos al estudio de caracteres cuantitativos discretos, puesto que si el carácter es continuo o discreto agrupado en intervalos, se trabajará con las marcas de clase.

  1. DISTRIBUCIONES DE FRECUENCIAS Se disponen las frecuencias en una tabla de doble entrada donde las x (^) i y la y (^) j están ordenadas en forma creciente. Recibe el nombre de tabla de frecuencias o tabla de correlación. Si hay pares que se repiten se agrupan siendo nij la frecuencia absoluta del par (xi , yj ). Las sumas F 0 E 5nij = ni , frecuencia absoluta de x (^) i. j F 0 E 5nij = n’ (^) j , frecuencia absoluta de yj i se llaman frecuencias absolutas marginales de las variables X e Y respectivamente. F 0 E 5F 0 E 5nij = N=número total de pares. j y Quedando la siguiente tabla de doble entrada:

X x1 x2 ....... xk Frec. absolutas

Y marginales de Y y1 n11 n21 ..... nk1 n’ 1

y2 n12 n22 ......^ nk2 n’ 2 ...... ..... .... .... ... .... . yr n1r n2r ...^ nkr n’ (^) r Frec. absolutas marginales de X

n1 n2 ..^ nk F 0 E 5F 0 E 5nij = N i j

En la práctica algunas de las nij puede ser cero. En tal caso la casilla correspondiente se dejará en blanco. Ejemplo 3. Dada la distribución bidimensional: X 1 2 1 2 3 2 2 2 3 1 Y 3 5 2 3 5 4 3 5 5 3

la tabla correspondiente es:

X Y

1 2 3 Frec. absolutas marginales de y 2 1 1 3 2 2 4 4 1 1 5 2 2 4 Frec. absolutas marginales de X

3 5 2 N=

Al estudiar una variable bidimensional se obtienen varias distribuciones unidimensionales, según se consideren las filas o las columnas de la tabla en estudio. Las distribuciones unidimensionales del total de los individuos de la población, respecto a cada una de las características reciben el nombre de distribuciones marginales. Distribución marginal de la Y: Y Frec. absolutas marginal de Y y y . . yr

n’ (^1) n’ (^2) . . n’r

Análogamente la distribución marginal de la X Ejemplo 4. Obtener la distribución marginal de la variable X. X Frec. absolutas marginal deX 1 2 3

Si en la tabla de correlación consideramos la primera columna y una columna intermedia , la correspondiente a y (^) j , se obtiene una distribución unidimensional que llamaremos distribución condicionada de la variable X por la modalidad y (^) j de la variable Y.

Ejemplo 6. Hacer el diagrama de dispersión de la distribución del ejemplo 3.

Ejercicio para el alumno: dibuja el estereograma correspondiente

  1. PARÁMETROS DE LA V. E. BIDIMENSIONAL

Considerando las distribuciones marginales, como son unidimensionales es posible calcular los siguiente parámetros: a) Medias x = F 0 E 5xi ni n. y= F 0 E 5yjn (^) j N

Donde N= F 0 E 5ni = F 0 E 5n’j es el numero total de pares Llamadas medias marginales.

Nota. En una distribución bidimension al punto ( x, y ) se le llama centro de gravedad de la distribución. b) Varianzas Se define: S^2 x= F 0 E 5(x (^) i - x ) 2 ni =^1 F 0 E 5xi^2 ni - ( x)^2 N N Varianza marginal de la variable X

Análogamente la varianza marginal de la variable Y. De ellas (extrayendo la raíz cuadrada ) se obtienen las correspondientes desviaciones típicas. Ejercicio 1. Calcula las medias marginales y las varianzas de la v.e. del ejemplo 3. Solución x = 19/10=1,9 ; y =38/10= 3,8 ; S (^) x^2 = 4,1-(1,9)^2 = 0,49 ; S (^) y^2 = 15,6 - 14,44=1.16. c) Covarianza Para las variables estadísticas bidimensionales se define la “ covarianza ’’ como la media aritmética de los productos de las desviaciones respecto de la media de cada una de las variables componentes. Es decir :

Sxy = F 0 E 5(x (^) i- x )(y (^) j- y )nij N

Se demuestra que Sxy = F 0 E 5xi yj nij - x.y = M (^) xy - x .y^2 N

1 1 Es decir la “media del cuadrado menos el cuadrado de la media”

2 F 0 B 2Media del producto menos el producto de las medias”

propiedad que facilita el cálculo de la covarianza Ejercicio 2. Calcula la covarianza de la distribución del ejemplo 3. Solución : S (^) xy = - (1,9)·(3,89 = 0,58.

  1. REGRESIÓN LINEAL Al considerar los dos caracteres de una variable bidimensional puede ocurrir.
  • Que haya una dependencia funcional entre ellos, de tal manera que a cada valor le corresponda un único valor del otro. Ejemplo: la temperatura a la que calentamos una barra de hierro y la longitud alcanzada. -Que halla una dependencia estadística o correlativa, de tal manera que los valores sigan unas pautas similares. Por ejemplo el número de horas de estudio y las notas obtenidas.
  • Que se de una independencia entre los caracteres. Por ejemplo la estatura y las calificaciones en Matemáticas. El estudio de la relación entre dos caracteres de una variable estadística bidimensional es el objeto de la regresión lineal. La nube de puntos de una distribución bidimensional nos da una primera idea de la relación existente entre los datos de la misma. Cuando la nube de puntos del diagrama de dispersión permita deducir algún tipo de dependencia entre las dos variables X, Y, concentrándose los puntos alrededor de una cierta línea (línea de regresión) se plantean dos cuestiones: A) Definir la línea. B) Medir el nivel de aproximación de dicha línea. Sí la línea es una recta , el problema es un caso típico de regresión lineal. A ) Rectas de regresión. Se llama recta de regresión a aquella que mejor se ajusta a la nube de puntos. El procedimiento más usado, para hallar dicha recta, es el los mínimos cuadrados. Se calcula la recta : y = a x + b, de tal manera que : S= F 0 E 5[y (^) i - ( a x (^) i + b ) F 0 5 D^2 sea mínima

El cálculo de a y b incluye conocimientos que no se dan en este nivel (derivación parcial...), por lo que sólo daremos el resultado: Se verifica: a= S (^) xy b= y - S (^) xy x Sx^2 S (^) x^2

luego se puede escribir : y= Sxy x (^) + y - Sxy x o lo que es igual : y - y = Sxy ( x - x ). Sx^2 S (^) x^2 Sx^2

b) Si r es positivo la correlación es directa , es decir, al aumentar una variable también aumenta la otra (coeficiente de regresión positivo). En este caso las pendientes de las rectas de regresión son positivas.

Si r es negativo la correlación es inversa, es decir , al aumentar una variable disminuye la otra. En este caso las pendientes de la rectas de regresión son negativas. c) Si r^2 = 1, es decir, r igual a 1 o a -1, las dos rectas de regresión coinciden y la nube de puntos está

contenida en la recta(correlación perfecta). Hay 0 0 0 0ependencia funcional entre las variables. d) Si r = 0 las rectas de regresión son perpendiculares entre sí y paralelas a los ejes. Las variables son incorreladas. Para los demás valores de r la dependencia es tanto más fuerte cuanto más próximo esté a 1 o a -1. Será más débil cuando se aproxime a 0: Para la correlación directa: Si 0,75 F 0 A 3 r F 0 A 31 correlación muy alta. Si 0,40 F 0 A 3 r F 0 A 30,75 correlación baja Si r < 0,40 la correlación es casi despreciable. Ejercicio 4. Hallar el coeficiente de correlación lineal para la distribución del ejemplo 3. Solución : r =+= 0,76. Se trata de una correlación directa alta.

Nota. En las calculadoras el coeficiente viene representado por

Problemas modelos resueltos:

1. Una asociación dedicada a la protección de la infancia decide estudiar la relación entre la mortalidad infantil en cada país y el número de camas de hospitales por cada mil habitantes.. Datos

x 50 100 70 60 120 180 200 250 30 90 y 5 2 2,5 3,75 4 1 1,25 0,75 7 3

Donde x es el nº de camas por mil habitantes e y el tanto por ciento de mortalidad. Se pide calcular las rectas de regresión y el coeficiente de correlación lineal. ¿ Si se dispusiese de 175 camas por mil habitantes que tanto por ciento de mortalidad cabria esperar?. ¿La estimación es fiable? Razona la respuesta. Solución : Para facilitar los cálculos de los parámetros se utiliza la siguiente tabla: xi yi xi^2 yi^2 x (^) i y (^) i 50 5 2500 25 250 100 2 10000 4 200 70 2,5 4900 6,25 170 60 3,75 3600 14,0625 225 120 4 14400 16 480 180 1 32400 1 180 200 1,25 40000 1,5625 250 250 0,75 62500 0,5625 187, 30 7 900 49 210 90 3 8100 9 270 F 0 E 5= 1150 30,25^179300 126,4375^ 2422,

x =115; y = 3,025%; S (^) x =68,59; S (^) y== 1,87 ; Sxy== -105, Las rectas de regresión serán por tanto: y - 3,025 = -0,022449 (x - 115) x - 115 = -30,2053 ( y - 3,025) El coeficiente de correlación lineal: r = = - 0, es una correlación inversa alta. Para la estimación que nos piden utilizaremos la recta de regresión de Y sobre X. y= 3,025 - 0,022449(175- 115) = 1,6783 que sería fiable por ser alto el coeficiente de correlación.

2. Dada la distribución bidimensional: X 1 2 1 2 3 2 2 2 3 1 Y 3 5 2 3 5 4 3 5 5 3 Encuentra el valor del coeficiente de correlación lineal usando una tabla de correlación. Solución.

1 día ..................... 90 % de permanencia de conocimientos.

2 días .................... 75 % “ “

3 días .................... 42 % “ “

4 días .................... 30 % “ “

5 días .................... 21 % “ “

Tomando los días transcurridos (X) y el tanto por ciento (Y) como variables de una distribución

dimensional, halla la recta de regresión de Y sobre X y estima, si existe una correlación fuerte, el tanto

por ciento de conocimientos que permanecerán a los ocho días. Organiza los cálculos y explica el

resultado.