Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Análisis de datos bidimensionales: Tablas, distribuciones y correlación., Apuntes de Administración de Empresas

Documento de clases de estadística que presenta conceptos básicos sobre la representación y análisis de datos bidimensionales a través de tablas de contingencia, distribuciones marginales y condicionadas, coeficiente de correlación lineal y recta de regresión.

Tipo: Apuntes

2010/2011

Subido el 07/02/2011

don_simo-2
don_simo-2 🇪🇸

4.1

(362)

77 documentos

1 / 10

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
1
19/11/2009 TC I - Benito Vinuesa 1
6.1 Representaciones numéricas en dos columnas y en tablas de
contingencia
6.2 Distribuciones marginales y condicionadas
6.3 Coeficiente de correlación lineal
6.4 Nube de puntos. Recta de regresión: Mínimos cuadrados
6. Variables estadísticas bidimensionales
19/11/2009 TC I - Benito Vinuesa 2
6.1 Representaciones numéricas en dos columnas y
en tablas de contingencia
Distribuciones bidimensionales: dos caracteres por individuo.
Se notan las variables X e Y.
Se pueden estudiar separadamente.
El estudio conjunto permite conocer relación entre ellas.
Representación en dos columnas: los pares de valores de cada
individuo se colocan juntos y con el mismo subíndice.
El último subíndice es el número total de datos.
Tabla de contingencia: tabla de doble entrada.
Primera columna X.
Primera fila Y.
Dentro de la tabla frecuencias de cada par.
Última fila sumas distribución marginal de Y.
Última columna sumas distribución marginal de X.
Esquina inferior derecha número total de datos.
pf3
pf4
pf5
pf8
pf9
pfa

Vista previa parcial del texto

¡Descarga Análisis de datos bidimensionales: Tablas, distribuciones y correlación. y más Apuntes en PDF de Administración de Empresas solo en Docsity!

19/11/2009 TC I - Benito Vinuesa 1

6.1 Representaciones numéricas en dos columnas y en tablas de contingencia

6.2 Distribuciones marginales y condicionadas

6.3 Coeficiente de correlación lineal

6.4 Nube de puntos. Recta de regresión: Mínimos cuadrados

6. Variables estadísticas bidimensionales

19/11/2009 TC I - Benito Vinuesa 2

6.1 Representaciones numéricas en dos columnas y

en tablas de contingencia

Distribuciones bidimensionales: dos caracteres por individuo.

  • Se notan las variables X e Y.
  • Se pueden estudiar separadamente.
  • El estudio conjunto permite conocer relación entre ellas. Representación en dos columnas: los pares de valores de cada individuo se colocan juntos y con el mismo subíndice.
    • El último subíndice es el número total de datos. Tabla de contingencia: tabla de doble entrada.
    • Primera columna X.
    • Primera fila Y.
    • Dentro de la tabla frecuencias de cada par.
    • Última fila sumas → distribución marginal de Y.
    • Última columna sumas → distribución marginal de X.
    • Esquina inferior derecha número total de datos.

19/11/2009 TC I - Benito Vinuesa 3

6.1 Representaciones numéricas en dos columnas y

en tablas de contingencia

X Y

x 1 y 1

x 2 y 2

xi yi

xn yn

y 1 ... yj ... yp ni*

x 1 n 11 ... n 1j ... n 1p n1*

xi ni1 ... n ij ... n ip ni*

xk nk1 ... n kj ... n kp nk*

nj n1 ... n *j ... n *p n

Y X

1

n * n i fijo

p

j

i ∑ ij

=

1

n * n j fijo

k i

j ∑ ij

=

= = = =

= = =

p j

j

k i

i

k i

p j

N nij n n 1

1

1 1

19/11/2009 TC I - Benito Vinuesa 4

6.1 Representaciones numéricas en dos columnas y

en tablas de contingencia

Ejemplo 17: Represente en dos columnas y en tabla de contingencia la superficie en hectáreas (X), y la producción en toneladas (Y), de cinco fincas: (10; 100), (5; 75), (10; 50), (15;75) y (5;75).

Finca X Y

50 75 100 ni*

n*j 1 3 1 5

Y X

19/11/2009 TC I - Benito Vinuesa 7

6.2 Distribuciones marginales y condicionadas

Ejemplo 18: Comprobar que hay independencia estadística sobre los datos de la siguiente tabla, donde X es el salario/hora en € e Y representa el sexo del trabajador.

Hombre Mujer

Y X Hombre Mujer ni*

n *j 35 N=

Y X

i j N

n n n (^) ij = i *^ * j ∀, 49

: 10 2 * *^11435

21

x N

ejemplo n = = n n =

19/11/2009 TC I - Benito Vinuesa 8

6.3 Coeficiente de correlación lineal

Covarianza: es una medida de la variabilidad conjunta o relación entre dos variables X e Y.

  • Si es positiva las dos varian en general en el mismo sentido.
  • Si es negativa, ambas varían en general en sentido opuesto.
  • Si hay independencia estadística, S (^) XY = 0 (no reciproca).

Coeficiente de correlación lineal: es una medida objetiva de la variabilidad conjunta de dos variables X e Y.

  • Está acotado; (-1 ≤ r ≤ 1).

k i

p j i i ij

k i ij

p XY (^) j i j

xyn xy

N

x x y y n

N

m S

(^111 11 )

X Y

XY

S S

S

m m

m

r = =

20 02

11

m (^) 11 = a 11 − a 10 a 01

19/11/2009 TC I - Benito Vinuesa 9

6.3 Coeficiente de correlación lineal

Ejemplo 19: Calcular el coeficiente de correlación lineal en la siguiente distribución bidimensional. Xi Yi 2 2 3 4 4 3

X^2 Y^2 XY

(^10 )

=

n i

a x N xi 5 2 ,^4

(^01 )

=

n i

a y N xi

1

2 20 =^ ∑= = =

n i

a (^) N xi 5 6 ,^8

1

2 02 =^ ∑= = =

n i

a N yi

S (^) XY = m 11 = a 11 − a 10 a 01 =− 0 , 8

= = −^0 ,^8 =−

X Y

XY S S

S

r

(^11 )

=

n i

a N xi yi

S^2 X^ = m 20 = a 20 − a^210 = 2

S^2 Y^ = m 02 = a 02 − a^201 = 1 , 04

19/11/2009 TC I - Benito Vinuesa 10

6.4 Nube de puntos. Recta de regresión: Mínimos cuadrados Nube de puntos: o diagrama de dispersión es la representación gráfica más usada para distribuciones bidimensionales.

  • En eje de abscisas valores de la variable X o intervalos de clase.
  • En eje de ordenadas valores de la variable Y.
  • Un punto por cada observación.
  • Junto al punto el valor de la frecuencia o círculo proporcional.

Ejemplo 20: Represente gráficamente la siguiente distribución bidimensional. X 1 2 3 4 5 6 7 8 9 10 Y 4 3 5 4 6 5 7 6 8 4 X 11 12 13 14 15 16 17 18 19 20 Y 9 7 8 12 10 8 14 13 15 16

Nube de puntos

0

2

4

6

8

10

12

14

16

0 5 10 15 20

19/11/2009 TC I - Benito Vinuesa 13

6.4 Nube de puntos. Recta de regresión: Mínimos cuadrados Recta de Regresión Y/X

0

2

4

6

8

10

12

14

16

18

0 5 10 15 20 25

Recta de regresión X/Y

0

2

4

6

8

10

12

14

16

18

0 5 10 15 20 25 y ˆ (^) i = a + bx i x ˆ (^) i = a ˆ+ b ˆ yi

ˆ ( ) 2 ( x x )

S

S

x x

S

S

y y r

X X

− = Y^ − = XY^ − ˆ ( ) ( )

S^2 y y

S

y y

S

x x rS

Y Y

− = X^ − = XY^ −

S^2 X

S

b = XY ˆ 2

S Y

S

a = ybx b = XY a ˆ = xb ˆ y

19/11/2009 TC I - Benito Vinuesa 14

6.4 Nube de puntos. Recta de regresión: Mínimos cuadrados Posición relativa de las rectas de regresión: ambas rectas se cortan en el c.d.g. de la distribución. El punto

  • Ambas pendientes tienen el mismo signo que la covarianza.
  • Si r 2 = 1 ambas rectas coinciden.
  • Si r 2 = 0 las rectas son paralelas a los ejes coincidiendo con las medias aritméticas respectivas.

bb ˆ^ = r^2

( x , y )

X/Y

0

2

4

6

8

10

12

14

16

18

0 5 10 15 20 25 30

Y/X

19/11/2009 TC I - Benito Vinuesa 15

6.4 Nube de puntos. Recta de regresión: Mínimos cuadrados Ejemplo 21: Calcular y representar las dos rectas de regresión para la distribución del ejemplo 20. ¿Cuál es el valor esperado de Y para x = 25? ¿Cuál es el valor esperado de X para y = 18? X 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 4 9 7 8 12 10

16 17 8 14

18 19 20 Y 4 3 5 4 6 5 7 6 8 13 15 16

10 , 5 20

1 210 = (^) ∑= 1 = =

n x (^) Ni xi 8 , 2 20

1 164 = (^) ∑= 1 = =

n y Ni yi

S X = 5 , 766281 SY =^3 ,^841875

=^2120 − =

SXY

( 10 , 5 ) 5 , 7663

Y / X : y ˆ− 8 , 2 = 0 , 89833 ,^8419 x

Y / X : y ˆ= 1 , 915789 + 0 , 598496 x

X Y

XY

S S

S

r

( 8 , 2 ) 3 , 8419

X / Y : x ˆ− 10 , 5 = 0 , 89835 ,^7663 y

X / Y : x ˆ= − 0 , 5 + 1 , 348238 y

y ˆ^ ( 25 )= 16 , 878195 x ˆ ( 18 )= 23 , 712728

19/11/2009 TC I - Benito Vinuesa 16

6.4 Nube de puntos. Recta de regresión: Mínimos cuadrados Ejemplo 22: Calcular las rectas de regresión para la siguiente distribución bidimensional: 5 10 5 15

Y (^) X n (^) i* n (^) i* x (^) i n (^) i* x (^) i 2 3 75 4 60 900 15(35+110)= 7 975

n (^) ij x (^) i yj 15 5(15+210)=

n (^) *j 4 3 75 500 n (^) *j yj 30 n (^) *j y (^) i^2300

100 400 7 10 ,^7143

x =^75 =^7 ,^1428 7

y =^50 =

S^2 = 975 − x^2 = X (^) 7 6 ,^122 S^2 = 400 − y^2 = Y 7 5 ,^10 S = 500 − xy =− XY

( 10 , 714 ) 24 , 49 Y / X : y ˆ− 7 , 1428 =−^5 ,^10 x

Y / X : y ˆ= 9 , 3788 − 0 , 2082 x

( 7 , 1428 ) 6 , 122 X / Y : x ˆ− 10 , 7143 =−^5 ,^10 y

X / Y : x ˆ 16 , 6 0 , 83 y

19/11/2009 TC I - Benito Vinuesa 19

6.4 Nube de puntos. Recta de regresión: Mínimos cuadrados Solución ejemplo 24: 49 , 8 ; 10

1 498 1

= (^) ∑ = =

n i i

x N

x

137 , 8 10

1 1378 = (^) ∑= 1 = = n y Ni yi

S^2 X^ = 10 , 95262 = 119 , 96 SY^2 = 14 , 28152 = 203 , 96 SXY =^7000610 − 49 , 8 * 137 , 8 = 138 , 16

0 , 8834 10 , 95 * 14 , 28 = =^138 ,^16 = X Y

XY S S r S

( 49 , 8 ) 297505 , 5984

Y / X : y ˆ− 137 , 8 =^138 ,^16 x

Y / X : y ˆ= 80 , 4445 + 1 , 15172 x

(^100) 2030

4050

6070

8090

100110

120130

140150

160170

0 10 20 30 40 50 60 70 80

y ˆ(^51 )= 80 , 4445 + 1 , 15172 * 51 = 139 , 2

19/11/2009 TC I - Benito Vinuesa 20

6.4 Nube de puntos. Recta de regresión: Mínimos cuadrados Ejemplo 25: Dos variables tienen las siguientes rectas de regresión: 8 X + 2 Y = 1; 16 X + 9 Y = 1. a) Obtener las rectas de regresión de Y/X y de X/Y. b) Obtener el coeficiente de correlación lineal. c) Obtener las medias marginales. Solución:

X Y

Y X

Y X

X Y

1 , 5 1 Imposible 16

9

2

ˆ 8 r = bb = = > ⇒

0 , 6 correcto 8

2

9

ˆ 16 = = =− ⇒

) r b b

solución sistema : x = 0 , 175 ; y =− 0 , 2