Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


apuntes DISTRIBUCIONES DIMENSIONALES, Apuntes de Estadística

Apuntes de distribuciones dimensionales

Tipo: Apuntes

2020/2021

Subido el 13/01/2021

tatiana.27
tatiana.27 🇪🇸

9 documentos

1 / 53

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Estadística I
Tema 4: Distribuciones bidimensionales.
4.1. Frecuencias absolutas y relativas conjuntas.
4.2. Distribuciones marginales.
4.3. Distribuciones condicionadas.
4.4. Independencia estadística.
4.5. Asociación entre variables: Gráficos de dispersión.
4.6. Medidas de asociación: Covarianza y Correlación.
4.7. Regresión: Coeficiente de determinación.
Carmen Muñoz Vaquer y Fco Javier Sierra Martínez
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35

Vista previa parcial del texto

¡Descarga apuntes DISTRIBUCIONES DIMENSIONALES y más Apuntes en PDF de Estadística solo en Docsity!

Estadística I Tema 4: Distribuciones bidimensionales. 4.1. Frecuencias absolutas y relativas conjuntas.4.2. Distribuciones marginales.4.3. Distribuciones condicionadas.4.4. Independencia estadística.4.5. Asociación entre variables: Gráficos de dispersión.4.6. Medidas de asociación: Covarianza y Correlación.4.7. Regresión: Coeficiente de determinación. Carmen Muñoz Vaquer y Fco Javier Sierra Martínez

4. Distribuciones Bidimensionales Las distribuciones bidimensionales son aquellas en las que se estudian dos características (variables) de forma simultáneasobre los individuos de la muestra o de la población.

Por tanto, en una distribución bidimensional a cada individuo le

corresponde un valor en cada una de las dos variables y lo denotaremos mediante el par (X

, Y).ij

4.1. Formas de presentar los datos. Frecuencias absolutas y relativas conjuntas.Ejemplo 1

: Sea la variable

X= Salario anual en miles de €

e^ Y= Años de experiencia laboral

a. Datos en columna: Importante

: Si las frecuencias absolutas conjuntas son iguales a la unidad, es decir, cada par de valores de las variables solamente se repiten una vez, diremos que tenemos

frecuencias absolutas conjuntas unitarias

X^ Y

nij (0-10]^

(0-10]^

(0-10]^

(10-20]^

(10-20]^

(10-20]^

(20-30]^

(20-30]^

(20-30]^

Interpretación

La^ variable X

toma los siguientes valores diferentes: (0-10],(10-20] y (20-30] y

la variable Y

toma los valores 2,4,8. La primera fila de la tabla nos informa de que existen 14 individuos(n) que tienen un ingreso de (0-10] con dos años de experiencia. Al valor nij

que indica elij ,

número^ de individuos o casos que tienen las dos características conjuntamente, sedenomina

FRECUENCIA ABSOLUTA CONJUNTA

. La segunda fila nos indica que existen 5

individuos con unos ingresos de (0-10] con cuatro años de experiencia laboral. El últimovalor de la tabla afirma que hay 29 casos con unos ingresos de (20-30] y ocho años deexperiencia laboral. Observar que:

Es decir, la suma de todas las frecuencias absolutas conjuntas es igual al tamaño de lamuestra. En este ejemplo 100.

Distribución de frecuencias absolutas conjuntasDistribución de frecuencias relativas conjuntas

4.2. Distribuciones marginales

: Las distribuciones marginales son las distribuciones de cada una de las variables, por tanto,

una distribución marginal es una distribución unidimensional.^ X\Y

(0-10]^

(10-20]^

(20-30]^

Distribución marginal de Y

Distribución marginal de X

Intervalos

xi^

ni^ fi (0-10]^

(10-20]^

(20-30]^

Yi^ ni

fi 2 21

Las distribuciones marginales son distribuciones unidimensionales y por lotanto podemos calcular para cada una de las variables las medidas de síntesisvista en el tema anterior, por ejemplo, la media de las variables sería: •^ Para los ingresos:

1 = ^ ^

 

-^ Para los años:

1  =  ^

= 5,30ñ

 

Ejemplo 2.

Se ha observado el precio del alquiler (variable Y en miles de €) de 335 pisos y la localidad (Variable X) de

pertenencia. La siguiente tabla recoge la información obtenida de la observación conjunta de estas dos variables.Obtenemos la tabla de doble entrada, tanto para las frecuencias absolutas conjuntas como relativas:^ Localidad^

Precio^ nij

fij Barcelona^

(0,5-0,7]^

35 0, Bilbao^

(0,5-0,7]^

20 0, Madrid^

(0,5-0,7]^

40 0, Valencia^

(0,5-0,7]^

15 0, Barcelona^

(0,7-0,9]^

25 0, Bilbao^

(0,7-0,9]^

35 0, Madrid^

(0,7-0,9]^

25 0, Valencia^

(0,7-0,9]^

20 0, Barcelona^

(0,9-1,1]^

10 0, Bilbao^

(0,9-1,1]^

15 0, Madrid^

(0,9-1,1]^

20 0, Valencia^

(0,9-1,1]^

25 0, Barcelona^

(1,1-1,3]^

5 0, Bilbao^

(1,1-1,3]^

20 0, Madrid^

(1,1-1,3]^

15 0, Valencia^

(1,1-1,3]^

X\Y^ (0,5-0,7]

(0,7-0,9]

(0,9-1,1]

(1,1-1,3]

Barcelona

^35

Bilbao^

Madrid^

Valencia^

10 n=

X\Y^ (0,5-0,7]

(0,7-0,9]

(0,9-1,1]

(1,1-1,3]

Barcelona

Bilbao^

0,^

0,^

0,^

Madrid^

0,^

0,^

0,^

Valencia^

0,^

0,^

0,^

0,0299^ Suma=

Tabla de doble entrada: Frecuencias Absolutas ConjuntasTabla de doble entrada: Frecuencias Relativas Conjuntas

Las distribuciones marginales

X\Y^ (0,5-0,7]

(0,7-0,9]

(0,9-1,1]

(1,1-1,3]

n(X)

Barcelona

^35

Bilbao^

Madrid^

Valencia^

n(Y)^

50 n=

X^ n(X)

f(X) Barcelona

^75

Bilbao^

Madrid^

Valencia^

Y^

yi^ n(Y)

f(Y) (0,5-0,7]^

0,6^110

(0,7-0,9]^

0,8^105

(0,9-1,1]^

(1,1-1,3]^

1,^

Marginal de X

Marginal de Y

Importante

: Las tablas de doble entrada pueden contener tanto variables

cuantitativas

como^ cualitativas

. Si las dos

variables son cuantitativas (discretas o continuas) se suelen denominar

tabla de correlaciones

y si las dos variables son

cualitativas se denominan

tablas de contingencia

. De forma genérica hablaremos de tablas de doble entrada.

b. Ahora calculamos las distribuciones condicionadas de Y/X^ Y/X=(0-10]

nY/X=(0-10]

f Y/X=(0-10] 2

Y/X=(10-20] n

fY/X=(10-20] Y/X=(10-20] 2

Y/X=(20-30]

nY/X=(20-30]

f Y/X=(20-30] 2

Distribución condicionada de Ycuando X es igual a (0-10]

Distribución condicionada de Ycuando X es igual a (10-20]

Distribución condicionada de Ycuando X es igual a (20-30]

Importante

: Las distribuciones condicionadas son distribuciones unidimensionales y, por lo tanto, podemos calcular las

medidas de síntesis vistas en el tema 3. • Vamos a calcular las medias condicionadas de X/Y^ X/Y=^

xi^ nX/Y=^

fxX/Y=2^ i

nX/Y=

(0-10]^

0,^

(10-20]^

0,^

(20-30]^

0,^

∑^ = /%&

nX/Y=2=^ ^

195 = 9,29€^21

X/Y=^

xi^ nX/Y=^

fxX/Y=4^ i

nX/Y=

(0-10]^

0,^

(10-20]^

0,^

(20-30]^

0,^

∑^ = /%)

nX/Y=4=^ ^

740 = 20,56€^36

X/Y=^

xi^ nX/Y=^

fX/Y=^

xniX/Y=

(0-10]^

0,^

(10-20]^

0,^

(20-30]^

0,^

∑^ = /%+

nX/Y=8=^ ^

895 = 20,81€^43

Interpretación

: Cuando tenemos

dos años de experiencia laboral setiene un salario medio de 9290€.

Interpretación

: Cuando tenemos 4

años de experiencia laboral se tieneun salario medio de 20560€.

Interpretación

: Cuando tenemos 8

años de experiencia laboral se tiene unsalario medio de 20810€.

-^ Calculamos las medias condicionadas de Y/X Y/X=(0-10]^

nfY/X=(0-10]^

YY/X=(0-10]

niY/X=(0-10] 2

Y/X=(10-20] n 80

fY/X=(10-20]

YY/X=(10-20]

niY/X=(10-20] 2

Y/X=(20-30] n

Y/X=(20-30]^

fY/X=(20-30]^

YniY/X=(20-30] 2

/,(-.-]

∑^0 n^1 = (^)

2 Y/X= (0−10] 134 =^ ^

+- = 3,48&^

años

/,(-.&-]

∑^0 n^1 = (^)

2 Y/X= (10−20] 134 =^ ^

) = 5,43&^

años

/,(&-.5-]

∑^0 n^1 = (^)

2134 Y/X= (20−30] =^ ^

556 = 6,00^76

años

Interpretación

:^ Para^ unos

ingresos entre 0 y 10000€, por término mediose tienen 3,48 años de experiencialaboral.

Interpretación

:^ Para^ unos

ingresos entre 10000€ y 20000€, por términomedio^ se

tienen^

5,43^ años

de

experiencia laboral.

Interpretación

:^ Para^ unos

ingresos entre 20000€ y 30000€, por términomedio^ se

tienen^

6,00^ años

de

experiencia laboral.

Y

X^2

(0-10]

(10-20]

(20-30]

^ Frecuencias absolutas conjuntas y marginales:

Y

X^

8 Sum

(0-10]

(10-20]

(20-30]

Sum^

Frequency table:

Y

X^

Sum

(0-10]^

(10-20] 0.05 0.06 0.

(20-30] 0.02 0.25 0.

Sum^

^ Frecuencias relativas conjuntas:

Total percentages:

El programa R Commader presenta una tabla para cada distribución

Distribuciones condicionadas: Porcentajes fila y columna

Porcentaje Columna:

Column percentages X/Y

Y

X^

(0-10]^

(10-20] 0.2381 0.1667 0.2326(20-30] 0.0952 0.6944 0.6744Sum^

Y

X^

8 Sum

(0-10]^

Porcentaje Fila (10-20] 0.2381 0.2857 0.4762 1.0000(20-30] 0.0357 0.4464 0.5179 1.

:Row percentages:Y/X

PRECIO^ Intervalos^

xi^ ni^

fi^ Ni^

Fi^ xini

(^2) xni

(0,5-0,7]^

0,6^110

0,^

110 0,

66

39,

(0,7-0,9]^

0,8^105

0,^

215 0,

84

67,

(0,9-1,1]^

1 70

0,2090^285

0,^

70 70

(1,1-1,3]^

1,2^50

0,^

335 1

60 72

335 1

280 248,

Localidad

ni^

fi Barcelona

Bilbao^

Madrid^

Valencia^

-^ Distribuciones marginales

1 = ^ ^

  ∑ (^ −^ ^ & ==

^  − 1^

&− ^ ^ ^  − 1^

& 335 − 1

& &^ = = ==

-^ Frecuencias condicionadas: Precio/localidad^ BARCELONA

BILBAO

Intervalos

xi^

ni^

xini^

fi^

Intervalos

xi^

ni^

xini^

fi

(0,5-0,7]^

0,^

35

21 0,

(0,5-0,7]^

0,^

20

12 0,

(0,7-0,9]^

0,^

25

20 0,

(0,7-0,9]^

0,^

35

28 0,

(0,9-1,1]^

1

10

10 0,

(0,9-1,1]^

1

15

15 0,

(1,1-1,3]^

1,^

5

6 0,

(1,1-1,3]^

1,^

20

24 0,

75

57

1

90

79

1

Media=^

0,^

Media=^

0,

MADRID^

VALENCIA

Intervalos

xi^

ni^

xini^

fi^

Intervalos

xi^

ni^

xini^

fi

(0,5-0,7]^

0,^

40

24 0,

(0,5-0,7]^

0,^

15

9 0,

(0,7-0,9]^

0,^

25

20 0,

(0,7-0,9]^

0,^

20

16 0,

(0,9-1,1]^

1

20

20 0,

(0,9-1,1]^

1

25

25 0,

(1,1-1,3]^

1,^

15

18 0,

(1,1-1,3]^

1,^

10

12 0,

100

82

1

70

62

1

Media=^

0,^

Media=^

0,

4.4. Independencia estadística

Existe independencia estadística entre dos variables cuando los valores que toma una de ellas no se ve afectado porlos valores que toma la otra variable, es decir, los valores de una de una variable no vienen condicionados por elcomportamiento o los valores de la otra variable. a) Comprobación de independencia estadística

: Si dos variables son estadísticamente independientes se cumple que:=^ ^ ,^1

·^ %?^

∀i,j

Es decir, el producto de las frecuencias

relativas

marginales es igual a las frecuencias

relativas

conjuntas.

b) También lo podemos comprobar mediante las frecuencias absolutas conjuntas

, concretamente para que dos variables

sean estadísticamente independientes se tiene que cumplir que:

^ = 

· ^   ^

∀i,j

Si dos variables son estadísticamente independientes ,

entonces se cumple que:

^ Todas las distribuciones de frecuencias

relativas

de X condicionada a cualquier valor de Y son iguales a la distribución de

frecuencias

relativas

marginal de X.

^ Todas las distribuciones de frecuencias

relativas

de Y condicionada a cualquier valor de X son iguales a la distribución de

frecuencias

relativas

marginal de Y.

Ejemplo 1:

Sean la Variable

X=“nº de días que se va al cine al año y la variable” Y=“Nº de conciertos al año”.

Vamos a

comprobar si estas dos variables son estadísticamente independientes:^ X\Y^

6 n(X) 10^2

15^4

20^8

n(Y)^14

Frecuencias absolutas conjuntas

X\Y^4

6 f(X) 10 0,

0,^

0,0446^ 0,

0,^

0,0893^ 0,

0,^

0,1786^ 0,

f(Y)^ 0,

0,^

0,^

Frecuencias relativas conjuntas

X,Y independientes

↔ =^

^ ,·^ %^1

i,j

^  =  · ^  = ^ 32 · 14= 2; ^224

^ ^ = & · ^ 32 · 140&= ^

= 20 224

^ =  · ^  5 = ^ 32 · 70= 10; ^224

^ &^ = & · ^ 64 · 14= ^

= 4 224

^ &= && · ^  &= ^ 64 · 140= 40; ^224

^ &^ = & · ^ 64 · 70^5 = ^

= 20 224

^5 = 5 · ^  = ^ 128 · 14= 8; ^224

^5 = 5& · ^ 128 · 140&= ^

= 80 224

^5 = 55 · ^  5 = ^ 128 · 70= 40^224

Conclusión

: Como el producto de las marginales es igual

a la frecuencia absoluta conjunta, entonces X e Y sonestadísticamente Independientes.

X,Y independientes

↔^ =^

·^ ,^1

%?^

∀i,j

=^  ,^4

·^ = 0,1429 · 0,0625 = 0,00%^4

=^ & ,^4

·^ = 0,1429 · 0,625 = 0,089%C^

=^ 5 ,^4

·^ = 0,1429 · 0,3125 = 0%D^

=^ & ,C^

·^ = 0,2857 · 0,0625 = 0,0%^4

=^ && ,C^

·^ = 0,2857 · 0,625 = 0,1786%C^

=^ &5 ,C^

·^ = 0,2857 · 0,3125 = 0,0893%D^

=^ 5 ,D^

·^ = 0,5714 · 0,0625 =%^4

=^ 5& ,D^

·^ = 0,5714 · 0,625 = 0,3571%C^

=^55 ,D^

·^ = 0,5714 · 0,3125 = 0,1786%D^ Conclusión : Como el producto de las marginales es iguala la frecuencia relativa conjunta, entonces X e Y sonestadísticamente Independientes.