Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Estadistica Aplicada, Apuntes de Estadística Aplicada

Asignatura: Estadística Aplicada al Turismo, Profesor: Monica Monica, Carrera: Turismo (Vicálvaro), Universidad: URJC

Tipo: Apuntes

2014/2015

Subido el 29/01/2015

mario94108740
mario94108740 🇪🇸

3.1

(10)

7 documentos

1 / 25

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Mónica Marbán
TEMA 6
DISTRIBUCIONES BIDIMENSIONALES
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19

Vista previa parcial del texto

¡Descarga Estadistica Aplicada y más Apuntes en PDF de Estadística Aplicada solo en Docsity!

TEMA 6

DISTRIBUCIONES BIDIMENSIONALES

6.1 Introducción

El objetivo del análisis de variables bidimensionales es estudiar conjuntamente el comportamiento de 2 características o variables diferentes observadas en una misma población, con el fin de determinar, si existen, las posibles relaciones que pueden darse entre ambas. La estadística ofrece diversos instrumentos que permiten: Cuantificar el grado de relación que existe entre las variables (covarianza y coeficiente de correlación). Predecir los valores de una variable en función de los valores de otra variable (regresión lineal).

Nota: A partir de ahora, para cada individuo o elemento de la población tendremos un par de valores (xi, yj), formado por el valor de la variable X en ese individuo, y el valor de la variable Y para ese mismo individuo.

6.1 Introducción

Nota: Las dos variables que vamos a analizar no tienen porqué ser de la misma clase (una puede ser cuantitativa y la otra cualitativa). A lo largo de este tema y de los siguientes veremos que: Es posible estudiar separadamente el comportamiento de cada una de las variables observadas DISTRIBUCIONES MARGINALES (y obtener, por tanto, sus correspondientes medidas de posición, dispersión, etc.) Es posible estudiar el comportamiento de una variable sólo en función de algunos posibles valores que tome la otra variable DISTRIBUCIONES CONDICIONADAS. Es posible determinar si existe algún tipo de relación o dependencia entre las variables, cómo es esa relación y si los valores de una de las variables se pueden predecir a partir de los valores de la otra variable.

6.2 Presentación y ordenación de los datos

Notación: Población de N individuos, donde cada uno de ellos presenta dos características observables: X = (x 1 , x 2 , …, xi, …, xn) Y = (y 1 , y 2 , …, yj, …, yk) Por tanto, para cada individuo o elemento de la población tenemos: (xi, yj)

X / Y y 1 y 2 … yj … yk x 1 n 11 n 12 … n 1 j … n 1 k x 2 n 21 n 22 … n 2 j … n 2 k … … … … … … … xi ni1 ni 2 … nij … nik … … … … … … … xn nn1 nn 2 … nni … nnk

nij: Frecuencias absolutas conjuntas

Ejemplos: n 11 : Frecuencia absoluta conjunta del par de valores (x 1 , y 1 ) n 12 : Frecuencia absoluta conjunta del par de valores (x 1 , y 2 )

6.2 Presentación y ordenación de los datos

Ejemplo 2: La siguiente tabla recoge el nivel de estudios y el género de un grupo de individuos: X: Sexo Y: Nivel de estudios

Como ambas variables son cualitativas, la tabla se denomina: TABLA DE CONTINGENCIAS

X / Y Primarios Secundarios Superiores Hombre 35 10 5 Mujer 10 25 5 N=

Nivel de estudios

Sexo

6.2 Presentación y ordenación de los datos

Ejemplo 3: La siguiente tabla recoge el nivel de estudios y la edad de un grupo de individuos: X: Edad Y: Nivel de estudios

X / Y Primarios Secundarios Superiores TABLA DE CONTINGENCIAS De 25 a 45 años 58 122 70 De 46 a 55 años 102 89 44 Más de 55 años 4 6 5 N=

Nivel de estudios

Edad

6.3 Distribuciones marginales

El concepto de distribución marginal de frecuencias de una variable surge cuando se estudia aisladamente una de las variables, es decir, cuando se estudia una variable de forma independiente de la otra. Por tanto, para obtener las frecuencias marginales de una variable haremos lo siguiente:

X / Y y 1 y 2 y 3 ni. x 1 n 11 n 12 n 13 n 1. = n 11 +n 12 +n 13 x 2 n 21 n 22 n 23 n 2. = n 21 +n 22 +n 23 x 3 n 31 n 32 n 33 n 3. = n 31 +n 32 +n 33 x 4 n 41 n 42 n 43 n 4. = n 41 +n 42 +n 43 n.j n. 1 n. 2 n. 3 N

Para calcular las medidas de posición y de dispersión se opera de forma muy similar a la descrita en las distribuciones unidimensionales.

6.3 Distribuciones marginales

Ejemplo 1: La siguiente tabla recoge la antigüedad (nº de años) y el salario por hora (en €) que reciben los 20 empleados de una pequeña empresa de informática:

X: Salario por hora (en €) Y: Antigüedad en la empresa (nº de años)

X / Y 1 2 3 ni. 10 4 1 0 5 15 3 3 1 7 20 2 1 1 4 30 1 1 2 4 Salario por hora (€)^ n.j^^10 6 4

Antigüedad (nº años) X ni. 10 5 15 7 20 4 30 4 N 20

Y n.j 1 10 2 6 3 4 N 20

Distribución marginal de la variable X Distribución marginalde la variable Y

N

Y n Y

n

  i ^1 i^ * i^1 ,^7 años

20

Y ^1 *^10 ^2 *^6 ^3 *^4 

6.4 Distribuciones condicionadas

En determinadas ocasiones nos puede interesar estudiar el comportamiento de una variable, únicamente en función de algunos posibles valores de la otra variable, es decir, fijando una condición o restricción en la otra variable: DISTRIBUCIONES CONDICIONADAS Ejemplo 1: N = X: Salario por hora (en €) Y: Antigüedad en la empresa (nº de años)

X / Y 1 2 3 ni. 10 4 1 0 5 15 3 3 1 7 20 2 1 1 4 30 1 1 2 4 Salario por hora (€)^ n.j^^10 6 4

Antigüedad (nº años)

Xi/Yj=1 10 15 20 30 n.j ni/j (^) 4 3 2 1 10

Distribución de los salarios por hora en los empleados de menor antigüedad Y^ j/Xi>=20^ nj/i 1 3 2 2 3 3 n3j+n4j (^) 8

Distribución de la antigüedad de los empleados con salarios por hora superiores o iguales a 20€

6.5 Dependencia e independencia estadística

El aspecto más interesante de estudiar conjuntamente el comportamiento de dos variables, es el de captar las posibles relaciones que puedan darse entre ambas. Estas relaciones, que pueden ser más o menos fuertes o intensas variarán entre dos extremos:

= ausencia de relación

INDEPENDENCIA

DEPENDENCIA FUNCIONAL

=relación perfecta

Y=f (x) X=f (y)

DEPENDENCIA ESTADÍSTICA

= cierto grado de interrelación entre las variables (imposible expresarlo matemáticamente)

6.5 Dependencia e independencia estadística

Basta que para un par de valores cualquiera no se cumpla la condición de independencia (tanto en un caso como en el otro), para que se pueda concluir que las variables NO son Independientes : existirá, por tanto, Dependencia estadística. Ejemplo 1: N= 20 empleados X: Salario por hora (en €) Y: Antigüedad en la empresa (nº de años)

X / Y 1 2 3 ni. 10 4 1 0 5 15 3 3 1 7 20 2 1 1 4 30 1 1 2 4 Salario por hora (€)^ n.j^^10 6 4

Antigüedad (nº años) ¿Son estadísticamente independientes el salario por hora de los empleados y su antigüedad en la empresa?

6.5 Dependencia e independencia estadística

Dos variables X e Y son independientes estadísticamente, si para todos los pares de valores (xi,yj), se cumple que:

N

n N

n N

n (^) ij (^) i   j  

N

n n

n ij i ^  j

(10,1) ^4  

4 ^50  

4 ^5 ^10    

Directamente con la fórmula:

Por tanto, existe al menos un par de valores para el que

N

n n

n ij i ^  j

Existe dependencia estadística

6.5 Dependencia e independencia estadística

Interpretación: Si Sxy> 0 DEPENDENCIA DIRECTA O POSITIVA : las dos variables varían en el mismo sentido, es decir, a mayores valores de X le corresponden mayores valores de Y (y a la inversa). Si Sxy< 0 DEPENDENCIA INVERSA O NEGATIVA : las dos variables varían en sentido contrario, a mayores valores de X le corresponden valores más pequeños de Y (y a la inversa). Si Sxy= 0 LAS VARIABLES ESTÁN INCORRELADAS : no existe relación lineal entre las variables.

    

N

x x y y n S i^ j^

i j ij xy

( ) ( )

( x. y )

N

x y n

i j

i j ij

Utilizaremos esta fórmula en la práctica

6.5 Dependencia e independencia estadística

Si X e Y son INDEPENDIENTES

El recíproco no siempre es cierto. El hecho de que la covarianza sea nula no implica, necesariamente, que las variables sean independientes, únicamente indica que no están relacionadas de un modo lineal. Propiedades de la covarianza

  1. Es invariante ante cambios de origen. Si a todos los valores de la variable X les sumamos o restamos una constante, y/o a los valores de la variable Y les sumamos o restamos otra constante, la Covarianza no varía.
  2. La Covarianza sí se ve afectada por cambios de escala. Si a todos los valores de la variable X los multiplicamos o dividimos por una constante, y a los valores de la variable Y los multiplicamos o dividimos por otra constante, la Covarianza queda multiplicada o dividida por el producto de ambas constantes.

Sxy=