

















Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Estadística Aplicada al Turismo, Profesor: Monica Monica, Carrera: Turismo (Vicálvaro), Universidad: URJC
Tipo: Apuntes
1 / 25
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!


















El objetivo del análisis de variables bidimensionales es estudiar conjuntamente el comportamiento de 2 características o variables diferentes observadas en una misma población, con el fin de determinar, si existen, las posibles relaciones que pueden darse entre ambas. La estadística ofrece diversos instrumentos que permiten: Cuantificar el grado de relación que existe entre las variables (covarianza y coeficiente de correlación). Predecir los valores de una variable en función de los valores de otra variable (regresión lineal).
Nota: A partir de ahora, para cada individuo o elemento de la población tendremos un par de valores (xi, yj), formado por el valor de la variable X en ese individuo, y el valor de la variable Y para ese mismo individuo.
Nota: Las dos variables que vamos a analizar no tienen porqué ser de la misma clase (una puede ser cuantitativa y la otra cualitativa). A lo largo de este tema y de los siguientes veremos que: Es posible estudiar separadamente el comportamiento de cada una de las variables observadas DISTRIBUCIONES MARGINALES (y obtener, por tanto, sus correspondientes medidas de posición, dispersión, etc.) Es posible estudiar el comportamiento de una variable sólo en función de algunos posibles valores que tome la otra variable DISTRIBUCIONES CONDICIONADAS. Es posible determinar si existe algún tipo de relación o dependencia entre las variables, cómo es esa relación y si los valores de una de las variables se pueden predecir a partir de los valores de la otra variable.
Notación: Población de N individuos, donde cada uno de ellos presenta dos características observables: X = (x 1 , x 2 , …, xi, …, xn) Y = (y 1 , y 2 , …, yj, …, yk) Por tanto, para cada individuo o elemento de la población tenemos: (xi, yj)
X / Y y 1 y 2 … yj … yk x 1 n 11 n 12 … n 1 j … n 1 k x 2 n 21 n 22 … n 2 j … n 2 k … … … … … … … xi ni1 ni 2 … nij … nik … … … … … … … xn nn1 nn 2 … nni … nnk
nij: Frecuencias absolutas conjuntas
Ejemplos: n 11 : Frecuencia absoluta conjunta del par de valores (x 1 , y 1 ) n 12 : Frecuencia absoluta conjunta del par de valores (x 1 , y 2 )
Ejemplo 2: La siguiente tabla recoge el nivel de estudios y el género de un grupo de individuos: X: Sexo Y: Nivel de estudios
Como ambas variables son cualitativas, la tabla se denomina: TABLA DE CONTINGENCIAS
X / Y Primarios Secundarios Superiores Hombre 35 10 5 Mujer 10 25 5 N=
Nivel de estudios
Sexo
Ejemplo 3: La siguiente tabla recoge el nivel de estudios y la edad de un grupo de individuos: X: Edad Y: Nivel de estudios
X / Y Primarios Secundarios Superiores TABLA DE CONTINGENCIAS De 25 a 45 años 58 122 70 De 46 a 55 años 102 89 44 Más de 55 años 4 6 5 N=
Nivel de estudios
Edad
El concepto de distribución marginal de frecuencias de una variable surge cuando se estudia aisladamente una de las variables, es decir, cuando se estudia una variable de forma independiente de la otra. Por tanto, para obtener las frecuencias marginales de una variable haremos lo siguiente:
X / Y y 1 y 2 y 3 ni. x 1 n 11 n 12 n 13 n 1. = n 11 +n 12 +n 13 x 2 n 21 n 22 n 23 n 2. = n 21 +n 22 +n 23 x 3 n 31 n 32 n 33 n 3. = n 31 +n 32 +n 33 x 4 n 41 n 42 n 43 n 4. = n 41 +n 42 +n 43 n.j n. 1 n. 2 n. 3 N
Para calcular las medidas de posición y de dispersión se opera de forma muy similar a la descrita en las distribuciones unidimensionales.
Ejemplo 1: La siguiente tabla recoge la antigüedad (nº de años) y el salario por hora (en €) que reciben los 20 empleados de una pequeña empresa de informática:
X: Salario por hora (en €) Y: Antigüedad en la empresa (nº de años)
X / Y 1 2 3 ni. 10 4 1 0 5 15 3 3 1 7 20 2 1 1 4 30 1 1 2 4 Salario por hora (€)^ n.j^^10 6 4
Antigüedad (nº años) X ni. 10 5 15 7 20 4 30 4 N 20
Y n.j 1 10 2 6 3 4 N 20
Distribución marginal de la variable X Distribución marginalde la variable Y
N
Y n Y
n
20
Y ^1 *^10 ^2 *^6 ^3 *^4
En determinadas ocasiones nos puede interesar estudiar el comportamiento de una variable, únicamente en función de algunos posibles valores de la otra variable, es decir, fijando una condición o restricción en la otra variable: DISTRIBUCIONES CONDICIONADAS Ejemplo 1: N = X: Salario por hora (en €) Y: Antigüedad en la empresa (nº de años)
X / Y 1 2 3 ni. 10 4 1 0 5 15 3 3 1 7 20 2 1 1 4 30 1 1 2 4 Salario por hora (€)^ n.j^^10 6 4
Antigüedad (nº años)
Xi/Yj=1 10 15 20 30 n.j ni/j (^) 4 3 2 1 10
Distribución de los salarios por hora en los empleados de menor antigüedad Y^ j/Xi>=20^ nj/i 1 3 2 2 3 3 n3j+n4j (^) 8
Distribución de la antigüedad de los empleados con salarios por hora superiores o iguales a 20€
El aspecto más interesante de estudiar conjuntamente el comportamiento de dos variables, es el de captar las posibles relaciones que puedan darse entre ambas. Estas relaciones, que pueden ser más o menos fuertes o intensas variarán entre dos extremos:
= ausencia de relación
INDEPENDENCIA
DEPENDENCIA FUNCIONAL
=relación perfecta
Y=f (x) X=f (y)
DEPENDENCIA ESTADÍSTICA
= cierto grado de interrelación entre las variables (imposible expresarlo matemáticamente)
6.5 Dependencia e independencia estadística
Basta que para un par de valores cualquiera no se cumpla la condición de independencia (tanto en un caso como en el otro), para que se pueda concluir que las variables NO son Independientes : existirá, por tanto, Dependencia estadística. Ejemplo 1: N= 20 empleados X: Salario por hora (en €) Y: Antigüedad en la empresa (nº de años)
X / Y 1 2 3 ni. 10 4 1 0 5 15 3 3 1 7 20 2 1 1 4 30 1 1 2 4 Salario por hora (€)^ n.j^^10 6 4
Antigüedad (nº años) ¿Son estadísticamente independientes el salario por hora de los empleados y su antigüedad en la empresa?
6.5 Dependencia e independencia estadística
Dos variables X e Y son independientes estadísticamente, si para todos los pares de valores (xi,yj), se cumple que:
N
n N
n N
n (^) ij (^) i j
Directamente con la fórmula:
Por tanto, existe al menos un par de valores para el que
Existe dependencia estadística
6.5 Dependencia e independencia estadística
Interpretación: Si Sxy> 0 DEPENDENCIA DIRECTA O POSITIVA : las dos variables varían en el mismo sentido, es decir, a mayores valores de X le corresponden mayores valores de Y (y a la inversa). Si Sxy< 0 DEPENDENCIA INVERSA O NEGATIVA : las dos variables varían en sentido contrario, a mayores valores de X le corresponden valores más pequeños de Y (y a la inversa). Si Sxy= 0 LAS VARIABLES ESTÁN INCORRELADAS : no existe relación lineal entre las variables.
N
x x y y n S i^ j^
i j ij xy
( ) ( )
i j
i j ij
Utilizaremos esta fórmula en la práctica
6.5 Dependencia e independencia estadística
Si X e Y son INDEPENDIENTES
El recíproco no siempre es cierto. El hecho de que la covarianza sea nula no implica, necesariamente, que las variables sean independientes, únicamente indica que no están relacionadas de un modo lineal. Propiedades de la covarianza
Sxy=