





Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Los conceptos clave sobre el análisis de variables bidimensionales, incluyendo la definición de distribuciones marginales y condicionadas, la cuantificación de la relación entre variables a través de la covarianza y el coeficiente de correlación, y la representación gráfica de las relaciones mediante diagramas de dispersión e histogramas bidimensionales. Se abordan ejemplos prácticos de aplicación en el ámbito del marketing y la gestión de recursos humanos, como la relación entre antigüedad y salario de los empleados, o entre nivel de estudios y género. El objetivo es que el estudiante comprenda cómo estudiar conjuntamente el comportamiento de dos características o variables observadas en una misma población, determinar si existen relaciones entre ellas y, en su caso, cuantificar e interpretar el grado de dependencia.
Tipo: Apuntes
1 / 9
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!






Tema 4. Distribuciones bidimensionales. Tablas de correlación y
contingencia.
El objetivo del análisis de variables bidimensionales es estudiar conjuntamente el
comportamiento de 2 características o variables diferentes observadas en una misma población,
con el fin de determinar, si existen, las posibles relaciones que pueden darse entre ambas.
La estadística ofrece diversos instrumentos que permiten:
correlación).
Nota : A partir de ahora, para cada individuo o elemento de la población tendremos un par de
valores (𝑥 𝑖
𝑗
), formado por el valor de la variable 𝑋 en ese individuo, y el valor de la variable 𝑌
para ese mismo individuo.
Ejemplos:
número medio de asignaturas aprobadas por año.
trabajadas.
accidentes de trabajo registrados.
Nota : Las dos variables que vamos a analizar no tienen por qué ser de la misma clase (una puede
ser cuantitativa y la otra cualitativa).
A lo largo de este tema y de los siguientes veremos que:
⟹ DISTRIBUCIONES MARGINALES (y obtener, por tanto, sus correspondientes medidas de
posición, dispersión, etc.).
valores que tome la otra variable ⟹ DISTRIBUCIONES CONDICIONADAS.
es esa relación y si los valores de una de las variables se pueden predecir a partir de los valores
de la otra variable.
Presentación y ordenación de los datos.
Notación: Población de 𝑁 individuos, donde cada uno de ellos presenta dos características
observables:
1
2
𝑖
𝑛
1
2
𝑗
𝑘
Por tanto, para cada individuo o elemento de la población tenemos: (𝑥 𝑖
𝑗
𝟏
𝟐
𝒋
𝒌
𝟏
11
12
1 𝑗
1 𝑘
𝟐
21
22
2 𝑗
2 𝑘
𝒊
𝑖 1
𝑖 2
𝑖𝑗
𝑖𝑘
𝒏
𝑛 1
𝑛 2
𝑛𝑗
𝑛𝑘
Donde 𝑛 𝑖𝑗
es la frecuencia absoluta conjunta del par de valores (𝑥
𝑖
𝑗
A partir de esta tabla se puede construir una tabla para la frecuencia relativa.
Nota : Los datos también se pueden presentar mediante una tabla simple, es análoga a los datos
sueltos para unidimensional.
1
2
𝑛
1
2
𝑛
Ejemplo: La siguiente tabla recoge la antigüedad (número de años) y el salario por hora (en €)
que reciben los 20 empleados de una pequeña empresa de informática.
𝑋: Salario por hora (en €)
𝑌: Antigüedad en la empresa (número de años)
Como ambas variables son cuantitativas, la tabla se denomina: TABLA DE CORRELACIONES.
1
I
Para calcular las medidas de posición y de dispersión se opera de forma similar a la descrita en
las distribuciones unidimensionales.
Ejemplo: La siguiente tabla recoge la antigüedad (número de años) y el salario por hora (en €)
que reciben los 20 empleados de una pequeña empresa de informática.
𝑋: Salario por hora (en €)
𝑌: Antigüedad en la empresa (número de años)
Ejemplo: La siguiente tabla recoge el nivel de estudios y el género de un grupo de individuos.
𝑋: Sexo
𝑌: Nivel de estudios
Distribuciones condicionadas.
En determinadas ocasiones nos puede interesar estudiar el comportamiento de una variable,
únicamente en función de algunos posibles valores de la otra variable, es decir, fijando una
condición o restricción en la otra variable: DISTRIBUCIONES CONDICIONADAS.
Ejemplo: 𝑁 = 20
𝑋: Salario por hora (en €)
𝑌: Antigüedad en la empresa (número de años)
Dependencia e independencia estadística.
El aspecto más interesante de estudiar conjuntamente el comportamiento de dos variables es
el de captar las posibles relaciones que puedan darse entre ambas. Estas relaciones, que pueden
ser más o menos fuertes o intensas, variarán entre dos extremos.
expresarlo matemáticamente).
La Dependencia estadística admite grados (más o menos fuerte o intensa), mientas que la
Dependencia funcional NO.
Independencia estadística. Diremos que dos variables 𝑋 e 𝑌 son independientes
estadísticamente, si para todos los pares de valores (𝑥 𝑖
𝑗
), se cumple que:
𝑖𝑗
𝑖
𝑗
La frecuencia relativa conjunta es igual al producto de las frecuencias relativas marginales.
Simplificando:
𝑖𝑗
𝑖
𝑗
Basta que para un par de valores cualquiera no se cumpla la condición de independencia, para
que se pueda concluir que las variables NO son Independientes. Existirá, por tanto, dependencia
estadística.
Si 𝑋 e 𝑌 son INDEPENDIENTES ⟹ 𝑆 𝑥𝑦
= 0. El recíproco no siempre es cierto. El hecho de que la
covarianza sea nula no implica, necesariamente, que las variables sean independientes,
únicamente indica que no están relacionadas de un modo lineal.
Propiedades de la covarianza.
restamos una constante, y/o a los valores de la variable 𝑌 les sumamos o restamos otra
constante, la Covarianza no varía.
multiplicamos o dividimos por una constante, y a los valores de la variable 𝑌 los multiplicamos
o dividimos por otra constante, la Covarianza queda multiplicada o dividida por el producto de
ambas constantes.
𝑖
′
1
1
𝑖
𝑗
′
2
2
𝑗
𝑥𝑦
′
1
2
𝑥𝑦
Principal inconveniente de la Covarianza: depende de las unidades de medida de las variables
(no es adimensional), no está acotada, y en el caso de que exista algún tipo de relación o
dependencia entre las variables, esta medida no es indicativa del grado de intensidad o de la
fuerza de dicha relación.
Representación gráfica.
Diagrama de dispersión o nube de puntos : Vamos a verlo con un ejemplo.
Cada columna representa los valores que toma una variable en todos los individuos de la
muestra. Todas estas observaciones pueden ser representadas en un diagrama de dispersión, o
nube de puntos, en el que cada individuo representa un punto cuyas coordenadas son los
valores de las variables correspondientes.
Objetivo de la representación gráfica: intentar reconocer a partir del diagrama de dispersión o
nube de puntos, si hay relación entre las variables, de qué tipo es la relación y, si es posible,
predecir el valor de una de ellas en función de la otra. En el gráfico anterior se observa que el
peso aumenta con la altura.
Histograma bidimensional: En un eje de coordenadas se levanta un prisma para cada modalidad
proporcional a su frecuencia.
Variaciones de un histograma: