¡Descarga Variables: Análisis de distribuciones marginales, condicionadas y correlación y más Apuntes en PDF de Estadística solo en Docsity!
Tema 2: Relación entre variables
Objetivos
Entender la naturaleza de los datos multidimensionales y en
concreto las relaciones bivariantes entre variables.
Distinguir el tipo de representaciones y resúmenes que se usan
para los distintos tipos de datos bivariantes.
Usar e interpretar las distintas herramientas y gráficos para
describir conjuntos de datos bivariantes.
Distribución conjunta
Una observación puede estar compuesta por datos de más de una
variable.
Por lo tanto,
además de estudiar cada variable por separado, otro objetivo de la
estadística es investigar las relaciones entre ellas.
Es muy común disponer de información de más de una variable, por
ejemplo k. Veamos un ejemplo...
Ejemplo: Datos meteorológicos y de presencia de aves en varias
áreas de los Alpes franceses
Fuente: Lebreton, Ph. (1977). Atlas ornithologique Rhone-Alpes. Centre
Ornithologique Rhone-Alpes, University of Lyon
Se analiza la frecuencia con que se han avistado 15 especies de aves
en diferentes áreas (23 áreas de los Alpes franceses). También se
estudian las características meteorológicas y de altitud de estas áreas.
Los datos meteorológicos recogen temperaturas mínimas y máximas
en enero y julio, así como la cantidad de lluvia en cada uno de estos
meses y en todo el año, por área.
Los datos que nos dispongamos a describir se dispondrán en una
tabla (o matriz) de datos rectangular con:
n filas: tantas como individuos u observaciones,
k columnas =n. de características (variables) medidas u
observadas.
Ejemplo tabla de datos: atlas ornitológico
Descripción conjunta de dos variables cualitativas
Supongamos que queremos resumir la información contenida en dos
variables cualitativas : X e Y.
Lo más inmediato es realizar una tabla de doble entrada, contando
cuántas observaciones caen en el valor x de la variable X , y el valor y
de la variable Y.
Este tipo de resúmenes es la generalización de la tabla de frecuencias
al caso de dos variables. Tendremos ahora una tabla de doble entrada
o tabla de contingencia.
Ejemplo
Avistamiento de chungungo (Lontra felina)
En la región del Biobío (Chile) se han llevado a cabo sesiones de avistamiento
de chungungo (Lontra felina).
Para cada ejemplar se ha registrado el hábitat en el que ha sido avistado (H) y el tipo
de actividad que estaba realizando (A). La tabla siguiente resume el resultado de este
estudio:
↓ A \ H → Agua Roca Arena
Alimentación 4 14 2
Descanso 82 10 8
Socialización 38 12 0
Tránsito 16 9 5
Observamos, por ejemplo, que 12 de los chungungos avistados estaban sobre roca
mientras socializaban. Vemos también que lo más frecuente (82 casos) es encontrar
chungungos que se encuentran en el agua y descansando.
Distribución conjunta
Igual que ocurría en la distribución de frecuencias para una sola
variable
las frecuencias conjuntas son números no negativos,
la suma de las frecuencias absolutas conjuntas es el número total
n de observaciones, y
la suma de las frecuencias relativas conjuntas es igual a uno.
Distribuciones de frecuencias relativas conjunta
Consideremos en general la siguiente tabla de frecuencias (relativas)
conjunta:
X \ Y y 1... yj... yJ
x 1 f 11 · · · f 1 j · · · f 1 J
xi fi 1 · · · fij · · · fiJ
xI fI 1 · · · fIj · · · fIJ
Donde cada f
ij
nij
n
f
ij
expresa la proporción (o tanto por uno) de observaciones en la
clase x
i
de la variable X y al mismo tiempo en la y
j
de la variable Y.
Multiplicando por 100 representa el tanto por ciento ( %).
Frecuencias absolutas marginales
A partir de la tabla de frecuencias conjunta (de doble entrada)
podemos calcular la distribución de frecuencias univariante de X y de
Y (marginales), por ejemplo la de Y sería:
Y y
1
... y
j
... y
J
Total
n
· 1
· · · n
·j
· · · n
·J
n
Análogamente para X.
En la próxima trasparencia incluimos estas distribuciones en los
márgenes de la tabla , de ahí el nombre de distribuciones marginales.
Ejemplo (tablas de contingencia)
Avistamiento de chungungos
La tabla siguiente incluye las frecuencias absolutas marginales de las
variables Actividad y Habitat en los chungungos:
↓ A \ H → Agua Roca Arena Total
Alimentación 4 14 2 20
Descanso 82 10 8 100
Socialización 38 12 0 50
Tránsito 16 9 5 30
Total 140 45 15 200
Vemos que la distribución marginal de la variable tipo de actividad es
Actividad (A) Total
Alimentación 20
Descanso 100
Socialización 50
Tránsito 30
María Eugenia Castellanos Nueda (DEIO) Total Estadística 200 Enero de 2013 17 / 112
Distribuciones marginales
X \ Y y 1... yj... yJ Total
x 1 n 11 · · · n 1 j · · · n 1 J n 1 ·
xi ni 1 · · · nij · · · niJ ni·
xI nI 1 · · · nIj · · · nIJ nI·
Total n· 1 · · · n·j · · · n·J n
Distribuciones marginales
En general,
la distribución marginal de la primera variable suele representarse
mediante
n
i.
donde el punto indica que hemos sumado en todos los valores de
la segunda variable manteniendo fijo el valor i de la primera, y
mediante
n
.j
se representa la marginal de la segunda variable y ahora el punto
expresa que se ha sumado en los valores de la primera variable.