Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Distribuciones bidimensionales y análisis de variables relacionadas, Apuntes de Matemáticas Aplicadas

Los conceptos clave sobre el análisis de variables bidimensionales, incluyendo la definición de distribuciones marginales y condicionadas, la cuantificación de la relación entre variables a través de la covarianza y el coeficiente de correlación, y la representación gráfica de las relaciones mediante diagramas de dispersión e histogramas bidimensionales. Se abordan ejemplos prácticos de aplicación en el ámbito del marketing y la gestión de recursos humanos, como la relación entre antigüedad y salario de los empleados, o entre nivel de estudios y género. El objetivo es que el estudiante comprenda cómo estudiar conjuntamente el comportamiento de dos características o variables observadas en una misma población, determinar si existen relaciones entre ellas y, en su caso, cuantificar e interpretar el grado de dependencia.

Tipo: Apuntes

2021/2022

Subido el 25/04/2024

andrea0407rebeca
andrea0407rebeca 🇪🇸

3 documentos

1 / 9

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Estadística Aplicada al Marketing
Profesores: Antonio Guerrero.
Tema 4. Distribuciones bidimensionales. Tablas de correlación y
contingencia.
El objetivo del análisis de variables bidimensionales es estudiar conjuntamente el
comportamiento de 2 características o variables diferentes observadas en una misma población,
con el fin de determinar, si existen, las posibles relaciones que pueden darse entre ambas.
La estadística ofrece diversos instrumentos que permiten:
- Cuantificar el grado de relación que existe entre las variables (covarianza y coeficiente de
correlación).
- Predecir los valores de una variable en función de los valores de otra variable (regresión lineal).
Nota: A partir de ahora, para cada individuo o elemento de la población tendremos un par de
valores (𝑥𝑖, 𝑦𝑗), formado por el valor de la variable 𝑋 en ese individuo, y el valor de la variable 𝑌
para ese mismo individuo.
Ejemplos:
- Antigüedad de cada empleado en una empresa y el salario anual que percibe.
- Nota media del expediente académico de los alumnos de una determinada promoción y el
número medio de asignaturas aprobadas por año.
- Accidentes laborales sufridos por cada trabajador de una empresa y tipo de actividad realizada.
- Accidentes de trabajo sufridos por cada trabajador de una empresa y número de horas
trabajadas.
- Gasto en sistemas de prevención de riesgos laborales realizado por cada empresa y número de
accidentes de trabajo registrados.
Nota: Las dos variables que vamos a analizar no tienen por qué ser de la misma clase (una puede
ser cuantitativa y la otra cualitativa).
A lo largo de este tema y de los siguientes veremos que:
- Es posible estudiar separadamente el comportamiento de cada una de las variables observadas
DISTRIBUCIONES MARGINALES (y obtener, por tanto, sus correspondientes medidas de
posición, dispersión, etc.).
- Es posible estudiar el comportamiento de una variable sólo en función de algunos posibles
valores que tome la otra variable DISTRIBUCIONES CONDICIONADAS.
- Es posible determinar si existe algún tipo de relación o dependencia entre las variables, cómo
es esa relación y si los valores de una de las variables se pueden predecir a partir de los valores
de la otra variable.
pf3
pf4
pf5
pf8
pf9

Vista previa parcial del texto

¡Descarga Distribuciones bidimensionales y análisis de variables relacionadas y más Apuntes en PDF de Matemáticas Aplicadas solo en Docsity!

Profesores: Antonio Guerrero.

Tema 4. Distribuciones bidimensionales. Tablas de correlación y

contingencia.

El objetivo del análisis de variables bidimensionales es estudiar conjuntamente el

comportamiento de 2 características o variables diferentes observadas en una misma población,

con el fin de determinar, si existen, las posibles relaciones que pueden darse entre ambas.

La estadística ofrece diversos instrumentos que permiten:

  • Cuantificar el grado de relación que existe entre las variables (covarianza y coeficiente de

correlación).

  • Predecir los valores de una variable en función de los valores de otra variable (regresión lineal).

Nota : A partir de ahora, para cada individuo o elemento de la población tendremos un par de

valores (𝑥 𝑖

𝑗

), formado por el valor de la variable 𝑋 en ese individuo, y el valor de la variable 𝑌

para ese mismo individuo.

Ejemplos:

  • Antigüedad de cada empleado en una empresa y el salario anual que percibe.
  • Nota media del expediente académico de los alumnos de una determinada promoción y el

número medio de asignaturas aprobadas por año.

  • Accidentes laborales sufridos por cada trabajador de una empresa y tipo de actividad realizada.
  • Accidentes de trabajo sufridos por cada trabajador de una empresa y número de horas

trabajadas.

  • Gasto en sistemas de prevención de riesgos laborales realizado por cada empresa y número de

accidentes de trabajo registrados.

Nota : Las dos variables que vamos a analizar no tienen por qué ser de la misma clase (una puede

ser cuantitativa y la otra cualitativa).

A lo largo de este tema y de los siguientes veremos que:

  • Es posible estudiar separadamente el comportamiento de cada una de las variables observadas

DISTRIBUCIONES MARGINALES (y obtener, por tanto, sus correspondientes medidas de

posición, dispersión, etc.).

  • Es posible estudiar el comportamiento de una variable sólo en función de algunos posibles

valores que tome la otra variable ⟹ DISTRIBUCIONES CONDICIONADAS.

  • Es posible determinar si existe algún tipo de relación o dependencia entre las variables, cómo

es esa relación y si los valores de una de las variables se pueden predecir a partir de los valores

de la otra variable.

Profesores: Antonio Guerrero.

Presentación y ordenación de los datos.

Notación: Población de 𝑁 individuos, donde cada uno de ellos presenta dos características

observables:

1

2

𝑖

𝑛

1

2

𝑗

𝑘

Por tanto, para cada individuo o elemento de la población tenemos: (𝑥 𝑖

𝑗

𝟏

𝟐

𝒋

𝒌

𝟏

11

12

1 𝑗

1 𝑘

𝟐

21

22

2 𝑗

2 𝑘

𝒊

𝑖 1

𝑖 2

𝑖𝑗

𝑖𝑘

𝒏

𝑛 1

𝑛 2

𝑛𝑗

𝑛𝑘

Donde 𝑛 𝑖𝑗

es la frecuencia absoluta conjunta del par de valores (𝑥

𝑖

𝑗

A partir de esta tabla se puede construir una tabla para la frecuencia relativa.

Nota : Los datos también se pueden presentar mediante una tabla simple, es análoga a los datos

sueltos para unidimensional.

1

2

𝑛

1

2

𝑛

Ejemplo: La siguiente tabla recoge la antigüedad (número de años) y el salario por hora (en €)

que reciben los 20 empleados de una pequeña empresa de informática.

𝑋: Salario por hora (en €)

𝑌: Antigüedad en la empresa (número de años)

Como ambas variables son cuantitativas, la tabla se denomina: TABLA DE CORRELACIONES.

1

I

B

Profesores: Antonio Guerrero.

Para calcular las medidas de posición y de dispersión se opera de forma similar a la descrita en

las distribuciones unidimensionales.

Ejemplo: La siguiente tabla recoge la antigüedad (número de años) y el salario por hora (en €)

que reciben los 20 empleados de una pequeña empresa de informática.

𝑋: Salario por hora (en €)

𝑌: Antigüedad en la empresa (número de años)

Ejemplo: La siguiente tabla recoge el nivel de estudios y el género de un grupo de individuos.

𝑋: Sexo

𝑌: Nivel de estudios

Distribuciones condicionadas.

En determinadas ocasiones nos puede interesar estudiar el comportamiento de una variable,

únicamente en función de algunos posibles valores de la otra variable, es decir, fijando una

condición o restricción en la otra variable: DISTRIBUCIONES CONDICIONADAS.

Profesores: Antonio Guerrero.

Ejemplo: 𝑁 = 20

𝑋: Salario por hora (en €)

𝑌: Antigüedad en la empresa (número de años)

Dependencia e independencia estadística.

El aspecto más interesante de estudiar conjuntamente el comportamiento de dos variables es

el de captar las posibles relaciones que puedan darse entre ambas. Estas relaciones, que pueden

ser más o menos fuertes o intensas, variarán entre dos extremos.

  • Independencia = ausencia de relación.
  • Dependencia estadística = cierto grado de interrelación entre las variables (imposible

expresarlo matemáticamente).

  • Dependencia funcional = relación perfecta (𝑌 = 𝑓 (𝑥) 𝑜 𝑋 = 𝑓 (𝑦)).

La Dependencia estadística admite grados (más o menos fuerte o intensa), mientas que la

Dependencia funcional NO.

Independencia estadística. Diremos que dos variables 𝑋 e 𝑌 son independientes

estadísticamente, si para todos los pares de valores (𝑥 𝑖

𝑗

), se cumple que:

𝑖𝑗

𝑖

𝑗

La frecuencia relativa conjunta es igual al producto de las frecuencias relativas marginales.

Simplificando:

𝑖𝑗

𝑖

𝑗

Basta que para un par de valores cualquiera no se cumpla la condición de independencia, para

que se pueda concluir que las variables NO son Independientes. Existirá, por tanto, dependencia

estadística.

Profesores: Antonio Guerrero.

Si 𝑋 e 𝑌 son INDEPENDIENTES ⟹ 𝑆 𝑥𝑦

= 0. El recíproco no siempre es cierto. El hecho de que la

covarianza sea nula no implica, necesariamente, que las variables sean independientes,

únicamente indica que no están relacionadas de un modo lineal.

Propiedades de la covarianza.

  • Es invariante ante cambios de origen. Si a todos los valores de la variable 𝑋 les sumamos o

restamos una constante, y/o a los valores de la variable 𝑌 les sumamos o restamos otra

constante, la Covarianza no varía.

  • La Covarianza sí se ve afectada por cambios de escala. Si a todos los valores de la variable 𝑋 los

multiplicamos o dividimos por una constante, y a los valores de la variable 𝑌 los multiplicamos

o dividimos por otra constante, la Covarianza queda multiplicada o dividida por el producto de

ambas constantes.

𝑖

1

1

𝑖

𝑗

2

2

𝑗

𝑥𝑦

1

2

𝑥𝑦

Principal inconveniente de la Covarianza: depende de las unidades de medida de las variables

(no es adimensional), no está acotada, y en el caso de que exista algún tipo de relación o

dependencia entre las variables, esta medida no es indicativa del grado de intensidad o de la

fuerza de dicha relación.

Representación gráfica.

Diagrama de dispersión o nube de puntos : Vamos a verlo con un ejemplo.

Cada columna representa los valores que toma una variable en todos los individuos de la

muestra. Todas estas observaciones pueden ser representadas en un diagrama de dispersión, o

nube de puntos, en el que cada individuo representa un punto cuyas coordenadas son los

valores de las variables correspondientes.

Profesores: Antonio Guerrero.

Objetivo de la representación gráfica: intentar reconocer a partir del diagrama de dispersión o

nube de puntos, si hay relación entre las variables, de qué tipo es la relación y, si es posible,

predecir el valor de una de ellas en función de la otra. En el gráfico anterior se observa que el

peso aumenta con la altura.

Histograma bidimensional: En un eje de coordenadas se levanta un prisma para cada modalidad

proporcional a su frecuencia.

Variaciones de un histograma: