Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


estadistica bivariable, Ejercicios de Estadística

Asignatura: Estadística, Profesor: Pedro Novo, Carrera: Periodismo, Universidad: UPV-EHU

Tipo: Ejercicios

2017/2018

Subido el 10/05/2018

asier_anton_sanchez
asier_anton_sanchez 🇪🇸

5

(1)

4 documentos

1 / 23

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
2.- Estadística descriptiva bivariable: medidas de asociación
2.1.- Asociación entre variables cualitativas: tablas de contingencia,
chi-cuadrado…
2.2.- Asociación entre variables cuantitativas: correlación lineal,
coeficiente de Pearson
Bloque III: Tratamiento y análisis Bloque III: Tratamiento y análisis
estadístico de datos cuantitativosestadístico de datos cuantitativos
1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17

Vista previa parcial del texto

¡Descarga estadistica bivariable y más Ejercicios en PDF de Estadística solo en Docsity!

2.- Estadística descriptiva bivariable: medidas de asociación

2.1.- Asociación entre variables cualitativas: tablas de contingencia,

chi-cuadrado…

2.2.- Asociación entre variables cuantitativas: correlación lineal,

coeficiente de Pearson…

Bloque III: Tratamiento y análisisBloque III: Tratamiento y análisis

estadístico de datos cuantitativosestadístico de datos cuantitativos

Una vez descritos los datos, nos puede interesar saber cómo se relacionan unas variables con otras, para saber cómo se presentan juntas dos o más características de un fenómeno. Queremos saber, por lo tanto, si dos variables están relacionadas y varían de modo que cambian la una en relación con la otra.

Ejemplo:

saber si existe relación entre el nivel socioeconómico y la compra de diarios de

información general.

saber si existe relación entre la edad y el consumo de diarios gratuitos de

información general.

Nosotros nos vamos a ocupar de los siguientes:  Dos variables cualitativas: ¿Influye el sexo en la elección de carrera? Técnicas de asociación: tablas de contingencia, chi-cuadrado… Rho de Spearman  Dos variables cuantitativas: ¿Hay relación entre la edad y los ingresos? Coeficientes de correlación: Pearson…  Una variable cualitativa y otra cuantitativa: ¿Vivir en un pueblo influye en la compra de un determinado diario de tirada nacional? Análisis de la varianza …

Dos variables cualitativas. Tablas de contingencia Para representar dos variables cualitativas (X = independiente e Y= dependiente) utilizamos tablas de doble entrada con tantas filas como categorías tenga la variable X y tantas columnas como categorías tenga la variable Y. Ejemplo: X= Sexo 2 CATEGORÍAS (hombre, mujer) Y= Tabaquismo 3 CATEGORÍAS (fumador, no fumador,

ex fumador)

Tabaquismo Sexo

Fumador

No

fumador

Ex

fumador

Total

Hombre 30 50 20 100

Mujer 30 10 10 50

Total 60 60 30 150

Los laterales derecho e inferior son las frecuencias marginales.

Representan las frecuencias de las dos variables separadamente.

Las casillas contienen las frecuencias conjuntas.

En cada fila o columna aparecen las frecuencias condicionadas.

Tabaquismo Sexo

Fumador

No

fumador

Ex

fumador

Total

Hombre 30 50 20 100

Mujer 30 10 10 50

Total 60 60 30 150

Las frecuencias condicionadas indican las frecuencias de

una variable manteniendo fijo el valor de la otra.

Por ejemplo: entre los ex fumadores, ¿cuántos son

hombres y cuántos son mujeres?

Tabaquismo Sexo Fumador No fumador Ex fumador Total Hombre 0,30 0,50 0,20 1 Mujer 0,60 0,20 0,20 1 Total 0,4 0,4 0,2 1

Las frecuencias condicionadas también pueden expresarse en términos

relativos.

1.- Distribución de Y condicionada a X (porcentajes filas)

30/100. Del total de hombres (100) el 30% fuma

50/100. El 50% de los hombres son no fumadores

20/100. El 20% de los hombres son ex fumadores

Fumador (^) fumadorNo fumador^ Ex Total Hombre 30 50 20 100 Mujer 30 10 10 50 Total 60 60 30 150

Tabaquismo Sexo Fumador No fumador Ex fumador Total Hombre 0,50 0,83 0,67 0, Mujer 0,50 0,17 0,33 0. Total 1 1 1 1

2.- Distribución de X condicionada a Y (porcentajes columnas)

30/60= 0,50. De los fumadores, el 50% son hombres.

30/60.= 0,50. El 50% de los fumadores son mujeres.

Fumador No fumador Ex fumador Total Hombre 30 50 20 100 Mujer 30 10 10 50 Total 60 60 30 150

Se da independencia entre las variables cuando se cumplen las siguientes

condiciones:

1.- Las distribuciones de X condicionadas a cada valor Y (% columna)

coinciden entre sí y con la distribución marginal.

Dependencia: el sexo influye en el tabaquismo

Tabaquismo Sexo Fumador No fumador Ex fumador Total Hombre 0,50 0,83 0,67 0, Mujer 0,50 0,17 0,33 0. Total 1 1 1 1

2.- Las distribuciones de Y condicionadas a cada valor X (% fila)

coinciden entre sí y con la distribución marginal.

Dependencia: el sexo influye en el tabaquismo

Tabaquismo Sexo Fumador No fumador Ex fumador Total Hombre 0,30 0,50 0,20 1 Mujer 0,60 0,20 0,20 1 Total 0,4 0,4 0,2 1

Coeficientes de asociación entre variables cualitativas:

1.- Coeficiente chi-cuadrado ( X

 Sirve para saber si existe o no asociación entre variables cualitativas.

 No indica el sentido de la asociación.

 Se basa en la discrepancia entre unos datos empíricos y los que se

obtendrían teóricamente conforme a una hipótesis definida

(hipótesis nula= no asociación entre variables)

2.- Coeficiente de contingencia (C)

Fórmulas

Coeficiente

chi-cuadrado

( X^2 )

Coeficiente

de

Contingencia

(C)

Ejemplo Chi-cuadrado

15,52= X^2 empírico

Nivel Estudios Consumo TV Primarios Secundarios Superiores Total Si 96 123 81 300 No 54 27 19 100 Total 150 150 100 400 Nivel Estudios Consumo TV Primarios Secundarios Superiores Si 150300/400= 112, 150300/400= 112, 100300/400= 75 No 150100/400= 37, 150100/400= 37, 100100/400= 25 Nivel Estudios Consumo TV Primarios Secundarios Superiores Si ( 96 - 112,5)^2 /112,5= 2,42 (123-112,5)^2 /112,5= 0,98 (81-75)^2 /75= 0, No (54-37,5)^2 /37,5= 7,26 (27-37,5)^2 /37,5= 2,94 (19-25)^2 /25= 1, 

Ejemplo Chi-cuadrado. Interpretación

Partimos de la hipótesis nula: no hay relación entre las variables.

Comparamos el chi-cuadrado empírico con el teórico (tabla).

Si el X^2 empírico es mayor que el teórico, rechazamos la hipótesis nula, luego las variables

están relacionadas. Hay asociación.

Para hacer la comparación tenemos en cuenta:

1.- Nivel de confianza: nivel de probabilidad para el que se comprueba si las variaciones

entre las variables se deben al azar o no. Lo fijamos nosotros. Dos son los más habituales:

N.C. 95% y N.C. 99%

2.- Grados de libertad: son el número de puntuaciones que son libres de variar. Se calculan

restando 1 al número de categorías de las variables. Entonces, g.l. = (número de filas menos

1)x (número de columnas menos 1).

Nuestra tabla es de 3x2, luego g.l. = 2

Con los grados de libertad y el nivel de confianza buscamos en la tabla el X^2 teórico.

En nuestro caso: N.C.= 95% g.l. = 2 X^2 teórico= 5,

X^2 empírico (15,52) > X^2 teórico (5,9915) Rechazamos hipótesis nula. Hay

asociación entre las variables.