Prepara tus exámenes
Consigue puntos
Orientación Universidad
Vende en Docsity
Docsity AI

Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity

Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium

Orientación Universidad

Vende en Docsity

Docsity AI

Inicia sesión Regístrate

Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity

Busca documentos

Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity

Busca tu universidad

Encuentra los documentos específicos para los exámenes de tu universidad

Video Cursos

Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades

Quiz

Responde a preguntas de exámenes reales y pon a prueba tu preparación

Docsity AINEW

Resume tus documentos, hazles preguntas, conviértelos en quiz y mapas conceptuales

Ver preguntas

Despeja tus dudas leyendo las respuestas a las preguntas que realizaron otros estudiantes como tú

Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium

Compartir documentos

20 Puntos

Por cada documento subido

Responde a las preguntas

5 Puntos

por cada respuesta dada (máx. 1 al día)

Todos los modos para conseguir puntos gratis

Consigue puntos de inmediato

Elige un plan Premium con todos los puntos que necesitas.

Oportunidades de estudio

Elige tu próximo programa de estudio

Ponte en contacto inmediatamente con las mejores universidades del mundo. Busca entre miles de universidades en todo el mundo. Busca entre miles de universidades partner oficiales

Comunidad

Pregúntale a la comunidad

Pide ayuda a la comunidad y resuelve tus dudas de estudio

Ebooks gratuitos

¡Nuestros e-books salva-estudiantes!

Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity

spss contingencia, Apuntes de Estadística

Universidad Complutense de Madrid (UCM)Estadística

Asignatura: estadistica, Profesor: nebr nebr, Carrera: Trabajo Social, Universidad: UCM

Tipo: Apuntes

2012/2013

Subido el 04/09/2013

paticorto 🇪🇸

4.6

(5)

5 documentos

1 / 42

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

Capítulo 12

Análisis de variables categóricas:

El procedimiento Tablas de contingencia

En las ciencias sociales, de la salud y del comportamiento es muy frecuente encontrarse con

variables categóricas. El sexo, la raza, la clase social, el lugar de procedencia, la categoría labo-

ral, participar o no en un programa de intervención, el tipo de tratamiento aplicado, los distintos

departamentos de una empresa, padecer o no una enfermedad o un determinado síntoma, etc.,

son ejemplos de algunas variables categóricas con las que nos podemos encontrar. Son varia-

bles sobre las que únicamente es posible obtener una medida de tipo nominal (u ordinal, pero

con muy pocos valores).

En este capítulo vamos a estudiar un procedimiento SPSS que permite describir este tipo

de variables y detectar posibles pautas de asociación entre ellas.

Tablas de contingencia

Cuando se trabaja con variables categóricas, los datos suelen organizarse en tablas de doble

entrada en las que cada entrada representa un criterio de clasificación (una variable categórica).

Como resultado de esta clasificación, las frecuencias (el número o porcentaje de casos) apare-

cen organizadas en casillas que contienen información sobre la relación existente entre ambos

criterios. A estas tablas de frecuencias se les llama tablas de contingencia.

La tabla 12.1 muestra un ejemplo de tabla de contingencia. En ella, 474 sujetos han sido

ordenados con arreglo a dos criterios de clasificación: sexo y salario (se trata por tanto de una

tabla bidimensional). Los números que aparecen en la tabla no son puntuaciones, sino frecuen-

cias absolutas (número de casos): 19 varones tienen salarios de menos de 25.000 $; 86 mujeres

tienen salarios comprendidos entre 25.000 y 50.000 $; etc.

Descubre Apuntes de Estadística Universidad Complutense de Madrid (UCM)

Documentos relacionados

coeficientes contingencia

Tablas de contingencia

(1)

Tablas de contingencia

(7)

(5)

(7)

(4)

(2)

ejercicios miscelanea spss

Guia para spss

(5)

tablas de contingencia

(1)

Vista previa parcial del texto

¡Descarga spss contingencia y más Apuntes en PDF de Estadística solo en Docsity!

Capítulo 12

Análisis de variables categóricas:

El procedimiento Tablas de contingencia

En las ciencias sociales, de la salud y del comportamiento es muy frecuente encontrarse con variables categóricas. El sexo, la raza, la clase social, el lugar de procedencia, la categoría labo- ral, participar o no en un programa de intervención, el tipo de tratamiento aplicado, los distintos departamentos de una empresa, padecer o no una enfermedad o un determinado síntoma, etc., son ejemplos de algunas variables categóricas con las que nos podemos encontrar. Son varia- bles sobre las que únicamente es posible obtener una medida de tipo nominal (u ordinal, pero con muy pocos valores). En este capítulo vamos a estudiar un procedimiento SPSS que permite describir este tipo de variables y detectar posibles pautas de asociación entre ellas.

Tablas de contingencia

Cuando se trabaja con variables categóricas, los datos suelen organizarse en tablas de doble entrada en las que cada entrada representa un criterio de clasificación (una variable categórica). Como resultado de esta clasificación, las frecuencias (el número o porcentaje de casos) apare- cen organizadas en casillas que contienen información sobre la relación existente entre ambos criterios. A estas tablas de frecuencias se les llama tablas de contingencia. La tabla 12.1 muestra un ejemplo de tabla de contingencia. En ella, 474 sujetos han sido ordenados con arreglo a dos criterios de clasificación: sexo y salario (se trata por tanto de una tabla bidimensional ). Los números que aparecen en la tabla no son puntuaciones, sino frecuen- cias absolutas (número de casos): 19 varones tienen salarios de menos de 25.000 $; 86 mujeres tienen salarios comprendidos entre 25.000 y 50.000 $; etc.

Recuento

19 174 48 17 258 124 86 6 216 143 260 54 17 474

Hombre Mujer

Sexo

Total

Menos de 25.000 $

Entre 25. y 50.000 $

Entre 50. y 75.000 $

Más de 75.000 $

Grupos de salario actual Total

Tabla 12.1. Tabla de contingencia de las variables sexo y grupos de salario.

Por supuesto, en lugar de utilizar sólo dos criterios de clasificación para generar una tabla de contingencia bidimensional , también podríamos utilizar tres o más criterios, lo que nos llevaría a obtener tablas tridimensionales , cuatridimensionales , etc. El procedimiento Tablas de contingencia del SPSS permite generar tablas con cualquier número de dimensiones. No obstante, los estadísticos que incluye sólo son útiles para analizar tablas bidimensionales. El análisis de tablas de contingencia con más de dos criterios de clasifi- cación se aborda en otros procedimientos SPSS (por ejemplo, en el procedimiento Modelos loglineales ). Así pues, el procedimiento Tablas de contingencia permite obtener tablas de contingencia bidimensionales. Pero, además, incluye la posibilidad de añadir terceras variables (variables de segmentación) para definir subgrupos o capas y obtener así tablas multidimensionales. Tam- bién incluye varios estadísticos y medidas de asociación que proporcionan la información necesaria para estudiar las posibles pautas de asociación existentes entre las variables que conforman una tabla de contingencia bidimensional.

Para utilizar el procedimiento Tablas de contingencia :

| Seleccionar la opción Estadísticos descriptivos > Tablas de contingencia del menú

Analizar para acceder al cuadro de diálogo Tablas de contingencia que muestra la figura 12.1.

Recuento

157 27 74 258 206 10 216 363 27 84 474

Hombre Mujer

Sexo

Total

Administrativo Seguridad Directivo

Categoría laboral Total

Ejemplo (Tablas de contingencia)

Este ejemplo muestra cómo obtener una tabla de contingencia y un diagrama de barras agru- padas mediante el procedimiento Tablas de contingencia. Utilizaremos la variable sexo como variable fila y la variable catlab (categoría laboral) como variable columna :

| En el cuadro de diálogo Tablas de contingencia (ver figura 12.1), seleccionar la varia-

ble sexo y, mediante el correspondiente botón flecha , trasladarla a la lista Filas.

| Seleccionar la variable categoría laboral y, mediante el correspondiente botón flecha,

trasladarla a la lista Columnas.

| Marcar la opción Mostrar los gráficos de barras agrupadas.

Aceptando las especificaciones por defecto del procedimiento Tablas de contingencia , obte- nemos los resultados que muestran la tabla 12.2. y la figura 12.2.

Tabla 12.2. Tabla de contingencia resultante de cruzar las variables sexo y categoría laboral.

La tabla 12.2 ofrece las frecuencias (número de casos) que resultan de cruzar cada categoría de la variable sexo con cada categoría de la variable categoría laboral. Así, sabemos, por ejemplo, que hay 157 hombres administrativos y 10 mujeres directivas. La tabla también ofrece los totales marginales correspondientes a cada categoría indivi- dualmente considerada. De este modo, sabemos, por ejemplo, que el archivo contiene 258 varones y 27 agentes de seguridad.

Sexo

Hombre Mujer

Frecuencia

300

200

100

0

Categoría Laboral Administrativo Seguridad Directivo

La figura 12.2 muestra el gráfico de barras agrupadas correspondiente a los datos de la tabla 12.2. Cada barra del gráfico se corresponde con una casilla de la tabla.

Figura 12.2. Gráfico de barras agrupadas de las variables sexo y categoría laboral.

Podemos trasladar más de una variable tanto a la lista filas como a la lista columnas del cuadro de diálogo Tablas de contingencia (figura 12.1). En ese caso, cada variable fila se cruza con cada variable columna para generar una tabla de contingencia distinta. Seleccionando, por ejemplo, dos variables fila y tres variables columna , obtendríamos seis tablas de contingencia diferentes.

Recuento

110 14 70 194 166 10 176 276 14 80 370 47 13 4 64 40 40 87 13 4 104

Hombre Mujer

Sexo

Total Hombre Mujer

Sexo

Total

Clasificación étnica Blancos

No blancos

Administrativo Seguridad Directivo

Categoría Laboral Total

Ejemplo (Tablas de contingencia segmentadas)

Este ejemplo muestra cómo utilizar una variable de segmentación para obtener varias capas de una misma tabla de contingencia. Manteniendo las variables sexo y catlab como variables fila y columna , respectivamente:

| Seleccionar la variable minoría (clasificación étnica) y, utilizando el correspondiente

botón flecha, trasladarla a la lista del recuadro Capa 1 de 1 (ver figura 12.1).

Aceptando estas selecciones, el Visor ofrece los resultados que muestra la tabla 12.3.

Tabla 12.3. Tabla de contingencia de sexo por categoría laboral , segmentada por clasificación étnica.

Con los botones Siguiente y Anterior del recuadro Capa # de # (figura 12.1) podemos obtener tablas de contingencia para los distintos niveles resultantes de combinar dos o más variables de segmentación. Para cruzar, por ejemplo, las variables sexo y categoría laboral y obtener una tabla separada para cada uno de los niveles resultantes de combinar las variables minoría (clasificación étnica) y estudios (nivel de estudios):

| Seleccionar la variable minoría como variable de segmentación en la primera capa y

pulsar el botón Siguiente.

| Seleccionar la variable estudios como variable de segmentación en la segunda capa.

| Utilizar el botón Anterior para ver o cambiar la variable seleccionada en la capa pre-

via.

Al hacer esto, obtenemos una tabla de contingencia con cuatro dimensiones: sexo , catlab , mi- noría y estudios. Conforme vamos creando capas, los valores # del recuadro Capa # de # van indicando el número de la capa actual y el número total de capas definidas.

Estadísticos

El grado de relación existente entre dos variables categóricas no puede ser establecido simple- mente observando las frecuencias de una tabla de contingencia. Incluso aunque la tabla recoja las frecuencias porcentuales en lugar de las absolutas (más tarde veremos que podemos obtener diferentes tipos de frecuencias porcentuales), la simple observación de las frecuencias no puede llevarnos a una conclusión definitiva (aunque sí pueda darnos alguna pista). Para determinar si dos variables se encuentran relacionadas debemos utilizar alguna medida de asociación, pre- feriblemente acompañada de su correspondiente prueba de significación. Para obtener medidas de asociación:

| Pulsar el botón Estadísticos... del cuadro de diálogo Tablas de contingencia (ver figura

12.1) para acceder al subcuadro de diálogo Tablas de contingencia: Estadísticos que muestra la figura 12.3.

Figura 12.3. Subcuadro de diálogo Tablas de contingencia: Estadísticos.

Este cuadro de diálogo contiene una amplia variedad de procedimientos estadísticos (medidas de asociación para variables nominales y ordinales, índices de acuerdo y de riesgo, etc.) dise- ñados para evaluar el grado de asociación existente entre dos variables categóricas en diferen- tes tipos de situaciones.

Por tanto, podemos utilizar la distribución χ^2 para establecer el grado de compatibilidad existente entre el valor del estadístico X^2 y la hipótesis de independencia. Si los datos son compatibles con la hipótesis de independencia, la probabilidad asociada al estadístico X^2 será alta (mayor de 0,05). Si esa probabilidad es muy pequeña (menor que 0,05), consideraremos que los datos son incompatibles con la hipótesis de independencia y concluiremos que las va- riables estudiadas están relacionadas. Para que las probabilidades de la distribución χ^2 constituyan una buena aproximación a la distribución del estadístico X^2 conviene que se cumplan algunas condiciones; entre ellas, que las frecuencias esperadas no sean demasiado pequeñas. Suele asumirse que, si existen frecuen- cias esperadas menores que 5, éstas no deben superar el 20 por ciento del total de frecuencias esperadas. La salida del SPSS ofrece un mensaje indicando el valor de la frecuencia esperada más pequeña; si existe alguna casilla con frecuencia esperada menor que 5, la salida también muestra el porcentaje que éstas representan sobre el total de casillas de la tabla. En el caso de que ese porcentaje supere el 20 por ciento, el estadístico de Pearson debe ser interpretado con cautela.

79,277a^2 , 95,463 2 , 474

Chi-cuadrado de Pearson Razón de verosimilitud N de casos válidos

Valor gl

Sig. asint. (bilateral)

0 casillas (,0%) tienen una frecuencia esperada inferior a

La frecuencia mínima esperada es 12,30.

a.

Ejemplo (Tablas de contingencia > Estadísticos > Chi cuadrado)

Este ejemplo muestra cómo obtener e interpretar el estadístico chi-cuadrado de Pearson en una tabla de contingencia bidimensional.

| En el cuadro de diálogo Tablas de contingencia (ver figura 12.1), seleccionar las va-

riables sexo y categoría laboral como variables fila y columna , respectivamente.

| Pulsar el botón Estadísticos... para acceder al subcuadro de diálogo Tablas de contin-

gencia: Estadísticos (ver figura 12.3) y marcar la opción Chi cuadrado. Aceptando estas elecciones, el Visor ofrece los estadísticos que muestra la tabla 12.4.

Tabla 12.4. Tabla de estadísticos del procedimiento Tablas de contingencia.

Vemos que el estadístico chi-cuadrado de Pearson toma un valor de 79,277, el cual, en la dis- tribución χ^2 con 2 grados de libertad ( gl ), tiene asociada una probabilidad ( Sig. asint. = Signi- ficación asintótica ) de 0,000. Puesto que esta probabilidad (denominada nivel crítico o nivel de significación observado ) es muy pequeña, decidimos rechazar la hipótesis de independencia y concluir que las variables sexo y catlab están relacionadas. Además del estadístico chi-cuadrado , la tabla muestra otro estadístico denominado razón de verosimilitud (Fisher, 1924; Neyman y Pearson, 1928), que se obtiene mediante:

Se trata de un estadístico asintóticamente equivalente a X^2 (se distribuye e interpreta igual que X^2 ) y es muy utilizado para estudiar la relación entre variables categóricas, particularmente en el contexto de los modelos log-lineales. Cuando la tabla de contingencia se construye con dos variables dicotómicas (tablas 2×2), los resultados incluyen información adicional. Utilizando, por ejemplo, la variable sexo como

Correlaciones

La opción Correlaciones (ver figura 12.3) permite obtener dos coeficientes de correlación: el de Pearson y el de Spearman. Ambos se describen con detalle en el capítulo 16. El coeficiente de correlación de Pearson es una medida de asociación lineal especialmente apropiada para estudiar la relación entre variables de intervalo o razón. El coeficiente de correlación de Spearman es también una medida de asociación lineal , pero para variables ordinales. Ambos coeficientes poseen escasa utilidad para estudiar las pautas de relación presentes en una tabla de contingencia típica, pues lo habitual es utilizar las tablas de contingencia para cruzar variables de tipo nominal o, a lo sumo, de tipo ordinal con sólo unos pocos niveles.

Datos nominales

El estadístico chi-cuadrado de Pearson permite contrastar la hipótesis de independencia en una tabla de contingencia, pero no nos dice nada sobre la fuerza de la asociación entre las variables estudiadas. Esto es debido a que su valor depende, no sólo del grado en que los datos se ajustan al modelo de independencia, sino del número de casos de que consta la muestra. Con tamaños muestrales muy grandes, diferencias relativamente pequeñas entre las frecuencias observadas y las esperadas pueden dar lugar a valores chi-cuadrado demasiado altos. Por esta razón, para estudiar el grado de relación existente entre dos variables se utilizan medidas de asociación que intentan cuantificar ese grado de relación eliminando el efecto del tamaño muestral. Existen diversas medidas de asociación que, no sólo difieren en la forma de definir lo que es asociación perfecta e intermedia, sino en la forma en que cada una se ve afectada por facto- res tales como las distribuciones marginales. De hecho, una medida puede arrojar un valor bajo en una situación concreta, no porque las variables estudiadas no estén relacionadas, sino porque esa medida no sea sensible al tipo de relación presente en los datos. Para seleccionar una medida concreta, además de las características particulares de cada medida, hay que tener en cuenta cosas tales como el tipo de variables estudiadas y la hipótesis que interesa contrastar. En ningún caso está justificado obtener todas las medidas disponibles para seleccionar aquella cuyo valor se ajusta mejor a nuestros intereses. Conviene señalar que las medidas nominales sólo aprovechan información nominal. Úni- camente informan del grado de asociación existente, no de la dirección o naturaleza de tal aso- ciación.

Medidas basadas en chi -cuadrado. Son medidas que intentan corregir el valor del estadístico X^2 para hacerle tomar un valor entre 0 y 1, y para minimizar el efecto del tamaño de la muestra sobre la cuantificación del grado de asociación (Pearson, 1913; Cramer, 1946).

G Coeficiente de contingencia :. Toma valores entre 0 y 1, pero difícil-

mente llega a 1. Su valor máximo depende del número de filas y de columnas. Si el número de filas y de columnas es el mismo ( k ), entonces el valor máximo de C se obtiene de la siguiente manera:. Un coeficiente de 0 indica independencia, mientras que un coeficiente que alcanza su valor máximo indica asociación perfecta.

G Phi y V de Cramer. El coeficiente phi se obtiene de la siguiente manera:.

En tablas de contingencia 2×2, phi adopta valores entre 0 y 1, y su valor es idéntico al del coeficiente de correlación de Pearson (ver capítulo 16).

entre las mujeres (con un error de (86+6+0)/474 = 0,1941), estaremos cometiendo un error de clasificación de 0,1772+0,1941 = 0,3713. Actuando de esta segunda manera hemos conseguido reducir el error de clasificación en 0,0802 (de 0,4515 a 0,3713), lo cual repre- senta una proporción de reducción de 0,0802/0,4515 = 0,1776, que es justamente el valor que toma lambda en los estadísticos de la tabla 12.6.c cuando consideramos la variable grupos de salario como variable dependiente. Lambda tiene tres versiones: dos asimétricas (para cuando una de las dos variables se considera independiente y la otra dependiente) y una simétrica (para cuando no existe ra- zón para distinguir entre variable independiente y dependiente). La salida del SPSS incluye las tres versiones. Lambda toma valores entre 0 y 1. Un valor de 0 indica que la variable independiente (la variable utilizada para efectuar pronósticos) no contribuye en absoluto a reducir el error de predicción. Un valor de 1 indica que el error de predicción se ha conseguido reducir por completo, es decir, que la variable independiente permite predecir con toda precisión a qué categoría de la variable dependiente pertenecen los casos clasificados. Cuando dos varia- bles son estadísticamente independientes, lambda vale 0. Pero un valor de 0 no implica in- dependencia estadística, pues lambda únicamente es sensible a un tipo particular de asocia- ción: a la derivada de la reducción en el error que se consigue al predecir las categorías de una variable utilizando las de la otra. No existe ningún índice de asociación sensible a todo tipo de asociación posible.

La medida de asociación tau se parece a lambda , pero se basa en una lógica algo diferente. Al pronosticar a qué categoría de la variable grupos de salario pertenece un grupo de sujetos, podemos asignar aleatoriamente el 100(143/474) = 30,17 % a la categoría “menos de 25.000 $”, el 100(260/474) = 54,85 % a la categoría “entre 25.000 y 50.000 $”, etc., basándonos en la probabilidad de pertenecer a cada categoría, en lugar de considerar sólo la categoría más probable, como hemos hecho con lambda. Procediendo de esta manera estaremos clasificando correctamente al 30,17 % de los 143 sujetos del grupo “menos de 25.000 $”, al 54,85 % de los 260 sujetos con salarios “entre 25.000 y 50.000 $”, etc. Lo cual representa una proporción de clasificación correcta global de 0,4061 y, por tanto, una

proporción de clasificación errónea de 1n0,4061 = 0,5939.

En lugar de esto, podemos tener en cuenta la variable sexo y, entre los varones, asig- nar aleatoriamente el 100(19/258) = 7,36 % a la categoría “menos de 25.000 $", el 100(174/258) = 67,44 % a la categoría “entre 25.000 y 50.000 $", etc.; y entre las mujeres, asignar aleatoriamente el 100(124/216) = 57,41 % a la categoría “menos de 25.000 $", el 100(86/216) = 39,81 % a la categoría “entre 25.000 y 50.000 $"; etc. Al final, estaremos

clasificando de forma correcta al 49,45 % de los sujetos y, por tanto, estaremos efectuando

pronósticos erróneos con una probabilidad de 1n0,4945 = 0,5055.

Procediendo de esta segunda manera reducimos la probabilidad de efectuar pronós- ticos erróneos en 0,0884 (la diferencia entre 0,5939 y 0,5055). Por lo que habremos conse- guido reducir la probabilidad de error en una proporción de 0,0884/0,5939 = 0,149, que es justamente el valor que toma la tau de Goodman y Kruskal en los estadísticos de la tabla 12.6.c cuando consideramos la variable grupos de salario como dependiente. Al igual que lambda , tau también toma valores entre 0 y 1, significando el 0 ausencia de reducción del error de clasificación y el 1 reducción completa.

G Coeficiente de incertidumbre (Theil, 1970). Al igual que lambda y tau, el coeficiente de

incertidumbre es una medida de asociación basada en la reducción proporcional del error. Por tanto, es una medida que expresa el grado de incertidumbre que conseguimos reducir cuando utilizamos una variable para efectuar pronósticos sobre otra. Posee dos versiones asimétricas (dependiendo de cuál de las dos variables considere- mos dependiente) y una simétrica (para cuando no hacemos distinción entre variable inde- pendiente y dependiente). Se obtiene de la siguiente manera:

donde:

n (^) i = frecuencias marginales de las filas n (^) j = frecuencias marginales de las columnas n (^) ij = frecuencias de las casillas ( n (^) ij > 0)

Para obtener I (^) X|Y basta con intercambiar los papeles de I(X) e I(Y). Y la versión simétrica se obtiene multiplicando I (^) Y|X por 2 después de añadirle I(X) al denominador.

,333 ,048 6,054 , ,486 ,040 9,596 , ,178 ,061 2,641 , ,325 ,036 ,000 c ,149 ,024 ,000 c ,210 ,026 7,948 ,000 d ,266 ,033 7,948 ,000 d ,173 ,021 7,948 ,000 d

Simétrica Sexo dependiente Grupos de salario dependiente Sexo dependiente Grupos de salario dependiente Simétrica Sexo dependiente Grupos de salario dependiente

Lambda

Tau de Goodman y Kruskal

Coeficiente incertidumbre

Valor

Error típ. asint.a^

T aproximada b^

Sig. aproximada

a.No asumiendo la hipótesis nula. b.Empleando el error típico asintótico basado en la hipótesis nula. c.Basado en la aproximación chi-cuadrado. d.Probabilidad del chi-cuadrado de la razón de verosimilitud.

Tabla 12.6.c. Medidas de asociación direccionales del procedimiento Tablas de contingencia.

La primera tabla (12.6.a) recoge las frecuencias resultantes de cruzar las variables sexo y gru- pos de salario. Las otras dos tablas (12.6.b y 12.6.c) muestran las medidas de asociación para datos nomi- nales recién estudiadas. Cada medida aparece acompañada de su correspondiente nivel crítico ( Sig. aproximada ), el cual permite decidir sobre la hipótesis de independencia: puesto que el nivel crítico de todas las medidas listadas es muy pequeño (menor que 0,05 en todos los casos), podemos rechazar la hipótesis nula de independencia y concluir que las variables sexo y grupos de salario están relacionadas. En la tabla 12.6.c, junto con el valor concreto adoptado por cada medida de asociación aparece su valor estandarizado ( T aproximada ), que se obtiene dividiendo el valor de la medida entre su error típico (calculado éste suponiendo independencia entre las variables). La tabla también ofrece el error típico de cada medida calculado sin suponer independencia ( Error típi- co asintótico ). Además de las medidas de asociación, las tablas recogen notas aclaratorias acerca de as- pectos tales como bajo qué condiciones se hacen algunos cálculos, cómo se obtienen algunos de los niveles críticos que se ofrecen, cuál es el motivo de que no se puedan efectuar algunos cálculos, etc.

Datos ordinales

El apartado Datos ordinales recoge una serie de medidas de asociación que permiten apro- vechar la información ordinal que las medidas diseñadas para datos nominales pasan por alto. Con datos ordinales ya tiene sentido hablar de la dirección de la relación: una relación positiva indica que los valores altos de una variable se asocian con los valores altos de la otra, y los valores bajos, con valores bajos; una relación negativa indica que los valores altos de una va- riable se asocian con los valores bajos de la otra, y los valores bajos con valores altos. Muchas de las medidas de asociación diseñadas para estudiar la relación entre variables ordinales se basan en el concepto de inversión y no inversión. Si los dos valores de un caso en ambas variables son mayores (o menores) que los dos valores de otro caso, decimos que entre esos casos se da una no inversión ( P ). Si el valor de un caso en una de las variables es mayor que el de otro caso, y en la otra variable el valor del segundo caso es mayor que el del primero, decimos que se da una inversión ( Q ). Si dos casos tienen valores idénticos en una o en las dos variables, decimos que se da un empate ( E ). Cuando predominan las no inversiones , la relación es positiva: conforme aumentan (o disminuyen) los valores de una de las variables, aumentan (o disminuyen) los de la otra. Cuando predominan las inversiones , la relación es negativa: conforme aumentan (o disminuyen) los valores de una de las variables, disminuyen (o aumen- tan) los de la otra. Todas las medidas de asociación recogidas en este apartado utilizan en el numerador la di- ferencia entre el número de inversiones y no inversiones resultantes de comparar cada caso con cada otro, pero se diferencian en el tratamiento dado a los empates ( ver Somers, 1962; Ken- dall, 1963; Goodman y Kruskal, 1979).

G Gamma. Uno de los coeficientes más conocidos es el coeficiente gamma (γ) de Goodman

y Kruskal:

γ = ( n P n n Q ) / ( n P + n Q )

Si la relación entre dos variables es perfecta y positiva, todos los pares (comparaciones

entre casos) serán no inversiones y, consiguientemente, n P n n Q será igual a n P + n Q , en cuyo

caso, γ = 1. Si la relación entre las variables es perfecta, pero negativa, todos los pares

serán inversiones y, en consecuencia, n P n n Q será igual a n( n P + n Q ), de donde γ = n1. Si

las variables son independientes, habrá tantas inversiones como no inversiones : n (^) P = n (^) Q ;

spss contingencia, Apuntes de Estadística

Documentos relacionados

Vista previa parcial del texto

¡Descarga spss contingencia y más Apuntes en PDF de Estadística solo en Docsity!

Capítulo 12

Análisis de variables categóricas:

El procedimiento Tablas de contingencia

Tablas de contingencia

| Seleccionar la opción Estadísticos descriptivos > Tablas de contingencia del menú

Ejemplo (Tablas de contingencia)

| En el cuadro de diálogo Tablas de contingencia (ver figura 12.1), seleccionar la varia-

| Seleccionar la variable categoría laboral y, mediante el correspondiente botón flecha,

| Marcar la opción Mostrar los gráficos de barras agrupadas.

Ejemplo (Tablas de contingencia segmentadas)

| Seleccionar la variable minoría (clasificación étnica) y, utilizando el correspondiente

| Seleccionar la variable minoría como variable de segmentación en la primera capa y

| Seleccionar la variable estudios como variable de segmentación en la segunda capa.

| Utilizar el botón Anterior para ver o cambiar la variable seleccionada en la capa pre-

Estadísticos

| Pulsar el botón Estadísticos... del cuadro de diálogo Tablas de contingencia (ver figura

Ejemplo (Tablas de contingencia > Estadísticos > Chi cuadrado)

| En el cuadro de diálogo Tablas de contingencia (ver figura 12.1), seleccionar las va-

| Pulsar el botón Estadísticos... para acceder al subcuadro de diálogo Tablas de contin-

Correlaciones

Datos nominales

G Coeficiente de contingencia :. Toma valores entre 0 y 1, pero difícil-

G Phi y V de Cramer. El coeficiente phi se obtiene de la siguiente manera:.

proporción de clasificación errónea de 1n0,4061 = 0,5939.

pronósticos erróneos con una probabilidad de 1n0,4945 = 0,5055.

G Coeficiente de incertidumbre (Theil, 1970). Al igual que lambda y tau, el coeficiente de

Datos ordinales

G Gamma. Uno de los coeficientes más conocidos es el coeficiente gamma (γ) de Goodman

γ = ( n P n n Q ) / ( n P + n Q )

entre casos) serán no inversiones y, consiguientemente, n P n n Q será igual a n P + n Q , en cuyo

serán inversiones y, en consecuencia, n P n n Q será igual a n( n P + n Q ), de donde γ = n1. Si

de modo que n P n n Q = 0 y γ = 0. Así pues, γ oscila entre n1 y 1. Si dos variables son esta-