Prepara tus exámenes
Consigue puntos
Orientación Universidad
Vende en Docsity
Docsity AI

Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity

Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium

Orientación Universidad

Vende en Docsity

Docsity AI

Inicia sesión Regístrate

Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity

Busca documentos

Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity

Busca tu universidad

Encuentra los documentos específicos para los exámenes de tu universidad

Video Cursos

Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades

Quiz

Responde a preguntas de exámenes reales y pon a prueba tu preparación

Docsity AINEW

Resume tus documentos, hazles preguntas, conviértelos en quiz y mapas conceptuales

Ver preguntas

Despeja tus dudas leyendo las respuestas a las preguntas que realizaron otros estudiantes como tú

Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium

Compartir documentos

20 Puntos

Por cada documento subido

Responde a las preguntas

5 Puntos

por cada respuesta dada (máx. 1 al día)

Todos los modos para conseguir puntos gratis

Consigue puntos de inmediato

Elige un plan Premium con todos los puntos que necesitas.

Oportunidades de estudio

Elige tu próximo programa de estudio

Ponte en contacto inmediatamente con las mejores universidades del mundo. Busca entre miles de universidades en todo el mundo. Busca entre miles de universidades partner oficiales

Comunidad

Pregúntale a la comunidad

Pide ayuda a la comunidad y resuelve tus dudas de estudio

Ebooks gratuitos

¡Nuestros e-books salva-estudiantes!

Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity

analisis de datos, Apuntes de Análisis Económico

Universidad Complutense de Madrid (UCM)Análisis Económico

Prof. Juan Luis Peñaloza Figueroa

Asignatura: ANALISIS DE DATOS E INFERENCIA, Profesor: JuanLuis Peñaloza Figueroa, Carrera: Comercio, Universidad: UCM

Tipo: Apuntes

2013/2014

Subido el 06/05/2014

saramm_1989 🇪🇸

3.2

(26)

8 documentos

1 / 10

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

ANÁLISIS DE DATOS

CUALITATIVOS

José Vicéns Otero

Eva Medina Moral

Enero 2005

Descubre Apuntes de Análisis Económico Universidad Complutense de Madrid (UCM)

Documentos relacionados

Tablas de contingencia (Cross-tab)

Mercado de Valores

fdadaffdafd

TEMA10ESTADISTICA

Notación población y muestra

TEMA 4. ANÁLISIS DE LA VARIANZA

Técnicas estadísticas Tema 1

tema 1 tecnicas estadisticas multivariables

setp2011

(1)

Tipos y organización de datos en estadística - Prof. Peñaloza Figueroa

Inferencia Estadística: Planteamiento - Prof. Peñaloza Figueroa

(1)

Examen de Creación y Gestión de Bases de Datos de Clientes - Prof. Peñaloza Figueroa

Vista previa parcial del texto

¡Descarga analisis de datos y más Apuntes en PDF de Análisis Económico solo en Docsity!

ANÁLISIS DE DATOS

CUALITATIVOS

José Vicéns Otero

Eva Medina Moral

Enero 2005

1. CONSTRUCCIÓN DE UNA TABLA DE CONTINGENCIA

Para analizar la relación de dependencia o independencia entre dos variables cualitativas nominales o factores, es necesario estudiar su distribución conjunta o tabla de contingencia.

La tabla de contingencia es una tabla de doble entrada, donde en cada casilla figurará el número de casos o individuos que poseen un nivel de uno de los factores o características analizadas y otro nivel del otro factor analizado.

SEXO

HOMBRE MUJER MARGINAL

SI n 11 n 12 n 1. FUMA NO n 21 n 22 n 2. MARGINAL n. 1 n. 2 N

donde nij = número de observaciones que tienen el atributo i y j ni. = número de individuos que tie nen el atributo i (marginal i) n. j = número de individuos que tienen el atributo j (marginal j)

La tabla de contingencia se define por el número de atributos o variables que se analizan conjuntamente y el número de modalidades o niveles de los mismos. El ejemplo propuesto es una tabla de contingencia 2x2, ya que tiene dos atributos (FUMA Y SEXO) y cada uno de ellos tiene dos niveles. Si quisiéramos analizar conjuntamente tres variables nominales, como por ejemplo, Fumar, Sexo y Edad, y esta última variable tuviera tres niveles (<20 años, de 20 a 40 años, >40 años), obtendríamos tres tablas como la anterior, una para cada modalidad de edad y la tabla de contingencia tendría una dimensión 3× 2 ×2.

a) las frecuencias relativas condicionadas son iguales a las frecuencias relativas marginales, es decir:

N

n n

n f A B n

f A B n n

f A B n j j^ •

• •

= = = = = = =^1

1 1 1

1 2 12 1

( 1 / 1 )^11 ( / ) .... ( / )

N

n n

n f A B n

f A B n n

f A B n j j^ •

• •

= = = = = = =^2

2 2 2

2 2 22 2

( 2 / 1 )^21 ( / ) .... ( / )

N

f n n

n f A B ij i i

ij i j^ •

Frecuencias relativas marginales:

N

n f n

n f B A ji j j

ij j i

b) O bien si se cumple que la frecuencia relativa conjunta es igual al produc to de las frecuencias relativas marginales:

N

n x N

n N

n f ( Ai ∩ Bj )= ij = i •^ • j

De esta forma, comparando las frecuencias teóricas esperadas en caso de independencia entre los factores con las frecuencias observadas en la muestra, podremos concluir si existe una relación de dependencia o independencia entre los factores o atributos analizados.

Según la notación de la tabla inicial, y utilizando el concepto frecuentalista de probabilidad, podemos estimar la probabilidad de que se de un suceso determinado a partir de sus frecuencias relativas:

N

n P N

P n N

n Pij = ij ; i • = i • ; • j =^ • j

De esta forma, si las variables son independientes

N

n N

E

P ˆ ij = ij = i •^ ×^ • j

donde E (^) ij sería el número de casos o frecuencia absoluta esperada o teórica en condiciones de independencia. Por lo tanto podremos calcular las frecuencias esperadas:

N

n n E (^) ij i •^ • j

×

En lugar de los E (^) ij , habremos observado los nij. Tendremos tantos valores Eij y

nij como celdas de la matriz, concluyendo que si hay poca diferencia entre estos valores los atributos serán independientes, no pudiéndose afirmar lo mismo en caso contrario. Supuesto que el atributo A tiene n filas y el atributo B, k columnas, la tabla será de orden n×k. Pearson planteó la utilización del estadístico χ^2 para analizar la independencia, definido por:

h i

k j ij ij E

∑∑ n E = =

2 2

χ ˆ

La hipótesis nula a contrastar será la de independencia entre los factores, siendo la hipótesis alternativa la de dependencia entre los factores.

El valor de χ$^2 calculado se compara con el valor tabulado de una χ^2 para un

nivel de confianza determinado y (n-1) (k-1) grados de libertad. Si el valor calculado es mayor que el valor de tablas de una χ ˆ^2 ( n − 1 )( k − 1 ), significará que las diferencias entre las

frecuencias observadas y las frecuencias teóricas o esperadas son muy elevadas y por tanto diremos con un determinado nivel de confianza que existe dependencia entre los factores o atributos analizados.

Resumiendo:

χ^ $^2 > χ^ ˆ^^2 ( n^ − 1 )( k − 1 ) ⇒Rechazar hipótesis nula (dependencia entre las variables)

χ^ $^2 < χ^ ˆ^^2 ( n^ − 1 )( k − 1 ) ⇒Aceptar hipótesis nula (independencia entre las variables)

Valor de la Chi-cuadrado:

h i

k j

ij ij E

∑∑ n E = =

2 2

χ ˆ = 59

( 65 − 57 )^2 + −^2 + −^2 + −^2 = 4,

Dado que el valor calculado de la χ$^2 para un nivel de confianza del 95% (5%

nivel de significación) es mayor que el valor de tablas, se rechaza la hipótesis nula de independencia entre los factores, aceptando por tanto que el sexo de una persona influye en que ésta sea fumadora o no.

Cuando utilicemos el SPSS nos dará el nivel de significación, es decir la probabilidad de rechazar la hipótesis nula siendo cierta y por tanto la probabilidad de equivocarnos si rechazamos la hipótesis nula. Si esta probabilidad es muy pequeña (<0,05), rechazaremos la hipótesis nula y en consecuencia diremos que los atributos son dependientes. Por el contrario, si el nivel de significación fuera superior a 0,05, la probabilidad de equivocarnos si concluyéramos que los factores son dependientes sería muy alta, y por tanto cabría esperar que nos equivocaríamos en nuestra conclusión, y por tanto aceptaremos la hipótesis nula de independencia.

El problema de la χ$^2 es que está influenciada por el tamaño muestral, es decir,

que a mayor número de casos analizados (a mayor N), el valor de la $χ^2 tiende a

aumentar, por lo que cuanto mayor sea la muestra más fácil será que rechacemos la hipótesis nula de independencia, cuando a lo mejor podrían no ser independientes.

Otro aspecto a tener en cuenta a la hora de realizar este contraste, es que para que el contraste sea estadísticamente válido en cada celda de la tabla deberá existir un mínimo de 5 observaciones. Si no fuera así deberemos agregar filas o columnas, siempre y cuando el tipo de información lo permita.

3. PASOS A SEGUIR A TRAVÉS DE SPSS

Vamos a realizar el mismo análisis a través de SPSS.

Para analizar si existe una relación de dependencia o no entre estas dos variables a través de SPSS tendremos que seleccionar en el menú “Analizar” la opción “Estadísticos” y dentro de esta la opción “Tablas de contingencia”. El cuadro de dialogo que aparece es el siguiente:

En esta pantalla debemos seleccionar las variables para las cuales queremos realizar el análisis. Normalmente introduciremos la variable dependiente (en este caso la variable “fumar”) en el apartado correspondiente a filas y la variable independiente (“sexo”) en la casilla correspondiente a columnas.

A continuación debemos seleccionar algunas opciones a través de los distintos botones para que la salida de SPSS sea más completa:

ESTADÍSTICOS:

En esta pantalla será imprescindible señalar la opción Chi-cuadrado, ya que este es el estadístico que nos va a permitir contrastar la relación de dependencia o independencia entre las dos variables objeto de estudio.

La opción de estadísticos también nos permite calcular distintas medidas de asociación para el caso en el que el valor de la Chi-cuadrado indique que existe una relación de

en valor absoluto en una casilla indica que hay más casos, si es positivo, o menos, si es negativo, de los que debería haber en esa casilla si las variables fueran independientes, mientras que un valor comprendido entre +/-1,96 indica que la diferencia entre la frecuencia observada y la esperada es pequeña por lo que las variables en esa casilla tienen un comportamiento de independencia.

FORMATO:

Esta opción permite modificar el orden de las filas (ascendente o descendente).