Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Estadística categóricos, Diapositivas de Estadística

Estadística Categóricos Grado de Criminología

Tipo: Diapositivas

2018/2019

Subido el 04/12/2019

juliuss1310
juliuss1310 🇪🇸

5

(2)

5 documentos

1 / 14

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
1
CURSODEINTRODUCCIÓNALAESTADÍSTICA
Departamentd’EstadísticaiInvestigacióOperativa
UniversitatdeValència
DATOS CATEGÓRICOS TEMA 6
CURSO DE INTRODUCCIÓN A LA ESTADÍSTICA
Departament d’Estadística i Investigació Operativa
Universitat de València
Departament d'Estadística i Investigació Operativa. 2
Variables categóricas
Los valores de la variable no son numéricos, son categorías
Opinión sobre un tema (A favor / En contra / Indiferente)
Estado civil (casado, soltero, viudo)
Nacionalidad
Caso particular : Variables dicotómicas (sólo 2 valores posibles)
Sexo
Fumador
Interesa saber la proporción de personas de cada grupo
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe

Vista previa parcial del texto

¡Descarga Estadística categóricos y más Diapositivas en PDF de Estadística solo en Docsity!

CURSO DE INTRODUCCIÓN A LA ESTADÍSTICA

Departament d’Estadística i Investigació Operativa Universitat de València

DATOS CATEGÓRICOS TEMA 6

CURSO DE INTRODUCCIÓN A LA ESTADÍSTICA Departament d’Estadística i Investigació Operativa Universitat de València

Departament d'Estadística i Investigació Operativa. 2

Variables categóricas

  • Los valores de la variable no son numéricos, son categorías
    • Opinión sobre un tema (A favor / En contra / Indiferente)
    • Estado civil (casado, soltero, viudo)
    • Nacionalidad
  • Caso particular : Variables dicotómicas (sólo 2 valores posibles)
    • Sexo
    • Fumador
  • Interesa saber la proporción de personas de cada grupo
CURSO DE INTRODUCCIÓN A LA ESTADÍSTICA

Departament d’Estadística i Investigació Operativa Universitat de València

Departament d'Estadística i Investigació Operativa. (^3)

X

p n (tamaño muestral)

Intervalo de confianza para una proporción

z0.05 : percentil de la normal N(0,1)

Muestra

Población

p : proporción poblacional Variable :̂݌ proporción muestral dicotómica

Intervalo de confianza para p al 95%

Departament d'Estadística i Investigació Operativa. 4

Intervalo de confianza para una proporción

p  

Obtención del Intervalo de confianza al 95% parap : IC95% (p)

p p p z n

En una muestra aleatoria de 150 varones estadounidenses, 87 de ellos estaban a favor de la pena de muerte para convictos de asesinato. Construir un intervalo de confianza al 95% para la proporción de varones de Estados Unidos a favor de la pena de muerte.

0.50 < p < 0.66 con una confianza del 95%

Esta es la proporción muestral (estimación de la poblacional)

CURSO DE INTRODUCCIÓN A LA ESTADÍSTICA

Departament d’Estadística i Investigació Operativa Universitat de València

Departament d'Estadística i Investigació Operativa. 7

El test ^2 de bondad del ajuste

Un estudio de los jurados en Alameda County, California, comparó las características demográficas de los jurados con la población general, para ver si los miembros de los jurados eran representativos de la población. La Tabla muestra los resultados por edades. Los investigadores querían saber si los 66 miembros de los jurados habían sido seleccionados al azar de la población del condado.

Edad

% en el condado

Miembros en los jurados 21-40 42 5 41-50 23 9 51-60 16 19 61 ó más 19 33 Total 100 66

Departament d'Estadística i Investigació Operativa. 8

X

1 2  k

p p

p

n

p ˆ 1  p ˆ k

¿Es la muestra compatible con un modelo de proporciones dado? ¿Se ajustan las proporciones de la muestra a las de la hipótesis? p 1 (^)  p ˆ 1 (^) , p (^) 2  p ˆ (^) 2 ,  , pkp ˆ k

p p p p p p

1 2 k 1 2 k

, ,…, son proporciones poblacionales conjeturadas tales que + +…+ = 1

El test ^2 de bondad del ajuste

Muestra Población

Variable categórica con k categorías

pi : proporción poblacional de la categoría i. ̂݌௜ : proporción muestral de la categoría i.

CURSO DE INTRODUCCIÓN A LA ESTADÍSTICA

Departament d’Estadística i Investigació Operativa Universitat de València

Departament d'Estadística i Investigació Operativa. 9

El estadístico ^2

H 0 : Los porcentajes de los jurados son compatibles con 42:23:16: H 1 : Los porcentajes de los jurados no son compatibles con esos porcentajes

Oi = frecuencias observadas (los datos) Ei = frecuencias esperadas (si H 0 fuera cierta)

Cuanto mayor es el estadístico, mayor es la discrepancia con H (^0)

2 2 s

o

sigue una distribución con (k-1) grados de libertad cuando H es cierta.

2 2

1

( )

  (^) 

k i i s i (^) i

O E

E

En el ejemplo obtenemos ^2 = 61,24 con 3 grados de libertad, que

tiene un p‐valor = 3.2E‐13, luego rechazamos H 0.

EL P-VALOR CON EXCEL

Función: DISTR.CHI (x, gl)  x= valor buscado (^2 s )  gl = grados de libertad  Ejemplo: ^2 s =61.24, gl=

10

(^60)  s 2 80

p‐valor

CURSO DE INTRODUCCIÓN A LA ESTADÍSTICA

Departament d’Estadística i Investigació Operativa Universitat de València

TABLAS DE CONTINGENCIA 2 2

Departament d'Estadística i Investigació Operativa. 13

En una investigación sobre sobre género y delincuencia, Moffit y sus colegas indican que una posible razón por la que los hombres tienden a cometer más delitos que las mujeres es porque tienden a experimentar más “emociones negativas” (como ira o ansiedad). Para estudiar esta relación entre género y emociones negativas, hemos tomado una muestra de 120 adolescentes y los hemos clasificado respecto de 2 variables :

Emoción negativa Género Baja Alta Mujer 46 14 Hombre 44 16

¿Los hombres tienen más emociones negativas que las mujeres?

‐ Género (Mujer / Hombre) ‐ Emocionalidad negativa (Baja /Alta)

Departament d'Estadística i Investigació Operativa. 14

TABLAS DE CONTINGENCIA 2 2

Frecuencias esperadas

11 12

21 22

 ^ 
 ^ ^ ^ 
 ^ 
E E
E E

Emoción negativa

Género Baja Alta Total

Mujer 46 (45) 14 (15) 60

Hombre 44 (45) 16 (15) 60

Total 90 30 120

CURSO DE INTRODUCCIÓN A LA ESTADÍSTICA

Departament d’Estadística i Investigació Operativa Universitat de València

TEST DE INDEPENDENCIA

Departament d'Estadística i Investigació Operativa. 15

H 0 : El sexo y la emocionalidad negativa son independientes H 1 : Hay más emocionalidad negativa entre los hombres

2 2 2 2

1 1

 

ij ij s i j (^) ij

O E

E

Oij = frecuencias observadas (los datos) Eij = frecuencias esperadas (si H 0 fuera cierta)

ij 
total fila i total columna j
E
total global

Si H 0 es cierta la distribución del estadístico es una ^2 con gl=

(^2 2 2 2 ) 2 1

( ) (^) (46 45) (14 15) (44 45) (16 15) 45 15 45 15 0.022 0.067 0.022 0. = 0.

k (^) ij ij s i ij

O E E  

 (^)          

    

Departament d'Estadística i Investigació Operativa. 16

TABLAS DE CONTINGENCIA 2 2

  • Direccionalidad: Se cumple pues la proporción de emoción negativa es mayor en los hombres 16/60 que en las mujeres 14/60.
  • Estadístico test:
  • p-valor: Tabla de ^2 con 1 grado de libertad: p-valor (bilateral) = 0.
  • Pero nuestro contraste es unilateral y hemos comprobado la direccionalidad luego el p-valor (unilateral) = 0,34 > 0,05 (No significativo)
  • Decisión: No rechazar H 0 No hay evidencia de que la emoción negativa dependa del sexo.
CURSO DE INTRODUCCIÓN A LA ESTADÍSTICA

Departament d’Estadística i Investigació Operativa Universitat de València

Para establecer diferencias significativas necesitamos la tabla de frecuencias esperadas que es la tabla que esperaríamos obtener si no hubiese diferencias poblacionales entre las proporciones.

FRECUENCIAS ESPERADAS

Datos categóricos 19

ij

total fila i total columna j E Edad en el primer total global nacimiento  30 años  29 años Total Caso 521,6 2698,4 3220 Control 1659,4 8585,6 10245 Total 2181 11284 13465

COMPARACIÓN DE 2 PROPORCIONES

Datos categóricos 20

El valor que toma el estadístico es

2 2 2 2 2 683 521,6^2537 2698,4^1498 1659, 4^8747 8585,6^ 78. s 521,6 2698, 4 1659, 4 8585,          

La función de distribución de Excel de la Chi cuadrado con 1 g.l.:

DISTR.CHI (78.33, 1)= 8.5E‐

como el contraste es unilateral, el p‐valor = 8.5E‐19 / 2 = 4.3E‐19 << 0.05. Es decir rechazamos que las dos proporciones coincidan en la población: La proporción de mujeres con su primer hijo después de los 30 años es significativamente mayor entre las mujeres con cáncer de pecho que entre las que no lo tienen.

CURSO DE INTRODUCCIÓN A LA ESTADÍSTICA

Departament d’Estadística i Investigació Operativa Universitat de València

TABLAS DE CONTINGENCIA R X K

Departament d'Estadística i Investigació Operativa. 21

Variable categórica

B 1 B 2 ∙∙∙∙∙ Bk

Variable categóricaA 1 O 11 O 12 ∙∙∙∙∙^ O1k A 2 O 21 O 22 ∙∙∙∙∙ O2k ∙∙∙∙∙ ∙∙∙∙∙ ∙∙∙∙∙ ∙∙∙∙∙ Ar Or1 Or2 ∙∙∙∙∙ Ork

Frecuencia observada para A 2 B 2

Tabla rk

En la tabla de frecuencias observadas, las filas/columnas pueden representar :  1 variable con r categorías y k muestras: Test de homogeneidad  1 muestra con 2 variables ( r y k categorías resp.): Test de independencia

EJEMPLO 2 VARIABLES

La tabla muestra la distribución conjunta de dos variables:

  • Estatus socioeconómico del barrio
  • Rapidez de respuesta de la policía a llamadas al 911

Tiempo de respuesta de la policía Estatus Menos de 3’ Entre 3’ y 7’ Más de 7’ Total Bajo 11 17 35 63 Medio 16 24 13 53 Alto 48 20 7 75 Total 75 61 55 191

Departament d'Estadística i Investigació Operativa. 22

¿Hay dependencia entre el estatus y el tiempo de respuesta?

CURSO DE INTRODUCCIÓN A LA ESTADÍSTICA

Departament d’Estadística i Investigació Operativa Universitat de València

Departament d'Estadística i Investigació Operativa. 25

TEST DE HOMOGENEIDAD

La tabla muestra la distribución observada de los tipos sanguíneos de 3 muestras de afroamericanos procedentes de 3 estados diferentes de Estados Unidos

En este caso tenemos TRES MUESTRAS ( una por cada estado) y UNA VARIABLE categórica (el grupo sanguíneo ) con 4 categorías: Test de Homogeneidad

¿La variable se distribuye de forma homogénea en las tres poblaciones?

Florida Iowa Missouri TOTAL A 122 1781 353 2256 B 117 1351 269 1737 AB 19 289 60 368 0 244 3301 713 4258 TOTAL 502 6722 1395 8619

26

Test de homogeneidad

H 0 : La distribución del grupo sanguíneo es la misma en los 3 estados H 1 : La distribución del grupo sanguíneo no es la misma en los 3 estados

Florida Iowa Missouri TOTAL A 122 (131.4) 1781 (1759.5) 353 (365.1) 2256 B 117 (101.2) 1351 (1354.7) 269 (281.1) 1737 AB 19 (21.4) 289 (287.0) 60 (59.6) 368 0 244 (248.0) 3301 (3320.8) 713 (689.2) 4258 TOTAL 502 6722 1395 8619 Frecuencias observadas (esperadas) (^) Por ejemplo 11

2256 502 8619

E   131.

En este caso r = 4 y k = 3, de forma que gl = (4-1)(3-1) = 6 Obtenemos: p-valor = 0,46 > 0,05 luego no rechazamos H 0 No hay evidencia de que hayan diferencias en la distribución del grupo sanguíneo en los tres estados.

CURSO DE INTRODUCCIÓN A LA ESTADÍSTICA

Departament d’Estadística i Investigació Operativa Universitat de València

Departament d'Estadística i Investigació Operativa. 27

Condiciones de validez de los tests

Para que tanto el test de la bondad del ajuste como los test sobre

tablas de contingencia sean válidos es necesario que el número

de casillas con frecuencia esperada menor que 5 no supere el

20% de las casillas de la tabla.

Por ejemplo, si tenemos una tabla 2x3 entonces el 20% de 6 es

1.2. Lo cual significa que el número máximo de casillas con

frecuencia esperada menor que 5 debe ser uno.

No importa que existan frecuencias observadas menores que 5.