Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Capítulo VII: Estadística de Atributos - Análisis de Frecuencias y Medidas de Relación - P, Apuntes de Estadística

En este capítulo se presenta el análisis de atributos, herramienta estadística utilizada para recoger información observada sobre características cualitativas de elementos de una población. Se explica cómo se miden atributos en escala ordinal y nominal, así como el análisis unidimensional y bidimensional. Se tratan temas como la distribución de frecuencias, representaciones gráficas y medidas características en el caso unidimensional, y el análisis de tablas de contingencia y medidas de grado de relación en el caso bidimensional.

Tipo: Apuntes

2014/2015

Subido el 26/05/2015

haridian_rm
haridian_rm 🇪🇸

4

(3)

6 documentos

1 / 6

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
1
Capítulo VII. Estadística de atributos
Recordar que un atributo es una herramienta estadística que se utiliza para recoger la
información observada sobre una o varias características de naturaleza cualitativa de los
elementos de una población. Todo atributo presenta diferentes categorías de
clasificación, mutuamente excluyentes, que constituyen sus modalidades. Si las
modalidades del atributo se pueden ordenar se dice que el atributo se mide en escala
ordinal (ejemplo: el nivel de estudios), en cambio, cuando las modalidades no admiten
ningún tipo de ordenación, se dice que el atributo se mide en escala nominal (ejemplo:
el género).
En ocasiones, las modalidades de un atributo se expresan numéricamente y, por tanto,
pueden ser tratadas como valores de una variable estadística, no obstante, conviene no
olvidar el significado original de las mismas.
7.1. Análisis unidimensional: distribución de frecuencias, representación gráfica y
medidas características
En el análisis unidimensional se considera sólo una característica de naturaleza
cualitativa de los elementos de la población objeto de estudio.
Distribución de frecuencias
Sea X un atributo unidimensional y sean
i
x
( n,...,1i
=
) sus distintas modalidades. La
distribución de frecuencias de dicho atributo puede representarse de las siguientes
formas:
n,...,1i)n,x(
ii
=
n,...,1i)f,x(
ii
=
Siendo
i
n
la frecuencia absoluta de la modalidad i-ésima que representa el número de
veces que se observa dicha modalidad y
N
n
f
i
i
=, la frecuencia relativa de la i-ésima
modalidad que indica la proporción de elementos de la población que tienen esa
modalidad. Las frecuencias absolutas y relativas acumuladas sólo se pueden obtener
para atributos de naturaleza ordinal.
Representación gráfica
Las representaciones gráficas más utilizadas son el
diagrama de barras
, que es
equivalente al explicado para variables estadísticas, sólo que en este caso en el eje de
abscisas se ponen las modalidades del atributo en lugar de los valores de la variable y el
diagrama circular o gráfico de sectores
, que consiste en dividir un círculo en tantos
sectores como modalidades tenga el atributo de tal manera que sus áreas sean
proporcionales a las frecuencias absolutas de las distintas modalidades.
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga Capítulo VII: Estadística de Atributos - Análisis de Frecuencias y Medidas de Relación - P y más Apuntes en PDF de Estadística solo en Docsity!

Capítulo VII. Estadística de atributos

Recordar que un atributo es una herramienta estadística que se utiliza para recoger la información observada sobre una o varias características de naturaleza cualitativa de los elementos de una población. Todo atributo presenta diferentes categorías de clasificación, mutuamente excluyentes, que constituyen sus modalidades. Si las modalidades del atributo se pueden ordenar se dice que el atributo se mide en escala ordinal (ejemplo: el nivel de estudios), en cambio, cuando las modalidades no admiten ningún tipo de ordenación, se dice que el atributo se mide en escala nominal (ejemplo: el género).

En ocasiones, las modalidades de un atributo se expresan numéricamente y, por tanto, pueden ser tratadas como valores de una variable estadística, no obstante, conviene no olvidar el significado original de las mismas.

7.1. Análisis unidimensional: distribución de frecuencias, representación gráfica y medidas características

En el análisis unidimensional se considera sólo una característica de naturaleza cualitativa de los elementos de la población objeto de estudio.

Distribución de frecuencias

Sea X un atributo unidimensional y sean xi ( i = 1 ,...,n) sus distintas modalidades. La

distribución de frecuencias de dicho atributo puede representarse de las siguientes formas:

(x (^) i ,ni)i= 1 ,..., n ( xi ,fi)i= 1 ,..., n

Siendo n (^) i la frecuencia absoluta de la modalidad i-ésima que representa el número de

veces que se observa dicha modalidad y N

n f (^) i = i, la frecuencia relativa de la i-ésima

modalidad que indica la proporción de elementos de la población que tienen esa modalidad. Las frecuencias absolutas y relativas acumuladas sólo se pueden obtener para atributos de naturaleza ordinal.

Representación gráfica

Las representaciones gráficas más utilizadas son el diagrama de barras, que es equivalente al explicado para variables estadísticas, sólo que en este caso en el eje de abscisas se ponen las modalidades del atributo en lugar de los valores de la variable y el diagrama circular o gráfico de sectores, que consiste en dividir un círculo en tantos sectores como modalidades tenga el atributo de tal manera que sus áreas sean proporcionales a las frecuencias absolutas de las distintas modalidades.

Diagrama de barras

x i

ni

1

2

3

4

SE P S U

Diagrama circular

Sin Estudios SE

Primarios

Secundarios

Universitarios

En ciertos casos también se puede recurrir al diagrama de Pareto, que es similar al diagrama de barras pero las modalidades deben estar ordenadas de mayor a menor frecuencia, además, en dicho diagrama se dibuja una línea que representa las frecuencias acumuladas, por tanto, no puede ser utilizado para atributos nominales. También se puede utilizar el llamado pictograma en el que se utilizan dibujos alusivos a las modalidades del atributo cuyos tamaños son proporcionales a sus frecuencias abs.

Diagrama de Pareto

ni

1

2

3

4

SE P S U x i

7

9

10

Pictograma

Sin Estudios E. Primarios E. Secundarios E. Universitarios

Las distribuciones marginales y las distribuciones condicionadas se obtienen de manera análoga al caso de variables estadísticas.

Representación gráfica

Para representar gráficamente la distribución de un atributo bidimensional se puede recurrir a los diagramas rectangulares que muestran la distribución de frecuencias de un atributo entre los casos correspondientes a una modalidad concreta del otro.

1

2

3

4

SE

P

S

U

7

9

10

5

6

8

Hombres Mujeres

SE

P

S

n

SE

P

S

U

Hombres Mujeres

SE

P

S f

También están las representaciones mixtas como las pirámides de población que se utilizan para recoger la estructura de edades y géneros de una población.

10

20

40

70

90

100

50

60

80

Hombres (^) Mujeres

30

Véanse ejemplos 7.2 y 7.3 del libro “Conceptos Básicos de Estadística para Ciencias Sociales”.

Medidas del grado de relación

Coeficientes de correlación para caracteres ordinales

Estos coeficientes examinan tanto la intensidad como el sentido de la relación entre dos atributos ordinales. Los más utilizados son el coeficiente de correlación por rangos de Spearman, el coeficiente de correlación de Kendall y el coeficiente de correlación de Goodman-Kruskal, sin embargo, en clase sólo se estudiará el primero de ellos.

Coeficiente de correlación por rangos de Spearman

Sea (X,Y) un atributo bidimensional, en el que tanto X como Y son de naturaleza

ordinal, y sean N pares de modalidades {( x i ,yi)}i = 1 ,...,N, si definimos:

  • R Xi: el rango del carácter o modalidad i-ésima de X, es decir, el lugar que ocupa dicha modalidad una vez ordenadas todas de menor a mayor (si más de un individuo presenta la misma modalidad, a cada uno de ellos se le asignará el mismo rango; dicho rango se calculará como el promedio de los rangos que les hubiesen correspondido si no se hubiese dado esa coincidencia).
  • R Yi: el rango del carácter o modalidad i-ésima de Y, es decir, el lugar que ocupa dicha modalidad una vez ordenadas todas de menor a mayor.

El coeficiente de Spearman se puede calcular de la siguiente manera:

N^2

i 1

Y Y i

N^2

i 1

X X i

Y Y i

N

i 1

X X i S R R R R

R R R R

r

= =

=

− −

Siendo:

= =

= =

N

i 1

Y Y i N

i 1

X X i N

R y R N

R R

Los rangos son variables estadísticas y el coeficiente de Spearman es el coeficiente de correlación lineal de los rangos, por tanto, toma valores en el siguiente intervalo:

− 1 ≤rS ≤+ 1

rS =− 1 ⇒discordancia perfecta rS =+ 1 ⇒concordancia perfecta rS = 0 ⇒noexisterelación lineal

Si existe discordancia los atributos se mueven en sentidos opuestos y si existe concordancia los atributos se mueven en el mismo sentido. El valor del coeficiente en términos absolutos indica, además, la intensidad de la relación lineal entre ambos atributos, de tal manera que cuanto más próximo esté a 1 mayor será la intensidad y cuanto más próximo esté a 0 menor será la intensidad.