Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Estadística descriptiva ADE, Apuntes de Estadística Económica

Apuntes sobre estadística empresarial 1 año de ADE

Tipo: Apuntes

2020/2021

Subido el 01/05/2022

maria-blanco-24
maria-blanco-24 🇪🇸

2 documentos

1 / 34

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Por este término se engloban las técnicas que nos permitirán realizar un análisis elemental de las observaciones experimentales
observadas.
Se subdivide en dos bloques :
Estadística primaria : Obtenido un grupo de observaciones experimentales , este apartado nos enseña a ordenarlas
adecuadamente, de modo que se ofrezca una información lo más clara posible.
Estadística derivada o secundaria : Con los datos observados realizaremos ciertos cálculos, obteniendo así unas medidas.
Este bloque temático nos enseña a interpretarlas.
PROCEDIMIENTO A SEGUIR EN UN ESTUDIO ESTADÍSTICO.
El proceso seguido en el estudio estadístico de una cierta característica o variable, puede subdividirse en tres pasos sucesivos :
A RECOGIDA DE DATOS :
Planteado el test o encuesta oportuno y recogidos los datos que correspondan, el primer análisis que realizaremos
es el del tipo de variable que pretendemos estudiar (Cualitativa o Cuantitativa ; Discreta o Continua). Esto
condicionará en gran medida su posterior tratamiento.
B ORGANIZACIÓN DE LOS DATOS :
Determinado el modo de agrupamiento de las observaciones, procedemos a su recuento, construyendo la tabla de
frecuencias. Posteriormente podremos visualizar tales frecuencias de forma gráfica con el diagrama estadístico
apropiado.
C ANÁLISIS FINAL :
La obtención de muy diversas conclusiones respecto de la variable estudiada, se podrá realizar con auxilio de los
diferentes parámetros estadísticos (de centralización , posición , dispersión , etc.)
VARIABLES ESTADÍSTICAS. CLASIFICACIÓN.
El aspecto que deseamos estudiar (edad, sexo, peso, ...) recibe el nombre de VARIABLE ESTADÍSTICA. A lo largo de esta unidad
observaremos, que las técnicas estadísticas a seguir serán diferentes según el tipo de variable objeto de estudio.
La clasificación más tradicional de las variables estadísticas es la siguiente :
CUALITATIVAS
Los valores de las observaciones quedan expresados por características o atributos.
Por ejemplo : Estado civil ; Color preferido ; Nivel de estudios ; Raza ; ...
Dentro de ellas podremos subdividirlas en función de que puedan ser ordenadas (Nivel de estudios) o no tenga sentido una
determinada ordenación que se establezca (Color preferido, Razas, ...).
CUANTITATIVAS
Los valores de las observaciones son numéricos (cuantificables) y, en consecuencia, ordenables.
A su vez las variables cuantitativas se subdividen en dos tipos :
DISCRETAS :
Toman valores concretos (Nº de hijos : 0, 1, 2, ...)
CONTINUAS :
Pueden tomar cualquier valor de un cierto intervalo (Peso ; Estatura ; ...).
TABLAS DE FRECUENCIAS.
Si la variable es Cualitativa, observamos los valores diferentes de la misma.
Si es Cuantitativa buscaremos los valores mínimo y máximo obtenidos. En función del número de observaciones, decidiremos si se
realiza su estudio de forma individual o agrupando en intervalos.
CONSTRUCCIÓN DE INTERVALOS :
Teniendo en cuenta la amplitud total de las observaciones (Valor máximo menos valor mínimo observados), tomaremos
una decisión sobre el número total de intervalos, o bien sobre la amplitud o tamaño de los mismos.
Estadística descriptiva - 1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22

Vista previa parcial del texto

¡Descarga Estadística descriptiva ADE y más Apuntes en PDF de Estadística Económica solo en Docsity!

Por este término se engloban las técnicas que nos permitirán realizar un análisis elemental de las observaciones experimentales

observadas.

Se subdivide en dos bloques :

1º Estadística primaria : Obtenido un grupo de observaciones experimentales , este apartado nos enseña a ordenarlas

adecuadamente, de modo que se ofrezca una información lo más clara posible.

2º Estadística derivada o secundaria : Con los datos observados realizaremos ciertos cálculos, obteniendo así unas medidas.

Este bloque temático nos enseña a interpretarlas.

PROCEDIMIENTO A SEGUIR EN UN ESTUDIO ESTADÍSTICO.

El proceso seguido en el estudio estadístico de una cierta característica o variable, puede subdividirse en tres pasos sucesivos :

A

RECOGIDA DE DATOS :

Planteado el test o encuesta oportuno y recogidos los datos que correspondan, el primer análisis que realizaremos

es el del tipo de variable que pretendemos estudiar (Cualitativa o Cuantitativa ; Discreta o Continua). Esto

condicionará en gran medida su posterior tratamiento.

B

ORGANIZACIÓN DE LOS DATOS :

Determinado el modo de agrupamiento de las observaciones, procedemos a su recuento, construyendo la tabla de

frecuencias. Posteriormente podremos visualizar tales frecuencias de forma gráfica con el diagrama estadístico

apropiado.

C

ANÁLISIS FINAL :

La obtención de muy diversas conclusiones respecto de la variable estudiada, se podrá realizar con auxilio de los

diferentes parámetros estadísticos (de centralización , posición , dispersión , etc.)

VARIABLES ESTADÍSTICAS. CLASIFICACIÓN.

El aspecto que deseamos estudiar (edad, sexo, peso, ...) recibe el nombre de VARIABLE ESTADÍSTICA. A lo largo de esta unidad

observaremos, que las técnicas estadísticas a seguir serán diferentes según el tipo de variable objeto de estudio.

La clasificación más tradicional de las variables estadísticas es la siguiente :

CUALITATIVAS

Los valores de las observaciones quedan expresados por características o atributos.

Por ejemplo : Estado civil ; Color preferido ; Nivel de estudios ; Raza ; ...

Dentro de ellas podremos subdividirlas en función de que puedan ser ordenadas (Nivel de estudios) o no tenga sentido una

determinada ordenación que se establezca (Color preferido, Razas, ...).

CUANTITATIVAS

Los valores de las observaciones son numéricos (cuantificables) y, en consecuencia, ordenables.

A su vez las variables cuantitativas se subdividen en dos tipos :

DISCRETAS :

Toman valores concretos (Nº de hijos : 0, 1, 2, ...)

CONTINUAS :

Pueden tomar cualquier valor de un cierto intervalo (Peso ; Estatura ; ...).

TABLAS DE FRECUENCIAS.

Si la variable es Cualitativa , observamos los valores diferentes de la misma.

Si es Cuantitativa buscaremos los valores mínimo y máximo obtenidos. En función del número de observaciones, decidiremos si se

realiza su estudio de forma individual o agrupando en intervalos.

CONSTRUCCIÓN DE INTERVALOS :

Teniendo en cuenta la amplitud total de las observaciones (Valor máximo menos valor mínimo observados), tomaremos

una decisión sobre el número total de intervalos, o bien sobre la amplitud o tamaño de los mismos.

Estadística descriptiva - 1

EJEMPLO :

Supuesto : Valor máximo = 87 , Valor mínimo = 11. Luego : AMPLITUD = 87 - 11 = 76.

Si decidimos construir 8 intervalos, la amplitud de cada uno será de 10 unidades (valor aproximado de 76/8). El

primer intervalo no tiene porqué iniciarse en 11 (mínimo); es más, se aconseja tomar siempre valores "visualmente

agradables" (5, 10, 15 ,...).

Con esto los intervalos serían :

[10,20) [20,30) [30,40) [40,50) [50,60) [60,70) [70,80) [80,90]

Si partimos de la decisión de que los intervalos tengan 15 unidades de amplitud, simplemente iniciaremos su

construcción hasta llegar a un intervalo que contenga al valor máximo observado.

[10,25) [25,40) [40,55) [55,70) [70,85) [85,90]

Teóricamente se establece que el número ideal de intervalos debe ser la raíz cuadrada del número de observaciones disponibles :

Para N observaciones : Criterio de Kaiser Nº de intervalos ≈ N

Criterio de Sturges (^) Nº de intervalos ≈ E ( 15 ' + 3 ' 3.ln( N)) (E = parte entera)

NOTACIÓN

Al establecer dos intervalos consecutivos, por ejemplo de 10 a 20 y de 20 a 30, hemos de decidir si el valor 20 (final de

uno e inicio del siguiente) pertenece al primer intervalo o al segundo. Para ello empleamos los símbolos [ y (.

[ o ] el valor situado junto a él pertenece al intervalo

( o ) el valor situado junto a él no pertenece al intervalo

NOTACIONES PARA REPRESENTAR INTERVALOS

EXTREMOS REALES

Desde 0 hasta menos de 10 [ 0 , 10 )

De 10 a menos de 20 [ 10 , 20 )

De 20 a menos de 30 [ 20 , 30 )

De 30 a menos de 40 [ 30 , 40 )

Desde 40 hasta 50 (^) [ 40 , 50 ]

EXTREMOS APARENTES

Valores : 1, 2, 3 y 4

[ 0'5 , 4'5 )

Valores : 5, 6, 7 y 8

[ 4'5 , 8'5 )

Valores : 9, 10, 11 y 12

[ 8'5 , 12'5 ]

RECUENTO. TABLA DE FRECUENCIAS ABSOLUTAS.

Situados en una tabla los valores de la variable (desde el mínimo al máximo) o los intervalos que los contienen, procedemos a contar

las veces que se repiten. Construimos así una tabla como la de la izquierda. En ella podrá observarse que, en el supuesto de datos

agrupados en intervalos, se ha incluido una columna encabezada por x. Tal valor de x se denomina marca de clase y es el valor

central de cada intervalo.

Intervalos x Recuento f F

[ e 1

, e 2

) x 1

/// f 1

f 1

[ e 2

, e 3

) x 2

///// ///// / f 2

f 1

+f 2

[ e i

, e i+

) x i

///// /// f i

f 1

+f 2

  • ... +f i

Σ f i

= N

2 - Estadística descriptiva

C

Diagramas de sectores

Utilizable en cualquier tipo de variable.

FUNDAMENTO : Dividimos el círculo en sectores circulares , de modo que la

amplitud de cada sector, sea proporcional a la frecuencia. Junto a cada sector, se

suele indicar el valor representado. Es aconsejable la expresión de las amplitudes

de los sectores en % (porcentajes p ).

D

Pictogramas

Utilizable en todo tipo de variables, especialmente con las cualitativas.

FUNDAMENTO : Es el mismo que se sigue para la construcción de los

diagramas de barras y histogramas. La diferencia estriba en que, en lugar de

dibujar una barra o un rectángulo, se dibuja una figura que hace referencia al

problema objeto de estudio.

E

Diagramas de áreas

Representativo de las variables cuantitativas, equivale a la representación

independiente de los polígonos de frecuencias (descritos en los diagramas de

barras y histogramas).

FUNDAMENTO : Indica la evolución de los valores de la variable, consistiendo

en la visualización del área encerrada bajo el polígono de frecuencias. Para ello,

se conecta dicho polígono con el eje de la variable (el horizontal en el gráfico) ,

tanto a la izquierda del primer valor como a la derecha del último.

Los diagramas de barras , histogramas , pictogramas y de áreas , admiten la representación correspondiente a sus frecuencias

acumuladas.

MEDIDAS DE CENTRALIZACIÓN.

MEDIA ARITMÉTICA :

x

f x

N

i i

Es el resultado de dividir la suma de todas las observaciones entre el número de ellas.

MODA :

Mo e

f

f f

a

i

i

i i

i

1

1 1

Es el valor que más se repite. Será pues el valor (o valores) cuya frecuencia absoluta sea la mayor de

las observadas.

Si los datos se encuentran agrupados en intervalos, obtendremos el intervalo en el que se encuentra la

moda (INTERVALO MODAL). Para determinar su valor concreto, aplicamos la expresión de la

izquierda.

NOTACIONES

Los subíndices indican : i intervalo donde se encuentra la moda.

i-1 intervalo anterior al que contiene la moda.

i+1 intervalo siguiente al que contiene la moda.

e extremo inferior del intervalo en el que se encuentra la moda.

a amplitud del intervalo en el que está la moda.

f frecuencia absoluta.

MEDIANA :

Me e

N

F

f

a

i

i

i

i

1

Supuestas ordenadas las observaciones, MEDIANA es el valor de la variable que está en el centro

de las mismas. Deja pues a la mitad (el 50%) de las observaciones por debajo de dicho valor.

Para obtener el valor de la mediana, seguimos los pasos siguientes :

1º Calculamos la tabla de frecuencias absolutas acumuladas.

2º La mediana será el valor de la variable cuya frecuencia absoluta acumulada primero iguale o

supere a N/2.

Si los datos se encuentran agrupados en intervalos, el punto 2º nos dará el intervalo en el que se

encuentra la mediana. Para determinar su valor concreto, aplicamos la expresión de la izquierda.

NOTA : En el caso de variables continuas no agrupadas en intervalos, suelen considerarse previamente los intervalos reales que

esos valores representan, procediendo a aplicar la expresión superior.

Así, los valores 1 , 2 ,3 , ... representan a los intervalos de valores [0'5 , 1'5) , [1'5 , 2'5) , [2'5 , 3'5) , ...

4 - Estadística descriptiva

NOTACIONES

Los subíndices indican : i intervalo donde se encuentra la mediana.

i-1 intervalo anterior al que contiene la mediana.

e extremo inferior del intervalo en el que se encuentra la mediana.

a amplitud del intervalo en el que está la mediana.

f frecuencia absoluta.

F frecuencia absoluta acumulada.

OTRAS MEDIDAS DE CENTRALIZACIÓN.

MEDIA PONDERADA :

Aplicable cuando a cada valor ( Xi )

se le asigna un peso ( p i

x

p

∑p^ X

p

i i

i

MEDIA GEOMÉTRICA :

Estadística descriptiva - 5

x x x x

G N

N

1 2

Con frecuencias fi para cada xi : (N = Σfi )

x x x x

G

f f

n

f N n

1

1 2

2

MEDIA ARMÓNICA :

x

N

x

A

i

Con frecuencias f i

para cada x i

: (N = Σf i

x

N

f

x

A

i

i

∑ ⎟

MEDIDAS DE POSICIÓN.

CONCEPTO : Permiten el cálculo del valor de la variable que ocupa una cierta posición relativa respecto del conjunto total de los

valores observados.

PERCENTIL DE ORDEN K : Es el valor de la variable que deja por debajo de él el K% de las observaciones.

PROCESO DE CALCULO :

P e

k N

F

f

a

k i

i

i

i

1

Para obtener el valor del percentil de orden K, seguimos los pasos siguientes :

1º Calculamos la tabla de frecuencias absolutas acumuladas.

2º Obtenemos el LUGAR que ocupa : Lugar = N. K / 100

3º El percentil de orden K será el valor de la variable cuya frecuencia absoluta acumulada

primero iguale o supere a dicho lugar.

Si los datos se encuentran agrupados en intervalos, el punto 3º nos dará el intervalo en el que se

encuentra el percentil de orden K. Para determinar el valor concreto del percentil, aplicamos la

expresión de la izquierda.

NOTA : En el caso de variables continuas no agrupadas en intervalos, suelen considerarse previamente los intervalos reales que

esos valores representan, procediendo a aplicar la expresión anterior.

Así, los valores 1 , 2 ,3 , ... representan a los intervalos de valores [0'5 , 1'5) , [1'5 , 2'5) , [2'5 , 3'5) , ...

NOTACIONES Los subíndices indican : i intervalo donde se encuentra el percentil.

i-1 intervalo anterior al que contiene el percentil.

e extremo inferior del intervalo en el que se encuentra el percentil.

a amplitud del intervalo en el que está el percentil.

f frecuencia absoluta.

F frecuencia absoluta acumulada.

PERCENTILES ESPECIALES

MEDIANA Percentil de orden 50.

CUARTILES Percentiles de órdenes 25 (Cuartil 1º), 50 (Cuartil 2º) y 75 (Cuartil 3º).

DECILES Percentiles de órdenes 10, 20, .... , 90 (Deciles 1º, 2º, ... , 9º).

MEDIDAS DE DISPERSIÓN.

RANGO , RECORRIDO O AMPLITUD TOTAL :

R = Máx − Mín Con el fin de medir el mayor o menor grado de separación de las observaciones, en una primera instancia

se define el RANGO (también denominado recorrido o amplitud total), como la diferencia existente entre

los valores máximo y mínimo observados.

Basados en al relación existente entre media, mediana y moda : x − Mo = 3.( x −Md)

se definen dos nuevos coeficientes de asimetría (de Pearson):

As

x Mo

2

As

x Md

3

COEFICIENTE DE CURTOSIS :

Recibe también el nombre de coeficiente de concentración central , midiendo el grado de aplastamiento o apuntamiento de la gráfica

de la distribución de la variable estadística. Una mayor concentración de datos en torno al promedio harán que la forma sea alargad,

siendo tanto más plana (o aplastada) cuanto mayor sea la dispersión de los mismos.

INTERPRETACIÓN

Determina la forma de la distribución,

en relación con su grado de

aplastamiento.

( )

K

f x x

N

i i

∑.^ −

4

4

Basados en medidas de posición , se definen los nuevos coeficientes :

Coeficiente de asimetría de Bowley-Yule, o intercuartílico :

Estadística descriptiva - 7

Y

Q Me Q

3 1

Q −Q

3 1

Coeficiente absoluto de asimetría:

A

Q Me Q

3 1

Coeficiente de curtosis de Kelley :

K

Q

P P

con Q

Q Q

90 10

3 1

ANÁLISIS CONJUNTO DE VARIOS GRUPOS.

Si disponemos de k grupos con ni elementos, medias x S

i i

, y varianzas

2

, podemos obtener :

Media conjunta de los k grupos

X

n x

n

i i

i

Varianza conjunta de los k grupos

S

n S

n

i i

i

2

2

, o, con mayor rigor :

( )

S

n S

n

n x X

n

i i

i

i i

i

2

2

2

PROPIEDADES DE LAS MEDIDAS ESTADÍSTICAS.

TABLA PARA CÁLCULOS :

La tabla siguiente nos muestra una disposición práctica de los cálculos necesarios para la obtención de los parámetros estadísticos

usuales: Media , Moda, Mediana , Percentiles , Varianza y Desviación típica.

Intervalos x f f.x f.x

F P

[ e 1

, e 2

) x 1

f 1

f 1

. x 1

(f 1

. x 1

).x 1

F

=f 1

P
= (F
/ N). 100

[ e 2

, e 3

) x 2

f 2

f 2

. x 2

(f 2

. x 2

).x 2

F

=f 1

+f 2

P
= (F
/ N). 100

[ e i

, e i+ 1

) x i

f i

f i

. x i

(f i

. x i

).x i

F
I

=f 1

+f 2

+ ... +f i

P

i

= (F

i

/ N). 100

Σ f i

Σ f i

. x i

Σ f i

. x i

Cálculo de percentiles

N A B

Cálculo de media y varianza

La media y la varianza serían el resultado de calcular : Cálculo de media y varianza

x

A

N

2 2

B

N

x

PROPIEDADES :

A) Si a todos los valores de una variable x les sumamos una cantidad constante, la media queda incrementada en dicha constante,

mientras que la desviación típica (y la varianza) no varía.

B) Si multiplicamos todos los valores de una variable x por una constante, la media y la desviación típica quedan también

multiplicadas por dicha constante (la varianza quedará multiplicada por el cuadrado de la constante).

EJEMPLO :

CAMBIO DE VARIABLE. TIPIFICACIÓN.

Haciendo uso de las propiedades de las medidas estadísticas ,podremos facilitar y simplificar los cálculos de parámetros estadísticos,

realizando un cambio de variable.

Así, si todos los valores son muy altos, podremos restarles una cantidad (normalmente la Moda) y, si poseen cifras decimales o son

múltiplos de un mismo número, podremos multiplicarlos o dividirlos por el valor adecuado.

Una vez calculados los parámetros estadísticos, en virtud de las propiedades descritas, obtendremos el valor final real de tales

parámetros.

Mención especial merecen dos cambios de variables particulares :

A) Diferenciales : partiendo de la variable inicial x (puntuaciones directas) , si a todos los valores les restamos la media ,

obtenemos una nueva variable d (puntuaciones diferenciales) cuya media es cero (la desviación típica no se modifica).

B) Tipificadas : Si a todos los valores de la variable inicial x les restamos la media y el resultado lo dividimos por la

desviación típica , obtenemos una nueva variable z (puntuaciones tipificadas) cuya media es cero , teniendo siempre como

desviación típica la unidad.

Este último cambio de variable recibe el nombre de TIPIFICACIÓN.

SUMA Y DIFERENCIA DE VARIABLES.

Partiendo de dos variables X , Y, podemos definir las nuevas variables :

  • S = X + Y obtenida sumando cada valor de X con el correspondiente de Y.
  • D = X - Y obtenida restando a cada valor de X el valor correspondiente de Y.

Esto supone la existencia de tantas observaciones de X como de Y, así como el emparejamiento de ellas; es decir, a cada valor de X

queda asociado un valor de Y. Esto constituirá la base de estudio del siguiente tema.

Veamos como se comporta la media de las dos nuevas variables S y D definidas.

S = X + Y En efecto :

S

X Y

N

X Y

N

X

N

Y

N

X Y

i i i i i i

∑ (^ ) ∑ ∑ ∑ ∑

Análogamente se verifica que : D = X −Y

Calculemos la varianza de la suma S :

( ) ( ) ( )

( )

S

X Y S

N

X Y X Y

N

X X Y Y

N

X X Y Y X X Y Y

N

X X

N

Y Y

N

X X Y Y

N

S S S

S

i i i i i i

i i i i

i i i i

X Y XY

2

2 2

2 2

2 2

2 2

∑ ∑

2

∑ ∑ ∑

La expresión

( X X).( Y Y

N

i i

∑ −^ − )^

, representada por SXY , recibe el nombre de covarianza, justificándose que es igual también a :

S

X X Y Y

N

X Y

N

X Y

XY

i i i i

∑ ( ).( ) ∑.

Análogamente se verifica que : S S S S

D X Y X

2 2 2

Y

Si las variables X , Y son independientes, la covarianza (medida de variación conjunta) es igual a cero.

Resumiendo : Varianzas

Medias Dependientes ( S

XY ≠^ 0 )^

Independientes ( S

XY

S = X + Y S = X + Y

Y Y

2

S S S S

S X Y X

2 2 2

= + + 2. S S S

S X

2 2

D = X - Y D^ =^ X^ −^ Y S S S S

D X Y X

2 2 2

Y Y

2

S S S

D X

2 2

MOMENTOS ORDINARIOS Y CENTRALES

8 - Estadística descriptiva

ÍNDICE DE CONCENTRACIÓN DE GINI :

Haciendo uso de la tabla de cálculos anterior, necesaria para la obtención de la curva de Lorenz, definiremos el presente

estadístico. Otros, como el índice de Dalton, el de paridad, etc. , pueden ser empleados con idéntica interpretación a la que

tratamos con el de Gini, si bien omitimos su estudio.

( )

G

P Q

P

i i

i

TD

TP

k

i

i

k

=

=

1

1

1

1

  • Concentración mínima : G = 0

El índice de Gini (expresión de la izquierda) coincide geométricamente con el

cociente entre el área sombreada (definida por la curva de Lorenz) y la del

triángulo ABC.

  • Concentración máxima : G = 1

10 - Estadística descriptiva

EJERCICIOS RESUELTOS

La tabla siguiente nos muestra el resultado de una encuesta entre los alumnos de primer curso, analizando el

número de suspensos en la primera evaluación :

Realicemos un estudio estadístico completo.

Se trata de una variable cuantitativa discreta. Esto condicionará algunos procesos del cálculo estadístico.

RECUENTO Y TABLA DE FRECUENCIAS

x recuento f r p F R P

1 ///// ///// /^ 11 0'1833^ 18'33^19 0'3167^ 31'

Totales : (^) N = 60 1'0000 100'

GRÁFICOS ESTADÍSTICOS APROPIADOS PARA ESTE TIPO DE VARIABLE
DIAGRAMA DE BARRAS :

Sobre el valor de cada variable dibujamos una barra con

altura igual a la frecuencia que deseamos representar (en

este caso las absolutas f ).

POLÍGONO DE FRECUENCIAS :

Obtenidos enlazando los extremos superiores de las barras.

NOTA :Siendo la variable discreta, no tiene sentido dibujar

el polígono de frecuencias.

DIAGRAMAS ACUMULADOS :

Construidos como los anteriores, son los representativos de

las distintas frecuencias acumuladas.

El ejemplo representa las frecuencias absolutas acumuladas

(F).

El polígono de frecuencias se construiría enlazando los

extremos superiores de las barras.

PICTOGRAMAS:

Con el mismo principio seguido para la construcción de los diagramas de barras, sustituimos dichas barras por dibujos alusivos a la

variable estadística estudiada.

DIAGRAMAS DE SECTORES :

Resultan de la división de un círculo en sectores cuya amplitud es proporcional a la frecuencia.

La amplitud de cada sector será : α = =

f

N

. 360 º r. 360 º

Estadística descriptiva - 11

Trabajamos ahora con las edades de 50 jóvenes de nuestro barrio :

Como en el ejemplo anterior, realicemos un estudio estadístico completo.

Nos encontramos ante una variable estadística cuantitativa continua. Agruparemos o no las observaciones en intervalos en función de

los diferentes valores observados.

TABLA DE FRECUENCIAS

Observado el valor mínimo (1) y máximo (24), decidimos agrupar los datos en intervalos de 5 años de amplitud,

empezando por 0.

Intervalos recuento f r p F R P

[ 0 , 5 ) ///// 5 0'10 10 5 0'10 10
[ 5, 10 ) ///// ///// 10 0'20 20 15 0'30 30
[ 10 , 15 ) ///// ///// ///// /^ 16 0'32^32 31 0'62^62
[ 15 , 20 ) ///// / 6 0'12 12 37 0'74 74
[ 20 , 25 ] ///// ///// /// 13 0'26 26 50 1'00 100

Totales : N = 50 1'00 100

GRÁFICOS ESTADÍSTICOS
HISTOGRAMA :

Sobre el valor de cada variable dibujamos una franja con altura

igual a la frecuencia que deseamos representar (en este caso las

absolutas f ).

POLÍGONO DE FRECUENCIAS :

Obtenido enlazando los puntos medios de los extremos superiores

de las franjas.

HISTOGRAMAS ACUMULADOS :

Construidos como los anteriores, son los representativos de las

distintas frecuencias acumuladas.

El ejemplo representa las frecuencias absolutas acumuladas ( F ).

En este caso, el polígono de frecuencias NO se construiría

enlazando los puntos medios de los extremos superiores de las

franjas, sino como se indica en la figura.

Cálculo de Moda, Media, Varianza y Desviación típica :

Para el cálculo de la media y la varianza utilizamos la tabla auxiliar siguiente. En ella se incorpora la columna x , que

contiene la marca de clase (valor central) de cada intervalo.

La MODA (valor de mayor frecuencia) se encuentra en el intervalo [10 , 15). Determinemos su valor concreto :

Mo e

f

f f

a

i

i

i i

i

1

1 1

Intervalos f x f.x f.x

[ 0 , 5 ) 5 2'5^ 12'5^ 31'
[ 5, 10 ) 10 7'5 75'0 562'
[ 10 , 15 ) 16 12'5 200'0 2500'
[ 15 , 20 ) 6 17'5 105'0 1837'
[ 20 , 25 ] 13 22'5 292'5 6581'
N = 50 685'0^ 11512'

x

f x

N

i i

Estadística descriptiva - 13

s

f x

N

x

x

2 i^ i

2

2 2

' ' s s

x x

2

Utilizando las frecuencias absolutas acumuladas, calculemos el decil 2º y el percentil 62 :

Lugar que ocupa el decil 2º (percentil 20) = 20. 50 / 100 = 10

Lugar que ocupa el percentil 62 = 62. 50 / 100 = 31

Intervalos f F

[ 0 , 5 ) 5 5

[ 5, 10 ) 10^15 ⇐ Decil 2º (percentil 20) en [5,10) Lugar = 10

[ 10 , 15 ) 16^31 ⇐ Percentil 62 en [10,15) Lugar = 31

[ 15 , 20 ) 6 37
[ 20 , 25 ] 13 50
N = 50

Determinemos sus valores concretos :

14 - Estadística descriptiva

P e

N

F

f

a

i

i

i

20 i

1

. ' P e

N

F

f

a

i

i

i

62 i

1

Utilizando los porcentajes acumulados, calculemos el cuartil 1º y la mediana :

Intervalos f r p P

[ 0 , 5 ) 5 0'10 10 10

[ 5, 10 ) 10 0'20 (^20 30) ⇐ Cuartil 1º (percentil 25) en [5,10)

[ 10 , 15 ) 16 0'32 (^32 62) ⇐ Mediana (percentil 50) en [10,15)

[ 15 , 20 ) 6 0'12^12
[ 20 , 25 ] 13 0'26 26 100
N = 50 1'00 100

Determinemos sus valores concretos :

P e

N

F

f

a

i

i

i

25 i

1

. ' P e

N

F

f

a

i

i

i

50 i

1

3

x f De la presente distribución, calculemos :

2 6 Media, varianza y desviación típica.

3 15 Moda.

4 10 Mediana, Percentil 82, Cuartiles y amplitud semi-intercuartílica.

La variable establecida puede ser discreta o continua sin agrupar en intervalos. Realicemos los cálculos en ambos supuestos.

x f F P f.x f.x

Media

x

f x

N

i i

Varianza

σ

2 ∑^

2

f x

N

x

i i

Desviación típica

Moda

Mediana (percentil 50) Percentil 82

Cuartil 1º (percentil 25) Cuartil 3º (percentil 7

Rango semi-intercu ílico

  1. art

Q Q

3 1

L os valores anteriores, relativos a percentiles, son válidos si la variable es DISCRETA. En el supuesto de tratarse de una variable

CONTINUA (con datos no agrupados), deberíamos entender que el valor identifica el intervalo situado a la izquierda en la siguiente

tabla :

16 - Estadística descriptiva

Desviación media

D =

∑ 102 '

N

f .x x

i i

Asimetría

Algo asimétrica

hacia la izquierda

( )

  • 199'

N

f.x x

3 3

3

i i

As

1

Curtosis

Ligeramente aplanada

(Platicúrtica)

( )

N

f.x x

K

4 4

4

i i

5

La distribución de las estaturas en centímetros de los alumnos de un centro, expresados en porcentajes, es la

siguiente:

Estaturas Porcentajes

Menos de 150 0'

De 150 a 154 1'

De 155 a 159 9'

De 160 a 164 20'

De 165 a 169 31'

De 170 a 174 22'

De 175 a 179 10'

De 180 y más 3'

a) Siendo abiertos los intervalos primero y el último, ¿ qué valores sería razonable considerar para los límites

extremos de esos intervalos?

b) Si suponemos que en el Centro hay 1200 alumnos, ¿ cuáles serían las frecuencias absolutas?

c) Calcular la estatura media y la desviación típica.

d) ¿ Entre qué estaturas se encuentra la quinta parte de las estaturas centrales ?.

a)

Al referirse a intervalos de 5 cm. de amplitud en los restantes casos, debemos considerar que el primer intervalo es de 145 a menos

de 150 y, el último, de 180 a 185.

b)

Estaturas p f = p. 1200 / 100 f P F

[145,150) 0'3 3'6 4 0'3 4
[150,155) 1'6 19'2 19 1'9 23
[155,160) 9'4 112'8 113 11'3 136
[160,165) 20'5 246 246 31'8 382
[165,170) 31'5 378 378 63'3 760
[170,175) 22'5 270 270 85'8 1030
[175,180) 10'7 128'4 128 96'5 1158
[180,185) 3'5 42 42 100'0 1200
N=

c)

Estaturas f x f.x f.x

[145,150) 4 147'5 590'0 87025'
[150,155) 19 152'5 2897'5 441868'
[155,160) 113 157'5 17797'5 2803106'
[160,165) 246 162'5 39975'0 6495937'
[165,170) 378 167'5 63315'0 10605262'
[170,175) 270 172'5 46575'0 8034187'
[175,180) 128 177'5 22720'0 4032800'
[180,185) 42 182'5 7665'0 1398862'

De aquí resulta : x = =

s

x

2 2

= − 167 95' = 42 006' s

x

d)

La quinta parte representa el 20%. Con relación al centro (50%), cubrirán desde el 40% al 60%.

Se nos pide que calculemos los percentiles 40 y 60 de la distribución de estaturas.

La tabla de porcentajes acumulados del apartado b) nos permite deducir que :

Los percentiles 40 y 60 se encuentran en el intervalo [165,170).

Sus valores concretos son :

P e

N

F

f

a

i

i

i

40 i

1

P e

N

F

f

a

i

i

i

60 i

1

6

Partiendo de la siguiente distribución de frecuencias acumuladas, determinar la media, mediana y moda de la

siguiente distribución de edades. Analice la relación entre ellas.

Edad F

[10,12) 4
[12,14) 11
[14,16) 24
[16,18) 34
[18,20] 40

Estadística descriptiva - 17

Calculemos los parámetros pedidos, con el fin de observar en qué medida se verifica la relación x −Mo= 3 .( x−Me)

Para obtener las frecuencias absolutas, a partir de las acumuladas, aplicamos el concepto que define a estas últimas. En la práctica,

las frecuencias absolutas se obtienen restando la correspondiente acumulada de la anterior.

Edad F f x f.x f.x

[10,12) 4 4 11 44 484
[12,14) 11 7 13 91 1183
[14,16) 24 13 15 195 2925
[16,18) 34 10 17 170 2890
[18,20] 40 6 19 114 2166

x

Lugar que ocupa la mediana :

L = 50. 40 / 100 = 20

La mediana está en [14,16) :

Me = +

La moda se encuentra en [14 , 16). Su valor

concreto es :

Mo = +

Comprobemos la relación existente entre ellas :

x −Mo= 15 ' 35 − 15 ' 1765 = 0 ' 1735

  1. ( x−Me) = 3 .( 15 ' 35 − 15 ' 3845 ) =− 0 ' 1035

No se verifica la relación esperada, si bien la diferencia no es muy grande.

Esta relación teórica sólo se verifica en situaciones ideales y excepcionales (por ejemplo en distribuciones simétricas,

donde x = Mo = Me ).

7

Completar la tabla de frecuencias siguiente :

Nº de suspensos f F

N = 50

Las calificaciones de un alumno en dos test de conocimientos fueron 5'4 y 41. El primer test dio como media 5 con

varianza 2 y, el segundo, media 38 con varianza 12.

¿ En qué test obtuvo mejor calificación con relación al grupo total de alumnos ?.

Nos encontramos con dos distribuciones de calificaciones medidas en distintas escalas. Para poder comparar tendremos que referir

ambas series de valores a otras equivalentes entre sí (igual media y desviación típica).

El proceso de tipificación nos proporciona lo que deseamos (siempre obtendremos una distribución con media 0 y desviación típica

Tipificando ambas calificaciones se obtiene :

Estadística descriptiva - 19

Nota del test 1º : 5 4^

1

z =

Nota del test 2º : 41

1

z = '

La nota obtenida en el segundo test es superior a la del primero en términos comparativos.

12

a) Determinar la frecuencia desconocida, sabiendo que la estatura

media es de 151’5 cm.

b) Calcule la amplitud semi-intercuartílica.

c) Moda de la distribución y coeficiente de asimetría que la utiliza.

d) Percentil correspondiente a una estatura de 153 cm.. Explique su

significado.

e) ¿ Entre qué estaturas se encuentran las 25 centrales ?.

Estatura en cm. Alumnos

[140,145) 12
[145,150) 35
[150,155) 51
[155,160)?
[160,165) 7

f) Porcentaje de alumnos que miden más de 157 cm.

a)

La tabla de cálculos de la media conduce a :

f

f

Resolviendo deducimos que : f = 20

x f f.x

[140,145) 142’5 12 1710
[145,150) 147’5 35 5162’
[150,155) 152’5 51 7777’

[155,160) 157’5 f 157'5.f

[160,165) 162’5 7 1137’

105+f 15787’5+157'5.f

b)

Lugar Q 1 = 125. 25 / 100 = 31’

Q 1 se encuentra en [145,150)

Q

1

Lugar Q 3

Q 3 se encuentra en [150,155)

Q

3

f F

[140,145) 12 12
[145,150) 35 47
[150,155) 51 98
[155,160) 20 118
[160,165) 7 125
N=

Luego : Q

Q Q

3 1

c) 1º) Moda en [150,155) : Mo = +

s

s

As

x Mo

s

2

x f f.x f.x

2

d) 153 se encuentra en [150,155)

20 - Estadística descriptiva

P

k

k

Resolviendo : k = 62’08 ≈ 62

f F

[140,145) 12 12
[145,150) 35 47
[150,155) 51 98
[155,160) 20 118
[160,165) 7 125
N=

e) Lugar = 125. 40 / 100 = 50 ; en [150,155) :

P

40

Lugar = 125. 60 / 100 = 75 ; en [150,155) :

P

60

Entre 150’29 y 152’

f) 157 se encuentra en [155,160)

P

k

k

. Resolviendo : k = 84’8% (porcentaje inferiores a 157)

Luego, miden más de 157 cm. : 100% - 84’8% = 15’2%

13

a) Determine el número de hombres con edades comprendidas entre

los 11 y 15 años.

b) ¿ Cuál de los dos grupos de edades está más disperso ?.

c) Con relación al grupo integrado por los del mismo sexo, ¿quién

resulta más joven, un hombre o una mujer de 20 años ?.

Edad Hombres Mujeres

22 a 25 7 3

19 a 22 9 5

16 a 19 5 6

13 a 16 11 9

10 a 13 8 2

Hombre Mujer

x f F f.x f.x

2 f f.y f.y

2

[10,13) 11’5 8 8 92 1058 2 23 264’
[13,16) 14’5 11 19 159’5 2312’75 9 130’5 1892’
[16,19) 17’5 5 24 87’5 1531’25 6 105 1837’
[19,22) 20’5 9 33 184’5 3782’25 5 102’5 2101’
[22,25) 23’5 7 40 164’5 3865’75 3 70’5 1656’

P

k

k

k

a) 11 pertenece al intervalo [10,13) :. '

15 pertenece al intervalo [13,16) : P

k

k

k

Entre 11 y 15 el 38’33-6’67 = 31’66%. Luego hay : 40. 31’66 / 100 = 12’664 ≈ 13 hombres

b) Calculamos las varianzas de ambos grupos :

x s s

x x

2 2

y s s

y y

2 2

Siendo 17’91 > 12’1824 ⇒ Grupo hombres más disperso de forma aboluta

Pese a ser las medias prácticamente iguales, debemos emplear el coeficiente de variación para estudiar la variabilidad

relativa de ambos grupos :

CV CV

x y

⇒ hombres más disperso