¡Descarga Análisis Descriptivo de Datos: Distribución de Variables - Prof. Crespo y más Ejercicios en PDF de Econometría solo en Docsity!
Análisis Exploratorio
José Ángel Fernández Sampedro
Análisis Univariante
Variables cuantitativas
(intervalo/razón)
Distribuciones
Permiten aproximarse a un conjunto de datos
- Distribución de frecuencias (frec. absoluta): Número de veces que se repite una observación - Historgrama de frecuencias
- Distribución de frecuencias relativa: Idem/total de casos (n) oscila entre 0 y 1 - Histograma de frecuencias relativas - Polígono de frecuencias
- Distribución de frecuencias acumulada: número de valores igual o menor a cada nivel de observación. - Curva de distribución
Asociación de los valores de una variable con su correspondiente frecuencia
con la que se realizan (binomio: valor / número de veces que se repite)
Visualizar las distribuciones
Historgrama de Frecuencia Absoluta
Frecuencia absoluta
Histograma de Frecuencia Relativa
Frecuencia absoluta
Polígono de frecuencias
Frecuencia absoluta
Curva de distribución
Frecuencia acumulada
Superar el hábito natural a resumir toda la información con un
solo dato, como las medidas de tendencia central (media,
mediana)
Unimodal versus Bimodal
DISTRIBUCIÓN ASALARIADOS UNA EMPRESA ¿NORMAL? Segmento de Profesionales Oficio (^) Segmento de Titulados Superiores
Simetría y apuntamiento
• Cuantiles: puntos tomados a intervalos regulares de la
función de distribución de una variable
– Percentiles: dividen a la distribución en cien partes
– Cuartiles: dividen a la distribución en cuatro partes
(corresponden a los cuantiles 0.25, 0.50 y 0.75);
Función: Cuartil(matriz;número del cuartil)
Función: Percentil(matriz;número del percentil)
Medidas de tendencia no central
Medidas de dispersión
• Variabilidad y dispersión de los datos
– Desviación Media (poblacional y muestral)
– Varianza (poblacional y muestral)
– Desviación Estándar o Típica (poblacional y muestral)
– Coeficiente de Variación (poblacional y muestral)
n
x X
y DM
N
X
DM
i
2 2 2 2
n
x X
y s
N
X
i
2 2
n
x X
y s
N
X
i
X
s
V y v
Función: DESVPROM Función: VARP y VAR Función: DESVESTP y DESVEST
Medida de asimetría: coeficiente de asimetría
- Asimetría
- Coeficiente de Asimetría de Pearson (poblacional y muestral)
- Tercer Momento (poblacional y muestral)
- Si Sk > 0 la distribución es asimétrica positiva (extremo derecho más largo)
- Si Sk = 0 la distribución es simétrica
- Si Sk < 0 la distribución es asimétrica negativa (extremo izquierdo más largo) s X med y Sk med Sk 3 ( ) 3 ( ) 3 3 3 3 ( ) ( ) s x X y Sk X Sk i (^) Función: Coeficiente.asimetria
Variables cuantitativas
• Análisis gráfico (histograma, box-plot) permite
obtener información de la forma de la distribución :
simetría, curstosis, número de modas, rango (Definir
bien el número de grupos y su “ancho)
• Calcular medidas de posición central y dispersión.
• Evaluar la necesidad de transformaciones
• Tratar datos perdidos e identificar y analizar outliers
Preguntas
• Estadísticos descriptivos e histograma del y del gasto
diario.
• ¿Cuál es la edad promedio de los hombres? ¿Y de las
mujeres?
• ¿Cuál es el gasto diario promedio de los turistas del
sur de Europa?
• ¿Y de los del norte?
• ¿Cuál es el gasto diario promedio de los turistas del
Norte de Europa que viajaron por negocios?
Análisis Univariante
Variables cualitativas
(Nominales)
Variables cualitativas
• Calcular las distribuciones por categoría
• Análisis gráfico (barras o columnas) permite
comparar los resultados por categorías.
– Diferencia frente a histograma: el histograma es
un gráfico con el eje x ordenado de forma
creciente (inalterable). El bar-char permite
cambios en el orden del eje x.
• Las barras apiladas permiten un análisis más
ilustrativo de las frecuencias relativas
segmentadas.
Tabla y gráfico
20
Gráfico de barras absoluto
Nº Mucho 225 Algo 199 No mucho 78 Nada 33 No contesta 4 Tota 539
Mucho Algo No mucho Nada No contesta
¿Cuánto te interesa esta
asignatura?
Gráfico de barras (absoluto y relativo) describe distribuciones de
variables categóricas