Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Análisis Exploratorio de Datos: Descripción Estadística de una Variable, Apuntes de Estadística Empresarial

Una descripción estadística de una variable en el contexto de un análisis exploratorio de datos. Se explican las representaciones gráficas, las características numéricas de una distribución univariante y las medidas de tendencia central, posición y dispersión. Se definen y calculan la media aritmética, mediana, moda, media ponderada, media geométrica y media armónica. Además, se presentan observaciones sobre la media geométrica y media armónica.

Tipo: Apuntes

2015/2016

Subido el 11/10/2016

lauu2723
lauu2723 🇪🇸

4

(2)

4 documentos

1 / 28

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
ANÁLISIS EXPLORATORIO DE DATOS
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c

Vista previa parcial del texto

¡Descarga Análisis Exploratorio de Datos: Descripción Estadística de una Variable y más Apuntes en PDF de Estadística Empresarial solo en Docsity!

ANÁLISIS EXPLORATORIO DE DATOS

TEMA 2: Descripción estadística de

una variable

1. Ordenación simple de los datos.

2. Ordenación agrupada de los datos.

3. Representaciones gráficas.

4. Características numéricas de una

distribución univariante.

TEMA 2: Descripción estadística de

una variable

4. Características numéricas de una

distribución univariante.

A. Medidas de tendencia central

B. Medidas de posición

C. Medidas de dispersión (o de variabilidad)

D. Medidas de forma (asimetría y curtosis)

Los índices de centralidad o concentración (Promedios) cuantifican el

valor central representativo de toda la distribución (valores alrededor

de los cuales se concentran la mayor parte de las observaciones)

**1) Media aritmética

  1. Mediana
  2. Moda
  3. Media ponderada
  4. Media geométrica
  5. Media armónica**

1 ._ MEDIA ARITMÉTICA :

Propiedades:

a. La suma de las diferencias de n puntuaciones respecto a su media

vale cero. σ𝒊=𝟏 𝒏 𝒙𝒊 − ഥ𝒙 = 𝟎

b. Si cada una de las puntuaciones de una distribución (X) se

multiplica por una constante (b) y se le suma otra constante (a), la

media de las nuevas puntuaciones (Y) es igual a la media de las

puntuaciones originales (X) multiplicada por la constante b más la

constante a:

𝒀 = 𝒂 + 𝒃𝑿 ⇒ 𝒀ഥ = 𝒂 + 𝒃𝑿ഥ

1 ._ MEDIA ARITMÉTICA :

Limitaciones:

a. Cuando los datos están agrupados en intervalos, la media no se puede calcular si el intervalo máximo no tiene límite superior y/o el intervalo mínimo no lo tiene inferior. b. Puede que a la hora de tomar los datos nos encontremos con valores muy extremos (asimétricos), en ese caso debemos valorar si son errores, entonces deberemos eliminarlos para realizar la media. Pero si por el contrario estos valores extremos son importantes para nuestro estudio, deberemos escoger otros índices de medición.

2 ._ MEDIANA:

Cálculo de la mediana con muchos datos:

Al ser muchos casos, los datos vienen presentados en intervalos. El intervalo en el que se encuentra la mediana se llama intervalo crítico o intervalo mediano y se corresponde con aquel en el que la frecuencia absoluta acumulada 𝑁𝑖 es igual o superior a n/ 2. 𝑴𝒆 = 𝑴𝒅 = 𝒍𝒊−𝟏 + 𝒏 𝟐 − 𝑵𝒅 𝒏𝒄

. 𝒄 donde: 𝒍𝒊−𝟏 es el límite inferior del intervalo crítico 𝑵𝒅 frecuencia absoluta acumulada del intervalo por debajo del intervalo crítico 𝒏𝒄 frecuencia absoluta del intervalo crítico 𝒄 amplitud del intervalo crí[email protected] 10

2 ._ MEDIANA:

Propiedades:

a. Robustez: La mediana no se ve alterada por la presencia de valores extremos, puesto que no depende de los valores que toma la variable, sino del orden de los mismos. Por ello es adecuado su uso en distribuciones asimétricas. b. La mediana puede ser calculada con intervalos aunque el intervalo máximo no tenga límite superior y/o el intervalo mínimo no tenga límite inferior, siempre que éstos no coincidan con el intervalo crítico (se desconocería su amplitud). c. La mediana divide el área total del histograma de frecuencias en dos áreas con idéntica superficie.

3 ._ MODA:

Cálculo de la moda para datos agrupados en intervalos:

b. Los intervalos no tienen la misma amplitud

donde 𝒍𝒊−𝟏 límite inferior del intervalo modal 𝒏𝒊 frecuencia absoluta del intervalo modal 𝒏𝒊−𝟏 frecuencia absoluta del intervalo anterior al modal 𝒏𝒊+𝟏 frecuencia absoluta del intervalo siguiente al modal

𝒄𝒊 amplitud del intervalo modal

𝒄𝒊−𝟏 amplitud del intervalo anterior al modal

𝒄𝒊+𝟏 amplitud del intervalo siguiente al modal

3 ._ MODA:

Propiedades:

a. Una distribución de frecuencias puede ser Amodal / Bimodal / Multimodal (igual frecuencia en todos los valores o categorías; dos categorías o valores con igual frecuencia y más de dos categorías o valores con igual frecuencia). b. En una distribución de frecuencias de variables agrupadas en intervalos, la moda es función de los intervalos elegidos (amplitud de intervalo, número de intervalos y límites de los mismos). c. En distribuciones abiertas de variables agrupadas en intervalos (sin límite inferior y superior en el intervalo inferior y superior respectivamente), la moda puede calcularse siempre que la frecuencia máxima no pertenezca a alguno de los intervalos abiertos.

5 ._ MEDIA GEOMÉTRICA: Se recomienda su uso cuando se tienen porcentajes, tasas o números índice; es decir, cuando una variable presenta variaciones acumulativas.

Definición:

La media geométrica proporciona una medida precisa de un cambio porcentual medio en una serie de números.

𝒏𝟏

𝒏𝟐

𝒏𝒌 𝟏Τ 𝒏

Obs: Tomando logaritmos:

𝒊=𝟏 𝒏

La media geométrica no se ve tan afectada por valores extremos.

5 ._ MEDIA ARMÓNICA:

Este valor se emplea para promediar variaciones con respecto al tiempo. Definición: La media armónica se define como el recíproco de la media aritmética de los recíprocos: ഥ𝒙𝑨 = 𝟏 𝟏 𝒏 𝟏 𝒙𝟏

𝟏 𝒙𝟐

  • ⋯ + 𝟏 𝒙𝒏

TEMA 2: Descripción estadística de

una variable

4. Características numéricas de una

distribución univariante.

A. Medidas de tendencia central

B. Medidas de posición

C. Medidas de dispersión (o de variabilidad)

D. Medidas de forma (asimetría y curtosis)

B. Medidas de posición

Estas medidas son también llamadas cuantilas, cuantiles o fractiles y

cuyo objetivo es describir el comportamiento de una variable

dividiendo la serie de valores en diferente número de partes

porcentualmente iguales. Los más usados son:

**1) Cuartiles

  1. Deciles
  2. Percentiles**