Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Análisis Exploratorio de Datos: Preparación de Datos, Tipos de Variables y Gráficas, Diapositivas de Estadística

El Análisis Exploratorio de Datos (AED) es un conjunto de técnicas estadísticas que permiten obtener un entendimiento básico de los datos y de las relaciones existentes entre las variables analizadas. Este documento aborda el proceso de preparación de datos, tipos de variables y técnicas gráficas utilizadas en el AED. Se incluyen conceptos como la preparación de datos, tipos de variables cualitativas y cuantitativas, graficación de datos y tablas de frecuencias.

Tipo: Diapositivas

2021/2022

Subido el 08/12/2022

k-s-w-santiago
k-s-w-santiago 🇲🇽

1 / 47

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Que es el Análisis Exploratorio de Datos.
El Análisis Exploratorio de Datos (A.E.D.) es un
conjunto de técnicas estadísticas cuya finalidad
es conseguir un entendimiento básico de los
datos y de las relaciones existentes entre las
variables analizadas.
Para conseguir este objetivo el A.E.D. proporciona
métodos sistemáticos sencillos para organizar y
preparar los datos, detectar fallos en el diseño y
recogida de los mismos, tratamiento y evaluación
de datos ausentes (missing), identificación de
casos atípicos (outliers) y comprobación de los
supuestos subyacentes en la mayor parte de las
técnicas multivariantes (normalidad, linealidad,
homocedasticidad).
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f

Vista previa parcial del texto

¡Descarga Análisis Exploratorio de Datos: Preparación de Datos, Tipos de Variables y Gráficas y más Diapositivas en PDF de Estadística solo en Docsity!

Que es el Análisis Exploratorio de Datos.

El Análisis Exploratorio de Datos (A.E.D.) es un

conjunto de técnicas estadísticas cuya finalidad

es conseguir un entendimiento básico de los

datos y de las relaciones existentes entre las

variables analizadas.

Para conseguir este objetivo el A.E.D. proporciona

métodos sistemáticos sencillos para organizar y

preparar los datos, detectar fallos en el diseño y

recogida de los mismos, tratamiento y evaluación

de datos ausentes (missing), identificación de

casos atípicos (outliers) y comprobación de los

supuestos subyacentes en la mayor parte de las

técnicas multivariantes (normalidad, linealidad,

homocedasticidad).

ETAPAS DEL A.E.D.

  1. Preparar los datos para hacerlos accesibles a cualquier técnica

estadística.

  1. Realizar un examen gráfico de la naturaleza de las variables

individuales a

analizar y un análisis descriptivo numérico que permita cuantificar

algunos aspectos gráficos de los datos.

  1. Realizar un examen gráfico de las relaciones entre las variables

analizadas y un análisis descriptivo numérico que cuantifique el

grado de interrelación existente entre ellas.

  1. Evaluar, si fuera necesario, algunos supuestos básicos

subyacentes a muchas técnicas estadísticas como, por ejemplo, la

normalidad, linealidad y

homocedasticidad.

  1. Identificar los posibles casos atípicos (outliers) y evaluar el

impacto potencial que puedan ejercer en análisis estadísticos

posteriores.

  1. Evaluar, si fuera necesario, el impacto potencial que pueden

tener los datos

Variables

Cualitativas:

se refiere a que indica cualidad o características no

numerables directamente. Dentro de estas es

posible identificar tres categorías.

Dicotómicas: indica que solo tiene dos

posibilidades de respuesta.

Nominales: indica solo una correspondencia

entre un atributo y un valor numérico.

Ordinales: al igual que la anterior categoría es

una equivalencia entre un atributo y un valor

numérico, en esta ocasión, es de importancia el

orden en que se hace esta equivalencia.

Variables

Cuantitativas: indicativa de cantidad, es una

de las variables más encontradas en las

investigaciones. Esta se divide en dos tipos:

Discretas: Tipo de variable cuantitativa,
relacionada a la categoria de conteo,
matemáticamente hablando, no es posible
encontrar entre dos enteros consecutivos otro
número.
Continuas: ha diferencia de la anterior, y que la
hace más potente, es que es posible encontrar
infinitos números entre dos enteros consecutivos.

Los Datos

Una vez que hemos reconocido, las

variables, la población o muestra; viene la

toma de los datos y por cierto registrarlos.

La tabulación es un paso importante en el

análisis de los datos, es como se hace la

equivalencia, en el caso de una variable

cualitativa entre lo registrado y un valor

numérico y obviamente su significado.

Para una variable continua, es

recomendable saber cuales son los limites

de la variable.

¿dónde registrar...?

La pregunta actual, es donde se realiza el

registro de los datos.

En la actualidad, esto es fácil de decidir.

Obviamente es hacerlo en un

computador y por cierto la experiencia

ha desarrollado una especie de convenio,

en que todo converge desde una planilla

electrónica llamada Excel de Microsoft.

Por lo general, se ingresa o se registra los

datos en esta planilla, pero en la

actualidad la mayoría de los softwares

estadísticos, traen un módulo de ingreso

de datos de tipo planilla.

¿Cómo hacer...?

deberemos conocer como serán medidos los objetivos, en
consideracón a esto debemos analizar los siguientes
aspectos:
Tipo de medida: como recopilar los datos
Duración de la medición: cuanto nos demoramos en una
recopilación
Cantidad de mediciones: cuantas veces se repetira el
mismo tipo de medida
Factibilidad de las mediciones
Estas son las que en la mayoría de las ocasiones uno debe
tomar en cuenta para el posterior análisis.
De acuerdo a lo anterior, se encuentran las siguientes
posibilidades en las cuales uno debe encasillar el estudio.
¿Es Cualitativo o Cuantitativo?

¿qué hacer ahora?

En la etapa inicial, hemos reconocido, lo necesario para

saber donde estamos posicionados. Pero ahora ¿que se

hace?; veamos algunas posibilidades.

 Graficar.

 Hacer alguna agrupación de los datos.

 Obtener algunas medidas.

Graficar

Dentro de la gama de gráficos encontramos:

Barras Simples, Agrupadas, Compuesta, Histograma,

Circular, Area, Lineas o Tendencia, Dispersión,

Pictograma.

Reglas:

Mantener una escala entre la el eje vertical y la

horizontal.

Algunos hablan de una escala 1:1,5 y otros que

el eje vertical debe ser entre un 75% o un 80%

del eje horizontal.

Si tiene colores, úselos. Los tachados son

influyentes en la forma de lo que se esta usando.

Graficar

0

10

20

30

40

50

60

70

80

90

1er

trim.

2do

trim.

3er

trim.

4to

trim.

Este

Oeste

Norte

0

10

20

30

40

50

60

70

80

90

1er trim. 2do trim. 3er trim. 4to trim.

Graficar

0

10

20

30

40

50

60

70

80

90

año1 año3 año5 año7 año

Este

Oeste

Norte

1er trim.

2do trim.

3er trim.

4to trim.

1er trim.

2do trim.

3er trim.

4to trim.

0

10

20

30

40

50

60

70

80

90

100

1er trim. 2do trim. 3er trim. 4to trim.

Este

Graficar

Consideraciones extras:

 Todo Gráfico tiene un Título.

 El título del gráfico, nunca es, por ejemplo: Gráfico de

las edades.

 La interpretación es esencialmente importante,

recordando la base de los datos y su relación con otras

variables.

Agrupación de Datos

  • Tabla de Frecuencias

Como su nombre lo indica es una tabla en la cual se

agrupan los datos dependiendo de la cantidad de

veces que se repite dentro de los datos el mismo valor.

Agrupación de Datos

- Tabla de Frecuencias Agrupadas

A diferencia de la anterior tabla, uno

debe trabajar un poco los datos.

¿Cuando se utiliza?, bueno

básicamente, cuando la necesidad de

información con respecto a la calidad

de ella no es tan preponderantemente

importante. Obviamente lo que recien

hemos mencionado es la calidad de la

información, es decir, para este caso,

se pierde información al trabajar con

agrupación de datos.