Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Análisis Exploratorio de Datos: Resumen de 5 Números y Diagrama de Caja, Guías, Proyectos, Investigaciones de Estadística

En esta sesión del curso Estadística I, el docente Ing. Elmer Cruz Arocutipa presenta el objetivo de identificar y diferenciar los conceptos y metodologías relacionadas al análisis exploratorio de datos, aplicando técnicas como el resumen de 5 números y el diagrama de caja. Se utiliza el software SPSS para crear este último. El resumen de 5 números permite obtener información sobre la mediana, cuartiles y valores extremos de una variable de escala, mientras que el diagrama de caja es un resumen gráfico de los datos que nos permite identificar la distribución y dispersión de los datos. Se incluyen ejemplos para mejorar la comprensión.

Tipo: Guías, Proyectos, Investigaciones

2012/2013

Subido el 16/11/2021

joselyn-arana-1
joselyn-arana-1 🇵🇪

1 documento

1 / 21

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
ESTADÍSTICA I
Docente: Ing. Elmer Cruz Arocutipa
2021-II
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15

Vista previa parcial del texto

¡Descarga Análisis Exploratorio de Datos: Resumen de 5 Números y Diagrama de Caja y más Guías, Proyectos, Investigaciones en PDF de Estadística solo en Docsity!

ESTADÍSTICA I

Docente: Ing. Elmer Cruz Arocutipa 2021 - II

ANALISIS EXPLORATORIO DE DATOS

Sesión 11

CONTENIDOS

Sesión 11

1. Resumen de 5 números

2. Diagrama de caja

3. Aplicación en SPSS

Resumen de 5 números

Resumen de 5 números

Ejemplo: Los sueldos mensuales para la muestra de 12 licenciados en administración de empresas recién egresados se repiten aquí en orden ascendente. 4 3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925 Q 1 = 3465 Q 2 = 3505 Q 3 = 3600 Mediana

Diagrama de caja

Diagrama de caja

Ejemplo: Para comparar los sueldos mensuales iniciales de los licenciados en administración de empresas por área de especialización, se seleccionó una muestra de 111 licenciados recién graduados. 6

Diagrama de caja

¿Qué observaciones puede hacer acerca de los sueldos iniciales por área de especialización usando los diagramas de caja? En específico se observa lo siguiente: 7 Los sueldos más altos corresponden a contabilidad; los sueldos más bajos corresponden a administración y marketing. Con base en las medianas, la de los sueldos de contabilidad y sistemas de información es similar y mayor. Le sigue finanzas, y administración y contabilidad muestran sueldos con una mediana inferior. Existen observaciones atípicas de sueldos altos para las áreas de contabilidad, finanzas y marketing. Los sueldos en el área de finanzas parecen tener menos variación, mientras que en contabilidad parecen tener la mayor variación.

Crear una variable:

  • Colocar un nombre a la variable
  • Tipo de dato
  • Ancho y numero de decimales
  • Etiqueta
  • Medida

Crear el diagrama de caja

Se debe ingresar los datos en la columna de la variable. Para crear el diagrama de caja realizar lo siguiente:

  • Analizar/Estadísticos descriptivos/Explorar

Crear el diagrama de caja

  • En Gráficos, seleccionar los siguientes opciones
  • Hacer clic en “Aceptar”

Diagrama de caja

  • Existe un valor atípico que se encuentra en la observación 1
  • El 50% de los datos son homogéneos
  • No existe mucha dispersión en el 50% de los datos.

Diagrama de caja conjunta

  • Existen observaciones atípicas de los años estudiados para los dos géneros.
  • Con base en las medianas, los años estudiados en los dos géneros son similares.
  • La variabilidad en el genero Masculino es mayor con respecto al Femenino.

Resumen

  • El resumen de los 5 números sirven para realizar el diagrama de caja que describe la distribución y dispersión de los datos.