Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Ejercicios de Visualización de Datos en Minería de Datos, Ejercicios de Minería de Datos

Este documento contiene ejercicios relacionados con la visualización de datos en el contexto de la materia de minería de datos. Los ejercicios abordan temas como el uso de diferentes geoms y transformaciones estadísticas en ggplot2, como geom_bar(), geom_col(), geom_point(), geom_line(), geom_area(), geom_boxplot(), geom_violin(), geom_density(), geom_hex(), geom_tile(), geom_contour(), geom_count() y stat_smooth(). Se explican conceptos básicos de cada geom y transformación estadística, así como cómo se utilizan en conjunto. Además, se proporcionan ejemplos de cómo estas herramientas pueden ser utilizadas para analizar y representar diferentes aspectos de los datos, como frecuencias, distribuciones, tendencias y relaciones.

Tipo: Ejercicios

2022/2023

A la venta desde 28/02/2024

primo-147
primo-147 🇪🇨

97 documentos

1 / 5

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Ejercicios -6 de Visualización de Datos
Materia : Minería de Datos
Ing Estevan Gómez, Msc PhD( c)
Visualización de datos
Ejercicios-5
1. ¿Cuál es el geom predeterminado asociado con stat_summary()? ¿Cómo
podrías reescribir el gráfico anterior para usar esa función geom en lugar de la
función stat?
El geom predeterminado asociado con stat_summary() es geom_pointrange().
Este geom se utiliza para representar los valores resumidos mediante un rango
vertical.
2. ¿Qué hace geom_col()? ¿En qué se diferencia de geom_bar()?
El geom geom_col() se utiliza para crear gráficos de columnas en un gráfico de
coordenadas cartesianas. Este geom representa cada categoría de datos como una
columna vertical cuya altura está determinada por los valores de una variable. El geom
geom_bar() se utiliza cuando se desea contar o resumir una variable categórica y
representar la frecuencia o el recuento de cada categoría en un gráfico de barras. Por
defecto, utiliza stat_count() para realizar el cálculo del recuento. Sin embargo, se puede
modificar el compor tamiento mediante la opción stat para utilizar otras funciones
estadísticas o datos precalculados (stat = "identity").
MATERIA
Minería de Datos
NRC
10060
TRABAJO No.
04
CARRERA
Tecnologías de la Información
Docente
PERIODO ACADÉMICO
PREGRADO S-I MAYO-SEPT 23
FECHA
TÍTULO
Tarea 4
ESTUDIANTE(S)
Bryan Azuero
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga Ejercicios de Visualización de Datos en Minería de Datos y más Ejercicios en PDF de Minería de Datos solo en Docsity!

Materia : Minería de Datos

Visualización de datos

Ejercicios- 5

  1. ¿Cuál es el geom predeterminado asociado con stat_summary()? ¿Cómo podrías reescribir el gráfico anterior para usar esa función geom en lugar de la función stat? El geom predeterminado asociado con stat_summary() es geom_pointrange(). Este geom se utiliza para representar los valores resumidos mediante un rango vertical.
  2. ¿Qué hace geom_col()? ¿En qué se diferencia de geom_bar()? El geom geom_col() se utiliza para crear gráficos de columnas en un gráfico de coordenadas cartesianas. Este geom representa cada categoría de datos como una columna vertical cuya altura está determinada por los valores de una variable. El geom geom_bar() se utiliza cuando se desea contar o resumir una variable categórica y representar la frecuencia o el recuento de cada categoría en un gráfico de barras. Por defecto, utiliza stat_count() para realizar el cálculo del recuento. Sin embargo, se puede modificar el comportamiento mediante la opción stat para utilizar otras funciones estadísticas o datos precalculados (stat = "identity"). MATERIA Minería de Datos NRC 10060 TRABAJO No. 04 CARRERA Tecnologías de la Información Docente Ing. Estevan Gomez PERIODO ACADÉMICO PREGRADO S-I MAYO-SEPT 23 FECHA 23/05/ TÍTULO Tarea 4 ESTUDIANTE(S) Bryan Azuero

Materia : Minería de Datos

  1. La mayoría de los geoms y las transformaciones estadísticas vienen en pares que casi siempre se usan en conjunto. Lee la documentación y haz una lista de todos los pares. ¿Qué tienen en común? Tipos Geom Transformación Estadística Función común Geom de barras geom_bar() stat_count() Cuenta las frecuencias Geom de columnas geom_col() stat_identity() Utiliza los valores sin cambios Geom de puntos geom_point() stat_identity() Utiliza los valores sin cambios Geom de líneas geom_line() stat_identity() Utiliza los valores sin cambios Geom de áreas geom_area() stat_identity() Utiliza los valores sin cambios Geom de cajas geom_boxplot() stat_boxplot() Calcula los límites y cuartiles Geom de violín geom_violin() stat_ydensity() Estima la densidad de la variable y la representa mediante un violín Geom de densidad geom_density() stat_density() Estima la densidad de la variable Geom de hexágonos geom_hex() stat_binhex() Agrupa los datos en hexágonos Geom de mosaicos geom_tile() stat_identity() Utiliza los valores sin cambios Geoms de contorno relleno geom_contour() stat_contour() Calcula los contornos Geoms de recuento geom_count() stat_sum() Calcula el recuento de observaciones Los geoms y transformaciones estadísticas permiten visualizar diferentes aspectos de los datos, como frecuencias, distribuciones, tendencias y relaciones. Además, en la mayoría de los casos, la función stat_identity() se utiliza cuando no es necesario aplicar transformaciones estadísticas adicionales y se representa directamente el valor original de los datos. Muchos geoms tienen stat_identity()como estadística predeterminada.
  2. ¿Qué variables calcula stat_smooth()? ¿Qué parámetros controlan su comportamiento? Stat_smooth calcula las siguientes variables: ➢ y: valor predicho

Materia : Minería de Datos Si no establecemos group = 1 en ambas sentencias todas las barras de nuestro grafico tendrán la misma altura como lo observamos en el gráfico. La función geom_bar deduce que los grupos son iguales a los valores de x. El problema de estos dos gráficos es que las proporciones se calculan dentro de los grupos. Ademas de que after_stat(prop) no es una sintaxis válida dentro de aes() en el mapeo estético de geom_bar(). Al utilizar after_stat() para acceder a las estadísticas calculadas por stat_count(), pero no se ha especificado ninguna estadística adicional para calcular la proporción. Establecer group = 1 en el contenedor aes() ayuda a resolver estos problemas al indicar que se quiere calcular la proporción para todo el conjunto de datos sin considerar otras variables.

Materia : Minería de Datos Bibliografía.

  • Grafico de barras con ggplot2. (2023). R-Charts.com. https://r- charts.com/es/ranking/grafico-barras-ggplot2/
  • stat_smooth function - RDocumentation. (2016). Rdocumentation.org. https://www.rdocumentation.org/packages/ggplot2/versions/0.9.0/topi cs/stat_smooth