Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Visualización de datos Ejercicios-7, Ejercicios de Minería de Datos

Ejercicios 1. ¿Cuál es el problema con este gráfico? ¿Cómo podrías mejorarlo? ggplot(data = millas, mapping = aes(x = ciudad, y = autopista)) + geom_point() Como podemos observar en el gráfico, la cantidad de puntos no parece ser la correcta. Suponemos que los puntos se están sobreponiendo unos sobre otros. Al crear un gráfico de dispersión, puede ser útil alterar los puntos para que sea MATERIA Minería de Datos NRC 10060 TRABAJO No. 05 CARRERA Tecnologías de la Información Docente Ing. Estevan Gomez PERIODO ACADÉMICO PREGRADO S-I MAYO-SEPT 23 FECHA 23/05/2023 TÍTULO Tarea 5 ESTUDIANTE(S) Bryan Azuero Ejercicios -7 de Visualización de Datos Materia : Minería de Datos Ing Estevan Gómez, Msc PhD( c) más fácil ver los puntos superpuestos. Usamos position jitter para agregar una pequeña cantidad de ruido aleatorio.

Tipo: Ejercicios

2022/2023

A la venta desde 28/02/2024

primo-147
primo-147 🇪🇨

97 documentos

1 / 5

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Ejercicios -7 de Visualización de Datos
Materia : Minería de Datos
Ing Estevan Gómez, Msc PhD( c)
Visualización de datos
Ejercicios-7
Ejercicios
1. ¿Cuál es el problema con este gráfico? ¿Cómo podrías mejorarlo?
ggplot(data = millas, mapping = aes(x = ciudad, y = autopista)) +
geom_point()
Como podemos observar en el gráfico, la cantidad de puntos no parece ser la
correcta. Suponemos que los puntos se están sobreponiendo unos sobre otros.
Al crear un gráfico de dispersión, puede ser útil alterar los puntos para que sea
MATERIA
Minería de Datos
NRC
10060
TRABAJO
No.
05
CARRERA
Tecnologías de la Información
Docente
PERIODO
ACADÉMICO
PREGRADO S-I MAYO-SEPT
23
FECHA
TÍTULO
Tarea 5
ESTUDIANTE(S)
Bryan Azuero
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga Visualización de datos Ejercicios-7 y más Ejercicios en PDF de Minería de Datos solo en Docsity!

Materia : Minería de Datos

Visualización de datos

Ejercicios- 7

Ejercicios

  1. ¿Cuál es el problema con este gráfico? ¿Cómo podrías mejorarlo? ggplot (data = millas, mapping = aes (x = ciudad, y = autopista)) + geom_point () Como podemos observar en el gráfico, la cantidad de puntos no parece ser la correcta. Suponemos que los puntos se están sobreponiendo unos sobre otros. Al crear un gráfico de dispersión, puede ser útil alterar los puntos para que sea MATERIA Minería de Datos NRC 10060 TRABAJO No. 05 CARRERA Tecnologías de la Información Docente Ing. Estevan Gomez PERIODO ACADÉMICO PREGRADO S-I MAYO-SEPT 23 FECHA 23/05/ TÍTULO Tarea 5 ESTUDIANTE(S) Bryan Azuero

Materia : Minería de Datos más fácil ver los puntos superpuestos. Usamos position jitter para agregar una pequeña cantidad de ruido aleatorio.

  1. ¿Qué parámetros de geom_jitter() controlan la cantidad de ruido? Los argumentos que controlan el ruido son: - Width: controla la cantidad de desplazamiento horizontal. - Height: controla la cantidad de desplazamiento vertical. Los valores predeterminados de width y height introducirán ruido en ambas direcciones. Los parámetros width y height controlan la amplitud del desplazamiento aleatorio de los puntos en el eje x y el eje y, respectivamente. ggplot(data = millas, mapping = aes(x = ciudad, y = autopista)) + geom_point(position = position_jitter(width = 0.2, height = 0.1))

Materia : Minería de Datos

  1. ¿Cuál es el ajuste de posición predeterminado de geom_boxplot()? Crea una visualización del conjunto de datos de millas que lo demuestre. El ajuste de posición predeterminado de geom_boxplot() es "dodge", que significa que los diagramas de caja se colocan uno al lado del otro para cada nivel de una variable categórica. Gráfico de cajas donde cada caja representa la distribución de los valores de "autopista" para diferentes niveles de "cilindrada". Las cajas se colocaran en el eje de las x y se colorean según el nivel de la variable “clase”. ggplot(data = millas)+ geom_boxplot(mapping = aes(x= cilindrada, y= autopista, color = clase)) Bibliografía: Jittered points — geom_jitter. (2023). Tidyverse.org. https://ggplot2.tidyverse.org/reference/geom_jitter.html Count overlapping points — geom_count. (2023). Tidyverse.org. https://ggplot2.tidyverse.org/reference/geom_count.html Zach. (2022, July 22). How to Jitter Points in ggplot2 (With Examples) - Statology. Statology. https://www.statology.org/ggplot-jitter/

Materia : Minería de Datos