Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Ejercicios de Visualización de Datos en Minería de Datos, Ejercicios de Minería de Datos

Este documento contiene ejercicios resueltos sobre el tema de visualización de datos en el marco de la materia de minería de datos. Se abordan temas como el uso de ggplot, la asignación de colores, tamaños y formas a variables continuas y categóricas, y el ancho de borde de los puntos. El documento incluye código r y explicaciones detalladas.

Tipo: Ejercicios

2022/2023

A la venta desde 28/02/2024

primo-147
primo-147 🇪🇨

97 documentos

1 / 5

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Ejercicios -3 de Visualización de Datos
Materia : Minería de Datos
Ing Estevan Gómez, Msc PhD( c)
Visualización de datos
Ejercicios-4
1. ¿Qué no va bien en este código? ¿Por qué hay puntos que no son azules?
ggplot(data = millas) +
geom_point(mapping = aes(x = cilindrada, y = autopista, color = "blue"))
Lo que esta pasando es que el color esta dentro del contenedor aes, que es donde
especificamos las variables (X e Y). Asi que R lo trata como si fuera una variable hasta
lo podemos observar en la parte lateral derecha de la imagen. Para solucionar el
problema y los puntos se vean azules debemos colocar color=”blue” fuera del
contenedor aes() de la siguiente manera.
ggplot(data = millas)+
geom_point(mapping = aes(x= cilindrada, y= autopista), color = "blue")
MATERIA
Minería de Datos
NRC
10060
TRABAJO No.
03
CARRERA
Tecnologías de la Información
Docente
PERIODO ACADÉMICO
PREGRADO S-I MAYO-SEPT 23
FECHA
TÍTULO
Tarea 3
ESTUDIANTE(S)
Bryan Azuero
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga Ejercicios de Visualización de Datos en Minería de Datos y más Ejercicios en PDF de Minería de Datos solo en Docsity!

Materia : Minería de Datos

Visualización de datos

Ejercicios- 4

  1. ¿Qué no va bien en este código? ¿Por qué hay puntos que no son azules? ggplot (data = millas) + geom_point (mapping = aes (x = cilindrada, y = autopista, color = "blue")) Lo que esta pasando es que el color esta dentro del contenedor aes, que es donde especificamos las variables (X e Y). Asi que R lo trata como si fuera una variable hasta lo podemos observar en la parte lateral derecha de la imagen. Para solucionar el problema y los puntos se vean azules debemos colocar color=”blue” fuera del contenedor aes() de la siguiente manera. ggplot(data = millas)+ geom_point(mapping = aes(x= cilindrada, y= autopista), color = "blue") MATERIA Minería de Datos NRC 10060 TRABAJO No. 03 CARRERA Tecnologías de la Información Docente Ing. Estevan Gomez PERIODO ACADÉMICO PREGRADO S-I MAYO-SEPT 23 FECHA 25 /05/ TÍTULO Tarea 3 ESTUDIANTE(S) Bryan Azuero

Materia : Minería de Datos

  1. ¿Qué variables en millas son categóricas? ¿Qué variables son continuas? (Pista: escribe ?millas para leer la documentación de ayuda para este conjunto de datos). ¿Cómo puedes ver esta información cuando ejecutas millas? Para saber cuáles son las variables categóricas del dataset millas, hacemos uso de la función str() para analizar la estructura de dicho dataset, además de leer la documentación utilizando? millas. Analizando la información podemos concluir. - Variables categóricas: Fabricante, modelo, trasmisión, tracción, combustible, clase. - Variables continuas: cilindrada, año, cilindros, ciudad, autopista.

Materia : Minería de Datos

  1. ¿Qué ocurre si asignas o mapeas la misma variable a múltiples estéticas? ggplot(data = millas)+ geom_point(mapping = aes(x= cilindrada, y= autopista, color = ciudad, size = ciudad)) Lo que ocurre es que el grafico resultante mostrara la relación entre las variables cilindrada y autopista utilizando tanto el color como el tamaño de los puntos del grafico para representar a ciudad. Lo cual nos lleva a tener un gráfico con información redundante.
  2. ¿Qué hace la estética stroke? ¿Con qué formas trabaja? (Pista: consulta ?geom_point) La estética stroke hace referencia al ancho del borde de los puntos en un gráfico de dispersión. El valor de stroke oscila entre 1 y el 5. ggplot(data = millas) + geom_point(mapping = aes(x = cilindrada, y = autopista), shape = 1, stroke = 2)

Materia : Minería de Datos

  1. ¿Qué ocurre si se asigna o mapea una estética a algo diferente del nombre de una variable, como aes(color = cilindrada < 5)? En este caso estamos utilizando una expresión lógica para definir el color de los puntos, si la condición es verdadera se le asignara un color (salmón) de lo contrario se le asignara un color diferente (celeste). La expresión lógica utilizada es ahora considerada por R como una variable.