








Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: toc, Profesor: Pedro Martín Smith, Carrera: Ingeniería Informática, Universidad: UGR
Tipo: Ejercicios
1 / 14
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!









Práctica 1. Estadística. Pág 1 |
R es un lenguaje de programación y un entorno para análisis estadístico y la realización de gráficos. Fue inicialmente escrito por Robert Gentleman y Ross Ihaka del Departamento de Estadística de la Universidad de Auckland en Nueva Zelanda. R es un proyecto GNU, similar a su versión comercial, S, desarrollada por los laboratorios Bell. Desde 1997, se formó lo que se conoce como núcleo de desarrollo de R , que es quien tiene actualmente la posibilidad de modificación directa del código fuente de R. No obstante, R es actualmente resultado de un esfuerzo de colaboración de personas en todo el mundo. El código de R está disponible como software libre bajo las condiciones de licencia GNU-GPL. La página web del proyecto es http://www.r-project.org. En el presente curso, nos centramos por su sencillez y facilidad de empleo, en la interfaz gráfica de R , conocida como R-Commander.
Instalación de R
Práctica 1. Estadística. Pág 2 |
Se selecciona el país desde donde se desea descargar el programa pulsando CRAN mirror. Una vez seleccionado España se elige el sistema operativo, como se muestra a continuación
Se selecciona base para acceder a la ventana de descarga del programa
donde se puede descargar la versión 2.15.0 de R disponible.
Práctica 1. Estadística. Pág 4 |
Se pulsa Siguiente
Seleccionamos todas las opciones que aparecen en la siguiente ventana:
Para que R-Commander funcione correctamente es conveniente seleccionar la opción Sí en la ventana de opciones de configuración, así como SDI, ventanas separadas.
Práctica 1. Estadística. Pág 5 |
Se muestran pantallas con algunas opciones de instalación:
Instalación de R-Commander
Práctica 1. Estadística. Pág 7 |
Una vez instalado el paquete se carga en el menú de R como se muestra a continuación:
Se selecciona de nuevo el paquete Rcmdr y se instalan los paquetes que faltan para completar la instalación de R-Commander
Práctica 1. Estadística. Pág 8 |
Con esta instalación final de paquetes desde CRAN finaliza la instalación de R- Commander.
Para iniciar R-Commander es necesario escribir la orden library(Rcmdr) al inicio de la consola de R. Si se cierra R-commander , pero no R , basta con escribir Commander() para abrir R-commander de nuevo.
En la siguiente figura se muestra el aspecto general de R-Commander:
Práctica 1. Estadística. Pág 10 |
Ejecute library(Rcmdr). Trabajaremos con el menú “Datos”
Se han medido las alturas de un grupo de alumnos.
1.75 1.80 1.77 1.75 1.71 1.64 1.69 1.95 1.75 1.
a) Cree una carpeta en el escritorio llamada “Practica1” (Menú Fichero). Introducimos los datos de esta variable denominada “Altura” en un fichero denominado “Ejercicio1”. Cambiamos el nombre a la variable. b) Guardamos el conjunto de datos activo (Menú Datos/Conjunto de datos activo) en la carpeta “Practica1”. c) Añadimos otras 4 variables (Nombre, Edad, Sexo, Calificación). No le ponga acentos a los nombres de las variables. Puede llamar a la última Calif: Juan Salvador Luis José Lola Daniel David Carlos Agustín Maite 20 21 20 19 19 18 20 18 19 19 H H H H M H H H H M 6.3 9.1 5.2 3.1 5.8 8.6 2.2 6.3 9.3 9.
d) Guardamos de nuevo el fichero y miramos el nombre de las variables (Menú Datos/Conjunto de datos activo/Variables…). Nos aparecen los nombres de las variables. e) Establecemos los nombres de los casos por la variable “Nombre” (Menú Datos/Conjunto de datos activo/Establecer nombres de casos). Deben ser todos distintos para poder realizar esta operación. f) Filtramos el conjunto de datos para obtener un fichero que contenga a los alumnos con altura superior a 1.70. Visualice dicho fichero y guárdelo “Ejercicio1b”.
Práctica 1. Estadística. Pág 11 |
g) Seleccione como conjunto de datos activo el “Ejercicio1” (Menú Datos/Conjunto de datos activo/Seleccionar conjunto de datos activo). h) Vamos ahora a recodificar la variable “Calificación” para conocer los alumnos SUSPENSOS y APROBADOS (Menú Datos/Modificar variables/Recodificar).
Visualice el conjunto de Datos para comprobar que ha realizado correctamente esta operación.
i) Supongamos ahora que necesitamos la Altura en cm. Vamos a calcular una nueva variable Altura_cm, multiplicando la original por 100 (Menú Datos/Modificar variables/Calcular). j) Ejecute (Menú Datos/Modificar variables/Añadir número de observaciones). Compruebe que ha añadido la columna “ObsNumber”. k) Vamos a segmentar la variable “Edad”, para formar automáticamente grupos de observaciones, que más adelante podremos utilizar para realizar por ejemplo, gráficos por subgrupos de casos (Menú Datos/Modificar variables/Segmentar). En este caso, formaremos solamente dos grupos y llamaremos a la nueva variable “Edad_SEG”.
Práctica 1. Estadística. Pág 13 |
a) En el menú datos cargue el conjunto de datos “Ejercicio1.RData”. Visualice su contenido. Debe tener las siguientes columnas: "Altura","Edad", "Sexo", "Calif", "Nombre", "Calif_REC", "Altura_cm", "ObsNumber", "Edad_SEG". b) Cree un diagrama de barras con la columna “Calif_REC”, como sigue:
Nos crea un gráfico de barras con los resultados de las calificaciones de los alumnos. En el Script nos aparece: barplot(table(Ejercicio1$Calif_REC), xlab="Evaluación", ylab="número de alumnos", main="Resultados Calificaciones"). Este comando tiene múltiples opciones de mejora. Para mayor información: https://stat.ethz.ch/R-manual/R-devel/library/graphics/html/barplot.html Si queremos dar color al gráfico (p.e. verde), hemos de introducir en la orden anterior: barplot(table(Ejercicio1$Calif_REC), xlab="Evaluación", ylab="número de alumnos", main="Resultados Calificaciones", col="green"). Puede encontrar la gama de colores disponibles en: http://www.stat.columbia.edu/~tzheng/files/Rcolor.pdf
c) Realice pruebas con otros colores. También puede cambiar los colores del título, ejes, etiquetas del eje, etc. Pruebe lo siguiente e identifique cada opción: barplot(table(Ejercicio1$Calif_REC), xlab="Evaluación", ylab="número de alumnos", main="Resultados Calificaciones", col = "blueviolet", border = "dark blue", horiz=TRUE, col.main="coral4", col.lab="deeppink4", col.axis="green4")
d) R también tiene algunas gamas de colores predefinidos. Puede verlos en: http://stat.ethz.ch/R-manual/R-devel/library/grDevices/html/palettes.html En este caso, pruebe con la orden: barplot(table(Ejercicio1$Calif_REC), xlab="Evaluación", ylab="número de alumnos", main="Resultados Calificaciones", col=heat.colors(5)) e) Realice ahora un gráfico de sectores y pruebe las distintas opciones que tiene.
Práctica 1. Estadística. Pág 14 |
f) Vamos a realizar ahora un gráfico de sectores para la variable “Edad” en el que vengan expresados los porcentajes observados. En primer lugar, hemos de convertir dicha variable en factor (cualitativa). En el Menú Datos podemos convertir la variable numérica en factor.
Y a continuación, realizar el diagrama de sectores:
Pongamos ahora las etiquetas (con porcentajes) a cada uno de los sectores. Escribimos en el Script lo siguiente para crear una tabla de frecuencias para la edad: tabla<-table(Ejercicio1$Edad_factor)
Calculemos los porcentajes de la tabla y redondeo a un solo decimal: porcentajes<-round(prop.table(tabla)*100,1)
Incluyamos las etiquetas: etiquetas<-c("18","19","20","21") etiquetas<-paste(etiquetas, "años, ", porcentajes, "%") etiquetas
Realicemos el diagrama de sectores, incluyendo dichas etiquetas: pie(table(Ejercicio1$Edad_factor), labels=etiquetas, xlab="Porcentajes", ylab="Edad", main="Edad de mis alumnos", col=rainbow_hcl(length(levels(Ejercicio1$Edad_factor))))