Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Estadística l práctica 1, Ejercicios de Estadística

Ejercicio practica 1 de R-commander

Tipo: Ejercicios

2019/2020

Subido el 16/11/2020

kelusk
kelusk 🇪🇸

1 documento

1 / 9

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Actividad 1
Nom i Cognoms: Kelly Pico Suaárez
Grup: C2
Estadística Descriptiva (I): Tablas de frecuencias y representacions gráficas .
Objetivos
Cargar los datos del archivo Activitat_1. RData en R-Commander: Menú ~ Datos ~ Cargar conjunto de
datos (figura 1).
Figura 1: Cargar fichero de datos
Información del fichero Activitat_1.RData: contiene información referente al destino (variable Desti), el
retraso en minutos (variable Retras) y el número de plazas vacantes (variable Vacants) en 80 vuelos
desde Barcelona de la compañía A.
Actividades:
1) Realizar un resumen del conjunto de datos mediante la opción Estadísticos ~ Resúmenes ~ Conjunto
de datos activo (figura 2).
Figura 2: Opción Resumen Conjunto de datos activo
Creación de tablas de frecuencias de un conjunto de datos.
Representaciones Gráficas.
Nota: Los ficheros con extensión
RData son bases de datos generadas
en el programa R Commander. Se
pueden importar ficheros de bases de
datos de otros formatos, como EXCEL,
SPSS…
pf3
pf4
pf5
pf8
pf9

Vista previa parcial del texto

¡Descarga Estadística l práctica 1 y más Ejercicios en PDF de Estadística solo en Docsity!

Actividad 1

Nom i Cognoms: Kelly Pico Suaárez

Grup: C

Estadística Descriptiva (I): Tablas de frecuencias y representacions gráficas.

Objetivos

Cargar los datos del archivo Activitat_1. RData en R-Commander: Menú ~ Datos ~ Cargar conjunto de datos (figura 1). Figura 1 : Cargar fichero de datos Información del fichero Activitat_1.RData : contiene información referente al destino ( variable Desti ), el retraso en minutos ( variable Retras ) y el número de plazas vacantes ( variable Vacants ) en 80 vuelos desde Barcelona de la compañía A. Actividades:

  1. Realizar un resumen del conjunto de datos mediante la opción Estadísticos ~ Resúmenes ~ Conjunto de datos activo (figura 2). Figura 2: Opción Resumen Conjunto de datos activo
  • Creación de tablas de frecuencias de un conjunto de datos.
  • Representaciones Gráficas. Nota : Los ficheros con extensión RData son bases de datos generadas en el programa R Commander. Se pueden importar ficheros de bases de datos de otros formatos, como EXCEL, SPSS…

summary(Activitat_1) Desti Retras Vacants Granada :15 Min.: 0.430 Min.: 0. Palma :17 1st Qu.: 6.603 1st Qu.: 6. Sevilla :24 Median: 9.195 Median: 8. Valencia:23 Mean: 9.589 Mean: 7. NA's: 1 3rd Qu.:12.900 3rd Qu.:10. Max. :19.390 Max.:20. NA's :

  1. Obtener la tabla de frecuencias para la variable Desti : Estadísticos ~ Resúmenes ~ Distribución de frecuencias (figuras 3 a y 3b). Figure 3a: Distribución de frecuencias Figure 3b: Selección variable Desti counts: Desti Granada Palma Sevilla Valencia 15 17 24 23 percentages: Desti Granada Palma Sevilla Valencia 18.99 21.52 30.38 29. Nota : Observará que en el cuadro de selección de Variables (figura 3b) no están disponibles las variables Retras ni Vacants. Esto es debido a que el programa solamente obtiene la tabla de frecuencias para variables tipo factor (cualitativas definidas como factor) y no para variables cuantitativas. Existe la opción de calcular tablas de frecuencias para variables cuantitativas pero se tiene que realizar mediante la instrucción correspondiente o definiendo en el programa la variable cuantitativa como un factor.

Nota : Con esta instrucción ,cut(), dividimos los valores de la variable Retras en intervalos cuyos extremos son los indicados en breaks= c(0,2,4,6, 8,10,12,14,16,18,20) , de esta forma el primer intervalo es (0-2], el segundo (2-4] y así sucesivamente hasta el último que será (18-20]. Observar que la amplitud del intervalo es constante e igual a 2. Los intervalos se guardan en Activitat_1$T Introducimos las siguientes instruccions en la venta R Script para obtener la tabla de frecuencias de la variable Retras : r.n=table(Activitat_1$T1) # Frecuencias Absolutas r.f=table(Activitat_1$T1)/sum(table(Activitat_1$T1)) # Frecuencias Relativas r.N=c(cumsum(r.n)) # Frecuencias Relativas Acumuladas r.F=c(r.N/sum(r.n)) # Frecuencias Absolutas Acumuladas cbind(r.n,r.f,r.N,r.F) # Visualización de la tabla de Frecuencias r.n r.f r.N r.F (0,2] 3 0.03846154 3 0. (2,4] 4 0.05128205 7 0. (4,6] 7 0.08974359 14 0. (6,8] 1 1 0.14102564 25 0. (8,10] 21 0.26923077 46 0. (10,12] 10 0.12820513 56 0. (12,14] 8 0.10256410 64 0. (14,16] 10 0.12820513 74 0. (16,18] 3 0.03846154 77 0. (18,20] 1 0.01282051 78 1. Responder a las siguientes cuestiones:

  • Si la base de datos tiene 80 observaciones ¿por qué en la tabla tenemos 78 casos? Porque hay casos extremos
  • La variable Retras es de naturaleza: Cuantitativa continua
  • ¿Cuántos vuelos tienen entre 2 y 4 minutos de retraso? 4 vuelos
  • ¿Cuántos vuelos tienen 12 o menos minutos de retraso? 56 vuelos
  • ¿Cuántos vuelos tienen más de 14 minutos de retraso? 16 o 14 vuelos
  • ¿Cuántos vuelos tienen entre 4 y 16 minutos de retraso? 67 vuelos
  • ¿Qué porcentaje de vuelos tienen entre 6 y 8 minutos de retraso? 14.10%
  • ¿Qué porcentaje de vuelos tienen menos de 8 minutos de retraso? 32.05%
  • ¿Qué porcentaje de vuelos tienen más 10 minutos de retraso? 28.21%
  • ¿Qué porcentaje de vuelos tienen entre 4 y 18 minutos de retraso? 89.74%
  1. Realizar los siguientes gráficos seleccionando las respectivas opciones en el menú de Gráficas. a) Diagrama de barras y sectores de la variable Desti.
  • Barras
  • Sectores b) Diagrama de Stem and leaf de Vacants.

with(Activitat_1, stem.leaf(Vacants, na.rm=TRUE)) 1 | 2: represents 1. leaf unit: 0. n: 80 5 0 | 00000 1 | 10 2 | 00000 14 3 | 0000 15 4 | 0 Granada Palma Sevilla Valencia Desti Frequency 0 5 10 15 20 15 17 24 23 Granada (19%) Palma (22%) Sevilla (30%) Valencia (29%) Desti

a) El 25% de los vuelos con menos retraso tienen un retraso máximo de: 6 minutos b) El 40% de los vuelos con mayor retraso tienen un retraso mínimo de: 10 minutos c) El 50% de los vuelos tienen un retraso máximo de: 9 minutos d) Un retraso de 11 minutos corresponde al 5 % de los vuelos.

  1. Obtención de un polígono de frecuencias de la variable Retras : Copiar la siguiente instrucción en la ventana de R Script y ejecutarla. Copiar el gráfico que se obtiene. tmp=hist(Activitat_1$Retras,breaks=c(0,2,4,6,8,10,12,14,16,18,20)) lines(c(min(tmp$breaks),tmp$mids,max(tmp$breaks)),c(0,tmp$counts,0),type="l")
  2. Polígono de frecuencias acumuladas de Retras : Copiar las siguientes instrucciones en la ventana de R Script y ejecutarlas. Copiar los gráficos que se obtienen. 7.1) Frecuencias absolutes. breaks=c(0,2,4,6,8,10,12,14,16,18,20) r.N=c(0,cumsum(r.n)) # Recalculamos las frecuencias absolutas acumulades. plot(breaks,r.N,main="Polígono de frecuencias acumuladas",xlab="Retras", ylab=" Frecuencias absolutas acumuladas") lines(breaks,r.N) Histogram of Activitat_1$Retras Activitat_1$Retras Frequency 0 5 10 15 20 0 5 10 15 20

7.2) Frecuencias relativas r.F=c(0,cumsum(r.f)) # Recalculamos las frecuencias relativas acumulades. plot(breaks,r.F,main="Polígono de frecuencias acumuladas",xlab="Retras", ylab=" Frecuencias relativas acumuladas") lines(breaks,r.F) 0 5 10 15 20 0 20 40 60 80 Polígono de frecuencias acumuladas Retras Frecuencias absolutas acumuladas 0 5 10 15 20

Polígono de frecuencias acumuladas Retras Frecuencias relativas acumuladas