












Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Estadistica 1, Profesor: no lo recuerdo (era un poco cojo), Carrera: Administració i Direcció d'Empreses, Universidad: UB
Tipo: Apuntes
1 / 20
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!













Antes de comenzar a desarrollar la actividad podemos observar que existen tres variables relacionadas entre ellas: el destino, el restras y las vacantes.
Activitat_1 <- sqlQuery(channel = 1, select * from [Hoja1$])
Activitat_1 <- sqlQuery(channel = 2, select * from [Hoja1$])
A partir de aquí, se pueden ver los resultados más significantes a partir del programa EXCEL donde nos dice los destinos donde encontramos Valencia, Palma, Sevilla y Granda como ciudades españolas.
También se pueden observar diferentes datos como pueden ser: el retraso, los cuartiles, el mínimo, el máximo, entre otros..
summary(Activitat_1)
Desti Retras Vacants
Granada :15 Min. : 0.430 Min. : 0.
Palma :17 1st Qu.: 6.603 1st Qu.: 6.
Sevilla :24 Median : 9.195 Median : 8.
Valencia:23 Mean : 9.589 Mean : 7.7 NA's :
1 3rd Qu.:12.900 3rd Qu.:10.
Max. :19.390 Max. :20.
NA's :
.Table <- table(Activitat_1$Desti)
.Table # counts for Desti
Estos datos corresponden al número de
observaciones totales de cada destino.
Profesora: Núria ViladomiuDNI: 47953416–A
Para observar el conjuntos de frecuencias relativas y absolutas todas juntas hemos de seguir esta instrucción:
cbind(table(Activitat_1$Vacants),
A continuación, nos disposemos a dar las intrucciones para mostrar la tabla de frecuencias relacionada con la variable retraso:
Activitat_1$T1=cut(Activitat_1$Retras,breaks=c(0,2,4,6,8,10,12,14,16,18,20))
David Álvarez Martín David Álvarez Martín DNI: 47953416–A DNI: 47953416–A Profesora: Núria Viladomiu Profesora: Núria Viladomiu
Tal y como establece la actividad, camviamos los breaks y el nombre de la variable que se crea con
cut (Activitat_1$T2 i observamos como se modifica la tabla de frecuencias:
Activitat_1$T2=cut(Activitat_1$Retras, breaks=c(0,4,8,12,16,20))
table(Activitat_1$T2)
Calculamos las frecuencias relativas con las instrucciones:
table(Activitat_1$T1)/sum(table(Activitat_1$T1))
Aquí se muestran las frecuencias absolutas y relativas de la tabla original:
cbind(table(Activitat_1$T1),table(Activitat_1$T1)/sum(table(Activitat_1$T1)))
David Álvarez Martín David Álvarez Martín DNI: 47953416–A DNI: 47953416–A Profesora: Núria Viladomiu Profesora: Núria Viladomiu
Con las nuevas instrucciones podemos hacer las frecuencias de retraso. Se pueden observar los valores de intensities y de densities. Los límites de los intérvalos corresponden a los breaks, el número
de frecuéncias absolutas correspone a los counts. Finalmente, la marca de clase o valor representativa correspone al denominado mids.
David Álvarez Martín David Álvarez Martín DNI: 47953416–A DNI: 47953416–A Profesora: Núria Viladomiu Profesora: Núria Viladomiu
$breaks
[1] 0 2 4 6 8 10 12 14 16 18 20
$counts
[1] 3 4 7 11 21 10 8 10 3 1
$density
[1] 0.019230769 0.025641026 0.044871795 0.070512821 0.134615385 0.064102564 0.
[8] 0.064102564 0.019230769 0.
$mids
[1] 1 3 5 7 9 11 13 15 17 19
$xname
[1] "Activitat_1$Retras"
$equidist
[1] TRUE
attr(,"class")
[1] "histogram"
Llegados a este punto, podemos llegar a obtener el DIAGRAMA DE BARRAS de destino. Las dadas corresponden a los puntos iniciales que hemos dado y se puede ver reflejado en este tipo de gráfico.
David Álvarez Martín David Álvarez Martín DNI: 47953416–A DNI: 47953416–A Profesora: Núria Viladomiu Profesora: Núria Viladomiu
211 F r e q
DestiValenciaSevillaPalmaGranada 50
David Álvarez Martín DNI: 47953416–A Profesora: Núria Viladomiu
barplot(table(Activitat_1$Desti), xlab="Desti", ylab="Frequency")
library(aplpack, pos=4)
A continuación, podemos ver de forma detallada y clara el DIAGRAMA STEAM AND LEAF,
donde se puede observar que de los 80 vuelos, las plazas vacantes que se pueden encontrar. El número total de vuelos, es decir 80, también lo podemos encontrar a partir de la suma acumulada de: 39+18+23.
Por estos motivos, vemos que hay 11 vacantes de 6 plazas, de 4 vacantes de 5 plazas, o 10 plazas de 10 vacantes, como lo podíamos ver en el inicio.
stem.leaf(Activitat_1$Vacants, unit=1, na.rm=TRUE) 1
| 2: represents 1.
leaf unit: 1
n: 80
5 0* | 00000 14 t | 222223333
19 f | 45555 39 s | 66666666666777777777
Sevilla
F r e
Davi d
Álvarez Martín DNI: 47953416–A Profesora: Núria Viladomiu
9 t | 2222
f |
s |
El siguiente gráfico que podemos observar representa un HISTOGRAMA del retraso. En el gráfico
podemos ver la frecuencia de retraso. Podemos ver que el máximo se encuentra en 9’195. Además es el más común. Podemos ver como el valor máximo corresponde al valor 21, ya que si nos fijamos en el intervalo que va del 8 a 10 se puede observar fácilmente.
A continuación, represento gráficamente el HISTOGRAMA:
lines(c(min(tmp$breaks),tmp$mids,max(tmp$breaks)),c(0,tmp$counts,0),type="l")
Podemos calcular las frecuencias relativas y las frecuencias absolutas:
pas.n = table(Activitat_1$Vacants)
pas.n
pas.f= pas.n/sum(pas.n)
David Álvarez Martín David Álvarez Martín DNI: 47953416–A DNI: 47953416–A Profesora: Núria Viladomiu Profesora: Núria Viladomiu
Las frecuencias absolutas acumuladas tambien se pueden obtener:
pas.N=c(cumsum(pas.n))
pas.N
0 2 3 4 5 6 7 8 9 10 11 12 18 19 20
5 10 14 15 19 30 39 49 57 67 71 75 76 77 80
pas.F= pas.N/sum(pas.n)
pas.F
0 2 3 4 5 6 7 8 9 10 11 12 18 19
0.0625 0.1250 0.1750 0.1875 0.2375 0.3750 0.4875 0.6125 0.7125 0.8375 0.8875 0.9375 0.
20
cbind(pas.N, pas.F)
pas.N pas.F
David Álvarez Martín David Álvarez Martín DNI: 47953416–A DNI: 47953416–A Profesora: Núria Viladomiu Profesora: Núria Viladomiu
David Álvarez Martín DNI: 47953416–A Profesora: Núria Viladomiu
Calculamos el POLÍGONO DE FRECUENCIAS ACUMULADAS de retraso. Primero definiremos los intervalos y después calcularemos las frecuencias absolutas acumuladas. Más tarde calcularemos
las frecuencias relativas.
breaks=c(0,2,4,6,8,10,12,14,16,18,20)
breaks=seq(0,20, by=2)
breaks
[1] 0 2 4 6 8 10 12 14 16 18 20
retard.n = table(Activitat_1$T1)
retard.n
retard.N=c(0,cumsum(retard.n))
retard.N
(0,2] (2,4] (4,6] (6,8] (8,10] (10,12] (12,14] (14,16] (16,18] (18,20]
0 3 7 14 25 46 56 64 74 77 78
plot(breaks, retard.N, main="Polígon de freqüències acumulades", xlab="Retard",
lines(breaks, retard.N)
David Álvarez Martín David Álvarez Martín DNI: 47953416–A DNI: 47953416–A Profesora: Núria Viladomiu Profesora: Núria Viladomiu
retard.F=c(0,cumsum(retard.f))
plot(breaks, retard.F, main="Polígon de freqüències acumulades", xlab="Retard",
lines(breaks, retard.F)
David Álvarez Martín David Álvarez Martín DNI: 47953416–A DNI: 47953416–A Profesora: Núria Viladomiu Profesora: Núria Viladomiu