Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


R Commander, Apuntes de Estadística

Asignatura: Estadistica 1, Profesor: no lo recuerdo (era un poco cojo), Carrera: Administració i Direcció d'Empreses, Universidad: UB

Tipo: Apuntes

2017/2018

Subido el 25/01/2018

laiacbanus
laiacbanus 🇪🇸

5

(1)

1 documento

1 / 20

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
ESTADISTICA 1 (UB)
EJERCICIO 1 RCOMMANDER
LOPEZ HERRERO,
FRANCISCO MANUEL 17-18
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14

Vista previa parcial del texto

¡Descarga R Commander y más Apuntes en PDF de Estadística solo en Docsity!

ESTADISTICA 1 (UB)

EJERCICIO 1 RCOMMANDER

LOPEZ HERRERO,

FRANCISCO MANUEL 17-

Antes de comenzar a desarrollar la actividad podemos observar que existen tres variables relacionadas entre ellas: el destino, el restras y las vacantes.

Activitat_1 <- sqlQuery(channel = 1, select * from [Hoja1$])

Activitat_1 <- sqlQuery(channel = 2, select * from [Hoja1$])

A partir de aquí, se pueden ver los resultados más significantes a partir del programa EXCEL donde nos dice los destinos donde encontramos Valencia, Palma, Sevilla y Granda como ciudades españolas.

También se pueden observar diferentes datos como pueden ser: el retraso, los cuartiles, el mínimo, el máximo, entre otros..

summary(Activitat_1)

Desti Retras Vacants

Granada :15 Min. : 0.430 Min. : 0.

Palma :17 1st Qu.: 6.603 1st Qu.: 6.

Sevilla :24 Median : 9.195 Median : 8.

Valencia:23 Mean : 9.589 Mean : 7.7 NA's :

1 3rd Qu.:12.900 3rd Qu.:10.

Max. :19.390 Max. :20.

NA's :

.Table <- table(Activitat_1$Desti)

.Table # counts for Desti

Estos datos corresponden al número de

observaciones totales de cada destino.

Profesora: Núria ViladomiuDNI: 47953416–A

Para observar el conjuntos de frecuencias relativas y absolutas todas juntas hemos de seguir esta instrucción:

cbind(table(Activitat_1$Vacants),

  • table(Activitat_1$Vacants)/sum(table(Activitat_1$Vacants))) [,1]

[,2]

A continuación, nos disposemos a dar las intrucciones para mostrar la tabla de frecuencias relacionada con la variable retraso:

Activitat_1$T1=cut(Activitat_1$Retras,breaks=c(0,2,4,6,8,10,12,14,16,18,20))

David Álvarez Martín David Álvarez Martín DNI: 47953416–A DNI: 47953416–A Profesora: Núria Viladomiu Profesora: Núria Viladomiu

(0,2] (2,4] (4,6] (6,8] (8,10] (10,12] (12,14] (14,16] (16,18] (18,20]

Tal y como establece la actividad, camviamos los breaks y el nombre de la variable que se crea con

cut (Activitat_1$T2 i observamos como se modifica la tabla de frecuencias:

Activitat_1$T2=cut(Activitat_1$Retras, breaks=c(0,4,8,12,16,20))

table(Activitat_1$T2)

(0,2] (2,3] (3,6] (6,8] (8,11] (11,12] (12,13] (13,14] (14,25] (25,40]

Calculamos las frecuencias relativas con las instrucciones:

table(Activitat_1$T1)/sum(table(Activitat_1$T1))

(0,2] (2,4] (4,6] (6,8] (8,10] (10,12] (12,14] (14,16] (16,18]

(18,20]

Aquí se muestran las frecuencias absolutas y relativas de la tabla original:

cbind(table(Activitat_1$T1),table(Activitat_1$T1)/sum(table(Activitat_1$T1)))

[,1] [,2]

David Álvarez Martín David Álvarez Martín DNI: 47953416–A DNI: 47953416–A Profesora: Núria Viladomiu Profesora: Núria Viladomiu

Con las nuevas instrucciones podemos hacer las frecuencias de retraso. Se pueden observar los valores de intensities y de densities. Los límites de los intérvalos corresponden a los breaks, el número

de frecuéncias absolutas correspone a los counts. Finalmente, la marca de clase o valor representativa correspone al denominado mids.

David Álvarez Martín David Álvarez Martín DNI: 47953416–A DNI: 47953416–A Profesora: Núria Viladomiu Profesora: Núria Viladomiu

$breaks

[1] 0 2 4 6 8 10 12 14 16 18 20

$counts

[1] 3 4 7 11 21 10 8 10 3 1

$density

[1] 0.019230769 0.025641026 0.044871795 0.070512821 0.134615385 0.064102564 0.

[8] 0.064102564 0.019230769 0.

$mids

[1] 1 3 5 7 9 11 13 15 17 19

$xname

[1] "Activitat_1$Retras"

$equidist

[1] TRUE

attr(,"class")

[1] "histogram"

Llegados a este punto, podemos llegar a obtener el DIAGRAMA DE BARRAS de destino. Las dadas corresponden a los puntos iniciales que hemos dado y se puede ver reflejado en este tipo de gráfico.

David Álvarez Martín David Álvarez Martín DNI: 47953416–A DNI: 47953416–A Profesora: Núria Viladomiu Profesora: Núria Viladomiu

211 F r e q

DestiValenciaSevillaPalmaGranada 50

David Álvarez Martín DNI: 47953416–A Profesora: Núria Viladomiu

barplot(table(Activitat_1$Desti), xlab="Desti", ylab="Frequency")

library(aplpack, pos=4)

A continuación, podemos ver de forma detallada y clara el DIAGRAMA STEAM AND LEAF,

donde se puede observar que de los 80 vuelos, las plazas vacantes que se pueden encontrar. El número total de vuelos, es decir 80, también lo podemos encontrar a partir de la suma acumulada de: 39+18+23.

Por estos motivos, vemos que hay 11 vacantes de 6 plazas, de 4 vacantes de 5 plazas, o 10 plazas de 10 vacantes, como lo podíamos ver en el inicio.

stem.leaf(Activitat_1$Vacants, unit=1, na.rm=TRUE) 1

| 2: represents 1.

leaf unit: 1

n: 80

5 0* | 00000 14 t | 222223333

19 f | 45555 39 s | 66666666666777777777

Sevilla

F r e

Davi d

Álvarez Martín DNI: 47953416–A Profesora: Núria Viladomiu

9 t | 2222

f |

s |

El siguiente gráfico que podemos observar representa un HISTOGRAMA del retraso. En el gráfico

podemos ver la frecuencia de retraso. Podemos ver que el máximo se encuentra en 9’195. Además es el más común. Podemos ver como el valor máximo corresponde al valor 21, ya que si nos fijamos en el intervalo que va del 8 a 10 se puede observar fácilmente.

A continuación, represento gráficamente el HISTOGRAMA:

lines(c(min(tmp$breaks),tmp$mids,max(tmp$breaks)),c(0,tmp$counts,0),type="l")

Podemos calcular las frecuencias relativas y las frecuencias absolutas:

pas.n = table(Activitat_1$Vacants)

pas.n

pas.f= pas.n/sum(pas.n)

David Álvarez Martín David Álvarez Martín DNI: 47953416–A DNI: 47953416–A Profesora: Núria Viladomiu Profesora: Núria Viladomiu

Las frecuencias absolutas acumuladas tambien se pueden obtener:

pas.N=c(cumsum(pas.n))

pas.N

0 2 3 4 5 6 7 8 9 10 11 12 18 19 20

5 10 14 15 19 30 39 49 57 67 71 75 76 77 80

pas.F= pas.N/sum(pas.n)

pas.F

0 2 3 4 5 6 7 8 9 10 11 12 18 19

0.0625 0.1250 0.1750 0.1875 0.2375 0.3750 0.4875 0.6125 0.7125 0.8375 0.8875 0.9375 0.

20

cbind(pas.N, pas.F)

pas.N pas.F

David Álvarez Martín David Álvarez Martín DNI: 47953416–A DNI: 47953416–A Profesora: Núria Viladomiu Profesora: Núria Viladomiu

David Álvarez Martín DNI: 47953416–A Profesora: Núria Viladomiu

Calculamos el POLÍGONO DE FRECUENCIAS ACUMULADAS de retraso. Primero definiremos los intervalos y después calcularemos las frecuencias absolutas acumuladas. Más tarde calcularemos

las frecuencias relativas.

INTERVALOS

breaks=c(0,2,4,6,8,10,12,14,16,18,20)

breaks=seq(0,20, by=2)

breaks

[1] 0 2 4 6 8 10 12 14 16 18 20

FRECUENCIAS ABSOLUTAS ACUMULADAS

retard.n = table(Activitat_1$T1)

retard.n

(18,20]

FRECUENCIAS ABSOLUTAS ACUMULADAS

retard.N=c(0,cumsum(retard.n))

retard.N

(0,2] (2,4] (4,6] (6,8] (8,10] (10,12] (12,14] (14,16] (16,18] (18,20]

0 3 7 14 25 46 56 64 74 77 78

POLÍGON DE FRECUENCIAS ABSOLUTAS ACUMULADAS

plot(breaks, retard.N, main="Polígon de freqüències acumulades", xlab="Retard",

  • ylab="Freqüències absolutes acumulades")

lines(breaks, retard.N)

David Álvarez Martín David Álvarez Martín DNI: 47953416–A DNI: 47953416–A Profesora: Núria Viladomiu Profesora: Núria Viladomiu

retard.F=c(0,cumsum(retard.f))

plot(breaks, retard.F, main="Polígon de freqüències acumulades", xlab="Retard",

  • ylab="Freqüències relatives acumulades")

lines(breaks, retard.F)

David Álvarez Martín David Álvarez Martín DNI: 47953416–A DNI: 47953416–A Profesora: Núria Viladomiu Profesora: Núria Viladomiu