Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Activitats 2 R Comander, Apuntes de Estadística

Asignatura: Estadistica 1, Profesor: Javier Sierra, Carrera: Administració i Direcció d'Empreses, Universidad: UB

Tipo: Apuntes

2016/2017

Subido el 06/01/2017

andreea_millan
andreea_millan 🇪🇸

3.5

(28)

5 documentos

1 / 10

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
> load("C:/Users/Albert Porrino/Desktop/Encuesta.RData")
> summary(Encuesta)
1. Breu anàlisi de totes les variables de la base de dades
> summary(Encuesta)
Cuestionario Lugar_compra Compra_GB Zona Ingresos
EstCivil Edad Sexo Tam_familiar
Min. : 1.0 Comercio :112 Alguna_vez :140 Barcelona :145 Min. : 858.9
Casado :174 Min. :18.00 Hombre:224 Min. :1.000
1st Qu.:100.8 Grandes_Sup:211 Habitualmente:170 Hospitalet:140 1st Qu.:1266.1
Divorciado: 73 1st Qu.:29.00 Mujer :176 1st Qu.:2.000
Median :200.5 Mercado : 77 Nunca : 90 Sabadell :115 Median :1579.2
Soltero :153 Median :39.00 Median :3.000
Mean :200.5 Mean :1624.7
Mean :39.86 Mean :3.498
3rd Qu.:300.2 3rd Qu.:1909.0
3rd Qu.:51.00 3rd Qu.:4.000
Max. :400.0 Max. :3150.2
Max. :65.00 Max. :8.000
NA's :6
Gasto_alim V_AtencionC V_Limpieza V_SistemaP
V_AtencionP V_ProdGB V_ServicioD
Min. : 300.8 Min. : 0.000 Min. : 0.000 Min. : 0.000 Min. : 0.000
Min. : 0.000 Min. : 0.000
1st Qu.: 413.8 1st Qu.: 2.000 1st Qu.: 2.000 1st Qu.: 2.000 1st Qu.: 2.000
1st Qu.: 5.000 1st Qu.: 3.000
Median : 469.2 Median : 4.000 Median : 4.000 Median : 4.000 Median : 3.000
Median : 8.000 Median : 5.000
Mean : 489.5 Mean : 3.836 Mean : 4.042 Mean : 3.964 Mean : 3.842
Mean : 6.659 Mean : 4.845
3rd Qu.: 562.8 3rd Qu.: 5.000 3rd Qu.: 5.000 3rd Qu.: 5.000 3rd Qu.: 5.000
3rd Qu.: 9.000 3rd Qu.: 7.000
Max. :1150.4 Max. :10.000 Max. :10.000 Max. :10.000 Max. :10.000
Max. :10.000 Max. :10.000
NA's :2 NA's :15 NA's :15 NA's :14 NA's :13
NA's :13 NA's :14
La gràfica conté 5 variables.
Totes les variables són numèriques, per tant hi hauran les
mateixes, 5.
pf3
pf4
pf5
pf8
pf9
pfa

Vista previa parcial del texto

¡Descarga Activitats 2 R Comander y más Apuntes en PDF de Estadística solo en Docsity!

load("C:/Users/Albert Porrino/Desktop/Encuesta.RData")

summary(Encuesta)

  1. Breu anàlisi de totes les variables de la base de dades

summary(Encuesta)

EstCivil^ Cuestionario Edad Lugar_compraSexo^ Tam_familiarCompra_GB^ Zona^ Ingresos

CasadoMin.^ :^ :1741.0^ ComercioMin. :18.00^ :112 Hombre:224Alguna_vez Min.:140 :1.000Barcelona^ :145^ Min.^ :^ 858.

Divorciado:1st Qu.:100.8 73 Grandes_Sup:2111st Qu.:29.00 MujerHabitualmente:170 :176 1st Qu.:2.000^ Hospitalet:140^ 1st^ Qu.:1266.

SolteroMedian :200.5 :153^ MercadoMedian :39.00:^77 Nunca^ Median:^90 :3.000Sabadell^ :115^ Median^ :1579.

MeanMean :39.86:200.5 Mean :3.498 Mean^ :1624.

3rd Qu.:51.003rd Qu.:300.2 3rd Qu.:4.000 3rd^ Qu.:1909.

Max.Max. :65.00:400.0 Max. :8.000 Max.^ :3150. NA's :

V_AtencionP Gasto_alimV_ProdGB^ V_AtencionCV_ServicioD^ V_Limpieza^ V_SistemaP

Min.Min. : 0.000: 300.8 Min.Min. :: 0.0000.000^ Min.^ :^ 0.000^ Min.^ :^ 0.000^ Min.^ :^ 0.

1st Qu.: 5.0001st Qu.: 413.8 1st Qu.:1st Qu.: 3.0002.000^ 1st^ Qu.:^ 2.000^ 1st^ Qu.:^ 2.000^ 1st^ Qu.:^ 2.

Median : 8.000Median : 469.2 MedianMedian :: 5.0004.000^ Median^ :^ 4.000^ Median^ :^ 4.000^ Median^ :^ 3.

MeanMean : 6.659: 489.5 MeanMean :: 4.8453.836^ Mean^ :^ 4.042^ Mean^ :^ 3.964^ Mean^ :^ 3.

3rd Qu.: 9.0003rd Qu.: 562.8 3rd Qu.:3rd Qu.: 7.0005.000^ 3rd^ Qu.:^ 5.000^ 3rd^ Qu.:^ 5.000^ 3rd^ Qu.:^ 5.

Max.Max. :10.000:1150.4 Max.Max. :10.000:10.000^ Max.^ :10.000^ Max.^ :10.000^ Max.^ :10.

NA'sNA's :13:2^ NA'sNA's :14:15^ NA's^ :15^ NA's^ :14^ NA's^ :

La gràfica conté 5 variables. Totes les variables són numèriques, per tant hi hauran les mateixes, 5.

  1. Distribució de freqüències de la variable Lugar_compra.

**> local({

  • .Table <- with(Encuesta, table(Lugar_compra))
  • cat("\ncounts:\n")
  • print(.Table)
  • cat("\npercentages:\n")
  • print(round(100*.Table/sum(.Table), 2))
  • })**

counts: Lugar_compra Comercio Grandes_Sup Mercado 112 211 77

percentages: Lugar_compra Comercio Grandes_Sup Mercado 28.00 52.75 19.

¿Quin percentatge d'observacions correspon a “Grandes superficies”? “ Grandes superficies té un percentatge d’un 52,75%.

numSummary(Encuesta[,"Edad"], statistics=c("mean", "sd", "IQR", "quantiles"), quantiles=c(0,.25,.5,.75,1)) mean sd IQR 0% 25% 50% 75% 100% n 39.86 13.36364 22 18 29 39 51 65 400

L’edat mínima es de 18 anys. L’edat màxima es de 65 anys. L’edat mitjana es de 40 anys. (39,86). El recorregut interquartilic es del 22% ( 51-29). La mitjana es de 32,.

  1. Stem and Leaf de Gasto_alim i Ingresos. (Gràfiques ► Gràfica de tija i fulles) Indiqueu:

with(Encuesta, stem.leaf(Gasto_alim, na.rm=TRUE)) [1] "Warning: NA elements have been removed!!" Steam and leaf Gasto_alim 1 | 2: represents 120 leaf unit: 10 n: 398 13 3* | 0000011111111 22 t | 222333333 37 f | 444444444455555 55 s | 666666666677777777 82 3. | 888888888889999999999999999 111 4* | 00000000000011111111111111111 145 t | 2222222222222222222333333333333333 186 f | 44444444444444444455555555555555555555555 (26) s | 66666666666666677777777777

186 4. | 888888888888888899999999 162 5* | 00000000000000001111111111

136 t | 222222223333333333 118 f | 44444455555555555 101 s | 66666777 93 5. | 888888888889999999999 72 6* | 0000000000001111 56 t | 2223333333 46 f | 444444445555555 31 s | 66666667777 20 6. | 888888888889999999 2 7* | 0 HI: 1150.

  • Nom de la variable que presenta valors outliers ............
  • (^) Despesa màxima del 40% d' enquestats que gasta menys: 0,4 ·120 = 48 ; posició 48 = 7 ·10 = 70
  • Percentatge d' enquestats que gasten més de 600€ : 100·187 /360 = 52% ; 100 -52 = 48%
  • Ingrés mínim i màxim : Ingrés màxim = 70 Ingrés mínim = 30

with(Encuesta, stem.leaf(Ingresos, na.rm=TRUE)) [1] "Warning: NA elements have been removed!!" Steam and leaf Ingresos 1 | 2: represents 120 leaf unit: 10 n: 394 9 8 | 566788999 30 9 | 000112333335677899999 68 10 | 00011111112222345556667777778889999999 91 11 | 01111122333334555688899 100 12 | 011113459 136 13 | 112333444455556666777777778888899999 170 14 | 0000000111223334455566677888888999

numSummary(Encuesta[,"Ingresos"], statistics=c("mean", "sd", "IQR", "quantiles"), quantiles=c(0,.25,.5,.75,1)) mean sd IQR 0% 25% 50% 75% 100% n NA 1624.739 482.6939 642.9175 858.9 1266.122 1579.24 1909.04 3150.25 394 6

Indiqueu quina de les dues variables té una mitjana més representativa: La variable “ gasto alim” té una variable més representativa, ja que els seus valors estàn més compactes que no pas en la variable de “ingresos”, on la mitjana es de 1625, i té un percentatge que se’n va al 3150, per tant aquesta última serà més dispersa.

  1. Estandarditzeu la variable Edad i comproveu amb el resum numèric que la mitjana es 0 i la variància 1.

Encuesta <- local({

  • .Z <- scale(Encuesta[,c("Edad")])
  • within(Encuesta, {
  • Z.Edad <- .Z[,1]
  • })
  • }) [12] NOTA: El conjunto de datos Encuesta tiene 400 filas y 18 columnas.
    1. le Ingresos de la següent forma:

Variable Ingresos Tram_Ingreso 858 < Ingresos <= 1266. 1266.122 < Ingresos <= 1909. 1909.04 < Ingresos <= 3151

Bajo Medio Alto

Encuesta <- within(Encuesta, {

  • Tram_ingreso. <- Recode(Ingresos,
  • 'Variable Ingresos Tram_Ingreso; 858 < Ingresos <= 1266.122; 1266.122 < Ingresos <= 1909.04; 1909.04 < Ingresos <= 3151 Bajo; Medio; Alto;',
  • as.factor.result=TRUE)
  • Quants consumidors tenen uns Ingressos Baixos ?.......................
  • Quin percentatge de consumidors tenen uns Ingressos Mitjans ?......................
  • La mitjana de la variable Gasto_alim per als consumidors amb uns Ingressos Mitjans és igual a: .........................
  • (^) En quin tram d’ingressos la variable Gasto_alim és més homogènia?..........................................
  1. Obtingueu la taula de doble entrada de les variables Tram_Ingreso i Lugar_compra.
  2. Obtingueu el coeficient de correlació entre les variables Ingresos i Gasto_alim. Comenteu el resultat:

cor(Encuesta[,c("Gasto_alim","Ingresos")], use="complete") Gasto_alim Ingresos Gasto_alim 1.0000000 0. Ingresos 0.8803677 1.

En aquesta petita taula podem observar que els coeficients de correlació són positius, per tant serà directa, també podem parlar d’una correlació molt forta, ja que es 1, o es molt propera a 1.

  • Per uns ingressos de 1500€, quina és la despesa mitjana estimada? .............................
  • Si desitgem tenir una despesa mitjana en alimentació de 550€, quin hauria de ser el nivell de ingressos? .....................................................
  • Si s'incrementen en un 3% els ingressos de tots els individus, com queda afectada la recta de regressió? ..................................................................................................................................... ...............................
  • Obtingueu el diagrama de dispersió de X=Ingresos i Y=Gasto_alim