Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


actividad 2 rcommander, Apuntes de Estadística

Asignatura: Estadistica 1, Profesor: Francisco javier, Carrera: Administració i Direcció d'Empreses, Universidad: UB

Tipo: Apuntes

2016/2017

Subido el 07/10/2017

cris981988
cris981988 🇪🇸

3.5

(115)

31 documentos

1 / 10

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Descargado en:
patatabrava.com
ESTADISTICA 1 (UB)
ACTIVITATS 2 R COMANDER
SIERRA, JAVIER 16-17
pf3
pf4
pf5
pf8
pf9
pfa

Vista previa parcial del texto

¡Descarga actividad 2 rcommander y más Apuntes en PDF de Estadística solo en Docsity!

Descargado en:

patatabrava .com

ESTADISTICA 1 (UB)

ACTIVITATS 2 R COMANDER

SIERRA, JAVIER 16-

load("C:/Users/Albert Porrino/Desktop/Encuesta.RData")

summary(Encuesta)

1. Breu anàlisi de totes les variables de la base de dades

summary(Encuesta)

Tam_familiar^ Cuestionario^ Lugar_compra^ Compra_GB^ Zona^ Ingresos^ EstCivil^ Edad^ Sexo

Hombre:224Min.^ : 1.0^ ComercioMin. :1.000^ :112^ Alguna_vez^ :140^ Barcelona :145^ Min.^ : 858.9^ Casado^ :174^ Min.^ :18.

Qu.:29.001st Qu.:100.8 Mujer :176^ Grandes_Sup:211 1st Qu.:2.000^ Habitualmente:170^ Hospitalet:140^ 1st Qu.:1266.1^ Divorciado: 73^ 1st

Median :3.000Median :200.5^ Mercado^ : 77^ Nunca^ : 90^ Sabadell :115^ Median :1579.2^ Soltero^ :153^ Median :39. Mean :200.5 Mean :1624.7 Mean :39.86 Mean :3. 3rd Qu.:300.2 3rd Qu.:1909.0 3rd Qu.:51.00 3rd Qu.:4. Max. :400.0 Max. :3150.2 Max. :65.00 Max. :8. NA's :

Gasto_alim V_AtencionC V_Limpieza V_SistemaP V_AtencionP V_ProdGB V_ServicioD Min. : 300.8 Min. : 0.000 Min. : 0.000 Min. : 0.000 Min. : 0.000 Min. : 0.000 Min. : 0. 1st Qu.: 413.8 1st Qu.: 2.000 1st Qu.: 2.000 1st Qu.: 2.000 1st Qu.: 2.000 1st Qu.: 5.000 1st Qu.: 3. Median : 469.2 Median : 4.000 Median : 4.000 Median : 4.000 Median : 3.000 Median : 8.000 Median : 5. Mean : 489.5 Mean : 3.836 Mean : 4.042 Mean : 3.964 Mean : 3.842 Mean : 6.659 Mean : 4. 3rd Qu.: 562.8 3rd Qu.: 5.000 3rd Qu.: 5.000 3rd Qu.: 5.000 3rd Qu.: 5.000 3rd Qu.: 9.000 3rd Qu.: 7. Max. :1150.4 Max. :10.000 Max. :10.000 Max. :10.000 Max. :10.000 Max. :10.000 Max. :10. NA's :2 NA's :15 NA's :15 NA's :14 NA's :13 NA's :13 NA's :

La gràfica conté 5 variables. Totes les variables són numèriques, per tant hi hauran les mateixes, 5.

  1. Distribució de freqüències de la variable Lugar_compra.

**> local({

  • .Table <- with(Encuesta, table(Lugar_compra))
  • cat("\ncounts:\n")
  • print(.Table)
  • cat("\npercentages:\n")
  • print(round(100.Table/sum(.Table), 2))*

[,1] [,2]

(300,400] 82 0.

(400,500] 154 0.

(500,600] 90 0.

(600,700] 70 0.

(700,800] 1 0.

(800,900] 0 0.

(900,1e+03] 0 0. (1e+03,1.1e+03] 0 0. (1.1e+03,1.2e+03] 1 0.

¿Quina freqüència absoluta i relativa presenta l'interval amb marca de

classe 450? ...................

En la marce de classe de 450, es presenta una frequencia absoluta de 154, i una frequencia relativa de 0,386934673%

  1. Resum numèric d’ Edad

library(abind, pos=17)

library(e1071, pos=18)

numSummary(Encuesta[,"Edad"], statistics=c("mean", "sd", "IQR", "quantiles"), quantiles=c(0,.25,.5,.75,1)) mean sd IQR 0% 25% 50% 75% 100% n 39.86 13.36364 22 18 29 39 51 65 400

L’edat mínima es de 18 anys. L’edat màxima es de 65 anys. L’edat mitjana es de 40 anys. (39,86). El recorregut interquartilic es del 22% ( 51-29). La mitjana es de 32,.

  1. Stem and Leaf de Gasto_alim i Ingresos. (Gràfiques Gràfica de tija i fulles) Indiqueu:

> with(Encuesta, stem.leaf(Gasto_alim, na.rm=TRUE))

[1] "Warning: NA elements have been removed!!"

Nom de la variable que presenta valors outliers ............

Percentatge d' enquestats que gasten més de 600€ : 100·187 /360 = 52% ; 100 -52 = 48%

  • 1 | 2: represents Steam and leaf Gasto_alim
    • leaf unit: - n: - 13 3* | - 22 t | - 37 f | - 55 s | - 82 3. |
      • 111 4* |
      • 145 t |
      • 186 f |
      • (26) s |
      • 186 4. |
      • 162 5* |
      • 136 t |
      • 118 f |
      • 101 s |
        • 93 5. |
        • 72 6* |
        • 56 t |
        • 46 f |
        • 31 s |
        • 20 6. |
          • 2 7* |
  • HI: 1150. - 0,4 ·120 = 48 ; posició 48 = 7 ·10 = Despesa màxima del 40% d' enquestats que gasta menys: - Ingrés màxim = Ingrés mínim i màxim : - Ingrés mínim =

(CONTESTARLO)

  1. Resum numèric de Gasto_alim i Ingresos: Gasto_alim

numSummary(Encuesta[,"Gasto_alim"], statistics=c("mean", "sd", "IQR", "quantiles"), quantiles=c(0,.25,.5,.75,1)) mean sd IQR 0% 25% 50% 75% 100% n NA 489.5486 107.2262 149.0075 300.82 413.76 469.24 562.7675 1150.36 398 2 Ingresos numSummary(Encuesta[,"Ingresos"], statistics=c("mean", "sd", "IQR", "quantiles"), quantiles=c(0,.25,.5,.75,1)) mean sd IQR 0% 25% 50% 75% 100% n NA 1624.739 482.6939 642.9175 858.9 1266.122 1579.24 1909.04 3150.25 394 6

Indiqueu quina de les dues variables té una mitjana més representativa: La variable “ gasto alim” té una variable més representativa, ja que els seus valors estàn més compactes que no pas en la variable de “ingresos”, on la mitjana es de 1625, i té un percentatge que se’n va al 3150, per tant aquesta última serà més dispersa.

  1. Estandarditzeu la variable Edad i comproveu amb el resum numèric que la mitjana es 0 i la variància 1.

Encuesta <- local({

  • .Z <- scale(Encuesta[,c("Edad")])
  • within(Encuesta, {
  • Z.Edad <- .Z[,1]
  • })
  • }) [12] NOTA: El conjunto de datos Encuesta tiene 400 filas y 18 columnas.
    1. le Ingresos de la següent forma:

Variable Ingresos Tram_Ingreso

858 < Ingresos <= 1266.

1266.122 < Ingresos <=

1909.04 < Ingresos <= 3151

Bajo

Medio

Alto

Encuesta <- within(Encuesta, {

  • Tram_ingreso. <- Recode(Ingresos,
  • 'Variable Ingresos Tram_Ingreso; 858 < Ingresos <= 1266.122; 1266.122 < Ingresos <= 1909.04; 1909.04 < Ingresos <= 3151Bajo; Medio; Alto;',
  • as.factor.result=TRUE)
  • })

Quants consumidors tenen uns Ingressos Baixos ?.......................

Quin percentatge de consumidors tenen uns Ingressos

Mitjans ?......................

La mitjana de la variable Gasto_alim per als consumidors amb uns

Ingressos Mitjans és igual a: .........................

En quin tram d’ingressos la variable Gasto_alim és més

homogènia?..........................................

  1. Obtingueu la taula de doble entrada de les variables Tram_Ingreso i Lugar_compra.
  2. Obtingueu el coeficient de correlació entre les variables Ingresos i Gasto_alim. Comenteu el resultat:

cor(Encuesta[,c("Gasto_alim","Ingresos")], use="complete") Gasto_alim Ingresos Gasto_alim 1.0000000 0. Ingresos 0.8803677 1.

En aquesta petita taula podem observar que els coeficients de correlació són positius, per tant serà directa, també podem parlar d’una correlació molt forta, ja que es 1, o es molt propera a 1.

F-statistic: 1347 on 1 and 391 DF, p-value: < 2.2e-

Quin percentatge de variació observada a Gasto_alim s’explica amb la

recta ajustada?..................

Per uns ingressos de 1500€, quina és la despesa mitjana estimada?

Si desitgem tenir una despesa mitjana en alimentació de 550€, quin hauria

de ser el nivell de ingressos? .....................................................

Si s'incrementen en un 3% els ingressos de tots els individus, com queda

afectada la recta de regressió?

Obtingueu el diagrama de dispersió de X=Ingresos i Y=Gasto_alim