Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


r commander, Apuntes de Estadística

Asignatura: Estadistica 1, Profesor: Francisco javier, Carrera: Administració i Direcció d'Empreses, Universidad: UB

Tipo: Apuntes

2017/2018

Subido el 03/01/2018

edesan8118
edesan8118 🇪🇸

3.4

(8)

16 documentos

1 / 2

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
ACTIVITAT _2
Nom i Cognoms Sandra Egea Díaz . Grup A4
Entreu al programa R_Commander i carregueu la base de dades Encuesta.Rdata
(Seqüència: Dades Carregar conjunt de dades).
Realitzeu:
1. Breu anàlisi de totes les variables de la base de dades
(Estadístics Resums Conjunt de dades activa).
Indiqueu:
Nombre de variables que conté la base de dades 16
Variables Numèriques Cuestionario, Ingresos, Edad, Tamaño familiar, gasto alimento, V
atencionC, V limpieza, V atencionP, V sistema, VprodGB, V servicioD.
Dades factor . Lugar compra, compra GB, zona, estado civil, sexo.
2. Distribució de freqüències de la variable Lugar_compra. (Estadístics Resums Distribució de
freqüències).
¿Quin percentatge d'observacions correspon a “Grandes superficies”? 52.75%
3. Histograma de la variable Ingresos (Gràfiques Histograma).
¿Quina forma presenta aquesta distribució? Campaniforme / Asimètrica a la dreta / Asimètrica a l'esquerra
Asimetrica a la izquierda. Positiva
4. Taula de freqüències de la variable Gasto_alim amb les instruccions:
hist(Encuesta$Gasto_alim, plot=F)
Encuesta$T1=cut(Encuesta$Gasto_alim, breaks=c
(300,400,500,600,700,800,900,1000,1100,1200))
cbind(table(Encuesta$T1), table(Encuesta$T1)/sum(table(Encuesta$T1)))
¿Quina freqüència absoluta i relativa presenta l'interval amb marca de classe 450? Frecuencia absoluta de
154 y frecuencia relativa de 0.386934673
5. Resum numèric d’Edad (Estadístics Resums Resums numèrics)
Indiqueu: Edat Mínim 18 Màxim 65 Mediana 39 Recorregut interquartílic 22 i Edat Mitjana 39.86
6. Stem and Leaf de Gasto_alim i Ingresos. (Gràfiques Gràfica de tija i fulles) Indiqueu:
Nom de la variable que presenta valors outliers Ingresos
Despesa màxima del 40% d' enquestats que gasta menys 520€
Percentatge d' enquestats que gasten més de 600€ 25.45%
Ingrés mínim i màxim min 850 max 2790
7. Box-plots de Gasto_alim seleccionant a Gràfica per grups la variable Zona. (Gràfiques Diagrama
de caixa) Indiqueu:
Quina zona presenta valors outliers? Barcelona
Zona que té major mediana Barcelona
Zona amb menor rang interquartílic Sabadell
Zona amb major valor màxim (exclòs l’outlier) Hospitalet
Quina zona té menor despesa mitjana? Sabadell
8. Resum numèric de Gasto_alim i Ingresos (Estadístics Resums Resums numèrics). Indiqueu
quina de les dues variables té una mitjana més representativa Gasto alimento
9. Estandarditzeu la variable Edad i comproveu amb el resum numèric que la mitjana es 0 i la variància 1.
(Dades Modificar variable Tipificar variable).
> Encuesta <- local({
pf2

Vista previa parcial del texto

¡Descarga r commander y más Apuntes en PDF de Estadística solo en Docsity!

ACTIVITAT _

Nom i Cognoms Sandra Egea Díaz. Grup A

Entreu al programa R_Commander i carregueu la base de dades Encuesta.Rdata (Seqüència: Dades ► Carregar conjunt de dades ).

Realitzeu:

  1. Breu anàlisi de totes les variables de la base de dades (Estadístics ► Resums ► Conjunt de dades activa). Indiqueu:
    • Nombre de variables que conté la base de dades 16
    • Variables Numèriques Cuestionario, Ingresos, Edad, Tamaño familiar, gasto alimento, V atencionC, V limpieza, V atencionP, V sistema, VprodGB, V servicioD.
    • Dades factor. Lugar compra, compra GB, zona, estado civil, sexo.
  2. Distribució de freqüències de la variable Lugar_compra. (Estadístics ► Resums ► Distribució de freqüències). ¿Quin percentatge d'observacions correspon a “Grandes superficies”? 52.75%
  3. Histograma de la variable Ingresos (Gràfiques ► Histograma). ¿Quina forma presenta aquesta distribució? Campaniforme / Asimètrica a la dreta / Asimètrica a l'esquerra Asimetrica a la izquierda. Positiva
  4. Taula de freqüències de la variable Gasto_alim amb les instruccions:
    • hist(Encuesta$Gasto_alim, plot=F)
    • Encuesta$T1=cut(Encuesta$Gasto_alim, breaks=c (300,400,500,600,700,800,900,1000,1100,1200)) cbind(table(Encuesta$T1), table(Encuesta$T1)/sum(table(Encuesta$T1)))

¿Quina freqüència absoluta i relativa presenta l'interval amb marca de classe 450? Frecuencia absoluta de 154 y frecuencia relativa de 0.

  1. Resum numèric d’ Edad (Estadístics ► Resums ► Resums numèrics) Indiqueu: Edat Mínim 18 Màxim 65 Mediana 39 Recorregut interquartílic 22 i Edat Mitjana 39.
  2. Stem and Leaf de Gasto_alim i Ingresos. (Gràfiques ► Gràfica de tija i fulles) Indiqueu:
    • Nom de la variable que presenta valors outliers Ingresos
    • Despesa màxima del 40% d' enquestats que gasta menys 520€
    • Percentatge d' enquestats que gasten més de 600€ 25.45%
    • Ingrés mínim i màxim min 850 max 2790
  3. Box-plots de Gasto_alim seleccionant a Gràfica per grups la variable Zona. (Gràfiques ► Diagrama de caixa) Indiqueu:
    • Quina zona presenta valors outliers? Barcelona
    • Zona que té major mediana Barcelona
    • Zona amb menor rang interquartílic Sabadell
    • Zona amb major valor màxim (exclòs l’outlier) Hospitalet
    • Quina zona té menor despesa mitjana? Sabadell
  4. Resum numèric de Gasto_alim i Ingresos (Estadístics ► Resums ► Resums numèrics). Indiqueu quina de les dues variables té una mitjana més representativa Gasto alimento
  5. Estandarditzeu la variable Edad i comproveu amb el resum numèric que la mitjana es 0 i la variància 1. (Dades ► Modificar variable ► Tipificar variable). > Encuesta <- local({

**+ .Z <- scale(Encuesta[,c("Edad")])

  • within(Encuesta, {
  • Z.Edad <- .Z[,1]
  • })
  • })**
  1. Obtingueu una nova variable amb nom Tram_Ingreso , com a resultat de recodificar la variable Ingresos de la següent forma:

Variable Ingresos Tram_Ingreso 858 < Ingresos <= 1266. 1266.122 < Ingresos <= 1909. 1909.04 < Ingresos <= 3151

Bajo Medio Alto

Seqüència: (Dades ► Modificar variables del conjunt de dades actives ►Recodificar variables)

Indiqueu:

  • Quants consumidors tenen uns Ingressos Baixos? 99
    • Quin percentatge de consumidors tenen uns Ingressos Mitjans? 49%
    • La mitjana de la variable Gasto_alim per als consumidors amb uns Ingressos Mitjans és igual a: 477.
    • En quin tram d’ingressos la variable Gasto_alim és més homogènia? Ingresos bajos

Deseu el document amb el nom: Activitat_2_Cognom i envieu-lo a través de

l'aplicació Lliurament Activitat_2.