Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Análisis Estadístico Encuesta Rdata: Variables, Frecuencias, Histogramas y Correlaciones. , Apuntes de Administración de Empresas

Instrucciones para realizar un análisis estadístico básico de la base de datos encuesta.rdata utilizando el programa r_commander. Se incluyen tareas como la obtención de resúmenes de variables, distribución de frecuencias, histogramas, tablas de frecuencias y matriz de correlaciones. Se preguntan y se responden a varias cuestiones relacionadas con las distribuciones de las variables, porcentajes de observaciones y valores outliers.

Tipo: Apuntes

2015/2016

Subido el 11/12/2016

tonioverde
tonioverde 🇪🇸

3.6

(24)

24 documentos

1 / 3

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
ACTIVITAT _2
Nom i Cognoms David Rueda Rosas Grup 3A
Entreu al programa R_Commander i carregueu la base de dades Encuesta.Rdata
(Seqüència: Dades Carregar conjunt de dades).
Realitzeu:
1. Breu anàlisi de totes les variables de la base de dades
(Estadístics Resums Conjunt de dades activa).
Indiqueu:
Nombre de variables que conté la base de dades ......16 dades..............
Variables Numèriques Cuestionario; Ingresos; Edad; Tam_familiar;Gasto_alim; V_AtencionC;
V_limpieza; V_SistemaP; V_AtencionP; V_ProdGB y V_ServicioD.
Dades factor Lugar_Compra; Compra_GB; Zona; EstCivil y Sexo.
2. Distribució de freqüències de la variable Lugar_compra. (Estadístics Resums Distribució de
freqüències).
¿Quin percentatge d'observacions correspon a “Grandes superficies”? 52,75%
3. Histograma de la variable Ingresos (Gràfiques Histograma).
¿Quina forma presenta aquesta distribució? Campaniforme / Asimètrica a la dreta / Asimètrica a l'esquerra
Campaniforme.
4. Taula de freqüències de la variable Gasto_alim amb les instruccions:
hist(Encuesta$Gasto_alim, plot=F)
Encuesta$T1=cut(Encuesta$Gasto_alim, breaks=c
(300,400,500,600,700,800,900,1000,1100,1200))
cbind(table(Encuesta$T1), table(Encuesta$T1)/sum(table(Encuesta$T1)))
¿Quina freqüència absoluta i relativa presenta l'interval amb marca de classe 450? 154//0,386934673
5. Resum numèric d’Edad (Estadístics Resums Resums numèrics)
Indiqueu: Edat Mínim 18 Màxim 65 Mediana 39 Recorregut interquartílic 22 i Edat Mitjana 39,86
6. Stem and Leaf de Gasto_alim i Ingresos. (Gràfiques Gràfica de tija i fulles) Indiqueu:
Nom de la variable que presenta valors outliers 700
Despesa màxima del 40% d' enquestats que gasta menys 1210
Percentatge d' enquestats que gasten més de 600€ 5,03%
Ingrés mínim i màxim 700//2700
7. Box-plots de Gasto_alim seleccionant a Gràfica per grups la variable Zona. (Gràfiques Diagrama
de caixa) Indiqueu:
Quina zona presenta valors outliers? BCN.
Zona que té major mediana (BCN / Hospitalet / Sabadell)
Zona amb menor rang interquartílic (BCN / Hospitalet / Sabadell)
Zona amb major valor màxim (exclòs l’outlier) (BCN / Hospitalet / Sabadell)
Quina zona té menor despesa mitjana? (BCN / Hospitalet / Sabadell)
8. Resum numèric de Gasto_alim i Ingresos (Estadístics Resums Resums numèrics). Indiqueu
quina de les dues variables té una mitjana més representativa Gasto_alim.
9. Estandarditzeu la variable Edad i comproveu amb el resum numèric que la mitjana es 0 i la variància 1.
(Dades Modificar variable Tipificar variable).
pf3

Vista previa parcial del texto

¡Descarga Análisis Estadístico Encuesta Rdata: Variables, Frecuencias, Histogramas y Correlaciones. y más Apuntes en PDF de Administración de Empresas solo en Docsity!

ACTIVITAT _

Nom i Cognoms David Rueda Rosas Grup 3A

Entreu al programa R_Commander i carregueu la base de dades Encuesta.Rdata (Seqüència: Dades ► Carregar conjunt de dades ).

Realitzeu:

  1. Breu anàlisi de totes les variables de la base de dades (Estadístics ► Resums ► Conjunt de dades activa). Indiqueu:
    • Nombre de variables que conté la base de dades ......16 dades..............
    • Variables Numèriques Cuestionario; Ingresos; Edad; Tam_familiar;Gasto_alim; V_AtencionC; V_limpieza; V_SistemaP; V_AtencionP; V_ProdGB y V_ServicioD.
    • Dades factor Lugar_Compra; Compra_GB; Zona; EstCivil y Sexo.
  2. Distribució de freqüències de la variable Lugar_compra. (Estadístics ► Resums ► Distribució de freqüències). ¿Quin percentatge d'observacions correspon a “Grandes superficies”? 52,75%
  3. Histograma de la variable Ingresos (Gràfiques ► Histograma). ¿Quina forma presenta aquesta distribució? Campaniforme / Asimètrica a la dreta / Asimètrica a l'esquerra Campaniforme.
  4. Taula de freqüències de la variable Gasto_alim amb les instruccions:
    • hist(Encuesta$Gasto_alim, plot=F)
    • Encuesta$T1=cut(Encuesta$Gasto_alim, breaks=c (300,400,500,600,700,800,900,1000,1100,1200)) cbind(table(Encuesta$T1), table(Encuesta$T1)/sum(table(Encuesta$T1)))

¿Quina freqüència absoluta i relativa presenta l'interval amb marca de classe 450? 154//0,

  1. Resum numèric d’ Edad (Estadístics ► Resums ► Resums numèrics) Indiqueu: Edat Mínim 18 Màxim 65 Mediana 39 Recorregut interquartílic 22 i Edat Mitjana 39,
  2. Stem and Leaf de Gasto_alim i Ingresos. (Gràfiques ► Gràfica de tija i fulles) Indiqueu:
    • Nom de la variable que presenta valors outliers 700
    • Despesa màxima del 40% d' enquestats que gasta menys 1210
    • Percentatge d' enquestats que gasten més de 600€ 5,03%
    • Ingrés mínim i màxim 700//
  3. Box-plots de Gasto_alim seleccionant a Gràfica per grups la variable Zona. (Gràfiques ► Diagrama de caixa) Indiqueu:
    • Quina zona presenta valors outliers? BCN.
    • Zona que té major mediana (BCN / Hospitalet / Sabadell )
    • Zona amb menor rang interquartílic (BCN / Hospitalet / Sabadell )
    • Zona amb major valor màxim (exclòs l’outlier) ( BCN / Hospitalet / Sabadell)
    • Quina zona té menor despesa mitjana? (BCN / Hospitalet / Sabadell )
  4. Resum numèric de Gasto_alim i Ingresos (Estadístics ► Resums ► Resums numèrics). Indiqueu quina de les dues variables té una mitjana més representativa Gasto_alim.
  5. Estandarditzeu la variable Edad i comproveu amb el resum numèric que la mitjana es 0 i la variància 1. (Dades ► Modificar variable ► Tipificar variable).
  1. Obtingueu una nova variable amb nom Tram_Ingreso , com a resultat de recodificar la variable Ingresos de la següent forma:

Variable Ingresos Tram_Ingreso 858 < Ingresos <= 1266. 1266.122 < Ingresos <= 1909. 1909.04 < Ingresos <= 3151

Bajo Medio Alto

Seqüència: (Dades ► Modificar variables del conjunt de dades actives ►Recodificar variables)

Indiqueu:

  • Quants consumidors tenen uns Ingressos Baixos ?99 consumidors.
  • Quin percentatge de consumidors tenen uns Ingressos Mitjans? 196 consumidors..
  • La mitjana de la variable Gasto_alim per als consumidors amb uns Ingressos Mitjans és igual a: 477,0765.
  • En quin tram d’ingressos la variable Gasto_alim és més homogènia?
  1. Obtingueu la taula de doble entrada de les variables Tram_Ingreso i Lugar_compra (Estadístics ► Taules de contingencia ► Taules de doble entrada)
  • Quin percentatge d'individus tenen uns Ingressos Alts i compren en Grans Superfícies? 44%
  • Per als consumidors amb uns Ingressos Mitjans , quin percentatge compren al Mercat Municipal? 33%
  • Per als individus que compren habitualment en els Comerços del Barri , quin percentatge tenen uns Ingressos Baixos? 36%
  1. Obtingueu el coeficient de correlació entre les variables Ingresos i Gasto_alim. Comenteu el resultat: (Estadístics ► Resums ► Matriu de correlacions) Coeficient de correlació= 0,8803677 -> Es tracta d’una associació lineal quasi perfecta.
  2. Ajusteu el model de regressió lineal de les variables Ingresos (Variable Independent) i Gasto_alim (Variable Depenent). Respongueu a les següents qüestions: (Estadístics ► Ajust de Models ► Regressió lineal)
  • Quin percentatge de variació observada a Gasto_alim s’explica amb la recta ajustada?Un percentatge del 3,9677%.
  • Per uns ingressos de 1500€, quina és la despesa mitjana estimada? Entre 400-500.
  • Si desitgem tenir una despesa mitjana en alimentació de 550€, quin hauria de ser el nivell de ingressos? 1600
  • Si s'incrementen en un 3% els ingressos de tots els individus, com queda afectada la recta de regressió? Pendent augmenta i es més vertical (- elástica).
  • Obtingueu el diagrama de dispersió de X=Ingresos i Y=Gasto_alim