



Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
tutorial para practica rstudio
Tipo: Apuntes
1 / 7
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!




1 Introducció 1
2 Objectius 2 2.1 Conceptes teòrics relacionats.................................... 2
3 Preparant R : instal·lant paquets addicionals 2
4 Llegint dades 3
5 Taules de Freqüències Univariants 5 5.1 Per a variables qualitatives o quantitatives amb pocs valors................... 5 5.2 Per a variables quantitatives amb molts valors........................... 6
Benvinguts a les sessions pràctiques d’R! R és un potent llenguatge de programació per realitzar anàlisis estadístiques. Abasta des dels conceptes més bàsics, com per exemple calcular la mitjana d’una llista de números, fins a les tècniques més avançades com la modelització, l’estimació de models lineals i no lineals, proves estadístiques, anàlisi de sèries temporals, classificació, “clustering”, etc. De fet, R es considera un dels programaris estadístics més complets i utilitzats tant en el món de l’empresa com a l’acadèmia. R és un projecte altament versàtil, fàcil d’ampliar, i open source, el que significa que és distribueix lliurement i que hi ha una comunitat de milers d’usuaris i desenvolupadors contínuament contribuint a aquest programari. Podeu aprendre més sobre R visitant la Xarxa d’arxius R a CRAN.
Aquest document utilitza llenguatge “R Markdown Notebook” que permet convertir el text a fitxers PDF, Microsoft Word, HTML, LaTeX i molts altres formats llegibles. Si s’obre amb R Studio, es pot executar el codi R utilitzant aquest mateix document, alhora que es mostren els resultats després del codi. Abans de poder treballar amb aquest document, però, cal preparar la instal·lació d’R. Per fer-ho, cal escriure el següent codi a la pestanya Console del panell inferior: install.packages ("knitr", dependencies = TRUE)
Això només s’ha de fer una vegada, és a dir, la primera vegada que es fa servir un document R Markdown. Si s’està llegint aquest document des d’R Studio es pot executar el següent fragment fent clic al botó Executa (o Run) de la línia concreta o col·locant el cursor a sobre la instrucció i prement Ctrl + Intro.
print ("Hello World")
Aquesta instrucció és molt simple, només escriu el text que hi ha entre cometes, però és una bona mostra de com és la sintaxi i les sortides d’R.
2 Objectius
RStudio és un IDE (Integrated Development Environment) per treballar amb R, es a dir, és un entorn agradable i més senzill on executar R. En aquesta primera sessió es presentarà la interfície d’usuari, es veurà el funcionament bàsic d’ RStudio i es carregaran algunes dades d’exemple per treballar el càlcul de freqüències.
3 Preparant R : instal·lant paquets addicionals
El programari R s’inicia només amb un conjunt bàsic de comandes. Per això, depenent de la tasca que haurem de realitzar, s’hauran de proporcionar més comandes a R. Aquestes es poden obtenir instal·lant paquets addicionals que no formen part de la instal·lació base d’ R. Aquests paquets es troben a la Xarxa d’arxius de R a CRAN, i es poden descarregar i instal·lar des del mateix programari R.
La instal·lació d’aquests paquets es pot fer de dues maneres:
Durant aquest curs, necessitarem instal·lar els següents paquets:
Nombre mitjà d’anys que pot viure un nadó.
Aquest conjunt de dades s’ha emmagatzemat en un fitxer csv anomenat " HDI_Data.csv “. Per a que aquestes dades estiguin disponibles a RStudio primer haurem de carregar el paquet readr amb la comanda library (readr) i després crearem un nou objecte (una matriu en aquest cas) que anomenarem "HDI_Data" amb la comanda read.csv ("HDI_Data.csv")
library (readr) HDI_Data <- read.csv ("Data/HDI_Data.csv")
Notar que el símbol <- que trobeu al codi anterior és l’ operador d’assignació a R, és a dir, dóna un nom a un objecte (un número, un vector, una taula,... ). En aquest cas, hem donat el nom HDI_Data a la matriu de dades que es llegeix des del fitxer “HDI_Data.csv”. Aquest operador s’utilitza extensament a R. Cal que també tingueu en compte que “DATA/” indica la carpeta on es troba el fitxer dins la carpeta actual. Per situar-vos en alguna carpeta concreta, de forma que tot el que creeu es guardi aquí, cal que utilitzeu la comanda setwd(), per exemple setwd("C:/PL1/DATA").Per comprovar la carpeta en la que esteu situats utilitzar la comanda getwd(). També us poden resultar útils les següents dues comandes. Per poder veure els fitxers que teniu en la carpeta en que esteu situats podeu utilitzar la comanda dir(). I per veure els objectes que heu creat podeu utilitzar la comanda ls().
Observar que RStudio ha creat una matriu amb 7 columnes, cadascuna corresponent a una de les variables considerades. A més, també se’ns proporciona informació sobre el tipus d’aquestes variables.
Nom de variable Classificació R Studio Tipus de variable COUNTRY col_character () Qualitativa nominal HDI col_double () Quantitativa contínua LEB col_double () Quantitativa contínua EYS col_double () Quantitativa contínua MYS col_double () Quantitativa contínua GNI_GROUP col_integer () Qualitativa ordinal GNI_MINUS_HDI col_integer () Quantitativa discreta
Podem visualitzar les dades amb la següent comanda. Un cop executada, apareixerà una nova pestanya a la interfície RStudio que mostra una taula amb les dades. View (HDI_Data)
A més, escrivint el nom de la base de dades a la consola podrem visualitzar les dades, però només parcialment ja que és un conjunt de dades molt gran. HDI_Data
5 Taules de Freqüències Univariants
Les taules de freqüències es realitzen de diferents maneres depenent de si la variable que estem considerant és qualitativa o quantitativa. Això és així perquè en el cas de les variables quantitatives , si tenen molts valors, les observacions s’han d’agrupar en intervals (o classes), tal com veurem més endavant. Per a aquest exemple, analitzarem les variables:
Calcularem una taula completa de freqüències (absoluta, relativa, cumulativa) de la variable GNI_GROUP. Per calcular totes aquestes freqüències alhora i organitzar-les en una taula fàcil de llegir, el paquet questionr resulta molt útil. Així doncs, primer carregarem aquest paquet library (questionr)
A continuació, crearem una taula de freqüències amb la comanda freq () que anomenarem DiscFreqTable DiscFreqTable <- freq (HDI_Data $ GNI_GROUP, cum = TRUE, total = TRUE)
Notar que la sintaxi HDI_Data$GNI_GROUP ens indica que estem treballant amb la variable GNI_GROUP del conjunt de dades HDI_Data. Per tant, utilitzant aquesta assignació
El gràfic obtingut és un histograma que representa gràficament les freqüències que podem observar a la taula de freqüències amb les observacions agrupades en intervals (o classes ) tal com hem indicat a la comanda break. Per veure la taula de freqüències cal posar el nom que hem assignat a la taula.
ContFreqTable
A la taula observem: