



Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Metodologia de l'anàlisi política, Profesor: Josep San Martin, Carrera: Ciencia Política i Gestió Pública, Universidad: UAB
Tipo: Apuntes
1 / 6
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!




Continuem treballant amb la base de dades exemple1.
Un cop hem obert i explorat les nostres dades, és ben probable que no tinguem les variables en el format que més ens interessa per analitzar-les, representar-les o descriure-les. Per exemple, si volem presentar una taula mostrant la distribució d’edats de la nostra mostra, probablement necessitarem agrupar-les en diversos trams d’edat. El procés de canviar els continguts o estructura d’una variable es coneix com a recodificació.
Per il·lustrar-ho, demaneu una freqüència de la variable p_edat de l’arxiu de dades exemple (recordeu: Analysis Frequencies ). El que obtenim és una llarga llista, poc informativa, d’edats. D’entrada, però, el que més crida l’atenció d’aquesta taula és la presència de valors irreals que no hi haurien de ser, com edats negatives o excessivament altes. Com que no sabem l’edat real d’aquests individus, el que haurem de fer en primer lloc és codificar aquestes dades com a valors perduts, per excloure-les de l’anàlisi. Per fer-ho, anem al menú Data Recode Variables , i se’ns obre la següent finestra:
En aquesta finestra hem de seleccionar la variable (o variables) que volem recodificar. Quan les tenim a la caixa de la dreta, podem triar el nom de la nova variable, seleccionant el text i fent clic al botó Target. Cal tenir en compte que si no modifiquem el nom, es recodificarà sobre l’antiga variable, cosa que en general és poc recomanable perquè ens pot portar a perdre informació si cometem algun error. Així que, per norma general, recodificarem en variables diferents, tot mantenint les originals. Un cop hem canviat el nom, cal que li donem a R les ordres per recodificar la variable (els canvis que hi volem fer). Per fer-ho, cliquem a Define Recode :
En aquesta finestra hi ha diverses components. A l’esquerra hi veiem la variable que volem recodificar. Si hi cliquem, Deducer ens mostra la distribució que té la variable, cosa que ens pot resultar útil per recodificar-la. A la dreta és on hi hem d’inserir les ordres que vulguem donar-hi, sempre amb la mateixa estructura: especifiquem els valors de partida i els de destinació. En aquest cas, com que el que volem és codificar els valors extrems com a casos perduts, el que emprarem són les finestres de la part superior, on podem indicar que volem convertir tots els valors menors o iguals a, per exemple, 10 en casos perduts (que en R es codifiquen com a NA). Farem el mateix per a tots els valors superiors a 113, que els codificarem com a NA. Quan tenim l’ordre especificada, cliquem a Add , i la inclou a la finestra Recodings. Un cop tenim totes les ordres fetes, cliquem a OK i això ens haurà creat la nova variable.
Per comprovar-ho, demaneu els estadístics descriptius d’edat2, incloent-hi el màxim i el mínim. Hauríeu d’obtenir això:
descriptive.table(vars = d(edat2),data= exemple1,
strata: all cases Mean.edat2 St. Deviation.edat2 Valid N.edat2 Minimum.edat 70.249431 7.592034 8351.000000 15. Maximum.edatUna vegada hem fet això, hem d’ordenar convenientment les categories, i dir-li a R que la variable categòrica que hem creat és ordinal i no nominal. Si estiguéssim treballant amb una variable nominal, aquest pas seria, lògicament, innecessari. Per fer-ho hem d’anar al menú Data Edit Factor , que ens obrirà la finestra següent:
Aquí podem reordenar les categories de la nostra variable (amb els botons de les fletxes), afegir i treure categories. Si afegim una categoria, tindrà zero casos associats, i si en suprimim alguna, aquests casos passaran a ser casos perduts (NA). Per això, sovint ens convindrà més recodificar tal com hem vist abans. Addicionalment, podem marcar la casella Ordered si, com en aquest cas, el que tenim és una variable ordinal.
Ara ja tenim una variable categòrica amb les categories ben ordenades i etiquetades. Si en algun cas volguéssim operar amb aquesta variable com si fos numèrica, el que hauríem de fer és canviar a la finestra del visor de dades el tipus de variable de Factor a Integer. Tanmateix, en aquesta
operació, perdríem les etiquetes, així que si ho volem fer és millor que abans creem un duplicat de la variable.
Crear duplicats de variables Per crear un duplicat d’una variable (cosa que sovint és recomanable per assegurar-nos que no perdem la informació original), podem fer diverses coses:
a) A la finestra de dades, seleccionar tota la columna que volem duplicar, clicar amb el botó dret, triar copiar, col·locar-nos a la primera columna lliure i enganxar. És el mètode més senzill però de vegades pot fer que es pengi el programa, o que trigui una mica. b) Un ‘truc’ que podem fer servir és fer una falsa recodificació: triem la variable que volem duplicar, la recodifiquem en una de nova amb un altre nom i introduïm una ordre que no canviï res (per exemple, menys de 65 into menys de 65. Així tenim un duplicat. c) La manera més ràpida i segura, però, és amb la sintaxi. Escrivim a la consola, per exemple: exemple1$copiaedatgrups <- exmemple1$edatgrupsf i això ens crearà un duplicat idèntic.
Suprimir variables Per esborrar una variable que no vulguem, tenim també diverses opcions: a) Amb la sintaxi, escrivim exemple1$copiaedatgrups <- NULL, i això ens esborrarà el duplicat que acabem de crear b) En la finestra de dades, seleccionem la columna, i amb el botó dret triem ‘ Remove Column ’
Fins ara hem estat treballant amb variables categòriques, fent recodificacions en unes poques categories. Quan treballem amb variables numèriques, sovint en voldrem fer transformacions numèriques, siguin lineals o no lineals. Per exemple, podem voler fer el percentatge, o la diferència respecte a la mitjana, o treure’n el logaritme, o elevar-la al quadrat. Fer aquesta mena d’operacions és molt senzill en Deducer: només hem d’anar al menú Data Transform , que ens obre la finestra següent: