Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Deducer - gestió de dades, Apuntes de Ciencia de la administración

Asignatura: Metodologia de l'anàlisi política, Profesor: Josep San Martin, Carrera: Ciencia Política i Gestió Pública, Universidad: UAB

Tipo: Apuntes

2013/2014

Subido el 24/04/2014

ferran_qf
ferran_qf 🇪🇸

3.5

(14)

5 documentos

1 / 6

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Metodologia per a l’anàlisi política Robert Liñeira
1
Gestió de dades
Continuem treballant amb la base de dades exemple1.
Recodificar variables
Un cop hem obert i explorat les nostres dades, és ben probable que no tinguem les variables en el
format que més ens interessa per analitzar-les, representar-les o descriure-les. Per exemple, si
volem presentar una taula mostrant la distribució d’edats de la nostra mostra, probablement
necessitarem agrupar-les en diversos trams d’edat. El procés de canviar els continguts o estructura
d’una variable es coneix com a recodificació.
Per il·lustrar-ho, demaneu una freqüència de la variable p_edat de l’arxiu de dades exemple1
(recordeu: Analysis
Frequencies). El que obtenim és una llarga llista, poc informativa, d’edats.
D’entrada, però, el que més crida l’atenció d’aquesta taula és la presència de valors irreals que no
hi haurien de ser, com edats negatives o excessivament altes. Com que no sabem l’edat real
d’aquests individus, el que haurem de fer en primer lloc és codificar aquestes dades com a valors
perduts, per excloure-les de l’anàlisi. Per fer-ho, anem al menú Data
Recode Variables, i se’ns
obre la següent finestra:
En aquesta finestra hem de seleccionar la variable (o variables) que volem recodificar. Quan les
tenim a la caixa de la dreta, podem triar el nom de la nova variable, seleccionant el text i fent clic al
botó Target. Cal tenir en compte que si no modifiquem el nom, es recodificarà sobre l’antiga
variable, cosa que en general és poc recomanable perquè ens pot portar a perdre informació si
cometem algun error. Així que, per norma general, recodificarem en variables diferents, tot
mantenint les originals. Un cop hem canviat el nom, cal que li donem a R les ordres per recodificar
la variable (els canvis que hi volem fer). Per fer-ho, cliquem a Define Recode:
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga Deducer - gestió de dades y más Apuntes en PDF de Ciencia de la administración solo en Docsity!

Gestió de dades

Continuem treballant amb la base de dades exemple1.

Recodificar variables

Un cop hem obert i explorat les nostres dades, és ben probable que no tinguem les variables en el format que més ens interessa per analitzar-les, representar-les o descriure-les. Per exemple, si volem presentar una taula mostrant la distribució d’edats de la nostra mostra, probablement necessitarem agrupar-les en diversos trams d’edat. El procés de canviar els continguts o estructura d’una variable es coneix com a recodificació.

Per il·lustrar-ho, demaneu una freqüència de la variable p_edat de l’arxiu de dades exemple (recordeu: AnalysisFrequencies ). El que obtenim és una llarga llista, poc informativa, d’edats. D’entrada, però, el que més crida l’atenció d’aquesta taula és la presència de valors irreals que no hi haurien de ser, com edats negatives o excessivament altes. Com que no sabem l’edat real d’aquests individus, el que haurem de fer en primer lloc és codificar aquestes dades com a valors perduts, per excloure-les de l’anàlisi. Per fer-ho, anem al menú DataRecode Variables , i se’ns obre la següent finestra:

En aquesta finestra hem de seleccionar la variable (o variables) que volem recodificar. Quan les tenim a la caixa de la dreta, podem triar el nom de la nova variable, seleccionant el text i fent clic al botó Target. Cal tenir en compte que si no modifiquem el nom, es recodificarà sobre l’antiga variable, cosa que en general és poc recomanable perquè ens pot portar a perdre informació si cometem algun error. Així que, per norma general, recodificarem en variables diferents, tot mantenint les originals. Un cop hem canviat el nom, cal que li donem a R les ordres per recodificar la variable (els canvis que hi volem fer). Per fer-ho, cliquem a Define Recode :

En aquesta finestra hi ha diverses components. A l’esquerra hi veiem la variable que volem recodificar. Si hi cliquem, Deducer ens mostra la distribució que té la variable, cosa que ens pot resultar útil per recodificar-la. A la dreta és on hi hem d’inserir les ordres que vulguem donar-hi, sempre amb la mateixa estructura: especifiquem els valors de partida i els de destinació. En aquest cas, com que el que volem és codificar els valors extrems com a casos perduts, el que emprarem són les finestres de la part superior, on podem indicar que volem convertir tots els valors menors o iguals a, per exemple, 10 en casos perduts (que en R es codifiquen com a NA). Farem el mateix per a tots els valors superiors a 113, que els codificarem com a NA. Quan tenim l’ordre especificada, cliquem a Add , i la inclou a la finestra Recodings. Un cop tenim totes les ordres fetes, cliquem a OK i això ens haurà creat la nova variable.

Per comprovar-ho, demaneu els estadístics descriptius d’edat2, incloent-hi el màxim i el mínim. Hauríeu d’obtenir això:

descriptive.table(vars = d(edat2),data= exemple1,

  • func.names =c("Mean","St. Deviation","Valid N","Minimum","Maximum")) $strata: all cases Mean.edat2 St. Deviation.edat2 Valid N.edat2 Minimum.edat 70.249431 7.592034 8351.000000 15. Maximum.edat

Una vegada hem fet això, hem d’ordenar convenientment les categories, i dir-li a R que la variable categòrica que hem creat és ordinal i no nominal. Si estiguéssim treballant amb una variable nominal, aquest pas seria, lògicament, innecessari. Per fer-ho hem d’anar al menú DataEdit Factor , que ens obrirà la finestra següent:

Aquí podem reordenar les categories de la nostra variable (amb els botons de les fletxes), afegir i treure categories. Si afegim una categoria, tindrà zero casos associats, i si en suprimim alguna, aquests casos passaran a ser casos perduts (NA). Per això, sovint ens convindrà més recodificar tal com hem vist abans. Addicionalment, podem marcar la casella Ordered si, com en aquest cas, el que tenim és una variable ordinal.

Ara ja tenim una variable categòrica amb les categories ben ordenades i etiquetades. Si en algun cas volguéssim operar amb aquesta variable com si fos numèrica, el que hauríem de fer és canviar a la finestra del visor de dades el tipus de variable de Factor a Integer. Tanmateix, en aquesta

operació, perdríem les etiquetes, així que si ho volem fer és millor que abans creem un duplicat de la variable.

Crear duplicats de variables Per crear un duplicat d’una variable (cosa que sovint és recomanable per assegurar-nos que no perdem la informació original), podem fer diverses coses:

a) A la finestra de dades, seleccionar tota la columna que volem duplicar, clicar amb el botó dret, triar copiar, col·locar-nos a la primera columna lliure i enganxar. És el mètode més senzill però de vegades pot fer que es pengi el programa, o que trigui una mica. b) Un ‘truc’ que podem fer servir és fer una falsa recodificació: triem la variable que volem duplicar, la recodifiquem en una de nova amb un altre nom i introduïm una ordre que no canviï res (per exemple, menys de 65 into menys de 65. Així tenim un duplicat. c) La manera més ràpida i segura, però, és amb la sintaxi. Escrivim a la consola, per exemple: exemple1$copiaedatgrups <- exmemple1$edatgrupsf i això ens crearà un duplicat idèntic.

Suprimir variables Per esborrar una variable que no vulguem, tenim també diverses opcions: a) Amb la sintaxi, escrivim exemple1$copiaedatgrups <- NULL, i això ens esborrarà el duplicat que acabem de crear b) En la finestra de dades, seleccionem la columna, i amb el botó dret triem ‘ Remove Column

Calcular noves variables

Fins ara hem estat treballant amb variables categòriques, fent recodificacions en unes poques categories. Quan treballem amb variables numèriques, sovint en voldrem fer transformacions numèriques, siguin lineals o no lineals. Per exemple, podem voler fer el percentatge, o la diferència respecte a la mitjana, o treure’n el logaritme, o elevar-la al quadrat. Fer aquesta mena d’operacions és molt senzill en Deducer: només hem d’anar al menú DataTransform , que ens obre la finestra següent: