




























































































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Mediti (mètodes, dissenys i tècniques d'investigació), Profesor: - -, Carrera: Psicologia, Universidad: UAB
Tipo: Apuntes
1 / 127
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!





























































































Josep M. Domènech Massons
Roser Granero Pérez
Professors de la Universitat Autònoma de Barcelona
Filiació dels autors
Prof. Josep M Domènech i Massons Professor de la Universitat Autònoma de Barcelona. Bellaterra (Barcelona), Espanya.
Prof. Roser Granero Pérez Professora de la Universitat Autònoma de Barcelona. Bellaterra (Barcelona), Espanya.
Edició revisada l’any 2016
2016 Josep M Domènech i Massons Roser Granero Pérez
Edita i imprimeix Signo Impressió Gràfica, S.A. C/. Murcia, 54d 08830 Sant Boi de Llobregat (Barcelona)
ISBN: 978-84-8049-580- Dipòsit Legal: B.4864-
Imprès a Espanya − Printed in Spain
Presentació 5
La capacitat de variació acompanya qualsevol aspecte relacionat amb l’actuació humana. La Psicologia científica esdevé una disciplina que, a partir de l’estudi del comportament de les persones, facilita la formulació de models teòrics per clarificar la forma en què succeeixen les conductes en la realitat. L’objectiu últim és la descripció, explicació i predicció d’aquests fenòmens i de les seves interrelacions. L’anàlisi de dades, en la seva aplicació particular en l’àmbit de la Psicologia, es presenta com una eina fonamental que possibilita la configuració de models generals del compor- tament humà a partir de l’evidència empírica que aporten conjunts limitats d’informació. Amb aquesta finalitat, la denominació genèrica d’anàlisi de dades engloba un conjunt de tècniques i procediments que permeten seleccionar, explorar i modelar dades amb la fi d’obtenir interpretacions de la realitat que siguin psicològicament i conceptualment signi- ficatives. En referir-nos a anàlisi de dades no estem delimitant una nova àrea de coneixements dintre de la nostra disciplina, sinó que ens estem referint a una forma d’actuació en la qual els problemes psicològics esdevenen els propòsits (és a dir, els objectius) i les tècniques analítiques (fonamentalment estadístiques) els procediments. El modus operandi està contingut en el mateix terme “anàlisi”, ja que amb ell es fa referència a la identificació, selecció i descomposició de les causes que, presumiblement, originen la variabilitat pròpia dels esdeveniments que integren el cos de coneixements de la Psicologia científica. El text que presentem és el primer volum d’una col·lecció que ha estat desenvolupada per donar resposta a qüestions estadístiques i metodològiques relacionades amb la recerca en Psicologia. La finalitat d’aquest primer volum és ensenyar els fonaments de l’anàlisi de dades que permeten llegir i discutir rigorosament els estudis que es presenten dintre de les diferents àrees aplicades de la nostra disciplina. El segon volum, continuació del primer, és una lectura imprescindible per assolir aquest propòsit general, ja que recull les tècniques i els models bàsics que es fan servir per obtenir coneixement en Psicologia. Els volums 1 i 2 són una adaptació a l’àmbit de la Psicologia del llibre Métodos estadísticos en Ciencias de la Salud (Doménech, 1997-2014). L’enfocament d’aquest text és conceptual i pràctic, per la qual cosa la seva lectura i comprensió únicament requereix nocions bàsiques de matemàtiques. L’objectiu principal és ajudar a trobar procediments per donar resposta a les preguntes i les hipòtesis que formulen els investigadors que treballen en àrees aplicades, i a familiaritzar-se amb la interpretació dels resultats. El càlcul numèric i les fórmules no representen una meta, sinó un medi auxiliar per consolidar els fonaments de les tècniques que es presenten. Al llarg del llibre, cada vegada que apareix un terme important relacionat amb l’anàlisi de dades es presenta la seva equivalència en anglès. Així mateix, en els diferents capítols es plantegen un conjunt d’exemples que recullen preguntes i estructures reduïdes de dades hipotètiques ubicades en diferents àmbits psicològics, per il·lustrar els conceptes que van apareixent i facilitar la integració en un context aplicat dels coneixements que es van adquirint.
Els llistats d'ordinador que es presenten en aquest text s'han obtingut amb Stata.
6 Anàlisi de dades en Psicologia (Última revisió: 26.4.2017)
D’altra banda, la resolució dels exemples que es proposen s’acompanya de llistats d’ordi- nador per familiaritzar-se amb la seva interpretació i així evitar els càlculs innecessaris i focalitzar l’atenció en l’adequada comprensió dels conceptes. En aquest curs s’ha triat el programa Stata que és un dels programes comercials amb més futur. Els llistats amb els resultats d’aquest programa inclouen una capçalera on la icona indica la seqüència de menús, i en negreta la seva traducció en forma de sintaxi, per obtenir els corresponents llistats o resultats. L’objectiu d’aquestes capçaleres és guiar als lectors amb uns mínims coneixements d’ Stata perquè puguin reproduir els exemples que es presenten. Finalment, cada capítol inclou una prova d’autoavaluació per revisar els conceptes més importants i comprovar el nivell de comprensió i execució dels principals aspectes teòrics, pràctics i d’interpretació de llistats d’ordinador. Està formada per preguntes tancades d’elecció múltiple i incorpora les corresponents solucions. Per concloure aquesta presentació voldríem indicar que la configuració d’aquest llibre contempla l’anàlisi de dades com una eina bàsica al servei de la investigació i la recerca de respostes en l’àmbit general de la Psicologia. Per aquesta raó, els continguts relacionats amb aquesta matèria s’han procurat presentar com un medi que permetrà: 1) descobrir i comprendre millor les possibilitats i limitacions de la investigació científica i experimental aplicada a la nostra disciplina; 2) diferenciar les conclusions basades en evidències empíri- ques d’aquelles altres que no posseeixen aquests fonaments; i 3) desenvolupar una forma de pensament independent, antidogmàtic i crític de la realitat que ens envolta.
Barcelona, Març de 2014
Aquesta edició en pdf conté només els tres primers capítols del text. Els autors autoritzen la reproducció lliure i gratuïta d’aquest document.
Volem agrair a la professora Eva Penelo Werner la lectura crítica d’aquest text i els seus suggeriments per millorar-lo.
8 Anàlisi de dades en Psicologia (Última revisió: 26.4.2017)
Hi havia una vegada al país de Psicolandia... El rei, que era un gran estadista, estava desesperat. El príncep hereu, destinat a assumir en pocs dies totes les responsabilitats de la Corona, patia des de ben petit un problema d’enuresi primària nocturna i diürna. Durant la infància del nostre príncep, la major complicació d’aquesta incontinència era l’increment en la factura de bugaderia, raó per la qual no se li va concedir la més mínima importància. Ara però, el problema esdevenia molt més greu, ja que una de les relíquies que s’havien conservat des de temps immemorials estava amenaçada: la tapisseria del tro reial. Així doncs, la desesperació del rei pare posseïa un sòlid fonament. Deu mesos de psicoteràpia era el temps mínim que el Psicoanalista Major, considerat com el millor especialista del país, creia necessari per la remissió de l’enuresi. “Majestat, −acostumava a dir el Psicoanalista Major del regne− no desespereu, que la Psico- anàlisi és sàvia”. Però malgrat que el monarca no desconfiava de la saviesa de la Psicoanàlisi , ni dels designis de la Providència, va pensar que potser seria millor cercar savieses alterna- tives. I així ho va fer. Va ordenar cridar un jove i assabentat psicòleg, un dels que maneguen gran quantitat d’estadístiques tot just incorporades als seus coneixements, per a confirmar la veracitat dels números. Certament, deu mesos esdevé un temps d’espera massa llarg per a una sang tan blava i una tapisseria tan ben mimada. “Cinc mesos, majestat! La meitat dels pacients del doctor Mowrer presenten una remissió abans dels cinc mesos! Al feu de Frenopatolandia, aquest il⋅lustre professor conductista, ha aconseguit associar la distensió de la bufeta amb la resposta d’inhibir la micció i ha superat totes les estadístiques conegudes amb una teràpia coneguda com el pipi-stop”. Renoi! −meditava el rei− no aconsegueixo entendre-ho. O el meu Psicoanalista m’enganya o aquest jove ho pretén fer. “Sabeu, jove psicòleg, que el meu conseller no m’ha recomanat aquest doctor Mowrer?”. “Majestat, deu ser l’enveja. Us puc assegurar que és la millor dissuasió per a certes recomanacions”. “D’acord, d’acord! Però heu de saber que jo també disposo de sistemes per la dissuasió. Per exemple: la lapidació no és mal sistema per combatre fal⋅làcies. No creieu?”. El torn li va tocar ara al Psicoanalista Major. En l’audiència amb el rei l’habitual cortesia es transformà en conversa franca, com diuen les cròniques. És a dir: es va anar al gra. “Certament, el rumor ha arribat fins a mi, Majestat, però hi havia un error. Segons les meves notícies, la mitjana del temps de remissió és onze mesos ”. “Espero que estigueu ben assabentat −digué el rei−. Sapigueu que els nostres botxins fa temps que no s’entrenen, i això faria més penosa la vostra mort. I em sabria greu, de debò”. I així, igual que la fràgil nau abatuda per un fort temporal, el regi cap patia per l’humit futur del príncep entre aquella mar turbulenta d’estadístiques que, al menys en aparença, resultaven tan contradictòries entre si. Però sa majestat, capità ben previngut, abans d’ingressar el príncep a Frenopatolandia va voler que algú recollís de forma discreta més informació. D’aquesta manera, un cosí segon del príncep, persona de tota confiança, fou encarregat de la missió.
Capítol 1: Descripció de dades quantitatives 9
Taula 1-1: Temps de remissió de l’enuresi dels pacients tractats pel doctor Mowrer.
I com acostuma a succeir en la majoria dels estats, els assumptes transcendents s’arreglen als passadissos. No és –cregui-ho el lector− que a Frenopatolandia no tinguessin passa- dissos, però va voler la Deessa Fortuna que l’estança de l’emissari reial coincidís amb una festa en el país que representava l’última esperança per l’hereu de Psicolandia. Un cop fina- litzada la festa, pletòric de felicitat, retornà l’emissari al seu país. Havia aconseguit més del que calia esperar. Encara ressonava en les seves orelles l’eco de les paraules pronunciades per una gentil becària de Frenopatolandia: “El doctor Mowrer? Se’l coneix com el Gran Remeier. El més freqüent és que els pacients deixin de mullar-se abans del mes ”. La còlera del rei davant aquesta nova espècie de burla no coneixia límits. Va pensar que fins i tot els seus familiars volien conjurar-se contra ell i el seu dolor. Com és possible −va pensar− que la mitjana del temps de remissió sigui d’onze mesos i per altra banda em diguin que en la meitat dels casos l’enuresi remet abans dels cinc mesos? I com els meus parents m’anuncien que el més freqüent és que deixen de pixar-se abans d’un mes? Qualsevol altre hagués enviat a la forca a tal conjunt de farsants. Però el rei, prudent i molt entès en assumptes d’estat −per això se’l coneixia amb el sobrenom de l’estadista − va con- vocar el Consell de Savis i Similars. La deliberació va ser dura. La Retòrica i l’Astronomia podrien ajudar a embellir i orientar-se en el problema. La Geometria i la Filosofia a deli- mitar-lo i discutir-lo. La Medicina i la Música, en canvi, oferien poques solucions. Entre totes aquestes disciplines i entre tots els discursos va destacar l’Estadística i l’explicació del savi estadístic , que fou la següent: “Majestat, tinc en el meu poder les dades del frenopàtic i he pogut comprovar que el jove psicòleg us ha donat un valor correcte: la mediana del temps de remissió és de cinc mesos. També el Psicoanalista Major us ha dit la veritat: la supervivència mitjana és d’onze mesos. Ni tan sols la becària ha enganyat el vostre emissari, donat que allò més freqüent, és a dir la moda del temps de remissió, es troba entre 0 i 30 dies. Els vostres informadors us han donat, per tant, números correctes, però insuficients per conèixer la veritat. Aquests índexs estadístics, anomenats mesures de tendència central, sempre s’han d’acompanyar de mesures de dispersió que completen la informació estadís- tica donant, en el vostre cas, una imatge de l’homogeneïtat de la distribució del temps de remissió que podeu apreciar al pergamí reproduït a la Taula 1-1.
Temps de remissió Nombre (mesos complerts) de casos 0 3 2 1 3 1 4 1 5 1 6 1 7 1 16 1 30 1 53 1 Total 12
Estadístics Mitjana: 11.0 meses Mediana: 5.0 meses Moda: 0.5 meses
Capítol 1: Descripció de dades quantitatives 11
Figura 1-1. Població i mostres aleatòries.
Si en lloc de treballar amb tota la població es treballa amb una mostra de mida adequada no únicament disminueix el cost de l’estudi sinó que al tenir menys subjectes es millora la qualitat de la captura de les dades. En l’àmbit de l’estadística els elements que integren la població (o la mostra) s’anomenen individus o subjectes. Tot i que freqüentment els individus són persones, també poden ser animals, procediments, objectes diversos o altres elements reals o abstractes. El binomi població i mostra representa l’eix central de qualsevol plantejament estadístic. La Figura 1-1 suggereix que un cop definit el conjunt de subjectes als quals es desitja generalitzar les conclusions de l’estudi, es té una única població; però existeixen una infi- nitud de mostres representatives: cada vegada que s’escull a l’atzar un conjunt de subjectes s’obté una mostra amb una composició que probablement serà diferent de l’anterior degut a l’error aleatori del mostratge. Suposem que es coneix la població de talles en néixer de tots els nadons a Catalunya l’any 2000, de manera que la seva mitjana ha estat de 50.9 cm. Suposem també que s’ha obtingut d’aquesta població una mostra de n=400 nens, amb l’objectiu d’estudiar altres caracterís- tiques biomètriques, i que la seva talla mitjana ha estat 51.2 cm. Els diferents índexs estadístics descriptius de tota una població s’anomenen paràmetres , i s’acostumen a simbolitzar amb lletres gregues. El paràmetre mitjana de la població de talles d’aquests nens val μ=50.9 cm. Cada paràmetre de la població pot ser estimat a partir de les dades observades a una mostra obtinguda a l’atzar. El procediment consisteix en utilitzar una funció, anomenada estadístic , que és una fórmula en la qual intervenen el conjunt d’observacions. En aquest cas la funció de l’estadístic mitjana és molt simple: suma de les talles xi dels 400 nens de la mostra i dividida per n=400:
x = n
x
n
i 1
Així doncs, si la talla mitjana obtinguda a partir de l’estadístic x amb les talles dels 400 nens d’una mostra aleatòria ha estat de 51.2 cm, aquest valor és una estimació del parà- metre μ (mitjana verdadera de la població).
Estimador del paràmetre mitjana μ
POBLACIÓ Paràmetre mitjana → μ = 50.9 cm
Selecció a l’atzar
Mostra 1 = 51.
Mostra 2 = 49.
Mostra j = → = 51. ↑ Estadístic mitjana
12 Anàlisi de dades en Psicologia (Última revisió: 26.4.2017)
No es pot oblidar que la mitjana d’aquesta població (paràmetre) té un únic valor μ=50. cm, malgrat que en aplicar l’estadístic x a cada mostra obtinguem un valor x (^) jdiferent. En absència de biaix els valors x^ j de l’estadístic x^ calculats en les diferents mostres fluctuaran al voltant de la verdadera mitjana μ; aquesta fluctuació serà menys intensa (és a dir, les estimacions seran més semblants al paràmetre μ) a mesura que la mida de les mostres sigui més gran.
Matriu de dades: tipus de variables Les dades de qualsevol estudi es recullen, d’acord amb un determinat protocol, mitjançant formularis o qüestionaris, que permeten registrar la informació de cadascun dels subjectes de manera estandarditzada i estructurada en forma de matriu de dades. La matriu de dades és una estructura en forma de taula que conté els valors de cada sub- jecte en les diferents variables. Les files d’aquesta taula representen cada individu i les columnes representen les diferents variables. S’entén per variable cadascun dels caràcters o aspectes que es registren en els subjectes de l’estudi i que poden prendre diferents valors. És una característica compartida per a un determinat grup d’individus i que té diferents graus de magnitud o diferents categories. L’estadística classifica les variables en dos grans grups segons segons siguin dades no mètriques (variables categòriques) o dades mètriques (variables quantitatives). Dintre de les variables categòriques es distingeixen dos tipus segons tinguin o no ordre les diferents categories de la variable. Dintre de les variables quantitatives es distingeixen les discretes de les contínues. El Quadre 1-1 presenta un exemple de matriu de dades. En una investigació real és freqüent trobar subjectes amb valors desconeguts per alguna variable; aquests valors es designen en anglès amb el terme missing , i no intervenen en els càlculs estadístics posteriors. En el Quadre 1-1els casos amb valor missing s’han simbolitzat amb la notació (•). En la matriu de dades es registren altres aspectes que no es consideren variables des de la perspectiva de l’estadística, com el número de cas (que és l’identificador del subjecte) i les dates (que són punts en el temps). La data d’un esdeveniment requereix d’una consideració especial perquè representa un punt en el temps. Serà la diferència entre dues dates la que ens aporti la mesura del temps transcorregut. Per exemple, l’edat en el moment d’aplicar una intervenció és una variable generada mitjançant la diferència entre la data de la intervenció i la de naixement. Les variables amb categories sense ordre provenen d’una escala de mesura nominal. El sexe (masculí; femení) i el curs d’un trastorn psicològic (agut; crònic) són exemples de variables binàries. El color del cabell (negre; marró; ros) i el tipus d’intervenció (A/B/C) són exemples de variables amb varies categories. Les úniques operacions permissibles entre les seves categories (valors) són les relacions d’igualtat o desigualtat: negre ≠ marró ≠ ros. Les variables amb categories ordenades procedeixen d’una escala de mesura ordinal ; per exemple, el nivell socio-econòmic (baix; mitjà; alt). Les operacions permissibles entre els seus valors són les relacions d’igualtat o desigualtat i les d’ordre: baix < mitjà < alt.
14 Anàlisi de dades en Psicologia (Última revisió: 26.4.2017)
Les variables quantitatives, en estar mesurades en escales d’interval o de raó, permeten el càlcul d’índexs estadístics, com la mitjana, que comporten sumes i restes entre els seus valors. Aquests índexs, però, no s’han d’aplicar mai a variables ordinals. És fàcil cometre aquest error perquè les categories de les variables ordinals s’acostumen a codificar amb números 0, 1, 2, ... i aquests codis es confonen amb els valors d’una variable quantitativa. Calcular la mitjana, per exemple, del nivell socio-econòmic (1, 2, 3) d’un grup de subjectes implicaria acceptar que passar del nivell baix a mitjà representa el mateix increment que passar del nivell mitjà a alt. La puntuació APGAR del nadó en néixer és un exemple en el que es pot considerar ordinal o mètrica. Aquesta puntuació s’assigna valorant un conjunt de cinc ítems: freqüència cardíaca, ritme respiratori, to muscular, color de la pell i reflexos. Cadascun dels ítems obté una puntuació de 0, 1 o 2 en funció del nivell de resposta del subjecte (0 indica situació patològica i 2 situació normal). La puntuació APGAR final és la suma dels punts obtinguts en cadascun dels ítems i per aquest motiu la major part d’investigadors la consideren mètrica. Aquesta decisió implica el supòsit de que els intervals representen diferències iguals en els atributs que s’estan mesurant: una disminució en la puntuació APGAR al néixer de 9 a 8 és equivalent a una disminució en la puntuació de 7 a 6. Aquesta opció permetrà calcular estadístics com la mitjana, desviació estàndard, etc. L’estadística distingeix les variables discretes de les contínues. El nombre de símptomes és un exemple de variable quantitativa discreta, que sempre són el r esultat d’un recompte i només poden prendre els valors enters 0, 1, 2, ... L’edat, el pes i la talla són exemples de variables quantitatives contínues perquè poden prendre qualsevol valor dintre d’un cert interval. El Quadre 1-2 il·lustra com les variables discretes es mesuren de forma exacta i els seus valors intermedis no tenen sentit. Les variables contínues prenen com a valor números reals, valors que quan es mesuren amb un instrument sempre es transformen en dades discontínues resultants del grau d’exactitud de l’instrument de mesura emprat. Això fa que a vegades, al mirar els seus valores es considerin, erròniament, discretes. Com a regla general, les variables contínues donen mesures arrodonides. Així, al mesurar el pes amb exactitud de kilograms (sense decimals), s’ha arrodonit el resultat al valor enter més proper, obtenint el conjunt de valors {... 49; 50; 51; 52; ...}. En aquest cas la distribució de pesos presenta una discontinuïtat aparent d’1 kg, perquè ha estat mesurat amb un grau d’exactitud de ±0.5 kg. Això implica que 51 kg, per exemple, no és el valor exacte sinó un valor arrodonit que indica que el pes del subjecte pertany a l’interval 49.5 a 50.5 kg. Així doncs, un subjecte de 50 kg no vol dir que pesi exactament 50 kg sinó que el seu pes és dins l’interval 49.5 a 50.5 kg. Si se suposa que el procediment de mesura no introdueix cap biaix, els resultats de la mesura sempre seran els centres d’aquests intervals d’exactitud. La regla general és que les variables contínues donen mesures arrodonides , però tota regla té la seva excepció. En efecte, les variables contínues que mesuren el temps transcorregut (per exemple, l’edat, el temps de tractament o l’edat d’inici de consum de tabac) quan es presenten amb valors enters s’expressen en temps complert (en setmanes, mesos o anys complits) que s’obtenen truncant (no arrodonint) el temps transcorregut continu. En el Quadre 1-2 veiem que tant als subjectes que acaben de complir 50 anys com als que els falta 1 dia per complir 51 els correspon un valor truncat de 50 anys (complerts).
Cas particular molt important en Ciències de la Salut: variable temps transcorregut
Capítol 1: Descripció de dades quantitatives 15
Quadre 1-2. Precisió de la mesura de variables quantitatives.
Regla general: Les mesures s’arrodoneixen; per exemple, si es decideix registrar el pes en kilograms sense decimals, un subjecte de 50.7 kg se li assigna un pes de 51 kg perquè el seu valor és més pròxim a 51 kg que a 50 kg. Excepció: És habitual que les edats en particular, i els temps transcorreguts en general, es mesurin en unitats complertes de temps; així, es diu que un subjecte de 50.7 anys té 50 anys (i en tindrà 50 anys encara que només li falti 1 dia per complir els 51 anys).
Una edat registrada en anys complits igual a 50 no correspon al valor exacte 50 sinó que representa un valor que pertany a l’interval d’edats compreses entre el dia que es compleix 50 anys i l’instant anterior a complir 51 anys. El valor central 50.5 d’aquest interval és el que millor representa l’edat real d’aquests subjectes (a falta d’informació més exacta). Si únicament es disposa de l’edat en anys complits i s’introdueixen en la calculadora els valors truncats (... 49; 50; 51; ...) en comptes dels valors corregits (... 49.5; 50.5; 51.5; ...), és fàcil comprovar que la mitjana obtinguda és incorrecta perquè té un biaix de −0.5 anys. Sovint es pot mesurar una determinada característica amb diferents escales. Així, es podria recollir per a un mateix subjecte l’hàbit de fumar (no fumador, fumador) o el consum de tabac en cigarretes/dia (c/d) amb pràcticament el mateix cost. La regla general és registrar aquell aspecte que aporti la màxima informació. Registrant el tabac de forma quantitativa (c/d) és possible, posteriorment, classificar els subjectes en les categories de no fumador i fumador (escala nominal). En canvi, el pas contrari no és possible.
No té sentit tenir 2.7 símptomes: Variable discreta
2 símptomes (valor exacte)
Nombre de símptomes: 0 1 2 3 … (valors exactes)
Edat ( anys complits ): .. 49 50 51 .. (exactitud: +1año)
50 ⇒ [ 50 − 51 [ anys
Centre interval: 50.5 anys
Resultat mesura (truncat)
50.
Valor exacte
Té sentit tenir 50.7 anys
Pes (kg): .. 49 50 51.. (exactitud: ±0.5 kg)
51 ⇒ 50 .5 − 51 .5 kg
Resultat mesura (arrodonit)
Centre interval: 51 kg
50.
Valor exacte
Té sentit pesar 50.7 kg
Capítol 1: Descripció de dades quantitatives 17
Com s’analitzen les variables registrades en temps complert? Tal com es pot comprovar en l’exemple anterior, el registre de les variables en temps complert (valors truncats) té implicacions pràctiques tant en el càlcul dels índexs estadístics descriptius com en la seva representació gràfica. El més adequat és registrar les dates d’inici (DI) i final (DF) dels períodes temporals. Tanmateix, en moltes situacions únicament es tenen les variables mesurades en temps complerts, i en aquest cas s’hauran d’incrementar +0.5 anys abans d’incorporar-les a les anàlisis estadístiques.
Variables contínues categoritzades La regla general és recollir la informació quantitativa amb la major exactitud possible; per exemple, es pot demanar l'edat d'un adult en anys complits però és millor registrar la data de naixement. Ja que la major part d'estudis comporten seguiment el procediment d'elecció és recollir les dates de cada etapa perquè restant les dates disposarem de les edats i dels temps transcorreguts; així, si en un estudi sobre desintoxicació de toxicòmans es registren les dates de naixement, d'inici i final de la intervenció, del primer seguiment, etc., per dife- rència amb la de naixement es té l'edat en qualsevol moment, la diferència entre les dates d'inici i final de la intervenció dóna la duració del tractament, etc. De vegades es registren variables quantitatives agrupades en intervals o es categoritzen variables contínues. Per exemple, en compte de preguntar l'edat a la que va començar a fumar es registra la variable binària fumar abans del 14 anys; o es disposa de l'índex de massa corporal en kg/m^2 però s’introdueix categoritzat segons l’O.M.S. (infrapès, normopès, sobrepès i obesitat). Recollir variables quantitatives categoritzades, o categoritzar-les, és un error important quan es realitza sense motius teòrics perquè aquestes transformacions comporten una pèrdua d'informació (Royston, Altman i Sauerbrei, 2006). No obstant això, és freqüent trobar estudis amb variables quantitatives categoritzades pel fet que s'han analitzat amb models de regressió que exigeixen el supòsit de linealitat dels predictors, i quan no es compleix, la solució habitual és introduir el predictor categoritzat. També hi ha situacions en què convé recollir la informació quantitativa categoritzada; per exemple, per registrar el nivell de renda és millor presentar intervals perquè a les persones no els hi agrada dir la quantitat exacta de diners que guanyen. Quina és l'escala de mesura de les variables quantitatives categoritzades? Si es coneixen els intervals de classe es consideren mètriques i es pot usar el centre de cada interval per a realitzar els càlculs; en cas contrari es tracten com a ordinals. I les variables dicotomitzades? Per exemple, el sobrepès (IMC ≥ 25kg/m^2 ) o fumar abans dels 14 anys. Les categories d'aquestes variables, a diferència del sexe que és nominal, presenten un orde i les podem considerar ordinals.
18 Anàlisi de dades en Psicologia (Última revisió: 26.4.2017)
Taula 1-3: Regla d’Sturges per escollir el nombre d’intervals.
Mida de la mostra 6 a 10
a 22
a 44
a 90
a 181
a 362
a 726
a 1453
a 2909 Nombre d’intervals 4 5 6 7 8 9 10 11 12
Després de recollir en la matriu de dades els valors de les diferents variables de cada subjecte s’han d’organitzar per resumir-los. L’ordenació dels subjectes d’acord amb els valors que presenten en la variable que es vol estudiar és el primer pas per obtenir la distribució de freqüències i representar-la gràficament. Una distribució de freqüències consisteix en una sèrie de classes predeterminades (que poden ser categories, números o intervals de valors, segons l’escala de mesura de la variable) amb el nombre total de subjectes que s’inclouen en la classe. En altres paraules, quan construïm la distribució de freqüències estem classificant als subjectes en categories (si la variable és nominal u ordinal) o en números o intervals de valors (si la variable és mètrica).
L’histograma L’histograma ( histogram ) és una representació clàssica de la distribució d’una variable contínua. Per dibuixar-lo es parteix d’una distribució de freqüències amb les dades agrupades en intervals de classe d’igual o diferent amplitud. Sobre cada interval es dibuixa un rectangle amb àrea igual a la freqüència (absoluta) corresponent. Això equival a dibuixar un rectangle amb alçada igual al quocient entre la freqüència i l’amplitud de l’interval, de manera que l’eix de les ordenades representarà el nombre de casos per unitat de la variable mesurada (Colton; pp. 19-37). Un pas previ és ordenar les dades i agrupar-les en intervals de valors (anomenats classes). A l’hora de realitzar aquesta classificació s’han de tenir en compte alguns principis bàsics: els intervals de classe han de ser mútuament excloents, s’han d’evitar intervals amb extrems oberts i el nombre escollit de classes ha de reflectir la forma de la distribució. La Taula 1-3, construïda aplicant la regla d’Sturges (1926), ens ofereix una orientació sobre el nombre d’intervals. Així, per representar una variable amb un nombre d’observacions entre 91 i 181 podrem agrupar-les en 8 intervals. Exemple. Suposem que la talla d’una mostra de 58 subjectes, que s’ha mesurat amb un grau d’exactitud de ±0.5cm, oscil·la entre 150 i 179 cm. Per agrupar-les s’ha optat per construir sis intervals d’amplitud 5 cm (la regla d’Sturges suggereix 7 intervals): (150-154) (155-159) (160-164) (165-169) (170-174) (175-179) Així, en el primer interval situarem els subjectes amb una talla de 150, 151, 152, 153 i 154. Donat que aquests valors s’han mesurat amb precisió de ±0.5 cm, els llindars verdaders d’aquest primer interval són (149.5 - 154.5). De la mateixa manera, els llindars verdaders del segon interval són (154.5 – 159.5) i així successivament s’obté una partició de la talla en intervals que no presenten discontinuïtats.
En àmbits diferents de les Ciències de la Salut, s’empra la definició clàssica en la que tots els intervals tenen igual amplitud. En aquest cas els rectangles es dibuixen amb una alçada igual a la freqüències de cada l’interval.