Vista previa parcial del texto
¡Descarga tema 1 estadistica y más Apuntes en PDF de Psicología solo en Docsity!
Juan Botella Ausina Manuel Suero Suñe Carmen Ximénez Gómez 1 | J UNIVERSITAT DE VALENCIA OA PIRÁMIDE Prefacio .... 1 2 Ediciones Pirámide Indice Conceptos generales. 1.1. Introducción .. 1.2. Conceptos generales 1.3. Medición..... 1.3.1. Las escalas de medida 1.3.2. Las variables: clasificación y notación. Problemas y ejercicios .... Soluciones de problemas y ejercicios Apéndice ..... PARTE PRIMERA Estadística descriptiva con una variable Organización y representación de datos. Medidas de posi 2.1. Introducción ... 2.2. Distribución de frecuencias . 2.3. Representaciones gráficas.. 2.3.1. Representaciones gráficas de uso frecuent 2.3.2. Convenciones sobre las representaciones gráficas 2.3.3. Tendenciosidad en las representaciones gráficas . 2.3.4. Propiedades de las distribuciones de frecuencias. 2.4, Medidas de posición ..... 2.4.1. Centiles o percentiles 2.4.2. Otras medidas de posición. Equivalencias. Problemas y ejercicios ..... Soluciones de problemas y ejercicios Apéndice ..... Estadísticos univariados: tendencia central, variabilidad, asimetría y curtosis. 3.1. Medidas de tendencia central.. 3.1.1. Media aritmética. Puntuaciones diferenciale: 17 17 20 23 25 31 35 37 10. O Ediciones Pirámide Índice / 11 Regresión lineal... 7.1. Introducción .... 7.2, Funciones lineales. 7.3. Regresión simpl 7.3.1. Identificación del modelo: ecuacione: 7.3.2. Valoración del modelo: coeficiente de determinación . 7.3.3. Aplicación del modelo. 7.3.4. Algunas consideraciones en torno a la regresión . Problemas y ejercicios...... Soluciones de problemas y ejercicios Apéndice. Organización y descripción de datos con más de una variable .... 8.1. El caso de dos variables cualitativas 8.1.1. Organización de los datos Representaciones gráfic: Valoración de la asocia: .1.4. Dos variables dicotómicas: Coeficiente Phi. 8.2. El caso de una variable cualitativa y otra cuantitativ: 8.2.1. Organización y representación de los datos 8.2.2, Valoración de la asociación: Coeficiente biserial-puntual 8.3. Otros índices de asociación para dos variables 8.4. Descripción conjunta de tres variables. Problemas y ejercicios...... Soluciones de problemas y ejercicios Apéndice 'oeficiente de contingen: PARTE TERCERA Probabilidad Introducción a la probabilidad 9.1. Introducción . 9.2. Definiciones 9.3. Definición de probabilidad 9.3.1. Enfoque clásico o a priori... 9.3.2. Enfoque frecuencialista o a posterio: 9.4. Probabilidad condicional 9.5. Teoremas básicos...... 9.5.1. Teorema de la adi 9.5.2. Teorema del product: Problemas y ejercicios...... Soluciones de problemas y ejercicios Variables aleatorias 10.1. Introducción . 10.2. Definición y tipos de variables aleatoria: 175 175 176 179 180 184 187 190 195 204 211 217 217 217 221 224 225 227 227 228 229 229 231 233 237 241 241 242 247 248 249 251 253 253 254 257 262 265 265 265 12 / Índice “4. 12. 13. 10.3. Variables aleatorias discretas ... 10.3.1. Función de probabilidad y funci 10.3.2. Valor esperado y varianza... 10.3.3. Relación entre dos variables aleatorias discretas 10.4. Variables aleatorias continuas..... 10.4.1. Función de densidad y función de distribución. 10.4.2. Valor esperado y varianza... 10.4.3. Relación entre dos variables aleatorias continua: 10.4.4. El trabajo aplicado con variables continuas 10.5. Distribuciones de probabilidad 10.6. Muestreo aleatorio Problemas y ejercicios. Soluciones de problemas y ejercicio: Apéndice. Modelos de distribución de probabilidad: variables discretas... 11.1. Introducción . 11.2. Distribución uniforme 11.3. Distribución binomial 11.4. Distribución multinomia! Problemas y ejercicios. Soluciones de problemas y ejercicio: Apéndice... Modelos de distribución de probabilidad: variables continuas. . 12.1. Introducción ..... 12.2. Distribución rectangular. 12.3. Distribución normal... 12.4. Distribucion J? de pearson. 12.5. Distribución 7 de Student 12.6. Distribución F de Snedeco: Problemas y ejercicios .. Soluciones de problemas y ejercicios... Apéndice PARTE CUARTA Introducción a la inferencia estadística Distribución muestral de un estadístico... 13.1. Introducción 13.2. Muestreo aleatorio simple 13.3. La distribución muestral de un estadístico. 13.4. Distribución muestral de la media .. 13.4.1. La variable se distribuye según el modelo normal 13.42. La variable no se distribuye según el Modelo Normal 13.5. Distribución muestral de la correlación . 267 267 269 272 275 276 279 279 280 282 282 284 286 288 289 289 290 291 296 297 299 301 303 303 303 304 308 314 317 321 333 340 347 347 347 348 349 349 352 354 O Ediciones Pirámide Prefacio Cuando se publica un libro sobre análisis de datos en psicología hay dos cosas que parece obligado hacer. La primera es justificar el por qué de otro libro más; la segunda es hacer explícitos los agradecimientos a aquellos que han contribuido a que acabe viendo la luz. Comenzaremos por lo primero, dejando los agradeci- mientos para el final de este prefacio. El objetivo de este libro es servir de manual en la asignatura Análisis de Da- tos I, que impartimos en el Grado de Psicología de la Universidad Autónoma de Madrid, ya adaptada a las exigencias del Espacio Europeo de Educación Superior, más conocido como «Plan Bolonia». Su publicación se justifica por las modifica- ciones que se han ido introduciendo en el programa y por las actualizaciones de las estrategias didácticas que se derivan de nuestra experiencia docente. Aunque pudiera parecer que la materia de una asignatura como ésta no es algo que cambie con los años, lo cierto es que sí lo hace. El índice tiene algunas variaciones respecto al anterior manual de la asignatura, publicado también por Pirámide (Botella, León, San Martín y Barriopedro, 2001). Estas tienen que ver con el diferente énfasis que se quiere dar a los distintos procedimientos, pero también con la decisión de abordar una iniciación a la inferencia estadística. Ejemplo de lo primero son las distribuciones de frecuencias. En los libros de hace treinta años éstas recibían mucha atención, pues eran la base para muchos cálcu- los y para confeccionar representaciones gráficas. Ello obligaba a tratar también la problemática relacionada con la confección de intervalos. Hoy se trabaja con ordenadores y todo esto ha caído en desuso, por lo que su presencia en los ma- nuales ha ido disminuyendo progresivamente. Respecto a la estadística inferencial, debemos reconocer que las técnicas de contraste de hipótesis son difíciles de asimilar por muchos estudiantes, probable- mente porque tienen que acostumbrarse a adoptar decisiones en entornos de incertidumbre. Trabajar estos conceptos al final de la asignatura de Análisis de Datos I, y continuar profundizando en ellos en Análisis de Datos II, es una bue- na estrategia pedagógica. Los últimos capítulos de este libro han sido ideados para ser empleados en esa primera etapa de asimilación de conceptos de la esta- dística inferencial. Otros cambios tienen que ver con cuestiones estrictamente didácticas. Por ejemplo, las propiedades que implican los efectos de las transformaciones lineales O Ediciones Pirámide 16 / Índice sobre estadísticos como la media y la varianza ya no son tratados en conexión con estos estadísticos, de forma separada. Se tratan de forma combinada en un capítulo dedicado a las transformaciones y que incluye las puntuaciones típicas, una forma de exponerlas que hemos encontrado útil en nuestras clases. El libro es el resultado de la experiencia docente de los autores durante mu- chos años con esta difícil materia. De hecho, en bastantes puntos seguramente se notará que el libro está al servicio de la tarea docente que cada año afrontamos. La materia es difícil, pero agradecida. En pocas asignaturas es tan evidente la diferencia entre una buena estrategia didáctica y una inadecuada. Además, una de nuestras mayores satisfacciones es ver cómo algunos estudiantes a los que realmente les cuesta el razonamiento con números finalmente acaban compren- diendo la lógica que subyace en el pensamiento estadístico. A los estudiantes les ocurre lo mismo, pues su satisfacción es mayor cuanto mayor ha sido el esfuerzo realizado para superar la asignatura. Por todo esto hemos dedicado grandes es- fuerzos a intentar facilitar el proceso de aprendizaje; muchos de los cambios que se introducen en este libro son el resultado de esos esfuerzos. No hemos incluido exposiciones relacionadas con el apoyo informático que damos en el curso. La velocidad a la que aparecen las sucesivas versiones de los programas informáticos hace que los manuales que se apoyan en ellos queden pronto obsoletos. Por el contrario, son muy útiles las exposiciones específicas que se dirigen a los módulos básicos y que pueden ser actualizados a una velocidad diferente que los manuales. Tenemos la suerte de contar con la exposición que Ximénez y Revuelta (2011) hacen del uso de SPSS, que está especialmente pen- sada para estos mismos estudiantes y abarca todos los procedimientos que se incluyen en el programa completo de la asignatura. Nosotros lo utilizamos como complemento docente del presente manual. Respecto a los agradecimientos, debemos mencionar en primer lugar a nues- tros estudiantes, principales sufridores de nuestras limitaciones como docentes, pero a la vez fuente inagotable de ideas para mejorar nuestros recursos didácticos y para señalar los «puntos negros» que necesitan clarificaciones adicionales. Tam- bién a nuestros compañeros del Departamento en la Universidad Autónoma de Madrid; aunque son muchos los que han contribuido indirectamente a mejorar nuestro trabajo, queremos mencionar explícitamente a los que en algún momen- to de los últimos años han colaborado con la docencia en la asignatura: Ludgerio Espinosa, Jesús Garrido, Beatriz Gil y Yolanda de Pellegrín. Madrid, noviembre de 2011. JUAN BOTELLA MANUEL SUERO CARMEN XIMÉNEZ O Ediciones Pirámide 18 / Análisis de datos en psicología | CUADRO 1.1 Ejemplos EJEMPLO 1. La empresa BSX nos encarga un estudio sobre los perfiles de competen- cias de su plantilla de mandos intermedios, con vistas a futuras promociones. Les administramos varios cuestionarios que miden diversas competencias, entre ellas el grado en que demuestran «capacidad de liderazgo». Al terminar la corrección de esas pruebas contamos con un conjunto de números a partir de los cuales describiremos las competencias de los miembros de esa plantilla. EJEMPLO 2. Se trata de un estudio sobre la eficacia de un programa de atención a los familiares que ejercen el papel de cuidadores de enfermos con dolor crónico. La ab- negada dedicación de los familiares de un enfermo (con frecuencia el marido, la mu- jer, el padre o la madre) tiene para esos cuidadores un importante coste psicológico, en términos de estrés y otros efectos en su calidad de vida. Para estudiarlo reunimos a los familiares de 30 enfermos con dolor crónico que son atendidos en un determi- nado centro (centro 4) y aceptan participar en el estudio. También pedimos a los colegas de otro centro en el que no hay un programa de este tipo que colaboren con nosotros en el estudio, como grupo de control (centro B); reúnen también a 30 fami- liares de otros enfermos con dolor crónico que aceptan participar en el estudio. Eva= luamos el nivel de estrés de los 60, pero luego sólo los del centro A reciben las sesiones del programa destinado a controlar y reducir el estrés. Valoramos también para cada uno el nivel educativo (sin estudios, primarios, secundarios, universitarios) y la inteli- gencia, dado que pueden afectar al grado de comprensión tanto del programa como de la forma en que se aplica. Al final nos encontramos con un conjunto de puntua- ciones de cada uno de los 60 familiares, a partir de las cuales deseamos extraer con- clusiones acerca de la eficacia del programa y de los efectos moduladores que puedan tener el nivel educativo y la inteligencia sobre esa eficacia. EJEMPLO 3. Se centra en un aspecto de la atención selectiva. Se presentan al partici- pante tres letras en la pantalla del ordenador y debe responder lo más rápidamente que pueda a la letra central, presionando una tecla si es una vocal y otra tecla si se trata de una consonante. Es habitual emplear dos condiciones experimentales (a veces se añaden otras): en la condición de flancos compatibles, las letras que acompañan a la letra central (llamadas flancos) son de la misma categoría que la letra central (vo- cales si la central es vocal y consonantes en caso contrario); en la condición de flancos incompatibles los flancos pertenecen a la categoría contraria. El resultado habitual, muchas veces replicado, es que se tarda más en responder a la letra central si los flan- Cos son de la categoría contraria (flancos incompatibles) que si son de la misma cate- goría (flancos compatibles). Este resultado se interpreta en el sentido de que los ob- servadores no consiguen que su selección atencional se sustraiga completamente a los flancos y no consiguen ignorarlos del todo. Supongamos que queremos probar este efecto con números y las categorías pares/impares. Administramos a una persona 30 ensayos de cada condición y registramos los tiempos de respuesta. Si nos centramos en la condición de flancos incompatibles, dispondremos de 30 mediciones de tiempos. No en todos los ensayos el participante tarda lo mismo. Hay una cierta variabilidad en las distintas ejecuciones de la tarea. Para hacernos una idea global de cómo reali- za la tarea nuestro voluntario en cada condición tenemos que trabajar con los 30 valores procedentes de cada una. O Ediciones Pirámide Conceptos generales / 19 CUADRO 1.1 (continuación) EJEMPLO 4. Es un sondeo de opinión acerca de lo que la gente pensaría si se adop- tasen medidas restrictivas en el consumo de tabaco. La idea es anticiparse a las reac- ciones, de forma que interesa conocer la opinión general a partir de las preguntas realizadas en el sondeo. Sin duda, lo más preciso sería preguntarles a todos y cada uno de los españoles por su opinión, pero por razones económicas esto no sería sen- sato. Decidimos, en consecuencia, seleccionar un grupo de 2.500 españoles de todas las comunidades autónomas y edades, consultándoles acerca de su opinión (a favor/ en contra) sobre esta cuestión. Sin embargo, las conclusiones extraídas se agotaban en el propio conjunto de datos observados; el objetivo consistía en hacerse una idea clara de lo que había, lo cual se contaba y medía. Lo que posibilitó el cálculo de probabilidades fue el desarrollo de un conjunto de métodos para extrapolar las conclusiones a entida- des no observadas. Es decir, proporcionó la base conceptual para hacer inferencias acerca de potenciales observaciones a partir de unas pocas observaciones reales. Estas técnicas tuvieron su fundamento en el desarrollo de la curva normal por Gauss, en su aplicación por Galton a los problemas de herencia, etc. Sin embar- go, los auténticos padres de estas técnicas fueron Karl Pearson (1857-1936) y Ronald Fisher (1890-1962); sobre la historia de la estadística en psicología, véase Cowles (1989) y Walker (1975). Clásicamente, la estadística se ha dividido en dos partes: la estadística descrip- tiva y la estadística inferencial. Estas dos partes reflejan, como ya hemos dicho, las dos grandes épocas de su historia, pero también pueden reflejar la profundidad de los análisis que se realizan o, incluso, las fases de un estudio, puesto que para hacer un estudio inferencial primero hay que hacer un estudio descriptivo de los datos. Es decir, un estudio descriptivo se agota en la descripción, mientras que uno inferencial comienza por la descripción y luego aborda la inferencia. Mientras que la estadística descriptiva se puede abordar sin conocimientos téc- nicos previos más allá del álgebra elemental, para el estudio de la estadística infe- rencial es imprescindible adquirir unas nociones básicas de probabilidad. Por ello es frecuente encontrar que los libros de estadística aplicada están organizados, al me- nos, en esos tres bloques. En este libro nosotros nos ocupamos sobre todo de los dos primeros, aunque también incluimos una introducción a la inferencia estadística, cuyo desarrollo pleno se puede seguir en otras obras (Pardo y San Martín, 2010). Proponemos la siguiente definición de la estadística. La estadística es la disciplina que se ocupa de la ordenación y análisis de datos procedentes de muestras y de la realización de inferencias acerca de las poblaciones de las que proceden. Se puede decir que el sentido vulgar del término «estadística» al que nos re- feríamos al comenzar esta sección corresponde más o menos a la estadística des- £2 Ediciones Pirámide Conceptos generales / 21 Se llama población estadística al conjunto de todos los elementos que cumplen una o varias características. Se llama muestra a cualquier subconjunto de los elementos de una po- blación. A los elementos que componen una población se les denomina «entidades es- tadísticas o individuos». Pueden ser personas, animales, objetos o, simplemente, números. En nuestro ejemplo 1, sobre la capacidad de liderazgo, son las personas que integran la plantilla de mandos intermedios de la empresa BSX; en el ejemplo 2, de los cuidadores, son todos los potencialmente cuidadores de un enfermo; en el ejemplo 3, sobre la selección atencional, serían todas las realizaciones de la ta- rea, en las condiciones de flancos compatibles e incompatibles, que potencialmen- te podría realizar la persona que realiza nuestro experimento; en el ejemplo 4, la población del sondeo son todos los ciudadanos españoles mayores de edad. Dependiendo del número de elementos que la compongan, la población pue- de ser finita o infinita. Los niños que estudian la ESO en la Comunidad de Ma- drid, los niños invidentes españoles, las empresas de nuevas tecnologías con sede en Tres Cantos o las poblaciones de nuestros ejemplos sobre la capacidad de li- derazgo, el estrés de los cuidadores y el sondeo son casos de poblaciones finitas, puesto que en ellas los elementos se podrían contar, obteniendo un número finito. El número de lanzamientos posibles de un dado, el conjunto de los números pares o la población de nuestro ejemplo sobre tiempo de respuesta son casos de pobla- ciones infinitas, puesto que teóricamente no tienen un límite: por muchas obser- vaciones que realicemos, siempre podríamos recoger más. Muchas poblaciones con las que trabajamos son finitas, pero tan numerosas que, a la hora de hacer inferencias acerca de ellas, se pueden considerar infinitas a efectos prácticos (en este caso estarían la poblaciones de nuestros ejemplos so- bre estrés de cuidadores y sobre sondeos de opinión). En la estadística hay pro- cedimientos de cálculo que varían dependiendo de que la población sea finita o infinita, pero a medida que se va incrementando el tamaño de las poblaciones finitas el uso de uno u otro procedimiento resulta indiferente; proporcionan re- sultados cada vez más parecidos. En consecuencia, la mayor parte de las veces trabajaremos con poblaciones infinitas, ya sea porque lo son de verdad o porque su tamaño es tan grande que tomarlas por tales no afecta prácticamente a los resultados. Cuando un investigador aborda un trabajo empírico, debe definir la población correspondiente. La población ha de ser el marco o conjunto de referencia sobre el cual se van a realizar las conclusiones e interpretaciones; éstas no pueden ex- ceder ese marco. El hecho de que las poblaciones sean en general muy numerosas hace que la descripción de sus propiedades sea inaccesible. De ahí que se trabaje fundamen- talmente con muestras. La muestra nos va a proporcionar unos datos que podemos ordenar, simpli- ficar y describir. Pero uno de los objetivos es el de poder describir la población O Ediciones Pirámide UT — 22 / Análisis de datos en psicología | de partida mediante lo que encontremos en la muestra. Siguiendo con nuestros ejemplos del cuadro 1.1, podemos decir que lo que nos interesa no es la eficacia del programa de reducción de estrés en los 30 familiares concretos que participan en nuestro estudio del ejemplo 2, ni la forma de responder en los 30 ensayos de tiempo de reacción aplicados, ni la opinión de los 2.500 encuestados acerca de la pregunta. Lo que nos interesa realmente es extraer conclusiones generales acerca de la eficacia general de la técnica, la forma general de responder en la tarea y la opinión de toda la población. Y para poder extraer esas conclusiones lo más im- portante es que las muestras de observaciones sean representativas. Veámoslo con otro ejemplo. Supongamos que queremos estudiar la estatura de los españoles; para ello nos situamos en una calle de nuestra ciudad y nos disponemos a pre- guntar a los primeros cien transeúntes que pasen por aquel punto. Si por una casualidad nos hemos situado cerca de un polideportivo donde se practica el ba- loncesto, al cual suelen dedicarse individuos altos, los datos que recogeremos no serán representativos. Si lo que intentamos es hacernos una idea de cuál puede ser la estatura media de los españoles a partir de la estatura media de los inte- grantes de esa muestra, nuestras conclusiones serán incorrectas. Existe todo un campo de la metodología, llamado muestreo, dedicado a es- tudiar procedimientos de extracción de muestras que maximicen la representati- vidad de las mismas. Sólo un adecuado muestreo asegurará la representatividad de la muestra. Remitimos al lector interesado a obras específicas sobre muestreo (Azorín y Sánchez-Crespo, 1986; Clairin y Brion, 2001). Habitualmente, uno de los objetivos de cualquier investigación será la de al- canzar conclusiones acerca de la población a partir de la información obtenida en la muestra. Pero ese objetivo sólo se alcanzará plenamente en la medida en que esa información se aproveche adecuadamente. Por ello, un primer objetivo de la estadística descriptiva consiste en conseguir resúmenes de los datos, con índices compactos y muy informativos. Las poblaciones se pueden caracterizar mediante unas constantes denomina- das «parámetros». Una de las tareas de la estadística es hacer conjeturas acerca de esas cantidades. Para ello se utilizan magnitudes análogas obtenidas en las muestras, que se denominan «estadísticos». Podemos establecer las siguientes definiciones: Un parámetro es una propiedad descriptiva de una población. Un estadístico es una propiedad descriptiva de una muestra. Por ejemplo, el estrés medio de la población de cuidadores o el tiempo medio que invertiría nuestro participante en todas sus hipotéticas realizaciones de la tarea de los flancos son ejemplos de parámetros. Como estas cantidades son des- conocidas, haremos conjeturas sobre ellas a partir de cantidades similares obteni- das en las muestras. Así, es casi seguro que el estrés medio de los 60 familiares de nuestro estudio antes de comenzar con el programa no es idéntico al de la pobla- ción, pero si la muestra seleccionada es realmente representativa, probablemente O Ediciones Pirámide es 24 / Análisis de datos en psicología | Si trabajamos con la población española, sus elementos tienen las caracteris- ticas sexo (que adopta dos modalidades: varón y mujer), estado civil (soltero, casado, viudo...), estatura (cada una de las estaturas diferentes que adoptan los españoles), inteligencia (cada uno de los posibles valores diferentes que adopta- rían los españoles en inteligencia, según el instrumento que utilicemos para eva- luarla), etc. Por supuesto, la psicología se centra en aquellas características que son propias de su objeto de estudio, como la inteligencia, la memoria, la personalidad, etc. En el primero de nuestros ejemplos nos interesábamos por un rasgo de persona- lidad, en el segundo por el nivel de estrés, en el tercero por el tiempo de respues- ta en una tarea y en el cuarto por la opinión. Cada una de estas características puede mostrar distintas modalidades (en nuestros ejemplos, los grados en que se tiene capacidad de liderazgo, los niveles de estrés, las distintas cantidades de tiem- po y las opiniones sobre una cuestión particular). Las técnicas estadísticas no se aplican directamente a las modalidades obser- vadas. Las modalidades se representan por números y la estadística se aplica a esos números. La medición no es otra cosa que el proceso de atribuir números a las modalidades de las características. Los números se asignan a las caracterís- ticas siguiendo las reglas que se derivan de algún modelo de medición; del estudio de los modelos de medición se ocupa la «teoría de la medida». Ya hemos visto que las características permiten calificar a los elementos. Al- gunos de ellos adoptan la misma modalidad de una característica, mientras que otros adoptan modalidades diferentes. De algunas características incluso pode- mos decir que unos individuos las exhiben en mayor medida que otros. Es decir, a partir de una característica se puede establecer un sistema relacional empírico (porque se refiere a entidades y relaciones reales). Igualmente, el sistema numéri- co está formado por un conjunto de entidades (números) y unas relaciones entre ellos; es decir, se trata de un sistema relacional numérico. Asumiremos la siguiente definición de medición: Se llama medición de una característica a la conexión entre un sistema relacional empírico y un sistema relacional numérico, de tal forma que las relaciones entre las entidades se reflejen en las relaciones entre los números que los simbolizan. Sólo si se consigue el objetivo implicado en esta definición, ocurrirá que de las relaciones entre los números se podrán hacer inferencias válidas acerca de las relaciones entre las entidades. Esta conexión es lo que Stevens (1946) llamaba schemapiric union. Por ejemplo, las modalidades que adopta la variable estatura son tales que se podría decir que una determinada modalidad es una estatura superior a otra determinada moda- lidad. Pues bien, los números que se atribuyan a esas modalidades en el proceso de medición deben reflejar esa superioridad. Por el contrario, lo único que pode- mos decir al comparar las modalidades de dos individuos en la variable sexo es O Ediciones Pirámide Conceptos generales / 25 si esas modalidades son la misma o no, pero nada respecto a magnitudes. Los números asignados a las modalidades del sexo deben reflejar simplemente ese hecho diferencial; de la comparación de los números no se podrá deducir con- clusión alguna distinta a la de si esos individuos tienen o no el mismo sexo. Es habitual asignar los valores 0 y 1 a las modalidades de variables como el sexo, pero se trata de un mero etiquetado, y desde luego que un 1 no implica «más sexo» que un 0, 1.3.1. Las escalas de medida Como ya hemos avanzado, la medición estudia las condiciones de construc- ción de representaciones numéricas. Los modelos desarrollados para la medición se llaman escalas de medida. Aunque no podemos entrar aquí en profundidad en el complejo campo de la medición (para una exposición más detallada véase Já- ñez, 1989), vamos a exponer las características fundamentales del sistema de cla- sificación de escalas propuesto por Stevens (1946, 1975) y que es todavía la cla- sificación más utilizada: escalas nominales, ordinales, cuantitativas de intervalo y cuantitativas de razón. Esta clasificación se ilustra en el cuadro 1.2 con ejemplos de cada tipo de escala. El científico se centra en aquellas características que considera relevantes para su trabajo de investigación. Aplica a esas características un esquema de clasifi- cación, sin el cual no podría realizar su trabajo de registrar, ordenar y comunicar lo observado. En su forma más simple y primitiva, un esquema no es más que una regla que permite organizar las observaciones en clases de equivalencia, de manera que las observaciones que son incluidas en la misma clase son conside- radas como cualitativamente iguales, y las que son incluidas en clases diferentes son consideradas como cualitativamente diferentes. Se utiliza una clase para cada una de las modalidades que adopta la característica que se está estudiando. Las clases han de ser mutuamente exclusivas y exhaustivas, es decir, cada observación es incluida en una clase y sólo en una. Supongamos que tenemos un conjunto de n elementos (e;, €,, ..., €,) que tienen una característica cuyo estudio nos inte- resa. Esa característica adopta un número k de modalidades distintas; represen- tamos por m(e,) a la modalidad del elemento e, Asignamos números a los ele- mentos en función de la modalidad que presentan en esa característica; representamos por n(e,) al número asignado al elemento e, Establecemos una regla de asignación de números a los objetos, de tal forma que se cumplan las siguientes condiciones: Si n(e) =n(e), entonces m(e)= m(e) Si n(e)+n(e), entonces m(e,) + m(ej) Al sencillo tipo de medición que cumple estas condiciones se le llama escala- miento cualitativo o nominal; al conjunto de clases que la integran se le llama escala nominal. O Ediciones Pirámide Conceptos generales / 27 de las magnitudes. Sin embargo, a veces lo único que esos números nos permiten inferir son relaciones del tipo «mayor que» o «menor que». En concreto, a veces la escala con la que estamos trabajando cumple sólo, para todo par de elementos, e, y €; las dos condiciones siguientes: Si ní =n(e), entonces c(e,) = c(e) Si n(e) > n(e), entonces c(e) > c(ej) A las escalas de medida que cumplen estas características se les llama escalas ordinales; también se dice que se está haciendo una medición a nivel ordinal. Es- tas condiciones implican un paso más allá de lo que suponían las escalas nomi- nales. Al igual que en estas últimas, si dos elementos comparten el mismo núme- ro podemos concluir que presentan la misma modalidad (en este caso tienen la misma cantidad de esa propiedad), pero de dos elementos a los que se han asig- nado números diferentes no sólo se puede decir que son diferentes en esa carac- terística, sino que se pueden establecer relaciones del tipo «mayor que» o «menor que». Se puede decir cuál de esos elementos presenta una mayor magnitud en la característica. Dicho de otro modo, los elementos se pueden ordenar; de ahí el nombre de la escala. Un ejemplo tradicionalmente utilizado para ilustrar este tipo de escalas es la medición de la dureza de los minerales. Supongamos que tomamos cuatro mine- rales (e,, €,, e, y €4) y tratamos de rayar unos con otros, haciendo todas las com- binaciones posibles. Cuando un mineral raya a otro se dice que el primero es más duro que el segundo. Dos minerales con distinta dureza no sólo son diferentes en esa característica, sino que se puede decir que la poseen en distinta magnitud. El proceso de medición, o asignación de números, debe ser tal que refleje esas dis- tintas magnitudes. Supongamos que e, ha rayado a todos los demás, mientras que e, ha rayado a e, y e,; por último, e, ha rayado a e,. La ordenación de los objetos según su dureza sería la siguiente: e, €, €,, €, Pues bien, en una escala ordinal los números asignados deben respetar esa ordenación. Por ejemplo, podríamos hacer la siguiente asignación: n(e,) = 4, n(e,) = 3, n(e,) = 2 y n(e,) = 1. La comu- nicación de esta información permite al receptor extraer conclusiones del tipo «el mineral 3 tiene una mayor dureza que el mineral 4» o «el mineral 2 tiene una menor dureza que el mineral 3». En psicología son muchas las características cuya medición se considera de nivel ordinal, pues son muchos los casos en los que lo único que se puede decir es que un individuo es más extravertido que otro, que un niño es más hiperactivo que otro o que el aprendizaje es más rápido con el método A que con el método B. Igualmente, si tomamos las calificaciones como un índice de los conocimientos de un estudiante, entonces lo único que podemos decir de un estudiante con so- bresaliente es que tiene mejores conocimientos que otro con notable, y éste que otro con aprobado. Ñ Un ejemplo de escalas ordinales en ciencias sociales es el nivel educativo for- mal alcanzado. Supongamos que asignamos a los individuos los siguientes valo- res: 1, si no tiene estudios; 2, si ha completado los estudios primarios; 3, si ha Pirámide 28 / Análisis de datos en psicología | completado la enseñanza secundaria; 4, si ha terminado algún estudio universi- tario. Estos números se pueden utilizar para hacer inferencias del tipo «igual que» o «mayor que». La limitación de las escalas ordinales es que, aunque nos informan de que un elemento representa la característica en cuestión en una mayor magnitud que otro elemento, no nos dice en cuánto más. Para poder alcanzar conclusiones más precisas, como la de en cuánto más presenta la característica un elemento sobre otro, hay que contar con una unidad de medida. Pero en ese caso ya estaríamos hablando de otros tipos de escala, que expondremos a continuación. Supongamos ahora una escala en la que, además de las dos condiciones ex- presadas para las escalas ordinales se cumple una tercera, según la cual, para cualquier elemento e; n(e) = a+ b- cle) (siendo b%0) A este tipo de escala se le llama escala de intervalo. La tercera condición aña- dida a las exigidas para una escala ordinal impone que el número asignado al elemento e,, que representamos por n(e;), sea una función lineal (véase el capítu- lo 7) de la magnitud real que ese objeto presenta en la característica en cuestión. La clave de esta tercera condición (que supone una mejora sustancial con respec- to a las escalas ordinales) es que se cuenta con una unidad de medida, sin impor- tar que tanto esta unidad de medida como el origen de la escala sean arbitrarios. Lo cierto es que si se cumple esta tercera condición podemos alcanzar consecuen- cias acerca de la igualdad o desigualdad de diferencias. Es decir, que para todo cuarteto de elementos, e,, €; e,, e, se cumplen las siguientes condiciones: Si n(e) = n(e) = nte) = n(e) entonces c(e,) — c(e) = c(e,) — ce) Si n(e) — n(e) > n(e,) = nte) entonces c(e) — c(e) > c(e,) — cle) Es decir, que si la diferencia entre los números asignados a dos elementos es igual a la diferencia entre los números asignados a otros dos, entonces también son iguales las diferencias de magnitudes entre estos dos pares. Igualmente, una mayor diferencia entre los números asignados implica una mayor diferencia entre las magnitudes representadas. El ejemplo clásico de este tipo de escalas es el de las temperaturas. Para cons- truir la escala centígrada se enfría el agua hasta la temperatura de congelación y se pone un cero en la altura que alcanza la columna de mercurio. Después se ca- lienta el agua hasta el punto de ebullición, y donde se encuentre la altura de la columna de mercurio se marca un cien. Posteriormente se divide el espacio entre (O Ediciones Pirámide