Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Métodos de escalamiento, Apuntes de Psicometría

Asignatura: Psicometria, Profesor: María Dolores Sancerni, Carrera: Psicologia, Universidad: UV

Tipo: Apuntes

2014/2015

Subido el 07/01/2015

jimenez_silvia
jimenez_silvia 🇪🇸

3.8

(28)

4 documentos

1 / 18

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Métodos de escalamiento
- 1-
TEMA 3. MÉTODOS DE ESCALAMIENTO
El escalamiento psicológico se inicia con Thurstone (1927), como una
continuación de la psicofísica clásica y de los métodos indirectos. La diferencia
esencial radica en que su método es más general, permitiendo escalar tanto
sensaciones a las que subyace un continuo físico, como atributos psicológicos
que carecen de dicho sustrato. Además su objetivo es únicamente construir
escalas, no descubrir funciones psicofísicas.
3.1. Métodos centrados en los estímulos. Escalamiento
de Thurstone
El punto de partida son los juicios que son requeridos a los sujetos al
evaluar los estímulos. Estos pueden ser de dos tipos: comparativos y
categóricos. Estos juicios se relacionan con el atributo psicológico a medir a
través de una serie de ecuaciones que se conocen como la ley del juicio
comparativo y la ley del juicio categórico. Nosotros sólo nos ocuparemos de la
primera.
La Ley del juicio comparativo
Los datos se obtienen mediante el método de las comparaciones binarias.
En el método de las comparaciones binarias se presentan todos los pares
posibles de estímulos, y el sujeto debe juzgar cuál de los estímulos del par
presenta en mayor medida la propiedad evaluada (belleza, utilidad, contenido
racista, etc.). Para analizar estos datos y elaborar con ellos la escala
psicológica, Thurstone propone un modelo matemático partiendo de una serie
de conceptos y supuestos.
En concreto parte de la idea de que el juicio comparativo de dos estímulos
puede variar entre distintos sujetos u ocasiones debido a fluctuaciones
momentáneas del organismo. Se asume que el estímulo que más
frecuentemente es juzgado superior a otro tiene un valor más alto en el
continuo psicológico. Así es posible relacionar la probabilidad de cada estímulo
de ser juzgado “mayor que” con sus valores en el continuo.
Al efecto psicológico que provoca un estímulo concreto en un sujeto, se le
denomina “proceso discriminativo”, que no es fijo sino que varía
aleatoriamente. Los distintos procesos discriminativos dan lugar a una
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12

Vista previa parcial del texto

¡Descarga Métodos de escalamiento y más Apuntes en PDF de Psicometría solo en Docsity!

TEMA 3. MÉTODOS DE ESCALAMIENTO

El escalamiento psicológico se inicia con Thurstone (1927), como una

continuación de la psicofísica clásica y de los métodos indirectos. La diferencia

esencial radica en que su método es más general, permitiendo escalar tanto

sensaciones a las que subyace un continuo físico, como atributos psicológicos

que carecen de dicho sustrato. Además su objetivo es únicamente construir

escalas, no descubrir funciones psicofísicas.

3 .1. Métodos centrados en los estímulos. Escalamiento

de Thurstone

El punto de partida son los juicios que son requeridos a los sujetos al

evaluar los estímulos. Estos pueden ser de dos tipos: comparativos y

categóricos. Estos juicios se relacionan con el atributo psicológico a medir a

través de una serie de ecuaciones que se conocen como la ley del juicio

comparativo y la ley del juicio categórico. Nosotros sólo nos ocuparemos de la

primera.

La Ley del juicio comparativo

Los datos se obtienen mediante el método de las comparaciones binarias.

En el método de las comparaciones binarias se presentan todos los pares

posibles de estímulos, y el sujeto debe juzgar cuál de los estímulos del par

presenta en mayor medida la propiedad evaluada (belleza, utilidad, contenido

racista, etc.). Para analizar estos datos y elaborar con ellos la escala

psicológica, Thurstone propone un modelo matemático partiendo de una serie

de conceptos y supuestos.

En concreto parte de la idea de que el juicio comparativo de dos estímulos

puede variar entre distintos sujetos u ocasiones debido a fluctuaciones

momentáneas del organismo. Se asume que el estímulo que más

frecuentemente es juzgado superior a otro tiene un valor más alto en el

continuo psicológico. Así es posible relacionar la probabilidad de cada estímulo

de ser juzgado “mayor que” con sus valores en el continuo.

Al efecto psicológico que provoca un estímulo concreto en un sujeto, se le

denomina “proceso discriminativo”, que no es fijo sino que varía

aleatoriamente. Los distintos procesos discriminativos dan lugar a una

distribución discriminativa que se asume continua y normal. La media

constituye el llamado proceso discriminativo modal, que se hará corresponder

con el valor escalar (la puntuación) del estímulo psicológico en el continuo, y la

desviación típica es la dispersión discriminativa. De esta forma, la proximidad

entre dos estímulos, en este caso psicológicos, dependerá del solapamiento de

sus distribuciones discriminativas. Una mayor confusión en los juicios acerca

de qué estímulo del par presenta más cantidad de atributo, indicará un mayor

solapamiento entre las distribuciones. Por ejemplo, si el estímulo A es juzgado

mayor que B en un 40% de los casos, y A es juzgado mayor que C en un 90%

de los casos, las distribuciones de A y B estarán más solapadas que las de A y

C, lo que implicará que A y B están más próximos en el continuo psicológico y

tienen valores escalares más similares.

La pregunta clave es, ¿cómo estimar los valores escalares de los

estímulos a partir de los juicios de los sujetos, es decir, a partir de las medidas

porcentuales sobre la preferencia de estímulos? Veamos. Al comparar dos

estímulos A y B con distribuciones discriminativas normales, la distribución de

las diferencias también será normal con media μ A

−μ

B

y desviación típica

𝜎

!!!

= 𝜎

!

!

  • 𝜎

!

!

− 2 𝜌

!"

𝜎

!

𝜎

!

. Por ello, a través del área de la curva normal se

puede determinar la puntuación típica que corresponde a la proporción de

veces en que un estímulo es juzgado mayor que el otro (en este caso, z AB

Asimismo, podemos expresar en unidades de desviación típica el punto de la

distribución de diferencias a partir de cual la diferencia entre A y B será mayor

o igual a cero:

𝑍

!"

=

𝜇

!

− 𝜇

!

− 0

𝜎

!!!

Esto permitirá estimar la diferencia entre los valores escalares de cada par de

estímulos a través de la ecuación que constituye la ley del juicio comparativo:

𝜇

!

− 𝜇

!

= 𝑍

!"

𝜎

!

!

  • 𝜎

!

!

− 2 𝜌

!"

𝜎

!

𝜎

!

Sin embargo, la ley del juicio comparativo así formulada no es resoluble en la

práctica. Dado un número de estímulos a comparar, sólo se conocerán las

puntuaciones típicas correspondientes a los juicios emitidos por el sujeto

respecto de cada par. Esto dará lugar a un sistema de ecuaciones con más

incógnitas que ecuaciones. Para hacer el sistema resoluble es necesario

imponer una serie de restricciones. Las más habituales se reflejan en el

llamado caso V de la ley del juicio comparativo , que asume que los juicios

la ley del juicio comparativo es el elevado número de comparaciones que se

requieren.

3 .2. Métodos centrados en los sujetos. Escalas Likert

En la aproximación de Thurstone, lo que se busca es situar los

estímulos, los objetos en la escala. El sujeto hace el papel de generador de

datos para conseguir el escalamiento de los estímulos. Si la persona que

genera los datos lo hiciera sin error, con esa persona sería suficiente para

obtener los valores de escala para los estímulos, pero desgraciadamente eso

no es así debido a dos motivos fundamentales: uno, hay variabilidad entre las

personas (personas distintas generan datos distintos ante el mismo estímulo) y

dos, hay variabilidad en la propia persona cuando se le presenta el mismo

estímulo varias veces. Thurstone utiliza muchos individuos porque le interesan

los individuos en sí mismos, sus patrones de respuesta, o sus diferencias.

Likert, desde otro extremo, ideó un método en el que lo importante son

los individuos en lugar de los estímulos (1932, 1937). Con su método se

escalan sujetos, los estímulos no son importantes en sí mismos, se usan con la

finalidad de generar datos en los individuos que permitan su escalamiento.

La técnica Likert se basa en los siguientes postulados:

a) es posible estudiar dimensiones de actitud a partir de un conjunto de

enunciados que operen como reactivos para los sujetos.

b) Los individuos pueden situarse en la variable de actitud desde el punto más

favorable hasta el más desfavorable. La variación de las respuestas será

debida a diferencias individuales.

c) La valoración de los sujetos en la variable de actitud no supone una

distribución uniforme sobre el continuo de actitud, sino su posición favorable

o desfavorable sobre el objeto estudiado.

Likert trató de situar su trabajo dentro del marco general de la Teoría de los

Test; de ahí que no proporcione un modelo explícito de escalamiento. Las

escalas elaboradas por este procedimiento tienen como finalidad la medida de

las diferencias individuales respecto a una determinada actitud.

Siguiendo con la clasificación de Torgerson se trataría de un método de

escalamiento centrado en los sujetos, en el que:

  • los estímulos (ítems) son considerados réplicas unos de otros y
  • las variaciones en las respuestas son debidas a diferencias individuales

respecto a la actitud.

Desde el punto de vista de la medición, la técnica Likert asume un nivel de

medida ordinal. Los individuos se ordenan en la escala en función de su

posición favorable/desfavorable respecto a la actitud medida.

Se trata de escalas sumativas, ya que la puntuación obtenida por los

sujetos es función de las puntuaciones obtenidas en cado uno de los elementos

que la componen.

Asignación de puntuaciones

Para asignar puntuaciones es necesario tener en cuenta su posición

negativa o positiva respecto a la actitud que se quiere medir y una vez

evaluado este aspecto, asignar una puntuación a cada una de las opciones o

categorías de respuesta.

Lo vemos con un ejemplo: Para el siguiente ítem: Se debería dar trabajo

a los extranjeros,

Si estamos midiendo la actitud favorable/desfavorable hacia la

integración de los extranjeros en España, este ítem estaría midiendo una

actitud favorable. Si utilizamos 5 categorías, la asignación de puntuaciones

podría ser:

Hay que prestar atención al hecho de que algunos ítems pueden estar

invertidos: miden al revés que los demás.

En el ejemplo anterior vemos que es un ítem donde una puntuación alta

corresponde a una actitud desfavorable.

  • Otro ítem del test podría medir al revés y tener la misma puntuación.
  • La forma de saber si un ítem está invertido es ponerse en el lugar de un

sujeto con una actitud extrema: sus respuestas deben caer siempre al mismo

lado.

  • La puntuación de los sujetos en el test total será la suma de las puntuaciones

asignadas a cada categoría elegida por los sujetos en todos los ítems.

TD D I A TA

2 1 0 - 1 - 2

entre los estímulos o ítems.

Frente a Thurstone y Likert, donde la unidimensionalidad de la escala ha

de ser puesta a prueba, el método del escalograma, según Guttman, si

muestra un buen ajuste garantiza la unidimensionalidad. En concreto, según

Guttman, la unidimensionalidad de un continuo queda garantizada si la

puntuación total obtenida a partir de un conjunto de elementos, permite

predecir las respuestas de los sujetos a cada uno de esos elementos. También

frente a Thurstone y Likert, que eran probabilísticos, el escalograma de

Guttman es un método determinista. Si la posición de un sujeto en el continuo

es superior a la posición del ítem, el sujeto acertará (si se trata de una escala

de aptitudes) o aceptará (si, como es más frecuente, se trata de una escala de

actitudes) el ítem; es decir, la probabilidad de acertar el ítem será igual a 1. Si

la posición del sujeto es inferior a la posición del ítem, lo fallará (o no lo

aceptará); es decir, la probabilidad de acertar el ítem será igual a 0.

En el caso de la escala Guttman perfecta, acertar o aceptar un ítem

implica haber acertado (o aceptado) los ítems más fáciles. Además, una vez se

falla un ítem, los siguientes, más difíciles, serán fallados también. De ahí esa

concepción acumulativa. Así, una vez se han ordenado los ítems de acuerdo

con su dificultad (o aceptación), a partir del porcentaje de individuos que

aciertan (o aceptan) el ítem, se podrá conocer el patrón de respuestas de

cualquier sujeto a partir de su puntuación total en la escala. Las cuestiones de

aritmética ofrecen buenos ejemplos de este tipo de escalas.

Supongamos que a un grupo de niños de 2º de Primaria se les presenta las

siguientes sumas:

Es probable que si un sujeto A responde correctamente al ítem 5, responda

también correctamente a los ítems 1, 2, 3, y 4. Si el sujeto B puede responder

correctamente el ítem 2 y no el ítem 3, es probable que pueda responder

correctamente el ítem 1, pero será incapaz de responder correctamente los

ítems 4 y 5. Puntuando con un 1 cada acierto y con un 0 las respuestas

incorrectas, puede obtenerse un patrón o perfil de las respuestas de un

individuo. Si las cuestiones aritméticas forman una escala perfecta , la suma de

las respuestas correctas a los cinco ítems puede utilizarse para revelar la

escala tipo - el patrón de respuestas a los ítems- de una persona en términos de

una sucesión de unos y ceros. En nuestro ejemplo:

ítems

1 2 3 4 5 suma

La escala tipo del sujeto A es: 1 1 1 1 1 5

La escala tipo del sujeto B es: 1 1 0 0 0 2

La escala tipo del sujeto C es: 0 0 0 0 0 0

Si las cuestiones aritméticas forman una escala perfecta conociendo sólo el

número total de aciertos de cada sujeto podríamos pronosticar las respuestas

que ha dado a cada ítem. Supongamos que ése sea el caso, y que el sujeto D

ha obtenido una puntuación de 3 aciertos; pronosticaríamos que sus

respuestas han sido las siguientes:

ítems

1 2 3 4 5 suma

respuestas del sujeto D: 1 1 1 0 0 3

Sería posible así ordenar los estímulos y los sujetos en un mismo continuo,

formando una escala de entrelazamiento. En nuestro ejemplo, el sujeto C que

no acierta o acepta ningún ítem, ni siquiera el primero, que es el más sencillo,

estaría situado a la izquierda del continuo. El que acierta los 5 ítems (como el

sujeto A) iría al extremo derecho del continuo. El sujeto D superaría el nivel

requerido para acertar o aceptar los ítems 1, 2 y 3, pero no el 4 ni el 5, por lo

que se situaría entre los ítems 3 y 4, y así sucesivamente

Así pues, el propósito de Guttman cuando diseñó este método de

escalamiento fue lograr escalas perfectas, de manera que conociendo

únicamente un número - el de aciertos- pudiera reproducirse la serie de

respuestas dadas ante los ítems. Y ¿cómo se reconoce que una serie de ítems

o cuestiones forman una escala perfecta? Visualmente se reconoce cuando los

patrones de respuesta de los sujetos coinciden con las escalas tipo posibles. Si

la escala está compuesta por cinco ítems que se puntúan como correcto (1) o

incorrecto (0), hay seis escalas tipo posibles:

escalas tipo puntuación

Un aspecto importante es que è j

y b

i

se refieren al mismo continuo psicológico:

el rasgo que interesa medir; luego, son cantidades expresadas en la misma

escala de medida, y por lo tanto son comparables. Así pues, la CCI de un ítem

en el modelo de Guttman indica que:

P

i

= 0 si è

j

< b

i

P

i

= 1 si è

j

≥ b

i

El método de conteo del error de Goodenough.

Vamos a seguir el método que proponen Goodenough (1944) y

Edwards (1948) para evaluar si un conjunto de estímulos o ítems constituyen

una escala perfecta o escala Guttman.

Hay que tener en cuenta que los estímulos o ítems que se escojan para

formar la escala deben ser capaces de discriminar entre los sujetos con

actitudes o percepciones distintas sobre los estímulos a lo largo de una única

dimensión que se pretende medir. Supongamos que las seis afirmaciones que

se muestran abajo se han presentado a doce sujetos, que han respondido a las

mismas utilizando la siguiente escala de respuesta: 1. De acuerdo. 0.

Desacuerdo. Nos formulamos la siguiente pregunta: ¿constituyen las seis

afirmaciones una escala perfecta o escala Guttman a lo largo de la dimensión

actitudes hacia la escuela? Recuérdese que si la respuesta fuera afirmativa,

conociendo tan sólo el número de respuestas "de acuerdo" podríamos

reproducir las respuestas de cada individuo a cada uno de los ítems o

afirmaciones.

Afirmaciones:

a. La escuela está bien.

b. Voy a la escuela con regularidad.

c. Pienso que la escuela es importante.

d. Es bueno estar en la escuela.

e. Pienso que la escuela es divertida.

f. Pienso que la escuela es mejor que un circo.

Las respuestas de cada individuo a cada ítem pueden organizarse en una

matriz como la que se presenta en la tabla 1.

Tabla 1. Matriz de respuestas.

sujetos a b c d e f puntuación

Es conveniente reordenar la tabla de manera que su configuración se aproxime

a la que mostraría una escala perfecta. Para ello, y tal como ocurre cuando la

escala es perfecta, la primera columna debe corresponder al ítem que evoca

mayor cantidad de unos, siguiendo la ordenación de manera decreciente.

Asimismo, el primer sujeto debe ser el que más unos ha "respondido",

siguiendo también la ordenación de manera decreciente hasta el sujeto que

menos unos responde. Tras realizar estas reordenaciones obtendríamos la

matriz que aparece en la tabla 2. Aquí los ítems están ordenados en función de

su nivel de dificultad, esto es, en función del nivel de rasgo que exigen al sujeto

para que éste dé una respuesta de acuerdo. Éste es el escalamiento de

estímulos que produce el método de Guttman: una escala ordinal de ítems.

Tabla 2. Matriz reordenada de respuestas.

sujetos b c e d a f puntuación

Tabla 3. Matriz reordenada de respuestas con indicaciones de los errores.

sujetos b c e d a f puntuación errores

errores 3 6 3 3 3 2

CR

i

  • Indica error.

El coeficiente de Reproductividad.

¿Cómo puede obtenerse un estimador de cuánto se aproxima la matriz

de las tabla 2 y 3 a una escala perfecta? Guttman propone un estimador a

partir de la proporción de errores obtenida. El número total de posibles errores

es igual al producto entre el número de sujetos (N) y el de ítems (k); en nuestro

caso: (12) (6)= 72. Si no existiera ninguna coincidencia entre los patrones de

respuesta de los individuos y las escalas tipo perfectas, la matriz estaría llena

de errores. Como las dimensiones de la matriz son 12 por 6, contendría un total

de 72 errores.

Para calcular el estimador señalado en el párrafo anterior hay que

realizar las siguientes operaciones: 1º) hallar el cociente entre los errores

hallados y las respuestas posibles (20/72=0.277); 2º) restar de uno la cantidad

resultante: 1-0.27=0.723. El resultado es un coeficiente que indica la capacidad

de la escala para reproducir las respuestas de los sujetos a partir de sus

puntuaciones totales. Ese coeficiente recibe el nombre de coeficiente de

reproductibilidad (CR):

Guttman señaló que una escala con un coeficiente de reproductibilidad inferior

a 0.90 no puede ser considerada una aproximación efectiva a una escala

perfecta.

Tras los resultados obtenidos parece claro que los ítems no forman una

buena aproximación a una escala perfecta. Para detectar cuáles son los ítems

que peor funcionan, se puede calcular el coeficiente de reproductibilidad de

cada ítem (CR i

En la tabla 3, puede observarse que el ítem c (pienso que la escuela es

importante) es el que presenta un CR i

más bajo contiene (0.5); contiene 6

errores de un total de 12 posibles. Por ello parece razonable eliminarlo o

reformularlo. Supongamos que se elimina el ítem c. Tras realizar esta

operación, hay que volver a reordenar a los sujetos pues la puntuación de

algunos de ellos habrá variado. Una vez concluidas este conjunto de

operaciones obtendríamos la siguiente matriz de respuestas:

Tabla 4. Matriz de respuestas tras eliminar el ítem c y reordenar los sujetos.

sujetos b e d a f puntuación errores

  • Indica error.

Asimismo, hay que volver a calcular los errores que contienen los

patrones de respuestas de cada individuo. Ahora tan sólo se encuentran 12

errores (nótese que 4 de ellos están contenidos en el patrón de respuestas del

sujeto 3. Habría que asegurarse de que este sujeto ha seguido las

instrucciones, no ha cometido errores a la hora de codificar sus respuestas,

"de acuerdo"; q: proporción de "desacuerdo") obtenidas para cada ítem, y su

coeficiente de reproductibilidad.

Tabla 5. Proporciones de respuesta y coeficientes de resproductibilidad de los ítems.

sujetos b e d a f puntuación errores

p .75 .50 .42 .33.

q .25 .50 .58 .67.

errores 2 4 2 3 1

CR

i

Como se aprecia en la tabla anterior, todos los ítems superan este

criterio.

Como se señaló anteriormente, el coeficiente de reproductibilidad puede

verse inflado por la existencia de ítems con proporciones de respuesta

extremas. Para valorar este aspecto es útil calcular la Reproductibilidad

Marginal Mínima (RMM), que es la media aritmética de las categorías modales

de todos los ítems de la escala. En nuestro caso, sería:

RMM=(0.75+0.50+0.58+0.67+0.83)/5=0.67.

Un valor elevado de la RMM puede indicar que el coeficiente de

reproductibilidad ha sido inflado artificialmente, siendo un resultado de la

existencia de categorías modales extremas. Para facilitar la interpretación de la

RMM, Menzel (1953) propuso el coeficiente de escalabilidad (CE):

𝐶𝑆 =

𝐶𝑅 − 𝑅𝑀𝑀

1 − 𝑅𝑀𝑀

=

𝑃𝑀

1 − 𝑅𝑀𝑀

donde PM es el porcentaje de mejora que ofrece el CR sobre la RMM. Para

que una escala sea considerada una buena aproximación a una escala

perfecta su coeficiente de escalabilidad debe ser igual o superior a 0.60.

En nuestro caso:

𝐶𝑆 =

0 , 13

1 − 0 , 67

= 0 , 39

Más recientemente, Cliff (1983) propone otros índices basados en el

coeficiente Tau de Kendall o coeficiente de correlación de Pearson. Algunos de

los índices son aplicables a los distintos ítems y sujetos de manera individual,

lo que resulta útil a la hora de determinar si hay algún grupo de sujetos, o

algunos ítems concretos que no sean escalables.

Valoración.

Uno de los aspectos destacables del modelo de Guttman es que pone

de manifiesto que tanto ítems como sujetos son escalables, mensurables. Los

ítems ya no se consideran réplicas unos de otros, como ocurría en el modelo

de Likert. Los ítems difieren en su grado de dificultad, esto es, en el nivel de

rasgo que exigen al sujeto para que éste acierte o respalde el ítem. Esta

característica del método de Guttman fue desarrollada más tarde por otros

métodos que permiten escalar con precisión los ítems y ubicarlos a lo largo del

continuo psicológico que se pretende medir.

Uno de los problemas del modelo de Guttman, que dificulta además la

construcción de escalas perfectas, es su carácter determinista. Según este

modelo, cuando un sujeto tiene un nivel de rasgo o aptitud igual o superior al

exigido por el ítem – esto es, domina el ítem-, no cabe otra respuesta que

acertar o respaldar el ítem (según se trate de: 1. un ítem de aptitud o 2. un ítem

de actitud o personalidad, respectivamente). Sin embargo, la experiencia

demuestra que esto no siempre es así. Por ejemplo, en algunas ocasiones,

cuando los estudiantes se enfrentan a problemas sencillos en un examen, su

incredulidad ante la facilidad del ítem, les lleva a reformularlo de manera

compleja, y lo complican tanto que al final no lo resuelven correctamente.

También ocurre que a veces, por mero azar, sujetos con un nivel de aptitud

inferior al exigido por el ítem, lo aciertan. Según el modelo determinista de