










Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Psicometria, Profesor: María Dolores Sancerni, Carrera: Psicologia, Universidad: UV
Tipo: Apuntes
1 / 18
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!











El escalamiento psicológico se inicia con Thurstone (1927), como una
continuación de la psicofísica clásica y de los métodos indirectos. La diferencia
esencial radica en que su método es más general, permitiendo escalar tanto
sensaciones a las que subyace un continuo físico, como atributos psicológicos
que carecen de dicho sustrato. Además su objetivo es únicamente construir
escalas, no descubrir funciones psicofísicas.
El punto de partida son los juicios que son requeridos a los sujetos al
evaluar los estímulos. Estos pueden ser de dos tipos: comparativos y
categóricos. Estos juicios se relacionan con el atributo psicológico a medir a
través de una serie de ecuaciones que se conocen como la ley del juicio
comparativo y la ley del juicio categórico. Nosotros sólo nos ocuparemos de la
primera.
Los datos se obtienen mediante el método de las comparaciones binarias.
En el método de las comparaciones binarias se presentan todos los pares
posibles de estímulos, y el sujeto debe juzgar cuál de los estímulos del par
presenta en mayor medida la propiedad evaluada (belleza, utilidad, contenido
racista, etc.). Para analizar estos datos y elaborar con ellos la escala
psicológica, Thurstone propone un modelo matemático partiendo de una serie
de conceptos y supuestos.
En concreto parte de la idea de que el juicio comparativo de dos estímulos
puede variar entre distintos sujetos u ocasiones debido a fluctuaciones
momentáneas del organismo. Se asume que el estímulo que más
frecuentemente es juzgado superior a otro tiene un valor más alto en el
continuo psicológico. Así es posible relacionar la probabilidad de cada estímulo
de ser juzgado “mayor que” con sus valores en el continuo.
Al efecto psicológico que provoca un estímulo concreto en un sujeto, se le
denomina “proceso discriminativo”, que no es fijo sino que varía
aleatoriamente. Los distintos procesos discriminativos dan lugar a una
distribución discriminativa que se asume continua y normal. La media
constituye el llamado proceso discriminativo modal, que se hará corresponder
con el valor escalar (la puntuación) del estímulo psicológico en el continuo, y la
desviación típica es la dispersión discriminativa. De esta forma, la proximidad
entre dos estímulos, en este caso psicológicos, dependerá del solapamiento de
sus distribuciones discriminativas. Una mayor confusión en los juicios acerca
de qué estímulo del par presenta más cantidad de atributo, indicará un mayor
solapamiento entre las distribuciones. Por ejemplo, si el estímulo A es juzgado
mayor que B en un 40% de los casos, y A es juzgado mayor que C en un 90%
de los casos, las distribuciones de A y B estarán más solapadas que las de A y
C, lo que implicará que A y B están más próximos en el continuo psicológico y
tienen valores escalares más similares.
La pregunta clave es, ¿cómo estimar los valores escalares de los
estímulos a partir de los juicios de los sujetos, es decir, a partir de las medidas
porcentuales sobre la preferencia de estímulos? Veamos. Al comparar dos
estímulos A y B con distribuciones discriminativas normales, la distribución de
las diferencias también será normal con media μ A
−μ
B
y desviación típica
𝜎
!!!
= 𝜎
!
!
!
!
− 2 𝜌
!"
𝜎
!
𝜎
!
. Por ello, a través del área de la curva normal se
puede determinar la puntuación típica que corresponde a la proporción de
veces en que un estímulo es juzgado mayor que el otro (en este caso, z AB
Asimismo, podemos expresar en unidades de desviación típica el punto de la
distribución de diferencias a partir de cual la diferencia entre A y B será mayor
o igual a cero:
𝑍
!"
=
𝜇
!
− 𝜇
!
− 0
𝜎
!!!
Esto permitirá estimar la diferencia entre los valores escalares de cada par de
estímulos a través de la ecuación que constituye la ley del juicio comparativo:
𝜇
!
− 𝜇
!
= 𝑍
!"
𝜎
!
!
!
!
− 2 𝜌
!"
𝜎
!
𝜎
!
Sin embargo, la ley del juicio comparativo así formulada no es resoluble en la
práctica. Dado un número de estímulos a comparar, sólo se conocerán las
puntuaciones típicas correspondientes a los juicios emitidos por el sujeto
respecto de cada par. Esto dará lugar a un sistema de ecuaciones con más
incógnitas que ecuaciones. Para hacer el sistema resoluble es necesario
imponer una serie de restricciones. Las más habituales se reflejan en el
llamado caso V de la ley del juicio comparativo , que asume que los juicios
la ley del juicio comparativo es el elevado número de comparaciones que se
requieren.
3 .2. Métodos centrados en los sujetos. Escalas Likert
En la aproximación de Thurstone, lo que se busca es situar los
estímulos, los objetos en la escala. El sujeto hace el papel de generador de
datos para conseguir el escalamiento de los estímulos. Si la persona que
genera los datos lo hiciera sin error, con esa persona sería suficiente para
obtener los valores de escala para los estímulos, pero desgraciadamente eso
no es así debido a dos motivos fundamentales: uno, hay variabilidad entre las
personas (personas distintas generan datos distintos ante el mismo estímulo) y
dos, hay variabilidad en la propia persona cuando se le presenta el mismo
estímulo varias veces. Thurstone utiliza muchos individuos porque le interesan
los individuos en sí mismos, sus patrones de respuesta, o sus diferencias.
Likert, desde otro extremo, ideó un método en el que lo importante son
los individuos en lugar de los estímulos (1932, 1937). Con su método se
escalan sujetos, los estímulos no son importantes en sí mismos, se usan con la
finalidad de generar datos en los individuos que permitan su escalamiento.
La técnica Likert se basa en los siguientes postulados:
a) es posible estudiar dimensiones de actitud a partir de un conjunto de
enunciados que operen como reactivos para los sujetos.
b) Los individuos pueden situarse en la variable de actitud desde el punto más
favorable hasta el más desfavorable. La variación de las respuestas será
debida a diferencias individuales.
c) La valoración de los sujetos en la variable de actitud no supone una
distribución uniforme sobre el continuo de actitud, sino su posición favorable
o desfavorable sobre el objeto estudiado.
Likert trató de situar su trabajo dentro del marco general de la Teoría de los
Test; de ahí que no proporcione un modelo explícito de escalamiento. Las
escalas elaboradas por este procedimiento tienen como finalidad la medida de
las diferencias individuales respecto a una determinada actitud.
Siguiendo con la clasificación de Torgerson se trataría de un método de
escalamiento centrado en los sujetos, en el que:
respecto a la actitud.
Desde el punto de vista de la medición, la técnica Likert asume un nivel de
medida ordinal. Los individuos se ordenan en la escala en función de su
posición favorable/desfavorable respecto a la actitud medida.
Se trata de escalas sumativas, ya que la puntuación obtenida por los
sujetos es función de las puntuaciones obtenidas en cado uno de los elementos
que la componen.
Asignación de puntuaciones
Para asignar puntuaciones es necesario tener en cuenta su posición
negativa o positiva respecto a la actitud que se quiere medir y una vez
evaluado este aspecto, asignar una puntuación a cada una de las opciones o
categorías de respuesta.
Lo vemos con un ejemplo: Para el siguiente ítem: Se debería dar trabajo
a los extranjeros,
Si estamos midiendo la actitud favorable/desfavorable hacia la
integración de los extranjeros en España, este ítem estaría midiendo una
actitud favorable. Si utilizamos 5 categorías, la asignación de puntuaciones
podría ser:
Hay que prestar atención al hecho de que algunos ítems pueden estar
invertidos: miden al revés que los demás.
En el ejemplo anterior vemos que es un ítem donde una puntuación alta
corresponde a una actitud desfavorable.
sujeto con una actitud extrema: sus respuestas deben caer siempre al mismo
lado.
asignadas a cada categoría elegida por los sujetos en todos los ítems.
TD D I A TA
2 1 0 - 1 - 2
entre los estímulos o ítems.
Frente a Thurstone y Likert, donde la unidimensionalidad de la escala ha
de ser puesta a prueba, el método del escalograma, según Guttman, si
muestra un buen ajuste garantiza la unidimensionalidad. En concreto, según
Guttman, la unidimensionalidad de un continuo queda garantizada si la
puntuación total obtenida a partir de un conjunto de elementos, permite
predecir las respuestas de los sujetos a cada uno de esos elementos. También
frente a Thurstone y Likert, que eran probabilísticos, el escalograma de
Guttman es un método determinista. Si la posición de un sujeto en el continuo
es superior a la posición del ítem, el sujeto acertará (si se trata de una escala
de aptitudes) o aceptará (si, como es más frecuente, se trata de una escala de
actitudes) el ítem; es decir, la probabilidad de acertar el ítem será igual a 1. Si
la posición del sujeto es inferior a la posición del ítem, lo fallará (o no lo
aceptará); es decir, la probabilidad de acertar el ítem será igual a 0.
En el caso de la escala Guttman perfecta, acertar o aceptar un ítem
implica haber acertado (o aceptado) los ítems más fáciles. Además, una vez se
falla un ítem, los siguientes, más difíciles, serán fallados también. De ahí esa
concepción acumulativa. Así, una vez se han ordenado los ítems de acuerdo
con su dificultad (o aceptación), a partir del porcentaje de individuos que
aciertan (o aceptan) el ítem, se podrá conocer el patrón de respuestas de
cualquier sujeto a partir de su puntuación total en la escala. Las cuestiones de
aritmética ofrecen buenos ejemplos de este tipo de escalas.
Supongamos que a un grupo de niños de 2º de Primaria se les presenta las
siguientes sumas:
Es probable que si un sujeto A responde correctamente al ítem 5, responda
también correctamente a los ítems 1, 2, 3, y 4. Si el sujeto B puede responder
correctamente el ítem 2 y no el ítem 3, es probable que pueda responder
correctamente el ítem 1, pero será incapaz de responder correctamente los
ítems 4 y 5. Puntuando con un 1 cada acierto y con un 0 las respuestas
incorrectas, puede obtenerse un patrón o perfil de las respuestas de un
individuo. Si las cuestiones aritméticas forman una escala perfecta , la suma de
las respuestas correctas a los cinco ítems puede utilizarse para revelar la
escala tipo - el patrón de respuestas a los ítems- de una persona en términos de
una sucesión de unos y ceros. En nuestro ejemplo:
ítems
1 2 3 4 5 suma
La escala tipo del sujeto A es: 1 1 1 1 1 5
La escala tipo del sujeto B es: 1 1 0 0 0 2
La escala tipo del sujeto C es: 0 0 0 0 0 0
Si las cuestiones aritméticas forman una escala perfecta conociendo sólo el
número total de aciertos de cada sujeto podríamos pronosticar las respuestas
que ha dado a cada ítem. Supongamos que ése sea el caso, y que el sujeto D
ha obtenido una puntuación de 3 aciertos; pronosticaríamos que sus
respuestas han sido las siguientes:
ítems
1 2 3 4 5 suma
respuestas del sujeto D: 1 1 1 0 0 3
Sería posible así ordenar los estímulos y los sujetos en un mismo continuo,
formando una escala de entrelazamiento. En nuestro ejemplo, el sujeto C que
no acierta o acepta ningún ítem, ni siquiera el primero, que es el más sencillo,
estaría situado a la izquierda del continuo. El que acierta los 5 ítems (como el
sujeto A) iría al extremo derecho del continuo. El sujeto D superaría el nivel
requerido para acertar o aceptar los ítems 1, 2 y 3, pero no el 4 ni el 5, por lo
que se situaría entre los ítems 3 y 4, y así sucesivamente
Así pues, el propósito de Guttman cuando diseñó este método de
escalamiento fue lograr escalas perfectas, de manera que conociendo
únicamente un número - el de aciertos- pudiera reproducirse la serie de
respuestas dadas ante los ítems. Y ¿cómo se reconoce que una serie de ítems
o cuestiones forman una escala perfecta? Visualmente se reconoce cuando los
patrones de respuesta de los sujetos coinciden con las escalas tipo posibles. Si
la escala está compuesta por cinco ítems que se puntúan como correcto (1) o
incorrecto (0), hay seis escalas tipo posibles:
escalas tipo puntuación
Un aspecto importante es que è j
y b
i
se refieren al mismo continuo psicológico:
el rasgo que interesa medir; luego, son cantidades expresadas en la misma
escala de medida, y por lo tanto son comparables. Así pues, la CCI de un ítem
en el modelo de Guttman indica que:
i
= 0 si è
j
< b
i
i
= 1 si è
j
≥ b
i
El método de conteo del error de Goodenough.
Vamos a seguir el método que proponen Goodenough (1944) y
Edwards (1948) para evaluar si un conjunto de estímulos o ítems constituyen
una escala perfecta o escala Guttman.
Hay que tener en cuenta que los estímulos o ítems que se escojan para
formar la escala deben ser capaces de discriminar entre los sujetos con
actitudes o percepciones distintas sobre los estímulos a lo largo de una única
dimensión que se pretende medir. Supongamos que las seis afirmaciones que
se muestran abajo se han presentado a doce sujetos, que han respondido a las
mismas utilizando la siguiente escala de respuesta: 1. De acuerdo. 0.
Desacuerdo. Nos formulamos la siguiente pregunta: ¿constituyen las seis
afirmaciones una escala perfecta o escala Guttman a lo largo de la dimensión
actitudes hacia la escuela? Recuérdese que si la respuesta fuera afirmativa,
conociendo tan sólo el número de respuestas "de acuerdo" podríamos
reproducir las respuestas de cada individuo a cada uno de los ítems o
afirmaciones.
Afirmaciones:
a. La escuela está bien.
b. Voy a la escuela con regularidad.
c. Pienso que la escuela es importante.
d. Es bueno estar en la escuela.
e. Pienso que la escuela es divertida.
f. Pienso que la escuela es mejor que un circo.
Las respuestas de cada individuo a cada ítem pueden organizarse en una
matriz como la que se presenta en la tabla 1.
Tabla 1. Matriz de respuestas.
sujetos a b c d e f puntuación
Es conveniente reordenar la tabla de manera que su configuración se aproxime
a la que mostraría una escala perfecta. Para ello, y tal como ocurre cuando la
escala es perfecta, la primera columna debe corresponder al ítem que evoca
mayor cantidad de unos, siguiendo la ordenación de manera decreciente.
Asimismo, el primer sujeto debe ser el que más unos ha "respondido",
siguiendo también la ordenación de manera decreciente hasta el sujeto que
menos unos responde. Tras realizar estas reordenaciones obtendríamos la
matriz que aparece en la tabla 2. Aquí los ítems están ordenados en función de
su nivel de dificultad, esto es, en función del nivel de rasgo que exigen al sujeto
para que éste dé una respuesta de acuerdo. Éste es el escalamiento de
estímulos que produce el método de Guttman: una escala ordinal de ítems.
Tabla 2. Matriz reordenada de respuestas.
sujetos b c e d a f puntuación
Tabla 3. Matriz reordenada de respuestas con indicaciones de los errores.
sujetos b c e d a f puntuación errores
errores 3 6 3 3 3 2
i
El coeficiente de Reproductividad.
¿Cómo puede obtenerse un estimador de cuánto se aproxima la matriz
de las tabla 2 y 3 a una escala perfecta? Guttman propone un estimador a
partir de la proporción de errores obtenida. El número total de posibles errores
es igual al producto entre el número de sujetos (N) y el de ítems (k); en nuestro
caso: (12) (6)= 72. Si no existiera ninguna coincidencia entre los patrones de
respuesta de los individuos y las escalas tipo perfectas, la matriz estaría llena
de errores. Como las dimensiones de la matriz son 12 por 6, contendría un total
de 72 errores.
Para calcular el estimador señalado en el párrafo anterior hay que
realizar las siguientes operaciones: 1º) hallar el cociente entre los errores
hallados y las respuestas posibles (20/72=0.277); 2º) restar de uno la cantidad
resultante: 1-0.27=0.723. El resultado es un coeficiente que indica la capacidad
de la escala para reproducir las respuestas de los sujetos a partir de sus
puntuaciones totales. Ese coeficiente recibe el nombre de coeficiente de
reproductibilidad (CR):
Guttman señaló que una escala con un coeficiente de reproductibilidad inferior
a 0.90 no puede ser considerada una aproximación efectiva a una escala
perfecta.
Tras los resultados obtenidos parece claro que los ítems no forman una
buena aproximación a una escala perfecta. Para detectar cuáles son los ítems
que peor funcionan, se puede calcular el coeficiente de reproductibilidad de
cada ítem (CR i
En la tabla 3, puede observarse que el ítem c (pienso que la escuela es
importante) es el que presenta un CR i
más bajo contiene (0.5); contiene 6
errores de un total de 12 posibles. Por ello parece razonable eliminarlo o
reformularlo. Supongamos que se elimina el ítem c. Tras realizar esta
operación, hay que volver a reordenar a los sujetos pues la puntuación de
algunos de ellos habrá variado. Una vez concluidas este conjunto de
operaciones obtendríamos la siguiente matriz de respuestas:
Tabla 4. Matriz de respuestas tras eliminar el ítem c y reordenar los sujetos.
sujetos b e d a f puntuación errores
Asimismo, hay que volver a calcular los errores que contienen los
patrones de respuestas de cada individuo. Ahora tan sólo se encuentran 12
errores (nótese que 4 de ellos están contenidos en el patrón de respuestas del
sujeto 3. Habría que asegurarse de que este sujeto ha seguido las
instrucciones, no ha cometido errores a la hora de codificar sus respuestas,
"de acuerdo"; q: proporción de "desacuerdo") obtenidas para cada ítem, y su
coeficiente de reproductibilidad.
Tabla 5. Proporciones de respuesta y coeficientes de resproductibilidad de los ítems.
sujetos b e d a f puntuación errores
p .75 .50 .42 .33.
q .25 .50 .58 .67.
errores 2 4 2 3 1
i
Como se aprecia en la tabla anterior, todos los ítems superan este
criterio.
Como se señaló anteriormente, el coeficiente de reproductibilidad puede
verse inflado por la existencia de ítems con proporciones de respuesta
extremas. Para valorar este aspecto es útil calcular la Reproductibilidad
Marginal Mínima (RMM), que es la media aritmética de las categorías modales
de todos los ítems de la escala. En nuestro caso, sería:
Un valor elevado de la RMM puede indicar que el coeficiente de
reproductibilidad ha sido inflado artificialmente, siendo un resultado de la
existencia de categorías modales extremas. Para facilitar la interpretación de la
RMM, Menzel (1953) propuso el coeficiente de escalabilidad (CE):
𝐶𝑆 =
𝐶𝑅 − 𝑅𝑀𝑀
1 − 𝑅𝑀𝑀
=
𝑃𝑀
1 − 𝑅𝑀𝑀
donde PM es el porcentaje de mejora que ofrece el CR sobre la RMM. Para
que una escala sea considerada una buena aproximación a una escala
perfecta su coeficiente de escalabilidad debe ser igual o superior a 0.60.
En nuestro caso:
𝐶𝑆 =
0 , 13
1 − 0 , 67
= 0 , 39
Más recientemente, Cliff (1983) propone otros índices basados en el
coeficiente Tau de Kendall o coeficiente de correlación de Pearson. Algunos de
los índices son aplicables a los distintos ítems y sujetos de manera individual,
lo que resulta útil a la hora de determinar si hay algún grupo de sujetos, o
algunos ítems concretos que no sean escalables.
Valoración.
Uno de los aspectos destacables del modelo de Guttman es que pone
de manifiesto que tanto ítems como sujetos son escalables, mensurables. Los
ítems ya no se consideran réplicas unos de otros, como ocurría en el modelo
de Likert. Los ítems difieren en su grado de dificultad, esto es, en el nivel de
rasgo que exigen al sujeto para que éste acierte o respalde el ítem. Esta
característica del método de Guttman fue desarrollada más tarde por otros
métodos que permiten escalar con precisión los ítems y ubicarlos a lo largo del
continuo psicológico que se pretende medir.
Uno de los problemas del modelo de Guttman, que dificulta además la
construcción de escalas perfectas, es su carácter determinista. Según este
modelo, cuando un sujeto tiene un nivel de rasgo o aptitud igual o superior al
exigido por el ítem – esto es, domina el ítem-, no cabe otra respuesta que
acertar o respaldar el ítem (según se trate de: 1. un ítem de aptitud o 2. un ítem
de actitud o personalidad, respectivamente). Sin embargo, la experiencia
demuestra que esto no siempre es así. Por ejemplo, en algunas ocasiones,
cuando los estudiantes se enfrentan a problemas sencillos en un examen, su
incredulidad ante la facilidad del ítem, les lleva a reformularlo de manera
compleja, y lo complican tanto que al final no lo resuelven correctamente.
También ocurre que a veces, por mero azar, sujetos con un nivel de aptitud
inferior al exigido por el ítem, lo aciertan. Según el modelo determinista de