Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


PSICOMETRÍA, Apuntes de Psicometría

Asignatura: Psicometria, Profesor: , Carrera: Psicologia, Universidad: UV

Tipo: Apuntes

2012/2013
En oferta
30 Puntos
Discount

Oferta a tiempo limitado


Subido el 08/12/2013

raul_cuesta
raul_cuesta 🇪🇸

4.1

(63)

25 documentos

1 / 250

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
La psicometría se encuentra dentro de un área de conocimiento denominada Metodología de las
Ciencias del Comportamiento. Partiendo de que el concepto de medición, es algo intrínseco a la
psicometría y, aceptando la necesidad y posibilidad de llevar a cabo mediciones en el marco de la
Psicología, como ciencia positiva que es, en este tema, vamos a hacer un análisis de los dos caminos, a
través de los cuales se fue desarrollando la Psicometría:
Los estudios de Psicofísica estos estudios, dieron lugar a los Métodos de Escalamiento de
estímulos.
Los estudios de las Diferencias Individuales estos estudios, dieron lugar al Método de los Tests
para el escalamiento de los sujetos.
En un primer momento, estas dos vías de desarrollo siguieron caminos muy diferenciados, pero hoy
día, esta separación está superada, y suele mantenerse únicamente por motivos didácticos. *(Cuando
se utiliza un método de escalamiento, cuyo objetivo sea el escalamiento de los estímulos y los sujetos a
la vez, hablaremos de escalamiento de respuestas)
El concepto de Psicometría está formado por las palabras griegas Psykhe y Metrum que significa
literalmente Medida de la Psykhe.
La Psicometría es una disciplina metodológica, dentro del área de la Psicología, cuya tarea fundamental
es la medición o cuantificación de las variables psicológicas con todas las implicaciones que ello conlleva,
tanto teóricas (posibilidades y criterios de medición) como prácticas (cómo y con qué se mide).
La Psicometría deberá ocuparse de:
En primer lugar de la justificación y legitimación de la medición psicológica, para ello deberá: a)
desarrollar modelos formales, que permitan representar los fenómenos que se quieren estudiar y
posibiliten la transformación de los hechos en datos. b) validar los modelos desarrollados, para
determinar en qué medida representan la realidad que pretenden y c) establecer las condiciones
que permitan llevar a cabo el proceso de medición.
En segundo lugar, de las implicaciones prácticas y aplicadas que dicha medición conlleva:
proporcionando los métodos necesarios que indiquen, en cada caso concreto, cómo se debe llevar
a cabo la cuantificación, y construyendo los instrumentos necesarios y adecuados para poder
efectuarla. Esta vertiente aplicada de la psicometría, referida a la construcción y evaluación de los
instrumentos de medición, no ha de confundirse con el uso de los instrumentos una vez
construidos. Un instrumento puede estar bien construido y, sin embargo, ser utilizado de manera
incorrecta.
La importancia de la psicometría, como disciplina a la que incumbe todo aquello relacionado con la
medición de variables psicológicas, se justifica si se tiene en cuenta que en Psicología, como en las demás
ciencias empíricas, el objetivo final es la descripción, explicación y predicción de los fenómenos de interés
(en este caso, fenómenos psicológicos) y dicho objetivo, se podrá cumplir mejor mediante el proceso de
medición. Por eso, aunque la Psicometría no tiene un campo de actuación específico, su campo de
aplicación abarca todos los campos de la Psicología y juega un papel importantísimo ya que contribuye a
fundamentar, elaborar y contrastar todas las teorías psicológicas. Es dentro de este marco, donde se
justifica la medición. Ahora bien, las mediciones llevadas a cabo sin un contexto teórico o aplicación
práctica que le sirva de base, rara vez justifican el tiempo y el dinero que se invierte en ellas. Es necesario
evitar considerar que la medición es la piedra de toque de la respetabilidad científica….muchos psicólogos
se han precipitado a buscar números, antes de saber lo que esos números pueden significar
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64
Discount

En oferta

Vista previa parcial del texto

¡Descarga PSICOMETRÍA y más Apuntes en PDF de Psicometría solo en Docsity!

La psicometría se encuentra dentro de un área de conocimiento denominada Metodología de las Ciencias del Comportamiento. Partiendo de que el concepto de medición, es algo intrínseco a la psicometría y, aceptando la necesidad y posibilidad de llevar a cabo mediciones en el marco de la Psicología, como ciencia positiva que es, en este tema, vamos a hacer un análisis de los dos caminos, a través de los cuales se fue desarrollando la Psicometría:  Los estudios de Psicofísica  estos estudios, dieron lugar a los Métodos de Escalamiento de estímulos.  Los estudios de las Diferencias Individuales  estos estudios, dieron lugar al Método de los Tests para el escalamiento de los sujetos. En un primer momento, estas dos vías de desarrollo siguieron caminos muy diferenciados, pero hoy día, esta separación está superada, y suele mantenerse únicamente por motivos didácticos. *(Cuando se utiliza un método de escalamiento, cuyo objetivo sea el escalamiento de los estímulos y los sujetos a la vez, hablaremos de escalamiento de respuestas )

El concepto de Psicometría está formado por las palabras griegas Psykhe y Metrum que significa literalmente Medida de la Psykhe. La Psicometría es una disciplina metodológica, dentro del área de la Psicología, cuya tarea fundamental es la medición o cuantificación de las variables psicológicas con todas las implicaciones que ello conlleva, tanto teóricas (posibilidades y criterios de medición) como prácticas (cómo y con qué se mide). La Psicometría deberá ocuparse de:  En primer lugar de la justificación y legitimación de la medición psicológica, para ello deberá: a) desarrollar modelos formales, que permitan representar los fenómenos que se quieren estudiar y posibiliten la transformación de los hechos en datos. b) validar los modelos desarrollados, para determinar en qué medida representan la realidad que pretenden y c) establecer las condiciones que permitan llevar a cabo el proceso de medición.  En segundo lugar, de las implicaciones prácticas y aplicadas que dicha medición conlleva: proporcionando los métodos necesarios que indiquen, en cada caso concreto, cómo se debe llevar a cabo la cuantificación, y construyendo los instrumentos necesarios y adecuados para poder efectuarla. Esta vertiente aplicada de la psicometría, referida a la construcción y evaluación de los instrumentos de medición, no ha de confundirse con el uso de los instrumentos una vez construidos. Un instrumento puede estar bien construido y, sin embargo, ser utilizado de manera incorrecta. La importancia de la psicometría, como disciplina a la que incumbe todo aquello relacionado con la medición de variables psicológicas, se justifica si se tiene en cuenta que en Psicología, como en las demás ciencias empíricas, el objetivo final es la descripción , explicación y predicción de los fenómenos de interés (en este caso, fenómenos psicológicos) y dicho objetivo, se podrá cumplir mejor mediante el proceso de medición. Por eso, aunque la Psicometría no tiene un campo de actuación específico , su campo de aplicación abarca todos los campos de la Psicología y juega un papel importantísimo ya que contribuye a fundamentar , elaborar y contrastar todas las teorías psicológicas. Es dentro de este marco, donde se justifica la medición. Ahora bien, las mediciones llevadas a cabo sin un contexto teórico o aplicación práctica que le sirva de base, rara vez justifican el tiempo y el dinero que se invierte en ellas. Es necesario evitar considerar que la medición es la piedra de toque de la respetabilidad científica….muchos psicólogos se han precipitado a buscar números, antes de saber lo que esos números pueden significar

La Psicometría, es una disciplina metodológica dentro del área de la Psicología; por ello, a la hora de adscribir las asignaturas a un área de conocimiento, la psicometría lo fue al área denominada Metodología de las Ciencias del Comportamiento.  Metodología significa tratado de los métodos y, dentro del marco de la ciencia, el término Método , hace referencia al camino que se debe seguir para poder conseguir el objetivo de la ciencia. La metodología , estudia las estrategias y procedimientos que, de una forma más o menos estructurada, se utilizan para la obtención de los conocimientos que constituyen una disciplina científica.  Las Ciencias del Comportamiento son aquellas que estudian la conducta, mediante la utilización del método científico, con el fin de encontrar estructuras generales o leyes. El término Conducta en este contexto, se utiliza en sentido amplio y hace referencia a la actividad de un organismo ante una situación concreta, que estará determinada biológica y socialmente.

Teniendo en cuenta que el método científico , es el método común a todas las ciencias, que proporciona un marco general a cualquier proceso de investigación científica, pero que puede adaptarse a las peculiaridades de cada una de ellas, en función de sus problemas específicos y de su objeto de estudio: La Metodología de las Ciencias del Comportamiento , estará referida al estudio del método general de la ciencia y de las estrategias o métodos específicos que deberán desarrollar cada una de ellas, en función de sus peculiaridades, para poder llevar a cabo su tarea. La psicología, como ciencia del comportamiento, tiene su propio objeto de estudio y sus propios problemas, por ello, deberá adaptar el método general de la ciencia, el método científico, al marco concreto de cada uno de sus problemas, desarrollando las estrategias y técnicas complementarias que le permitan abordar su estudio y tratar de darles solución. A dichas técnicas, algunos autores las denominan Técnicas metódicas Dentro del marco de la Metodología de las Ciencias del Comportamiento, y más concretamente de la Metodología de la Psicología como ciencia del comportamiento que es, encontramos gran cantidad de contenidos relacionados entre sí por su carácter procedimental, que se pueden agrupar en tres grandes bloques, cuyos orígenes van unidos a los de la Psicología científica que, a pesar de tener una identidad propia, cada uno, tiene una enorme influencia sobre los demás, y juntos interactúan en el proceso global e integrado que es la investigación científica.

  • ••• Diseños de Investigación : este bloque atiende fundamentalmente, a aquella faceta de la investigación científica, cuya tarea fundamental es la operativización de las variables de la hipótesis y la elaboración de un plan de trabajo , o procedimiento para la recogida de datos, que sea coherente con la hipótesis. Este concepto, está esencialmente vinculado a la elección y especificación del procedimiento para la obtención de los datos relevantes para la hipótesis. Para llevar a cabo esta tarea, es necesario analizar: la naturaleza de las variables, sus posibilidades de manipulación, la elección de aquellas que sean de interés para la investigación objeto de estudio, la detección de variables extrañas y formas de control, criterios de selección y asignación de unidades de observación, estructuración interna del procedimiento con delimitación de situaciones, tareas, etc. En la medida en que se resuelvan todos estos aspectos, se reducirá la incertidumbre que conlleva la elección de un diseño de investigación.
  • ••• El Análisis de datos , este bloque, será el encargado de proporcionar las técnicas necesarias para llevar a cabo el tratamiento estadístico de los mismos, tratamiento que puede ir, desde la

Otro problema al tratar de medir variables psicológicas, es el referido a las unidades de medida. ¿Qué unidades de medida podemos utilizar para dar un significado a los resultados obtenidos?; En psicología hay dos formas fundamentales de afrontar el problema de las unidades de medida:  Referida a normas : es la forma más habitual de proceder. Que consiste en comparar los resultados obtenidos por un sujeto, con los obtenidos por un grupo de sujetos, que forman el grupo normativo y que pertenecen a su misma población (misma edad, misma clase…)  Referida al criterio : en otras ocasiones, la interpretación se hace en base a un criterio previamente establecido. Los resultados obtenidos, se comparan con dicho criterio (un punto crítico) y la superación o no del mismo, es lo que va a dar significado a las puntuaciones obtenidas. Sea cual sea el campo de la medición psicológica tiene una serie de objetivos comunes:

  • Estimar los errores aleatorios que conlleva toda medición ( fiabilidad de las medidas )
  • Garantizar, que la misma, no es algo inútil sino que sirve para explicar y predecir los fenómenos de interés ( validez de las medidas )

Hablar de orígenes y vías de desarrollo de la psicometría, es lo mismo que hablar de los orígenes y vías de desarrollo de la medición psicológica. Partiendo de que la medición en psicología es necesaria y posible, y teniendo en cuenta que la psicometría incluye todo lo relativo a la medición, vamos a analizar los hechos fundamentales que contribuyeron a su desarrollo y convirtieron a la psicología en una ciencia positiva, independiente de la filosofía. Siguiendo a Yela , dos motivos fundamentales, posibilitaron la introducción de la medición en Psicología.  La tendencia a formular los problemas científicos en términos matemáticos  El enfrentamiento de la Psicología, hacia la mitad del siglo XIX, con dos problemas fundamentales : a) El problema psicofísico : el estudio cuantitativo, de las relaciones entre las características físicas de los estímulos y las sensaciones que suscitan en los sujetos, en función de las cuales, se asignan valores numéricos a los estímulos. b) El problema de la cuantificación de las diferencias individuales : mediante la asignación de números a los sujetos, en función del grado en que manifiesten un atributo o conducta.

Así, se puede situar el origen de la psicometría hacia la mitad del S.XIX, y a partir de ese momento, se va a desarrollar fundamentalmente a través de 2 vías:  Los estudios de Psicofísica : que dieron lugar al desarrollo de modelos que permitieron asignar valores numéricos a los estímulos y, que por tanto, permitieron el escalamiento de estímulos.  Los estudios acerca de las diferencias individuales que dieron lugar al desarrollo de los Tests y de las distintas Teorías de los Tests (modelos), que posibilitaron la asignación de valores numéricos a los sujetos y, por lo tanto, el escalamiento de los sujetos. Estos dos puntos de arranque de la psicometría (estudios de psicofísica y la cuantificación de las diferencias individuales), dieron lugar a las 2 corrientes que mayor incidencia han tenido en la investigación psicológica: la experimentalista y la correlación. En la psicometría Clásica, se reservaba el término Escalamiento , para designar el proceso de construcción de escalas para la cuantificación de los estímulos; mientras que todo lo relativo a la cuantificación de los sujetos, que se estudiaba en la Teoría de los Tests , no se consideraba parte de dicho proceso. En la actualidad, la distinción entre Escalamiento y Teorías de los Tests, aunque se

mantiene por cuestiones didácticas, está superada, gracias al desarrollo de nuevas teorías de la medición y de numerosas técnicas estadísticas, comunes a ambas vertientes de la psicometría.

Escalamiento : Campo de la Psicometría cuyo objetivo fundamental es, la construcción de escalas de medida , es decir, la construcción de instrumentos que permitan llevar a cabo mediciones para representar las propiedades de los objetos ( estímulos , sujetos o respuestas ) por medio de números, de acuerdo a unas normas o reglas. Dentro del marco de la Psicometría, hay dos supuestos básicos en todos los métodos de escalamiento:  La existencia de un continuo , (una recta en términos geométricos) latente o subyacente, a lo largo del cual varían los objetos psicológicos que se van a escalar (estímulos, sujetos o respuestas), que no puede ser observado de forma directa.  Que los objetos psicológicos (estímulos, sujetos o respuestas) pueden situarse de forma ordenada a lo largo de ese continuo.

¿Qué diferencias nos vamos a encontrar en función de que los objetos psicológicos a escalar sean estímulos, sujetos o respuestas?  Los estímulos son las cosas que los investigadores presentan normalmente a un sujeto, con el propósito de elicitar una respuesta. Partiendo de dicha definición, el término es muy amplio, ya que pueden considerarse como tales, no sólo un conjunto de objetos físicos, sino una lista de adjetivos que hagan referencia al algún rasgo de personalidad, una serie de frases que se refieran a alguna variable de actitud, un grupo de personas a las que se vaya a calificar, una serie de problemas de psicometría…en cualquier caso, el propósito del escalamiento de estímulos es determinar las características que los sujetos perciben en ellos y, por lo tanto, la respuesta del sujeto (o sujetos) ante la presentación de los estímulos es una respuesta subjetiva que nos va a permitir diferenciarlos y escalarlos , es decir, asignar un valor numérico a cada uno de los estímulos. Cuando se utilizan varios sujetos para el escalamiento de estímulos, el valor que se asigna a cada uno de ellos, suele venir determinado por algún índice de tendencia central (media o mediana), obtenido a partir de los valores asignados por cada uno de los sujetos a cada estímulo. En este caso, serían los estímulos los que se situarían a lo largo del continuo, en función de sus valores escalares y los sujetos que han emitido juicios a cerca de esos estímulos, los que habrían actuado como instrumentos de medida.  Cuando el objeto a escalar son los sujetos: se utiliza una muestra, generalmente extraída de forma aleatoria de una población, y todos los sujetos que la componen, responden al mismo conjunto de estímulos (los elementos de un test, por ejemplo; posteriormente, los estímulos, serán combinados de alguna manera , para proporcionar una puntuación numérica para cada sujeto de la muestra. Las diferencias encontradas en las puntuaciones obtenidas , reflejarán las diferencias entre los sujetos, respecto al atributo o característica que se está midiendo. Se asume, que los estímulos presentados, son interpretados de la misma forma por todos los sujetos de la muestra, y por tanto, las variaciones encontradas, son debidas a las diferencias entre los sujetos. Serán los sujetos los que se situarán a lo largo del continuo, que representa la característica que se está midiendo, y los estímulos, los que habrán actuado como instrumentos de medida.  Hay veces, que lo que interesa situar sobre el continuo, a lo largo del cual varía el atributo que se está midiendo, tanto a los estímulos como a los sujetos: en este caso, las variaciones encontradas en las respuestas de los sujetos , ante la presentación de los estímulos, se atribuyen no sólo a las diferencias que hay entre los estímulos respecto al grado de atributo

Según Fechner, la función que mejor representa la relación entre los dos continuos es una función logarítmica cuya fórmula es:

Siendo:

S = valor en la escala de sensación

E = valor del estímulo

C y A = la pendiente y la ordenada en el origen, de la función logarítmica.

Para poder medir la relación entre los estímulos y las sensaciones Fechner introdujo los conceptos de:  Umbral Absoluto : que sería la magnitud física del estímulo que se requiere para que se produzca una sensación y  Umbral Diferencial sería el incremento mínimo, en la magnitud física del estímulo, que se requiere para que el sujeto perciba un cambio de sensación.

La ley de Fechner establece que cuando la magnitud física del estímulo está en el umbral absoluto la sensación es nula , y que, si se aumenta la estimulación en proporción geométrica, las sensaciones aumentarán aritméticamente. Es decir, que cada vez se necesitará un mayor incremento en la estimulación física para que se perciba un cambio en la sensación. Supongamos que se quiere medir la capacidad auditiva de una persona , para ello, se le presentan una serie de estímulos de distinta intensidad, comenzando por uno, cuya intensidad de sonido esté por debajo de su capacidad auditiva. Poco a poco, se va aumentando la intensidad del sonido, hasta que la persona empiece a detectar el estímulo. En ese momento, cuando la persona ha detectado el estímulo, ha habido un cambio, la persona ha pasado de no tener ninguna sensación a percibir el sonido. El valor del estímulo que ha provocado ese cambio , corresponde al umbral absoluto de la persona y marca el origen de la escala de sensación (punto cero). Si, a partir del valor correspondiente al umbral absoluto, se va aumentando muy lentamente la magnitud del estímulo (en nuestro caso, intensidad del sonido), llega un momento en que la persona detecta que ha habido un cambio y se produce en ella, un cambio se sensación ; en ese momento, se ha encontrado su primer umbral diferencial , esto es, el incremento mínimo que ha de experimentar la intensidad del estímulo, para que la persona perciba un cambio de sensación. Si, al cambio mínimo de la intensidad del estímulo se le denomina umbral diferencial, al cambio de sensación , se le denomina diferencia apenas perceptible (dap), por lo que se dirá que se ha producido una dap, a partir del umbral absoluto. Siguiendo el mismo razonamiento, se irían calculando los diferentes umbrales diferenciales, que permitirían obtener 2 series de valores : una, correspondiente a los distintos valores del estímulo ( escala física ) y la otra serie, la escala de sensación ( escala psicológica ), cuyos valores, se obtendrán, a base de ir sumando las dap que se han ido produciendo a partir del origen. Una vez obtenidas las dos series de valores, sería necesario comprobar la relación que existe entre ellas , y si esta relación, es logarítmica como postula Fechner.

Ahora bien, el problema fundamental está en la obtención experimental de los umbrales absoluto y diferencial , que permitirán medir la capacidad de detección y discriminación de los sujetos. Para ello, Fechner desarrolló una serie de procedimientos, entre los que destacaremos:

S = C ln E + A

 El método de los límites también llamado de los cambios mínimos : es el experimentador el que va modificando la intensidad del estímulo. Cuando se quiere calcular el umbral absoluto comenzará, o bien por un estímulo de baja intensidad e irá aumentándola hasta que el sujeto que lo va a evaluar comience a detectarlo, o bien por uno de alta intensidad e irá reduciéndola poco a poco hasta que el sujeto deje de percibirlo. En el caso de querer calcular los umbrales diferenciales el experimentador seleccionará un valor del estímulo como estándar y, junto a él, irá presentando al sujeto un estímulo de comparación cuya intensidad irá manipulando hasta que el sujeto considere que la intensidad del estímulo de comparación es igual que la del estímulo estándar.  El método de ajuste también llamado error promedio : En lugar de ser el investigador el que manipula la intensidad de los estímulos, es el propio sujeto el que va modificando, aumentándola o disminuyéndola, hasta encontrar el valor de sus umbrales.  El método de los estímulos constantes : este método, es el más utilizado para el cálculo de los umbrales absoluto y diferencial. se asume que, cuando un estímulo se presenta a un mismo sujeto en repetidas ocasiones, no siempre es percibido, y que, aun cuando lo perciba, no siempre le produce la misma sensación. Partiendo de este supuesto, cada estímulo se presenta a los sujetos un número elevado de veces en orden aleatorio y, en cada ocasión, cada sujeto ha de decidir si lo ha percibido o no. El umbral absoluto es la magnitud del estímulo que ha sido percibido por los sujetos el 50% de las veces que se ha presentado. Para el cálculo del umbral diferencial , al igual que en los métodos anteriores, se fija un valor del estímulo como estándar y, a continuación, se van presentando una serie de estímulos de comparación, cuyo valor estará situado simétricamente, en torno al del estándar. Se repiten varias veces los ensayos y, en cada uno de ellos, el sujeto deberá decidir, si el estímulo de comparación es mayor o menor que el estándar.

A pesar de su indudable importancia, la ley de Fechner pronto recibió varias críticas, debido fundamentalmente, a que los estímulos de muy alta intensidad o muy baja intensidad no se ajustan bien a ella y que tampoco lo hacen todos los sistemas sensoriales. No obstante, introdujo una nueva forma de medición en Psicología, de ahí que se considere que con Fechner, comience la etapa de la Psi. Cuantitativa , que se ha aplicado a toda clase de problemas psicológicos. Sus trabajos, junto con los que Wundt , llevó a cabo en su laboratorio de Psicología, fundado 19 años después, marcaron el comienzo de la Psicología Experimental. Las controversias que surgen a partir de la Psicofísica desarrollada por Fechner, influyeron en otra de las figuras más relevantes en el campo de la Psicofísica: Stevens : quien hace una reformulación de la psicofísica fechneriana, desarrollando los métodos de escalamiento que esta nueva reformulación requería, y una nueva función, conocida con el nombre de Función Potencial de Stevens :

R = q · En

Siendo:

R = respuesta de los sujetos.

E = valor del estímulo.

q = constante que depende de las unidades de medida.

n = exponente de la función, que depende del atributo sensorial.

Los trabajos de Stevens, contribuyeron al resurgimiento de la investigación en el campo de la Psicofísica, pues ponían a prueba y comparaban los dos tipos de funciones, la logarítmica y la potencial.

diferente, de manera que guarden entre sí la misma proporción que guardaban los primeros. o Estimación de razones : Se le presentan al sujeto todos los pares de estímulos, y su tarea consiste, en hacer estimaciones de las razones que hay entre las magnitudes de cada par, y asignar un número a cada par, que represente esa razón. Se trata de asignar razones numéricas a las razones entre las magnitudes de los estímulos. Si mantenemos el ejemplo de la longitud entre las dos rectas, y en uno de los pares que se le presenta al sujeto, la primera línea le parece que es la mitad de larga que la segunda, deberá asignar a este par, el valor numérico de ½, ya que, esta razón numérica es la que, a juicio del sujeto, representa la razón entre la longitud de las líneas que forman el par presentado. o Producción de razones : Se presenta al sujeto un estímulo estándar, y junto a él, una proporción numérica. La tarea del sujeto, consiste en producir otro estímulo que guarde con el estándar una proporción igual a la presentada. Por ejemplo, si a un sujeto se le presenta una línea recta, de una longitud determinada, y se le pide que produzca un estímulo cuya longitud, sea la mitad que la de la anterior, o bien el doble, etc.

 Métodos de emparejamiento de intervalos por : o Modalidad cruzada : Dados una serie de estímulos, que varían a lo largo de dos continuos divididos en intervalos, el sujeto habrá de emparejar los intervalos existentes entre los estímulos de un continuo, con los intervalos existentes entre los estímulos del otro continuo. o Estimación de intervalos : Se le presentan al sujeto una serie de estímulos diferentes entre sí y se le pide que, mediante números, haga una estimación de las diferencias estimulares. o Producción de intervalos : Se le presentan al sujeto dos estímulos y su tarea consiste, en encontrar un estímulo intermedio entre los dos presentados ( bisección ), una serie de estímulos, que dividan el intervalo entre los dos estímulos presentados, en más de dos intervalos iguales ( equisección ) o en una serie de intervalos distintos ( multisección ).

 Método de escalas de categorías o clasificación : es uno de los más utilizados en Psicología y Sociología. Consiste en asumir que, el continuo a lo largo del que se han de situar los estímulos está dividido en una serie de categorías ordenadas, cuyos límites serán fijos, salvo por error aleatorio. La tarea a realizar será, estimar los valores escalares de los límites de las categorías para, una vez hecho esto, asignar los estímulos a cada una de ellas y averiguar sus valores escalares.

A diferencia de los métodos de Fechner, que permitían medir la capacidad de detección y discriminación de las personas, los métodos desarrollados por Stevens están centrados en medir la capacidad de los sujetos para hacer estimaciones subjetiva s de la magnitud de los estímulos y comprobar hasta qué punto los juicios emitidos (estimaciones subjetivas) se ajustan a los datos reales (magnitud real de los estímulos). De este modo, se puede formalizar algo que estamos haciendo constantemente en nuestra vida diaria y que, sin embargo no siempre somos consciente de ello ( mi casa, mide unos 300 metros cuadrados….sucedió, hace aproximadamente 2 horas….) , lo que se pretende es comprobar hasta qué punto, esas respuesta emitidas por los sujetos se ajustan a la realidad de los datos.

7.2.Métodos de Escalamiento Psicológico

Los métodos de escalamiento, se desarrollaron en principio para su utilización en el campo de la percepción, utilizando características de los estímulos que variaban a lo largo de alguna dimensión física y que, por tanto, podían ser medidas con los instrumentos adecuados; se trata de establecer una relación

entre las características físicas de los estímulos y las sensaciones que producían. Ahora bien, ¿qué ocurriría si la característica que se quiere escalar (medir), no variase a lo largo de ningún continuo físico? , si por ejemplo, se quiere medir el grado de realismo de una serie de cuadros, las preferencias políticas de una muestra de sujetos, la agresividad , la actitud de los españoles ante la inmigración…difícilmente se podría llevar a cabo el proceso de medición utilizando ninguna escala física , puesto que estas características, no varían a lo largo de un continuo físico , sino a lo largo de un continuo psicológico. Al surgir este problema, comienzan a desarrollarse a finales del siglo XIX, y sobre todo, durante el S.XX, una serie de métodos de escalamiento psicológico que, aunque basados en las ideas de Fechner poseen unas características propias , como son, la no necesidad de recurrir a medidas de tipo físico. A las escalas resultantes de estos métodos, se las denomina escalas psicológicas o subjetivas.

La figura que más ha contribuido al desarrollo de este tipo de escalas fue Thurstone. Thurstone trató de elaborar un modelo a partir del cual pudiera elaborar una escala sobre un continuo psicológico y situar en ella los estímulos sin necesidad de recurrir a ninguna operación en un continuo físico. El modelo que desarrolló está basado en la variabilidad perceptual de los sujetos , e incluso de un mismo sujeto cuando se le presentan los mismos estímulos en distintas ocasiones y en la limitación que tienen los sujetos para percibir las diferencias de magnitud entre dos estímulos cuando estas son muy pequeñas. En la medida en que la diferencia entre la magnitud de dos estímulos sea mayor, será más fácil que los sujetos puedan diferenciarlos y ordenarlos, respecto a la característica o atributo que se está evaluando mientras que, en la medida que los estímulos sean más parecidos, los sujetos encontrarán mayores dificultades para realizar su tarea. Thurstone publicó varios trabajos que trataban sobre diversos problemas acerca de la medición subjetiva o psicológica y desarrolló un modelo matemático , relacionado con la Psicofísica Clásica de Fechner, cuyas ecuaciones se conocen con el nombre de Ley de Juicio Comparativo. Más tarde, desarrollaría otro modelo cuyas ecuaciones se conocen como Ley de Juicio Categórico (, método de los intervalos aparentemente iguales y el método de ordenación de rangos). Estos dos modelo, llevan asociados una serie de métodos experimentales para la obtención empírica de los datos:  La Ley del Juicio Comparativo : utiliza el Método de las Comparaciones Binarias  La Ley del Juicio Categórico : utiliza el Método de los Intervalos Sucesivo; Método de los Intervalos Aparentemente Iguales y Método de Ordenación de Rangos.

A partir de estos trabajos se fueron desarrollando nuevas formas de escalamiento psicológico :  Guttman, en los años 40 del siglo XX , desarrolló un nuevo modelo para el escalamiento conjunto de sujetos y estímulos ( escalamiento de respuestas ). Para la obtención de la escala, utiliza un método conocido como método del escalograma. La escala resultante, se denomina escala de entrelazamiento puesto que los sujetos y los estímulos se sitúan a lo largo del mismo continuo psicológico de forma entrelazada.  Coombs , desarrollo una teoría conocida como Teoría del despliegue y propuso un modelo que, al igual que el anterior autor, permite escalar sujetos y estímulos conjuntamente.

Todos estos modelos y sus métodos asociados, se desarrollaron, en principio, para la construcción de escalas unidimensionales , es decir, escalas que permitieran ordenar un conjunto de estímulos o estímulos y sujetos, respecto a un único atributo o característica , mediante la asignación de un único valor escalar, que represente la posición del objeto escalado.

carácter antropométrico, sensorial y motor. No obstante, a partir de Galton, empieza el gran desarrollo del Método de los Tests

8.2.Los primeros Tests mentales

J.M. Cattell se puso en contacto con Galton dado su común interés por investigar las diferencias individuales. Utilizó por primera vez el término Test Mental , pero los Tests a los que hace referencia Cattell, al igual que los de Galton tenían un carácter sensorial y motor fundamentalmente, ya que incluían medidas de energía muscular, velocidad de movimientos, sensibilidad al dolor, etc. El análisis de los datos, puso de manifiesto que la correlación entre este tipo de pruebas y el nivel intelectual de los sujetos, era nula. Para Cattell los tests constituían un sistema uniforme que permite comparar y combinar, en lugares y momentos diferentes, la medida de las funciones mentales y compartía con Galton la creencia de que se podía medir el funcionamiento intelectual de las personas mediante tests de discriminación sensorial y midiendo el tiempo de reacción. Fue necesario llegar a finales del siglo S.XIX, para aceptar que estos tests de carácter fundamentalmente motor y sensorial, no medían la inteligencia. Las puntuaciones obtenidas por los sujetos en estos tests, no guardaban relación con las medidas de rendimiento escolar, lo que venía a refutar la hipótesis de la relación entre la capacidad sensorial y la inteligencia.

8.3.Desarrollo de los primeros Test de inteligencia

Binet , fue el primero en darse cuenta de que las sensaciones no jugaban un papel demasiado importante en la Psicología Diferencial y que era necesario centrarse en el estudio de los procesos mentales superiores. Otro de los aciertos de este autor, fue darse cuenta de la importancia que tenía la edad de los sujetos como variable interviniente. Binet trabajó con Simon y en 1905, publicaron lo que puede ser considerada, la primera escala de inteligencia. Este test ya no se ocupaba de las funciones motoras o sensoriales, sino de la capacidad de comprensión y razonamiento de los niños. Esta escala, conocida como la Escala de Binet-Simon , constaba de 30 elementos de dificultad creciente, y aunque se incluían algunos elementos de tipo sensorial, la mayoría eran verbales. La adaptación más conocida de este test fue la que realizó Terman en 1919 en Stanford, de ahí el nombre de Test Stanford-Binet. Aunque la finalidad en un principio, era detectar a los sujetos que presentaran algún retraso intelectual, posteriormente se utilizó para el estudio de las diferencias en otros niveles. Para poder interpretar las puntuaciones obtenidas se desarrolló el concepto de Edad Mental que equivale a la edad cronológica de los niños intelectualmente normales, cuya media en la escala, es igual a la puntuación obtenida por el niño examinado. Es decir, se aplica la escala a una muestra representativa de niños intelectualmente normales, divididos en distintos niveles de edad y se calcula la puntación media de los niños en cada uno de los niveles. Esa sería la norma establecida con la cual comparar los resultados obtenidos. Así, supongamos se aplica la escala a un niño de 12 años, y obtiene una puntuación que coincide con la puntación media por los niños de 8 años; entonces, diremos que la edad cronológica del niño examinado es de 12 años, pero su edad mental es de 8 años. Terman consideraba que la inteligencia, se podía definir como la habilidad para llevar a cabo razonamientos abstractos y, a pesar de seguir la táctica de Binet para la elaboración de sus tests, utiliza como medida de la inteligencia el concepto de Cociente Intelectual (CI) acuñado por Stern en 1912. Este CI equivale al cociente entre la edad mental y la edad cronológica , generalmente multiplicado por cien para evitar los decimales. Al definir el C.I, se establece la 1ª Escala de Puntuaciones , referidas a las aptitudes mentales. En 1937, junto a Merrill , llevaron a cabo otra revisión del tests de Binet y obtuvieron 2 formas paralelas.

8.4.Los Test colectivos

Todos los tests desarrollados hasta el momento, eran de aplicación individual, lo que representaba un gran inconveniente por la cantidad de tiempo que requería su aplicación, pero la entrada de EEUU en la Primera Guerra Mundial, y la necesidad de seleccionar y clasificar a las personas disponibles para el ejército en función de sus capacidades , hacía imposible la aplicación de este tipo de pruebas. Yerkes sería el encargado de investigar nuevos procedimientos que posibilitaran la administración de tests en el ejército, creándose el: o Test Alpha : diseñado para la población general. o Test Beta : para los reclutas analfabetos o aquellos que no dominaban el inglés. Ambos tests, siguen usándose hoy día tras numerosas revisiones, y este fue el comienzo de los Test Colectivos. Una vez finalizada la guerra, el uso de test se extendió a la industria y al resto de instituciones. En 1922 Cattell fundó la primera empresa dedicada a la publicación masiva de test, y a partir de ahí, empezaron a utilizarse normalmente como instrumento de selección en la administración americana. Su sistema de valoración era sencillo: generalmente se asumía como puntación de los sujetos el número de aciertos y para su interpretación , se recurría, bien a normas cronológicas (edad mental o C.I), bien a normas estadísticas (centiles o puntuaciones típicas) En 1938 apareció el Test de Weschler-Bellevue para la medición de la inteligencia en adultos y en 1949 una versión para niños conocida como WISC. En 1955 apareció una revisión de la escala anterior conocida como Weschler Adult Intelligence Scale ( WAIS ). La aparición de estas escalas, supuso un avance en el desarrollo de los Test, porque se había constatado la falta de efectividad que tenía el test de Stanford-Binet aplicado a adultos. A pesar del gran desarrollo del Método de los Tests , quedaban preguntas sin responder, como qué era lo que medían realmente los tests, y si realmente existían los rasgos que decían medir. En un intento de dar respuestas a estos interrogantes, se desarrollaron el Coeficiente de Correlación de Pearson y una serie de técnicas correlacionales, conocidas como Análisis factorial. Los primeros esbozos de estas técnicas, se deben a Spearman, teniendo gran importancia en el desarrollo del Método de los Tests, ya que sin el desarrollo de estas técnicas, los tests mentales hubiesen tardado más en perder su carácter básicamente sensorial. El objetivo común de las técnicas reunidas bajo el término Análisis Factorial, es representar un conjunto de variables observables (escalas, ítems…) mediante un número más pequeño de variables no observables, sino latentes, llamadas factores de las que las primeras, son indicadores. La influencia del análisis factorial respecto a los test de inteligencia fue doble: o Dio una fundamentación teórica a su utilización , mostrando que en la mayor parte de las funciones cognoscitivas interviene un factor general “g” común a todas ellas. o Los resultados del análisis factorial subrayan la importancia de estudiar otras aptitudes más específicas en el campo de la inteligencia. Así surgen los primeros tests destinados a la medida de aptitudes y del rendimiento.

8.5.Las baterías de aptitud múltiple

Los tests de inteligencia utilizados hasta el momento, proporcionaban información acerca del nivel intelectual global de los sujetos y eso no bastaba., era preciso trazar su perfil mental , en función de las puntuaciones específicas obtenidas en diversos factores cognoscitivos. Así, a partir de las décadas de los 30-40 del S.XX, cuando la técnica del análisis factorial empezaba a dar sus frutos, comenzaron a desarrollarse las baterías de tests: Baterías de Aptitud Múltiple cuya finalidad era, procurarnos una medida

8.7.La medición de intereses y actitudes

o Entre los instrumentos clásicos para la medida de los intereses destacan: el Cuestionario de Intereses Vocacionales de Strong (SVIB) y la Escala de Preferencias de Kuder.

o En cuanto a la medida de las actitudes, creencias y opiniones su desarrollo efectivo tuvo lugar, a partir de que Thurstone desarrolló su dos modelos: la Ley del Juicio Comparativo y la Ley del Juicio Categórico , junto con los procedimientos experimentales para la recogida de datos, que basados en los métodos psicofísicos desarrollados por Fechner, iban a permitir el escalamiento de los ítems (estímulos). La técnica utilizada por Thurstone para la medida de las actitudes, permite la ordenación de los ítems (estímulos), a lo largo de una escala continua, en función de los valores escalares que les hayan asignado el grupo de sujetos a los que se les han presentado para su evaluación (prueba de jueces). Una vez escalados los ítems, se podrá utilizar la escala para averiguar el grado de actitud de los sujetos en la variable medida , es decir, para escalar a los sujetos. Algunos años más tarde , Likert , desarrolló una nueva técnica, que vino a paliar alguno de los inconvenientes de la de Thurstone, entre otros, la prueba de jueces. Las escalas elaboradas siguiendo la Técnica de Likert están basadas en los mismos principios que la mayoría de los test de aptitudes. Algunos investigadores encontraron que este tipo de escalas, eran más fáciles de elaborar que las de Thurstone y diagnosticaban mejor. Con el fin de medir el significado connotativo , también llamado afectivo o subjetivo , que determinados estímulos tienen para los sujetos, Osgood encontró el marco teórico (revisando todas las teorías del significado) que le permitió desarrollar una escala de clasificación para medirlo, el Diferencial Semántico.

8.8.La institucionalización del uso de los Tests

El uso masivo y el abuso de los test, condujo a ciertas críticas sociales e incluso a su prohibición en determinados estados. A las críticas sociales, se unieron ciertas críticas en la literatura científica, a cerca de la adecuación de los mismos para ciertos usos y colectivos, ya que muchos de ellos, presentaban determinados sesgos. No obstante, las limitaciones de los tests no justificaron del todo esta fuerte corriente crítica, ya que la teoría y la práctica , demostraron que las deficiencias propias de los instrumentos que tratan de medir capacidades humanas complejas, a partir de manifestaciones observables simples, son generalmente conocidas y controlables y, por tanto, basta considerarlas para hacer un uso correcto del test. Así mismo, habrá que tenerlas en cuenta al hacer la interpretación de las puntuaciones, puesto que es obvio, en cualquier proceso de medición, el que la interpretación de la medida se ajuste también a las características del instrumento. La cuestión puede consistir en no confundir la Teoría Psicométrica , con los tests derivados de ella , ni los test, con las Teorías Psicológicas, ni con los usos inadecuados que se hagan de los mismos. El uso masivo de los tests, fue extendiendo su campo de aplicación a diferentes sectores, tanto públicos como privados, en la selección de puestos en el gobierno y las escuelas, para ayudar a niños con problemas escolares, en orientación, en clasificación…lo que ocasionó la aparición de instituciones dedicadas a ello. Así, por ejemplo, en España, y con el fin de proporcionar una serie de directrices que ayuden a mejorar el uso de os tests por parte de los profesionales, se creó en 1995, la Comisión de Tests , por el COP, que funciona coordinada con otras comisiones internacionales, creadas con la misma finalidad.

8.9.Los Tests referidos al criterio frente los referidos a normas

A finales de los años 60 y durante la década de los 70 del S. XX, se había hecho en los EEUU una fuerte inversión económica en el campo educativo, y se deseaba conocer los resultados de la misma, para averiguar si se había conseguido que los alumnos, alcanzaran unos objetivos mínimos (estándares educativos) y, a la vez, evaluar su nivel de competencia y sus habilidades básicas. Los tests que se utilizaban habitualmente, no se adecuaban bien a los nuevos objetivos planteados, ya que se habían desarrollado para evaluar el grado de aptitud o el nivel de los sujetos en un determinado rasgo , pero interpretando los resultados en relación a los que se habían obtenido en una muestra representativa que había servido, para establecer una serie de normas (grupo normativo), sin analizar si los sujetos habían alcanzado o no, los objetivos mínimos a nivel educativo : Test referidos a las normas (TRN). Por el contrario, el interés del momento estaba centrado, no en la evaluación del nivel de rasgo o aptitud de los sujetos, sino en la evaluación del rendimiento y el diagnostico de las necesidades que pudieran tener los alumnos, de cara a una posible intervención. Se trataba de averiguar, hasta qué punto los alumnos dominaban el contenido de determinadas materias, o eran capaces de resolver correctamente problemas habituales de su vida real, de ahí que se desarrollaran otros tipos de tests: los Test referidos al criterio (TRC) , que iban a tratar de dar solución al problema. Estos test, proporcionaron las bases para interpretar las puntuaciones de los sujetos en relación a un dominio bien definido en lugar de en relación a un grupo normativo, y permitieron a los psicólogos y educadores, la evaluación de los estudiantes en función de su conocimiento o no de una materia determinada en lugar de hacerlo en relación a otros estudiantes. Glaser es considerado como el primero que distinguió entre las dos aproximaciones a la medición del rendimiento , referida al criterio y referida a la norma. Estableció que los TRC , son aquellos en los que los resultados, dependen del estatus absoluto de calidad del estudiante, frente a los TRN , que dependen del estatus del grupo. Los trabajos de este autor, suscitaron un enorme interés y, a partir de ese momento, aparecieron muchas publicaciones sobre el tema. La definición más aceptada en la actualidad, es la de Popahm , para quien un TRC, se utiliza para evaluar el estatus absoluto del sujeto, respecto al algún dominio de conducta bien definido. Las diferencias entre TRC y TRN no siempre son aparentes a simple vista, ya que ambos tipos de tests están formados por ítems de formatos similares, requieren el mismo tipo de operaciones cognitivas de los sujetos, etc. Sin embargo, existen grandes diferencias tan en su construcción como en la interpretación de las puntuaciones obtenidas. Estas diferencias, hacen referencia a cinco aspectos fundamentales, que hacen que a nivel psicométrico, se mantenga esta diferenciación entre los dos tipos de tests.

Tests Referidos a las Normas Tests Referidos al Criterio

Finalidad de la evaluación

El objetivo, es poner de manifiesto las diferencias individuales en la conducta o rasgo que mide el test.

El objetivo, es estimar el rendimiento o conducta del sujeto, en los objetivos que mide el test.

Construcción del test y la especificación de los contenidos

A la hora de construir los elementos que formarán el test, se suele recurrir a las teorías existentes respecto al rasgo o constructo que se quiere medir, sin una delimitación clara del dominio de los contenidos a evaluar.

Lo primero que hay que hacer es especificar claramente, el dominio de contenidos o conductas que se quiere evaluar y el uso que se pretende hacer del test.

Forma de seleccionar los ítems

Los ítems deben poner de relieve las diferencias individuales, maximizando la varianza del test, y seleccionando ítems de dificultad media y alto poder discriminativo.

Los ítems se seleccionan en función de los objetivos y del uso que se vaya a hacer de ese test.

Significado de las puntuaciones

La puntuación obtenida por los sujetos, se considera un indicador de su puntuación verdadera en un rasgo

La puntuación: es un estimador de la conducta o rendimiento del sujeto en el

9.1.Teoría Clásica de los Tests (TCT)

La TCT se desarrolló, fundamentalmente, a partir de las aportaciones de Galton , Pearson y Spearman , y gira en torno a tres conceptos básicos: las puntuaciones empíricas u observadas ( X ): puntuaciones obtenidas por los sujetos cuando se les aplica un test, las puntuaciones verdaderas ( V ): puntuaciones que realmente tienen los sujetos en el rasgo o constructo medido y coincidirían con las empíricas en el hipotético caso de que no existieran los errores de medida), y las puntuaciones debidas al error ( E ). Para establecer la relación funcional de esos tres conceptos la TCT se sirve del modelo más simple, el modelo lineal , desarrollado por Spearman. El modelo lineal de Spearman (ver tema IV): es un modelo aditivo, en el que la puntuación observada ( variable dependiente ) de un sujeto en un test ( X ) es el resultado de la suma de dos componentes: su puntuación verdadera ( variable independiente ) en el test ( V ) y el error ( e ) que inevitablemente lleva asociado todo proceso de medición. A partir de los supuestos, y de las deducciones que se extraigan a partir de los mismos, se podrá hacer una estimación de esos errores. La expresión formal de este modelo es:

X = V + e

La ejecución de un sujeto al responder a un test en un momento determinado, estará afectada por múltiples factores difícilmente controlables, lo que implicará que la puntuación obtenida, su puntuación empírica, no coincida con su puntuación verdadera. Ante la imposibilidad de saber con exactitud cuál es esta puntuación verdadera, será necesario hacer estimaciones de la misma en base a los supuestos del modelo. A pesar de que en el Modelo Lineal de Spearman, sólo se encuentra un término de error , en el que se incluirían todos los errores aleatorios que están afectando las puntuaciones empíricas u observadas , los errores pueden provenir de numerosas fuentes: una de las fuentes de error puede ser el mismo sujeto , ya que cualquier cosa que le haya ocurrido, su estado emocional, cansancio y fatiga, puede estar incidiendo en el rendimiento en el test y, por lo tanto, en la puntuación que se obtenga; otra fuente de error puede provenir del propio test , debido a los ítems que lo forman y al tipo de formato; también de las características de los aplicadores del test pueden estar incidiendo en la puntuación de los sujetos en el mismo; otras fuentes pueden ser las condiciones ambientales y las instrucciones que se den. Aunque resulta imposible separar inequívocamente cuales son los factores que contribuyen a la puntuación verdadera y los que contribuyen al error, se han realizado algunos intentos para sistematizar y clasificar el error , en función de las posibles fuentes que lo originan y se han propuesto algunos Modelos , que suponen variaciones o extensiones del Modelo Lineal de Spearman. Las variaciones entre estos modelos alternativos, se deben a distintas matizaciones hechas respecto a los errores. El más ambicioso y global de los intentos realizados para estimar la fiabilidad de un instrumento de medida, analizando de forma sistemática las posibles fuentes de erro r es el proporcionado por la Teoría de la Generalizabilidad (TG) propuesta por Cronbach que tiene en cuenta, todas posibles fuentes de error (a factores del sujeto, situacionales, características del evaluador, variables instrumentales…) e intenta diferenciarlas, mediante la aplicación de los procedimientos clásicos de análisis de varianza (AVAR). Las fuentes de variación (factores en términos de ANOVA) se denominan facetas y los niveles de cada factor condiciones. La medida psicológica, se convierte en un índice obtenido en una muestra y el problema, como en toda inferencia, será generalizar esa medida. A pesar del avance que supuso la TG, suele ser considerada más como una extensión de la TGC, que como un modelo alternativo. Por otra parte, la complicación de sus diseños y la aparición de nuevos modelos psicométricos , englobados bajo la

denominación de Teoría de Repuesta al Ítem (TRI, fueron la causa de que su utilización en el marco de la Teoría de los Tests quedara relegada a 2º término.

9.2.Teoría de respuesta al Ítem (TRI)

Lord : considerado el padre y fundador de la TRI, marcó el comienzo de una nueva forma de trabajar en psicometría. Observó que, cuando a una muestra de sujetos, se le aplicaba un test, o una serie de test, para evaluar su nivel en un determinado rasgo, la puntuación obtenida, dependía del conjunto de ítems o tests utilizados cuando, en realidad, su nivel en el rasgo en el momento de la aplicación, no tenía por qué variar. Los sujetos no debían tener puntuaciones altas o bajas en un test, en función de que lo ítems que lo formaran fueran más fáciles o difíciles. Así mismo, los estadísticos de los ítems, su índice de dificultad y de discriminación, dependían de la muestra de sujetos utilizada para su cálculo Estos dos problemas, junto con la indiferenciación del error , (sólo había un componente error que englobaba a todos) fueron los que centraron las críticas hechas a la TCT. Para intentar solucionar el último de estos problemas, ya hemos comentado más arriba lo que se hizo; para intentar solucionar los dos restantes, algunos psicómetras, entre ellos Gulliksen y Lord se interesaron en el desarrollo de teorías y modelos que permitieran describir los niveles de habilidad de los sujetos, con independencia de la muestra de ítems o de tareas utilizados para su evaluación, y el cálculo de los estadísticos de los ítems con independencia de la muestra de sujetos utilizada. La solución más adecuada, se encontró en el marco de la Teoría de Respuesta al Ítem ( TRI ) que proporciona una serie de modelos que asumen, una relación funcional entre los valores de la variable que miden los ítems (nivel de habilidad de los sujetos) y la probabilidad de que los sujetos, en función de su nivel de habilidad, acierten cada ítem. A esta función se la conoce con el nombre de Curva Característica del ítem ya que, realmente, es la curva que caracteriza a cada uno de ellos. La probabilidad de acertar cada ítem depende, exclusivamente, del nivel de los sujetos en la variable que mide cada uno de ellos. El desarrollo de estos modelos, supuso un gran avance en la Teoría de los Tests, sin embargo, la dificultad de utilizarlos en la práctica, sin la ayuda de los ordenadores, fue la causa de que su gran desarrollo no llegase hasta finales del S.XX, desarrollándose los programas de software necesarios para su utilización. A pesar del gran desarrollo de la TRI hacia 1980, la TCT sigue en auge, al existir problemas que se pueden solucionar más eficaz y rápidamente dentro de este marco.