Prepara tus exámenes
Consigue puntos
Orientación Universidad
Vende en Docsity
Docsity AI

Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity

Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium

Orientación Universidad

Vende en Docsity

Docsity AI

Inicia sesión Regístrate

Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity

Busca documentos

Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity

Busca tu universidad

Encuentra los documentos específicos para los exámenes de tu universidad

Video Cursos

Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades

Quiz

Responde a preguntas de exámenes reales y pon a prueba tu preparación

Docsity AINEW

Resume tus documentos, hazles preguntas, conviértelos en quiz y mapas conceptuales

Ver preguntas

Despeja tus dudas leyendo las respuestas a las preguntas que realizaron otros estudiantes como tú

Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium

Compartir documentos

20 Puntos

Por cada documento subido

Responde a las preguntas

5 Puntos

por cada respuesta dada (máx. 1 al día)

Todos los modos para conseguir puntos gratis

Consigue puntos de inmediato

Elige un plan Premium con todos los puntos que necesitas.

Oportunidades de estudio

Elige tu próximo programa de estudio

Ponte en contacto inmediatamente con las mejores universidades del mundo. Busca entre miles de universidades en todo el mundo. Busca entre miles de universidades partner oficiales

Comunidad

Pregúntale a la comunidad

Pide ayuda a la comunidad y resuelve tus dudas de estudio

Ebooks gratuitos

¡Nuestros e-books salva-estudiantes!

Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity

Test psicometrico confiabilidad, Guías, Proyectos, Investigaciones de Psicología Moral

Universidad Alas Peruanas (UAP) - Lima Psicología Moral

Upsjb informe de investigacion

Tipo: Guías, Proyectos, Investigaciones

2016/2017

Subido el 15/07/2017

jean-carlos-10 🇵🇪

1 documento

1 / 24

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

Psicometria: Tests Psicométricos,

Confiabilidad y Validez

Jaime Aliaga Tovar

En las ciencias fácticas se miden las características de los

objetos que estudian. La psicología es una ciencia fáctica y para

medir los atributos o características psicológicas del ser humano

utiliza como instrumentos a los tests. Estos pueden ser tests

proyectivos o tests psicométricos. Los tests psicométricos son los

que utilizan el concepto de medición y tienen su fundamento en la

psicometría. El primer test psicométrico fue la Escala Métrica de la

Inteligencia creada por los franceses Binet y Simon (1905), con la

que se introdujo en psicología el concepto de edad mental. Uniendo

este concepto con el de edad cronológica, el psicólogo alemán

William Stern (1912) creó el concepto de Cociente Intelectual o CI.

Por otro lado, el Cuestionario de Datos de Personalidad de Robert S.

Woodsworth (1916) es reconocido como el primer test de

personalidad. Desde las primeras décadas del pasado siglo los tests

psicométricos han sido construidos siguiéndose el enfoque de la

Teoría Clásica de los Tests, creada por el psicólogo inglés Charles

Spearman en la segunda década del siglo XX; en las tres últimas

décadas del mismo siglo apareció otro enfoque para la construcción

de tests que ha sido llamado Teoría de Respuesta al Ítem (TRI), pero

todavía hay pocos tests basados en esta teoría. Los tests

psicométricos han tenido un gran avance relacionado con los avances

de la psicometría que es la rama de la psicología que se ocupa de las

mediciones mentales. Tests psicométricos son por ejemplo la Escala

de Inteligencia para Adultos de Wechsler (WAIS) y su contraparte

para niños (WISC), del mismo autor; otro test de reconocido

prestigio es el Test de Matrices Progresivas de Raven; por otro lado,

en personalidad, tests psicométricos son, por ejemplo, el Inventario

Multifásico de la Personalidad de Minnesotta (MMPI), el

Descubre Guías, Proyectos, Investigaciones de Psicología Moral Universidad Alas Peruanas (UAP) - Lima

Documentos relacionados

PSICOMETRICO EJERCICIOS

Informe Psicométrico PMA

Informe Psicométrico MCMI III

informe psicometrico del test de denver

(6)

Informe Psicométrico - Test de Matrices Progresivas de Raven

Informe Psicométrico de Evaluación de Alumnos - Prof. Torres Sanchez

Informe psicometrico

(7)

analisis psicometrico

Psicometríco - psicología

Informe Psicométrico

Mantenimiento confiabilidad

Confiabilidad

(1)

Vista previa parcial del texto

¡Descarga Test psicometrico confiabilidad y más Guías, Proyectos, Investigaciones en PDF de Psicología Moral solo en Docsity!

Psicometria: Tests Psicométricos,

Confiabilidad y Validez

Jaime Aliaga Tovar

En las ciencias fácticas se miden las características de los objetos que estudian. La psicología es una ciencia fáctica y para medir los atributos o características psicológicas del ser humano utiliza como instrumentos a los tests. Estos pueden ser tests proyectivos o tests psicométricos. Los tests psicométricos son los que utilizan el concepto de medición y tienen su fundamento en la psicometría. El primer test psicométrico fue la Escala Métrica de la Inteligencia creada por los franceses Binet y Simon (1905), con la que se introdujo en psicología el concepto de edad mental. Uniendo este concepto con el de edad cronológica, el psicólogo alemán William Stern (1912) creó el concepto de Cociente Intelectual o CI. Por otro lado, el Cuestionario de Datos de Personalidad de Robert S. Woodsworth (1916) es reconocido como el primer test de personalidad. Desde las primeras décadas del pasado siglo los tests psicométricos han sido construidos siguiéndose el enfoque de la Teoría Clásica de los Tests, creada por el psicólogo inglés Charles Spearman en la segunda década del siglo XX; en las tres últimas décadas del mismo siglo apareció otro enfoque para la construcción de tests que ha sido llamado Teoría de Respuesta al Ítem (TRI), pero todavía hay pocos tests basados en esta teoría. Los tests psicométricos han tenido un gran avance relacionado con los avances de la psicometría que es la rama de la psicología que se ocupa de las mediciones mentales. Tests psicométricos son por ejemplo la Escala de Inteligencia para Adultos de Wechsler (WAIS) y su contraparte para niños (WISC), del mismo autor; otro test de reconocido prestigio es el Test de Matrices Progresivas de Raven; por otro lado, en personalidad, tests psicométricos son, por ejemplo, el Inventario Multifásico de la Personalidad de Minnesotta (MMPI), el

(^86) Psicometría

Cuestionario 16PF de Cattell y el Inventario de la Personalidad de Eysenck (EPI).

ENFOQUE ACTUAL

El enfoque actual sobre los tests psicométricos lo haremos empezando por la conceptualización de la psicometría hasta llegar a una breve descripción de la teoría de la respuesta al ítem (TRI), tratando de paso otros conceptos básicos necesarios para comprender la realidad de los tests psicométricos.

Psicometría

Una disciplina de la psicología cuya finalidad intrínseca es la de aportar soluciones al problema de la medida en cualquier proceso de investigación psicológica. También es un campo metodológico que incluye teorías, métodos y usos de la medición psicológica, en que se incluyen aspectos meramente teóricos y otros de carácter más práctico. La perspectiva teórica incluye las teorías que tratan de las medidas en psicología, encargándose de describirlas, categorizarlas, evaluar su utilidad y precisión, así como la búsqueda de nuevos métodos, teorías y modelos matemáticos que permitan mejores instrumentos de medida. La perspectiva práctica se ocupa tanto de aportar instrumentos adecuados para conseguir buenas medidas como de los usos que de los mismos se puedan realizar. Estos instrumentos son los tests psicométricos. Finalmente, la psicometría se distingue por el uso del lenguaje formal y estructurado de las matemáticas.

Medición

En la psicología, la educación y las ciencias sociales se trata de medir aspectos que no son físicos ni directamente observables. La medición según Nunnally (1987) consiste en reglas para la asignación de números a objetos en tal forma que representen cantidades de atributos. La palabra “objeto” se usa en un sentido amplio e incluye personas. En psicología, medir es dar la magnitud de cierta propiedad o atributo, por ejemplo, la inteligencia, la

(^88) Psicometría

g) Si las condiciones no cambian, la repetición del examen debe conducir siempre al mismo resultado, o a otro muy próximo ( fiabilidad ) (Pichot, 1996).

Estandarización

Se llama así al proceso mediante el cual se establecen procedimientos unívocos para la aplicación, calificación e interpretación de un test psicométrico (Cronbach, 1972). Cuando las condiciones de administración y calificación del test psicométrico están bien definidas y su utilización es idéntica en todos los sujetos examinados, entonces el aspecto más importante que queda por resolver es la interpretación de las puntuaciones logradas por los sujetos evaluados. Esta interpretación se realiza comparando el puntaje obtenido por el sujeto con las puntuaciones contenidas en el baremo o tablas de normas.

Interpretación de los puntajes de un test psicométrico estandarizado

Los números que arrojan la medición de un atributo psicológico realizada con un test psicométrico se denominan puntajes o calificaciones directas. Estos puntajes en sí mismos no tienen un significado preciso, adquieren un significado psicométrico cuando se les compara con una tabla de normas o baremo, que ha sido previamente construida con las puntuaciones que en el test han obtenido un grupo de sujetos llamado grupo normativo. Al realizar esta comparación se puede hacer la clasificación de los sujetos examinados con lo cual se llega a cumplir la finalidad del test, que es clasificar a los sujetos examinados. Los puntajes directos se transforman en varios tipos de puntajes derivados o unidades de medición que se presentan en las tablas de normas o baremos. Un baremo es una tabla que sistematiza las normas (afirmación estadística del desempeño del grupo normativo en el test psicométrico) que trasforman los puntajes directos en puntajes derivados que son interpretables estadísticamente. Puntajes derivados son los siguientes: a) percentiles, puntaje derivado que tranforma el puntaje directo en una escala del 1al 100, llamándose cada uno de los puntos un centil. Un examinado que tiene un puntaje

Jaime Aliaga 89

directo equivalente al percentil 80, se dice que supera al 80% del grupo normativo en el aspecto evaluado; b) puntajes estándar, que son aquellos que tienen como unidad a fracciones de la desviación estándar, ejemplos: el puntaje CI, el puntaje eneatipo (escala del 1 al 9), el puntaje decatipo (escala del 1 al 10), entre otros. También es un puntaje derivado la edad mental.

Clasificación de los tests psicométricos

Hay varias clasificaciones. Presentamos la siguiente clasificación:

Criterio Clasificación

Por su forma de dar las instrucciones

*Orales *Escritos (aunque en algunos casos hay que ejemplificar lo que se quiere que el sujeto realice en la tarea, como en el caso de personas con problemas auditivos)

Por su administración * Individual
Colectiva
Autoadministrada
Por la forma o tipo de respuesta que exigen
Objetivas
Subjetivas
Por el material de la prueba * Lápiz y papel
Verbal completamente
De ejecución (material, manual, visomotor)
De aparatos especiales
Combinación de los tres primeros (Ej.: WAIS)

*Por su forma de calificación * Manual

Electrónica
Por sus edades límites de aplicación
Pruebas para infantes (baby test)
Pruebas para preescolares
Pruebas para escolares
Pruebas para adolescentes
Pruebas para adultos *Por su libertad de ejecución * Pruebas de poder (power test)

Pruebas de rapidez (speedy test)

Jaime Aliaga 91

Se deben construir normas para los grupos en los cuales se usará el test, si esos grupos difieren de aquellos en los cuales se hicieron los baremos que aparecen en el manual de la prueba.
Un test aprecia la función medida tal como se dan en el individuo en el momento de aplicación de la prueba. Si las condiciones que influyen sobre el individuo se modifican, existe la posibilidad de que tales cambios influyan en los puntajes resultantes del test.
Los resultados de un test no deben emplearse para diagnosticar per se estados patológicos. Deben considerarse como elementos de información que juiciosamente analizados e integrados con otros elementos de información ayudarán al diagnóstico.
Categorías descriptivas (inteligencia muy superior, superior, etc.) sólo deben utilizarse para los tests cuyos puntajes le dieron origen. Por ejemplo, la tabla de categorías del WAIS sólo debe ser utilizada con este test y no con otro (Anastasi, 1982).

Secciones o partes de un test psicométrico

Un test psicométrico tiene generalmente las siguientes secciones o partes:

El test propiamente dicho.
El manual del test. Documento que contiene los siguientes capítulos o partes: a) Exposición de los objetivos de la prueba (qué mide). Generalmente empieza con un resumen mostrado en la FICHA TÉCNICA. b) Descripción de las características estructurales del test (sus partes y componentes). c) Información acerca del proceso de estandarización o tipificación. d) Instrucciones generales sobre la manera de aplicar o administrar la prueba y del tipo de población en la cual es aplicable. e) Descripción del material de examen propiamente dicho a las instrucciones detalladas para la aplicación del test o de cada uno de los subtests. f) Instrucciones para las valoraciones (calificación) de las respuestas obtenidas en cada uno de los subtests.

(^92) Psicometría

g) Información estadística y psicométrica acerca de las propiedades de la prueba como instrumento de medida, vale decir, confiabilidad y validez. h) Tablas de normas o baremos con los puntajes directos y convertidos para los diferentes grupos de edades y poblaciones (poblaciones de referencia y grupos normativos adecuadamente descritos). Los puntajes convertidos son, usualmente, los percentiles y los puntajes estándar (Cronbach, 1972).

Cualidades que debe tener un test psicométrico

Confiabilidad

La confiabilidad (o consistencia) de un test es la precisión con que el test mide lo que mide, en una población determinada y en las condiciones normales de aplicación. (Anastasi, 1982; Aiken, 1995). (Las condiciones normales de aplicación se refieren a las condiciones especificadas en el manual del test). La falta de confiabilidad de un test psicométrico esta en relación con la intervención del error. Se considera que el error es cualquier efecto irrelevante para los fines o resultados de la medición que influye sobre la falta de confiabilidad de tal medición. El error es de dos tipos: a) Error constante (sistemático), que se produce cuando las mediciones que se obtienen con una escala son sistemáticamente mayores o menores que lo que realmente deben ser. b) Error causal (al azar o no sistemático), que se produce cuando las medidas son alternativamente mayores o menores de lo que realmente deben ser. Este último tipo de error interviene cuando se afecta la confiabilidad de un test psicométrico. Este error tiene que ver con la salud, fatiga, motivación, tensión emocional, fluctuaciones de la memoria, condiciones externas de luz, humedad, ventilación, calor, distracción por problemas del momento, familiaridad con la prueba, que presenta el examinado al momento de dar el test (Rey, 1972; Brown, 1982). ¿Cómo se presenta la confiabilidad de un test psicométrico? La confiabilidad se presenta por medio del coeficiente de confiabilidad (rxx) y del error estándar de medida (EEM).

(^94) Psicometría

confiabilidad, son las más conocidas la KR 20 y la KR 21. Actualmente, un coeficiente más utilizado es el coeficiente alfa de Cronbach (1972; Anastasi, 1982; Aiken, 1995). B) Error estándar de medida Por medio de este error estándar de medida se estima el intervalo probable de puntajes en el cual se encontrará el puntaje verdadero de un sujeto examinado con un test psicométrico. El error estándar de medida (EEM) se obtiene a través de la siguiente fórmula:

EEM = s 1 − rxx

Donde: s = Desviación estándar de los puntajes de la distribución. rxx = Coeficiente de confiabilidad del test. 1 = Constante. Obtenido el EEM, debemos escoger el nivel de confianza:

Nivel de confianza del 68% = PD ± 1 EEM.
Nivel de confianza del 95% = PD ± 2 EEM. Para el nivel de confianza del 68% la interpretación es la siguiente: "Podemos concluir, con un 68% de confianza, que el puntaje verdadero de un sujeto está en la zona o intervalo comprendido entre su puntaje directo u obtenido (PD) y ± 1 EEM". El nivel de confianza más usado en psicometría es el del 95%: "el puntaje verdadero de un sujeto se encontrara en el intervalo comprendido entre su puntaje obtenido o directo (PD) y ± 2 EEM".

Validez

Si tenemos una prueba “X” nos equivocaríamos al creer que su titulo nos dice lo que la prueba mide, pues cualquier persona puede reunir un conjunto de reactivos y esperar a obtener una medida, por ejemplo, de razonamiento numérico o de las estrategias de aprendizaje. La averiguación de lo que la prueba mide no responde a la pregunta ¿cómo llama el autor a la prueba?, sino más bien ¿a qué hacen referencia los puntajes obtenidos en esta?, ¿es válido el uso o la interpretación de las puntuaciones de este test?, ¿qué generalizaciones se pueden hacer apropiadamente a partir de la puntuación en esta prueba? (Thorndike, 1989). En esencia, el trasfondo de estas preguntas es determinar cuáles son los procesos mentales que pone en juego el test. Ahora bien, el responder a las

Jaime Aliaga 95

citadas interrogantes necesita de una indagación larga y compleja que en psicometría se denomina proceso de validación. a) Distinción entre la validez y la confiabilidad según el error. La distinción entre confiabilidad y validez se basa en lo que consideramos como error. En la validez interesan los errores constantes o sistemáticos y en la confiabilidad los errores aleatorios o no sistemáticos. El siguiente ejemplo nos permitirá precisar la diferencia entre ambos tipos de error: Supongamos que un reloj es adelantado 20 minutos. Si se trata de un buen cronometro el tiempo que marca será confiable (es decir consecuente), pero no será valido en comparación con el tiempo estándar (hora GMT). b) Definición de validez. En términos estadísticos la validez se define como la proporción de la varianza verdadera que es relevante para los fines del examen. Con el término relevante nos referimos a lo que es atribuible a la variable, características o dimensión que mide la prueba. En este sentido, generalmente la validez de un test se define ya sea por medio de (1) la relación entre sus puntuaciones con alguna medida de criterio externo, o bien (2) la extensión con la que la prueba mide un rasgo subyacente específico hipotético o “constructo”. En términos psicométricos , la validez es un concepto que ha pasado por un largo proceso evolutivo, desde aquella posición que sostenía que “un test es válido para aquello con lo que correlaciona” (Guilford, 1946, citado en Muñiz, 1996, p. 52), hasta la más reciente que la entiende como un juicio evaluativo global en que la evidencia empírica y los supuestos teóricos respaldan la suficiencia y lo apropiado de las interpretaciones y acciones en base a los puntajes de las pruebas, que son función no sólo de los ítemes sino también de la forma de responder de las personas así como del contexto de la evaluación. Es decir, lo que se valida no es la prueba sino las inferencias hechas a partir de la misma, lo que tiene dos importantes consecuencias: a) el responsable de la validez de una prueba ya no es solo su constructor sino también el usuario, y b) la validez de una prueba no se establece de una vez por todas sino que es resultado del acopio de evidencias y supuestos teóricos que se dan en un proceso evolutivo y continuo que comprende todas las cuestiones

Jaime Aliaga 97

estrategia distinta para la obtención de las evidencias (Vidal, 1996, en Muñiz, 1996). En el estudio de la validez de constructo estas evidencias están relacionadas a cinco aspectos: a ) Contenido (relevancia y representatividad del test); b) Sustantivo (razones teóricas de la consistencia observada de las respuestas); c) Estructural (configuración interna del test y dimensionalidad ); d) Generalización (grado en que las inferencias hechas a partir del test se pueden generalizar a otras poblaciones, situaciones o tareas); e) Externo (relaciones del test con otros tests y constructos); f) Consecuencia (consecuencias éticas y sociales del test) (Messick, 1995). d Categorías de la validez. La validez empieza a considerarse como el grado en que cada test refleja el constructo que dice medir y que las relaciones entre tests que miden distintos constructos reflejan las relaciones hipotetizadas entre ellos. En este sentido, al estimarse que la validez de un test es la validez de constructo la que ha de hacerse en un marco teórico, ya no se tiende a hablar de tipos de validez sino de categorías o estrategias de validación comprendiendo éstas a los tipos tradicionales de validez: validez de contenido, validez empírica y validez de constructo. Si tenemos en cuenta que lo que se valida no es el test sino las inferencias hechas a partir del mismo, cada tipo de inferencia requerirá una estrategia distinta. (Vidal, 1996, en Muñiz, 1996). ( 1) Validez de Contenido (evidencia del contenido).- ¿Los ítems que constituyen el test son realmente una muestra representativa del dominio de contenido o dominio conductual que nos interesa? Es conveniente precisar que un dominio o campo conductual es una agrupación hipotética de todos los reactivos posibles que cubren un área psicológica particular. Al hablar de este conjunto de reactivos posibles, se emplean los términos de dominio, universo o población conductual como sinónimos. Por ejemplo: Un test de vocabulario debe ser una muestra adecuada del dominio o universo de ítems posibles en esta área. La validez de contenido consiste en determinar lo adecuado del muestreo de reactivos del universo de reactivos posibles; en este sentido, es una “medida” de lo adecuado del muestreo. Ponemos “medida” entre comillas debido a que este tipo de validez consiste en

(^98) Psicometría

una serie de estimaciones u opiniones, que no proporcionan un índice cuantitativo de validez (para su obtención no se utiliza procedimientos estadísticos). Este tipo de validez se asocia fundamentalmente a los tests de aprovechamiento o rendimiento (test de matemática, historia, etcétera); aunque no existen razones para que no pueda aplicarse a los otros tipos de pruebas psicológicas (pruebas de aptitudes, habilidades, etcétera). Para su determinación se compara sistemáticamente los reactivos del test con el dominio conductual del contenido postulado. Por ejemplo: si tenemos una lista de 500 palabras que esperamos que los estudiantes de un curso sean capaces de escribirlas correctamente al final de este, su performance o rendimiento respecto a estas palabras será importante solamente en tanto que proporciona una prueba de su habilidad para escribir correctamente las 500 palabras. El test que construyamos tendrá una muestra de las 500 palabras, pero sólo tendrá validez de contenido en la medida en que proporcione una muestra adecuada de las 500 palabras que represente. Si seleccionamos solamente palabras fáciles o difíciles, o palabras que representen únicamente ciertos tipos de faltas comunes de ortografía, estaríamos propensos a obtener una validez de contenido muy baja. En consecuencia, el aspecto clave en la validez de contenido es el muestreo de los reactivos. En otras palabras, la validez de contenido es cuestión de determinar si la muestra de sus reactivos es representativa del universo o dominio conductual de ítems al que supuestamente representa. Para hacer esta determinación se recurre a “jueces” (o expertos, generalmente en número impar). El proceso es básicamente lógico y racional, los distintos jueces pueden no estar de acuerdo en la validez de contenido de un test; por ejemplo, la falta de claridad en la especificidad del dominio conductual, hará que resulten difíciles los juicios de validez de contenido. Existen algunos índices estadísticos para valorar el grado de acuerdo de los jueces en torno a los reactivos, por ejemplo el coeficiente V de Aiken. Un procedimiento para que el proceso de “enjuiciamiento” de los reactivos sea lo más objetivo posible, es el siguiente:

- El constructor de la prueba:

Define específicamente el dominio del contenido por medio de una descripción que lo debe delimitar claramente.

(^100) Psicometría

Para este logro es necesario que los criterios externos con los cuales se relacionará las puntuaciones del test sean criterios validos y confiables. Un criterio es cualquier desempeño que los sujetos tienen en la vida real, por ejemplo, las medidas de rendimiento académico, medidas de rendimiento laboral, clasificaciones psiquiátricas, etcétera. En muchos casos resulta imposible hallar un criterio no ambiguo de un rasgo mental. Por ejemplo, dos psicólogos, Carla y Abel, que investigan el rasgo de aptitud numérica pueden emplear diferentes criterios externos para correlacionar los puntajes del test que han creado. Así, Carla puede considerar que el criterio externo más adecuado son las calificaciones que reciben los sujetos en un curso de mecánica en taller; mientras que Abel puede considerar como criterio el periodo de tiempo que gastan los estudiantes en aprender una tarea mecánica y sencilla durante el entrenamiento en un fabrica. ¿Qué sucede si las pruebas que emplean ambos psicólogos correlacionan 0.006 con uno de los criterios, y 0.70 con el otro?, ¿cómo podemos afirmar que la prueba es valida cuando arrojan resultados de cierta clase?, ¿se trata en verdad de una prueba de aptitud mecánica? En razón a situaciones como esta se llego a la conclusión de que la validación de un test es un proceso largo y no un hecho aislado. Solamente a través de estudios de correlación con una amplia variedad de criterios podremos comprender que mide la prueba. Así, una serie de investigaciones sobre la “prueba de actitud mecánica” nos puede demostrar que en realidad esta midiendo la habilidad para realizar movimientos fino y cuidadosamente controlados, siendo completamente independiente para comprender las reacciones complejas de la piezas mecánicas. De esta manera el test puede tener una alta correlación con las calificaciones obtenidas en el taller y ninguna con los trabajos e maquinarias. En el proceso de validación, la validez predictiva de un test (y también la concurrente) se expresa generalmente por medio de un coeficiente de correlación entre los puntajes y los denominados criterios. Este coeficiente se denomina coeficiente de validación. La interpretación de este coeficiente requiere un dominio excelente del análisis estadístico utilizado para obtenerlo. Después del criterio, los procedimientos estadísticos adquieren vital importancia para obtener esta categoría de validez. Incluso para un mejor análisis es conveniente contar con el dispersigrama o scatergrama o “nube de

Jaime Aliaga 101

puntos” (gráfica del coeficiente de correlación entre las puntuaciones del test “X” y las del criterio “Y”). (3) Validez Concurrente.- ¿Permiten las puntuaciones del test la valoración de ciertos hechos presentes? Para estimarla se administra el test y se le correlaciona con el criterio. La diferencia con la validez predictiva se da en dos aspectos: a) las medidas del test y del criterio son obtenidas contemporáneamente, y b) en su uso principal. Respecto a esto último, se la utiliza principalmente para obtener tests como sustitutos de otros procedimientos menos convenientes por diversas razones. Ejemplos: un test de inteligencia colectiva se compara con uno de inteligencia individual. Los diagnósticos de lesiones cerebrales basados en el test de diseños de bloques (cubos de Kohs) se comparan con síntomas neurológicos. El problema principal de este tipo de validez es encontrar tests que sirvan como criterios válidos y confiables. Análogamente a la validez predictiva requiere un amplio domino de las técnicas de correlación y de los procedimientos estadísticos que se utilizan en su obtención. Junto con la validez predictiva es importante en ciertos problemas de psicología aplicada como en psicología clínica, psicología educacional, psicología industrial y en general, en la toma de decisiones que debe hacer el psicólogo en situaciones de selección, clasificación, hospitalización, etc. (4) Validez de Constructo.- El constructo viene a ser un concepto hipotético que forma parte de las teorías que intentan explicar la conducta humana: inteligencia, creatividad, dependencia de campo, etc. La validez de constructo es la obtención de evidencias que apoyan que las conductas observadas en un test son (algunos) indicadores del constructo. Este tipo de validez responde a la pregunta "¿cómo se puede explicar psicológicamente la puntuación del test?". La respuesta a esta pregunta puede verse como la elaboración de una “miniteoría” acerca de una prueba psicológica. La lógica de la validez de constructo en muchos aspectos así como en sus métodos, es esencialmente la del método científico. El proceso de validación de constructo implica a partir del establecimiento de deducciones de la teoría: a) Formular hipótesis y relaciones entre elementos del constructo, de éste con otros constructos de la teoría y con otros constructos externos.

Jaime Aliaga 103

En el test de ansiedad, los sujetos evaluados por supervisores y colegas como ansiosos, lograrán mayores puntuaciones que quienes están considerados como no ansiosos (Kline, 1985). Los resultados de los estudios que hagamos realmente no “validan” o “prueban” la teoría completa, puesto que nunca se puede demostrar una “construcción” en forma absoluta; solamente se puede aceptar como la mejor definición de trabajo. Si los resultados son negativos, hay por lo menos tres interpretaciones posibles: a) la prueba puede no medir el “constructo”, b) el marco teórico puede ser erróneo, permitiendo que se hicieran inferencias incorrectas, o bien c) quizá, el diseño del experimento no permitía una prueba apropiada de la hipótesis. La falla del diseño suele ser la falla más fácil de detectar, pero no siempre se puede hallar con facilidad el lugar exacto de la falla. La interpretación ambigua de los resultados negativos es un inconveniente evidente del procedimiento de validación de los “constructos” (Crombach, 1972; Kline, 1985). e) Implicaciones prácticas en la validación de un test. El psicólogo que utiliza un test debe tener en cuenta lo siguiente: a) antes de tomar de decisiones sobre individuos o grupos, debe acumular toda la información disponible acerca del test; b) para la predicción o selección, el test debe estar validado en la situación específica donde se va utilizar; c) en cualquier situación, el psicólogo debe tener presente que nuestras ideas sobre la naturaleza de los rasgos y sobre todo lo que miden se modifica constantemente con nueva información hacer

MÉTODOS EMPLEADOS PARA ESTIMAR LA VALIDEZ DE CONSTRUCCIÓN

a) Métodos intrapruebas , cuyas fuentes de evidencia más usadas son: la validez de contenido de la prueba, el análisis de los procesos psicológicos empleados al responderla (p. e., pidiendo que los sujetos “razonen” en voz alta sus respuestas). Otras técnicas estudian la estructura interna de la prueba, mediante el análisis de los ítemes y las correlaciones entre los diferentes subtests; asimismo, también mediante el establecimiento de la homogeneidad a través del coeficiente alfa de Cronbach o los coeficientes de Kuder-Richardson (que contribuyen a evaluar la unidimensionalidad del test). b) Métodos interpruebas: Utilizan las técnicas del análisis factorial (para evaluar los factores que subyacen en las intercorrelaciones de las

(^104) Psicometría

pruebas estudiadas), la validez congruente (en tanto correlaciona los puntajes de la prueba con los puntajes obtenidos en otra prueba de validez ya establecida), los estudios de validez convergente y divergente- discriminante (propuestos por Campbell). c) El método de los estudios relacionados con los criterios : Que implican la diferenciación de grupos (evaluando la capacidad de la prueba para poder diferenciar dos o más grupos naturalmente separados o diseñados experimentalmente) y los coeficientes de validez (cuando la prueba es aplicada a un grupo de sujetos en los que se estudian criterios relacionados con el constructo teórico estudiado). d) El método de la manipulación experimental: Se manipula experimentalmente una variable y se observa sus efectos sobre los puntajes de una prueba psicológica o la relación de estos puntajes con algún criterio. e) El método de los estudios de la capacidad de generalización: Estos estudios analizan sistemáticamente la prueba psicológica en una amplia gama de dimensiones o en condiciones diferentes de administración (p. e., la matriz multirasgo-multimétodo propuesta por Campbell y Fiske).

Teoría de respuesta al ítem (TRI)

Llamada también Teoría del Rasgo Latente , es un modelo probabilístico que permite conocer la información proporcionada por cada ítem, y así crear tests individualizados, es decir, a medida. Es un modelo complejo que se ha popularizado como modelo de Rasch (1980) (aunque específicamente el modelo de Rasch es un parámetro de la dificultad del ítem), pero existe también el modelo de dos parámetros, que tiene en cuenta también la discriminación o pendiente de la curva, y el de tres parámetros que tiene en cuenta el factor azar en la respuesta a ítemes de alternativas múltiples (Cortada de Kohan, 1999). La diferencia principal entre el modelo de la Teoría Clásica de los Test y este modelo es que la relación entre el puntaje observado y el rasgo o la aptitud en la teoría clásica es de tipo lineal (PD = PV + e: puntaje directo del sujeto es igual a su puntaje verdadero más el error); mientras que en los diversos modelos de la TRI las relaciones son funciones de tipo exponencial, principalmente logísticos. Los postulados básicos de la TRI son:

El resultado de un examinado en un ítem puede ser explicado por un conjunto de factores llamados rasgos o aptitudes simbolizados por θ.