Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Evidencias de Validez: ¿Mide el Test lo Que Afirma?, Transcripciones de Psicometría

En este documental se discute la importancia de las evidencias de validez en el contexto de los tests psicométricos. Se explica que la validez es la capacidad de un test medir lo que afirma medir según un modelo teórico. Se presentan diferentes tipos de evidencias de validez, tanto internas (teóricas) como externas (prácticas), y se discuten métodos para verificarlas, como el análisis factorial, la metodología de grupos contrastados, estudios evolutivos y clínicos, y las matrices multimetodo multirasgo. Se destaca la importancia de evaluar la validez de un test para garantizar su fiabilidad y precisión.

Tipo: Transcripciones

2022/2023

Subido el 06/02/2024

monica-marambio
monica-marambio 🇦🇷

7 documentos

1 / 12

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
2
Teórico 6.
EVIDENCIAS DE VALIDEZ
Evidencias de Validez. Definición general. Evidencias de validez de contenido y de constructo.
Evidencias de validez aparente y empírica. Otros tipos y subtipos de evidencias de validez.
Adaptaciones regionales de los tests.
Soy un psicólogo evaluador, y debo realizar una evaluación psicológica con un sujeto según el
motivo de consulta, ¿Qué batería debería emplear? Si incluyo o no un test de acuerdo con un
árbol de decisiones ¿Cómo juzgamos la calidad psicométrica de un test?
1) ¿Qué constructo o variable evalúa un test? ¿Según qué modelo teórico? si esa variable sirve
para ese motivo de consulta, para responder parcialmente y si ese modelo teórico tiene
suficientes evidencias en cuanto a su capacidad para explicar el comportamiento real de las
personas y x su puesto si es coherente con nuestras propias adhesiones teóricas. Si es negativo
buscamos otro test, si es positivo debemos responder:
2) ¿A qué tipo de sujeto se destina ?
A niños, adolescentes, adultos, con patología sin patología, etc. ¿Si coincide esas
características con el tipo de personas que yo debo evaluar?
3) ¿Con que adaptación regionales cuenta el test? ¿Ha sido adaptado a nuestra población y de
manera reciente? Tenemos q tener baremos q hayan sido calculados sobre sujetos
homogéneos en características sociodemográficas y de hábitat, respecto del sujeto q tenemos
q evaluar, sino q además esas adaptaciones regionales deben incluir que todas las
características psicométricas técnicas del test (hoy solo hablamos de validez) hayan sido
analizadas en investigaciones científicas debidamente realizadas en la población en la q ese
sujeto pertenece xq si nosotros estamos examinando resultados de investigaciones sobre el
uso de éste test en sujetos de otros contextos culturales, se puede cometer errores gravísimos,
de evaluación o de diagnóstico, xq las variables psicológicas están atravesadas x la cultura.
4) ¿Discrimina diferencias individuales?
Es capaz de captar las peculiaridades en esa variable o constructo que evalúa en ese sujeto
especifico y particular o generaría informes prácticamente iguales a los de cualquier otra
persona, x ejem diría el test q ésta persona afronta conflictos psicológicos? Eso lo podemos
decir de todo el mundo ¿verdad? Ese es un test q no discrimina.
Los test tienen q dar algún tipo de información única sobre éste sujeto para tener sentido.
5) ¿Me permite obtener resultados confiables?
Puedo tener confianza en el resultado numérico que puede ser cualitativo, o cuantitativo u
ordinal o semicuantitativo
6) ¿Cuenta con evidencias sobre la validez de los resultados que arroja?
Solemos decir q el test es válido, cuidado con esto. Desde los años 90 se dejó de hablar de una
validez del test, una vez q se determinó la validez en una población en un momento histórico
dado, ese test sería válido para siempre y para cualquier población "ERROR" gravísimo. Tanto
las evidencias de validez como de confiabilidad, como los baremos, y como la capacidad
del test para captar diferencias individuales varían según la población que estemos
analizando, x lo tanto no hablamos más de variabilidad de un test como algo estático/fijo. Esas
evidencias de validez deben resultar de investigaciones que deben renovarse por parte de
pf3
pf4
pf5
pf8
pf9
pfa

Vista previa parcial del texto

¡Descarga Evidencias de Validez: ¿Mide el Test lo Que Afirma? y más Transcripciones en PDF de Psicometría solo en Docsity!

Teórico 6.

EVIDENCIAS DE VALIDEZ

Evidencias de Validez. Definición general. Evidencias de validez de contenido y de constructo. Evidencias de validez aparente y empírica. Otros tipos y subtipos de evidencias de validez. Adaptaciones regionales de los tests. Soy un psicólogo evaluador, y debo realizar una evaluación psicológica con un sujeto según el motivo de consulta, ¿Qué batería debería emplear? Si incluyo o no un test de acuerdo con un árbol de decisiones ¿Cómo juzgamos la calidad psicométrica de un test?

  1. ¿Qué constructo o variable evalúa un test? ¿Según qué modelo teórico? si esa variable sirve para ese motivo de consulta, para responder parcialmente y si ese modelo teórico tiene suficientes evidencias en cuanto a su capacidad para explicar el comportamiento real de las personas y x su puesto si es coherente con nuestras propias adhesiones teóricas. Si es negativo buscamos otro test, si es positivo debemos responder:
  2. ¿A qué tipo de sujeto se destina? A niños, adolescentes, adultos, con patología sin patología, etc. ¿Si coincide esas características con el tipo de personas que yo debo evaluar?
  3. ¿Con que adaptación regionales cuenta el test? ¿Ha sido adaptado a nuestra población y de manera reciente? Tenemos q tener baremos q hayan sido calculados sobre sujetos homogéneos en características sociodemográficas y de hábitat, respecto del sujeto q tenemos q evaluar, sino q además esas adaptaciones regionales deben incluir que todas las características psicométricas técnicas del test (hoy solo hablamos de validez) hayan sido analizadas en investigaciones científicas debidamente realizadas en la población en la q ese sujeto pertenece xq si nosotros estamos examinando resultados de investigaciones sobre el uso de éste test en sujetos de otros contextos culturales, se puede cometer errores gravísimos, de evaluación o de diagnóstico, xq las variables psicológicas están atravesadas x la cultura.
  4. ¿Discrimina diferencias individuales? Es capaz de captar las peculiaridades en esa variable o constructo que evalúa en ese sujeto especifico y particular o generaría informes prácticamente iguales a los de cualquier otra persona, x ejem diría el test q ésta persona afronta conflictos psicológicos? Eso lo podemos decir de todo el mundo ¿verdad? Ese es un test q no discrimina. Los test tienen q dar algún tipo de información única sobre éste sujeto para tener sentido.
  5. ¿Me permite obtener resultados confiables? Puedo tener confianza en el resultado numérico que puede ser cualitativo, o cuantitativo u ordinal o semicuantitativo 6) ¿Cuenta con evidencias sobre la validez de los resultados que arroja? Solemos decir q el test es válido, cuidado con esto. Desde los años 90 se dejó de hablar de una validez del test, una vez q se determinó la validez en una población en un momento histórico dado, ese test sería válido para siempre y para cualquier población "ERROR" gravísimo. Tanto las evidencias de validez como de confiabilidad, como los baremos, y como la capacidad del test para captar diferencias individuales varían según la población que estemos analizando , x lo tanto no hablamos más de variabilidad de un test como algo estático/fijo. Esas evidencias de validez deben resultar de investigaciones que deben renovarse por parte de

diferentes equipos de investigación sobre el estudio de ese test en muestras supernumerarias de sujetos pertenecientes al contexto cultural a donde pertenece el sujeto que yo necesito evaluar. Si eso no está en el manual sería un test poco serio, no científico, de los divertidos de Facebook. Evidencias de validez implican que son resultados de investigaciones que deben renovarse periódicamente en cada grupo poblacional en donde yo necesito usar el test. Si el evaluado vive en Bs As y tiene 27 años, el test y sus estudios debieron realizarse sobre muestras de sujetos de esas edades y lugar.

Video 2

Evidencia de validez:

Supongamos que compre entradas para ver un grupo que me gusta, resulta que la entrada se la compre a un amigo que no pudo ir mi duda es, ¿ la entrada es valida, o voy a rebotar en la puerta? De manera similar, ¿de que hablamos cuando hablamos de evidencias de validez? Nos referimos a la pregunta, si un test, mide lo que dice medir, según un modelo teórico, De la misma manera, nos podemos preguntar si la entrada es válida de acuerdo con el propósito que tiene que es lograr que yo entre a ese recital, a ese concierto, según determinadas cuestiones que la entrada debe tener, seria el equivalente de ese modelo teórico, como para establecer un paralelo, podemos pensarlo de esta manera Es la respuesta a la pregunta acerca de si un test mide lo q dice medir según un modelo teórico -La definición general: La definición de validez es, aquella que me remite a la pregunta “’¿el test, mide el constructo o variable que dice medir, según el modelo teórico que afirma, o con el que afirma medir ese constructo o variable en este grupos de sujetos, en este grupo poblacional con tales características sociodemográficas? *Evidencia de validez ¿Por qué habría dudas de si un test mide lo q dice medir según un modelo teórico? Porque los test se llaman test de inteligencia de fulano, test de ansiedad de mengano,test de psicopatología de sultano, test de adaptación al estrés de X persona. En general tienen el nombre de la variable que ese test dice evaluar, el autor obvio dirá que es el mejor test, hay q tener en cuenta que no podemos confiar en el autor o editorial, es por eso que debemos revisar esas evidencias de validez de modo tal que en el manual del test esté reportado uno por uno, los aspectos de esas evidencias de validez que fueron verificados en esas investigaciones científicas que fueron debidamente revisadas en sujetos con características sociodemográficas homogéneos al sujeto que yo debo evaluar, pertenecientes al mismo grupo de población, ¿Qué evidencias debo revisar? Las evidencias de validez de los test tienen relaciones. *Las evidencias de validez de contenido o constructo: son teóricas o internas al instrumento. El resto de los tipos de validez empírica o de criterio interno que se divide en, concurrente y predictiva (retrospectiva también hay) la aparente o de facie o ecológica (distintas de las teóricas) Clasificarlas como aspecto de la evidencia de validez de tipo empírico o externas al test en sí mismo (validez externas al test). Entre la intersección entre las teóricas y las empíricas encontramos CONVERGENTES Y

DIFERENTES TIPOS DE EVIDENCIAS DE VALIDEZ:

Evidencias internas al test o vinculadas a cuestiones TEORICAS en las q estaban las EVIDENCIAS DE VALIDEZ DE CONTENIDO o las EVIDENCIAS DE CONSTRUCTO O TEORICAS propiamente dichas y las EVIDENCIAS DE VALIDEZ MAS EMPIRICAS o prácticas o pragmáticas que hacen más al uso del test, también conocidas como EVIDENCIAS DE VALIDEZ EXTERNAS. En la intersección entre las internas y las externas teníamos las CONVERGENTES Y DIVERGENTES.

EVIDENCIAS DE VALIDEZ DE CONTENIDO:

ASPECTO DEL CONTENIDO o JUICIO EXPERTO en este caso son SINONIMOS. ¿El contenido de los ítems del test es coherente con el modelo teórico? ¿Se interroga por todas las dimensiones del modelo? DIMENSIONES: Un constructo o concepto teórico suele ser sumamente complejo, no se puede hablar de constructo unidimensionales. Ejem la personalidad tendría muchísimas dimensiones, que podemos considerar en su interior, lo mismo q la inteligencia. Pero vamos a una variable más sencilla, una construcción más sencilla, La ansiedad, posee tres dimensiones, según un autor, tres aspectos de un constructo o variable que podríamos diferenciar: 1, 2, 3 ¿cuáles son éstas dimensiones? Para la ansiedad según éste autor tendríamos la dimensión COGNITIVA, FISIOLOGICA, y MOTRIZ. Podemos decir que cuando la persona incrementa sus niveles de ansiedad manifiesta indicadores que denotan esa suba de ansiedad en el nivel cognitivo, es decir ideación, (el famoso pensar, pensar, pensar) a nivel fisiológico; transpirar las manos, subir la presión arterial, se pone pálido o colorado, taquicardia etc., y la tercera dimensión es la motriz, que podría ser comernos las uñas, comer galletitas, cigarrillos, ninguna es excluyente, van JUNTAS las tres manifestaciones, habrá q predomine una de la otra, pero las tres forman parte del constructo, así es como éste modelo teórico concibe el constructo ansiedad formado por 3 dimensiones. ¿El constructor de los ítems es coherente con el modelo teórico? Este modelo prevé tres dimensiones para la ansiedad, los ítems preguntan por las 3 dimensiones del modelo? O preguntan por 2 y se olvidan de 1 o preguntan demasiado por una y se olvidan del resto? Un grupo DE EXPERTOS nos dice si estamos haciendo bien o no. Si el test es de ansiedad, expertos en ansiedad ; clínicos de la psicología o psiquiatría, pacientes con ansiedad, o sus familiares, se convoca por lo general a 5 EXPERTOS, se necesita un grupo no demasiado grande ni pequeño, y q sean IMPARES, para q no haya empate, estos reciben de manera independiente, no se consultan entre ellos, cada uno evalúa de manera independiente, reciben un resumen del modelo teórico, éste modelo descripto por 3 dimensiones (lo cognitivo, motriz, fisiológico) y por el otro lado los ítems. Deben decidir cada ítems que le estamos enviando en el archivo si está midiendo según el modelo la dimensión cognitiva, fisiológica y motriz, si está midiendo las 3, o 2 de ellas no nos sirven, xq los ítems deben ser claros, y estamos preguntando de a un indicador a la vez, aquellos ítems q sean confusos van a ser eliminados, los q no estén preguntando por ninguna de las dimensiones serán eliminados, los expertos nos dirán, si lo q estamos preguntando por cada dimensión es suficiente o estamos olvidando algo, o estamos minusválorando algo. Esto hace q el test reciba el PRIMER FILTRO DE CALIDAD, se mira la adecuación del contenido de los ítems, es decir lo q estamos preguntando respecto de las dimensiones previstas por el modelo.

El segundo tipo de VALIDEZ DE CONSTRUCTO O VALIDEZ TEORICA; los aspectos de validez relacionado con el constructo o evidencia de validez teórica ¿El test es una adecuada personalización del constructo teórico? ¿Verifica en el plano empírico loq la teoría afirma? OPERACIONALIZACION: un test es una operacionalización de un constructo teórico teorizado según un modelo y los ITEMS del test, SON las unidades más pequeñas, son indicadores empíricos medibles que darían cuenta de la presencia o ausencia de ese constructo teórico de una persona o de su grado o de cuantía, de modo tal entonces que las EVIDENCIAS DE VALIDEZ DE CONSTRUCTO apuntan a verificar si ese test es adecuado en términos de operacionalizacion de ese constructo de los indicadores que aporte ese test para medir ese constructo y en SEGUNDO lugar si ese test sirve para verificar en el plano empírico o comportamental de la conducta humana, aquella hipótesis teórica que esos modelos sostienen ¿ con que metodologías alternativas podemos analizar esa VALIDEZ de CONSTRUCTO? Son 4! **1) ANALISIS FACTORIAL

  1. LA METODOLOGÍA DE GRUPOS CONTRASTADOS
  2. LOS ESTUDIOS EVOLUTIVOS Y CLINICOS
  3. LAS MATRICES MULTIMETODO (MM) MULTIRASGO (MR)**

1) Análisis factorial:

Parece una planilla de Excel, son las entradas de los ítems y los datos sociodemográficos de una muestra de un sujeto , acá hay 23 casos en pantalla, pero para un trabajo de análisis de EVIDENCIAS DE VALIDEZ, trabajamos con más casos, miles de sujetos, y cada una de las columnas verticales representan, primero cuestiones sociodemográficas y luego los ítems del test, y como se responden en cuanto a cuestiones digamos las respuestas se traducen en indicadores numéricos tal como vimos en la clase uno. Lo que se hace en el ANALISIS FACTORIAL es correlacionar todas las respuestas de los ítems del test brindadas por todos los sujetos de la muestra con todo el resto de las respuestas a los siguientes test, brindadas por el resto de los sujetos de la muestra, es decir q se hace una matriz de correlación entre toda la información q tenemos en ésta base de datos p determinar mediante el uso de las correlaciones, como se agrupan las distintas dimensiones o factores que ese test obtiene como resultado ya no de hipótesis teóricas, sino ya de las respuestas que los sujetos reales que compusieron esa muestra dieron al test esas correlaciones, nos indican el grado de asociación o correlación entre variables, cuando un grupo de ítems se agrupan, xq los reúnen correlaciones altas ya sean positivas o negativas, significan q tienen un parecido entre sí, en cuanto al estilo de respuesta que los propios evaluados brindaron, si la cantidad de factores obtenidas en ese ANALISIS FACTORIAL coincide con el número de dimensiones previstas por la teoría y exactamente cada uno de esos factores remiten a aquellos ítems que darían cuenta de cada una de las dimensiones, entonces el ANALISIS FACTORIAL estaría mostrando que el test mide las dimensiones que el constructo teórico propone medir según ese modelo y a la vez sirve como evidencia que ese modelo explica bien el comportamiento de las personas en ese sentido, volviendo al ejemplo del video anterior el concepto de ansiedad que tiene 3 dimensiones (cognitivo, fisiológico, motriz) que deberíamos encontrar para verificar q el test es una buena operacionalización de ese modelo y a la vez que ese modelo explica bien el comportamiento de las personas cuando experimentan ansiedad, deberíamos encontrar 3 factores o dimensiones en el comportamiento de las respuestas que los sujetos dieron gracias al método del ANALISIS FACTORIAL que recomendamos leer en la bibliografía!! Deberíamos encontrar 3 factores, un grupo de ítems que mide la dimensión cognitiva, otro que mide lo

evalúan variables relacionadas, mediante multiplicidad de métodos, no con un solo test, sino con variables mediante test que la midan, se trabaja entonces con multimetodos para multirasgo es decir atributos relacionados entre si, se arma algo parecido al ANALISIS FACTORIAL, pero en éste caso no con un solo test sino con multiplicidad de test, q miden distintas variables teóricamente relacionadas y se hacen correlaciones múltiples, se calculan matrices de correlaciones y se busca verificar si las hipótesis que los modelos teóricos que lo sustentan, las descripciones de esos constructos q estamos midiendo aquí se ven verificadas efectivamente en la práctica, es decir en el nivel EMPIRICO mediante las respuestas de los sujetos a los diversos test q hemos usado para medir esas variables teóricas y prácticamente relacionada.

Video 6

Evidencias de Validez (último video sobre evidencias de validez

de constructo o teórica)

Habiendo visto las metodologías que solemos emplear los investigadores para evaluar, para analizar evidencias de validez de constructo, y a la luz de los videos anteriores y la bibliografía consultada, que pedimos que lean repetidamente porque es un tema bastante complejo, podemos decir para finalizar que los análisis de validez de constructo tienen propósitos teóricos, porque de algún modo estudian si el test es una buena operacionalización del modelo. Es decir que, se refieren al test, a la coherencia entre test y modelo (por eso decimos que son teóricas). Pero también se refieren al modelo porque indirectamente sirven para brindar evidencia a favor de verificar las hipótesis sostenidas por ese modelo, o para refutarlas. Por eso decimos que tiene propósitos teóricos. Además de llamarlas evidencias de validez interna, junto con las evidencias de validez de contenido, este tipo de evidencias de validez de constructo se llaman internas porque no utilizamos nada externo al test para analizarlas. Contempla diferencias culturales, porque es importante que estos estudios se renueven cada vez que el test se importa a un contexto cultural diferente, ya sea que se trate de contextos radicalmente distintos (de un país a otro, de un continente a otro), pero también dentro de un mismo país: diferentes regiones geográficas, diferentes subgrupos culturales, diferentes franjas etarias, etc. a su vez se divide en dos subtipos, lo vimos en el esquema del principio: validez de constructo convergente y divergente. La validez convergente o las evidencias de validez convergentes tienen que ver con todas aquellas evidencias que remitan a variables o dimensiones de variables que converjan, es decir, que se muevan en el mismo sentido, que cuando una aumente, la otra aumenta, cuando una disminuye, la otra disminuye. Divergentes son aquellas variables que debieran estar inversamente relacionadas se muestren no-relacionadas, o relacionadas de manera inversa, es decir, divergentemente. Por ejemplo, ¿qué dimensiones podrían mostrar que son divergentes al interior de un constructo? Por ejemplo, en el trastorno bipolar, la manía y la depresión son divergentes porque un mismo sujeto, aunque puede sufrir episodios maniacos y episodios depresivos, no lo sufre en el mismo momento, sino que los sufre en distintos momentos. Es decir, una persona con trastorno bipolar debería puntuar, en un test que mida ambas dimensiones, si está en una fase depresiva, puntuar alto en depresión y bajo manía, y si está en la fase maniaca, a la inversa. En cambio, la validez convergente o las evidencias de validez convergente desde el punto de vista teórico apuntaría a que dimensiones de un constructo que están relacionadas deberían moverse en el mismo sentido, es decir que se encontraría un correlación o alta covariación entre dimensiones que, si deberían moverse juntas, ambas hacia arriba, ambas hacia abajo. Por ejemplo, la dimensión obsesiva suele ser bastante

convergente con síntomas fóbicos. Estas dos configuraciones patológicas suelen ser bastante convergentes. Entonces, en un mismo test que mida ambas, deberían estar ambas presentes, moviéndose en el mismo sentido. Esto que estoy comentando, lo estoy comentando en un sentido general y muy poco preciso, y recomendamos fuertemente revisarlo en la bibliografía teórica, porque en pocos minutos es muy difícil poder transmitirlo. Para otros autores, la convergencia y la divergencia de las evidencias de validez no son teóricas, sino que son empíricas. Pero como tenemos discrepancia, y de autor en autor se ubican del lado teórico o del lado empírico, por el momento las vamos a dejar del lado teórico. La convergencia tiene que ver con factores o dimensiones que pueden moverse juntos y que hasta podrían unirse en un solo factor o dimensión, y la divergencia tendría que ver con factores que, si bien correlacionan, y tienen algún tipo de relación entre sí, se mueven de manera relativamente más independiente, como podría ser en un trastorno bipolar la manía y la depresión. A la vez, los estudios de evidencias de validez de constructo, además de tener propósitos teóricos, porque buscan validar la calidad del test en cuanto a operacionalización de un modelo, y validar el modelo en cuanto a verificar si sus hipótesis teóricas se verifican en la práctica, también tienen propósitos aplicados. Estos estudios de validez de constructo sirven también a los fines de la discriminación, como veíamos en la metodología de grupos contrastados. Por ejemplo, un test de depresión debería servir para discriminar, en un grupo de población, a sujetos depresivos de sujetos no depresivos. Ahí tendríamos también un propósito aplicado adicional a los propósitos teóricos que estos estudios tienen con respecto al test, al modelo y a los usos prácticos del test, en cuanto a su capacidad para discriminar o diferenciar diferencias individuales, valga la redundancia. Por último, podemos recordar que nos preguntábamos sobre si el test era una adecuada operacionalización del constructo teórico, y si verificaba en el plano empírico las hipótesis sostenidas por el modelo teórico. En este tipo de estudios de validez, que son los estudios de validez de constructo. Fíjense que acá lo que se hace es verificar si el comportamiento de personas reales respondiendo a un test mediante distintas metodologías verifica las hipótesis del modelo, mientras que, en el aspecto anterior, que era la validez de contenido, lo que se examinaba era si el contenido de los ítems del test representabantodos los ítems posibles , o todas las preguntas posibles que les podemos hacer una persona para examinar un constructo o variable del universo de preguntas posibles que tenemos a disposición. Atención con esto último, vuelvan a escucharlo, búsquenlo en la bibliografía y traten de diferenciar estos dos tipos de evidencias de validez, la de contenido y la de constructo, que si bien son ligeramente distintas, se relacionan porque ambas son teóricas o internas al test, pero se diferencian en cuanto a las metodologías con las que las trabajamos y están dirigidas a verificar cosas relacionadas pero no exactamente iguales. Para no aburrirlos más, dejamos acá y vamos a pasar a las evidencias de validez más relacionadas con cuestiones empíricas o prácticas, con los usos prácticos del test, o evidencias de validez externas. Consulten la bibliografía porque este es el punto más complejo del programa.

Video 7.

Sobre Evidencias de Validez de un Test Psicométrico

Habíamos revisado los dos tipos de validez interna o vinculada con la teoría, y ahora vamos a pasar a los tipos de validez que se relacionan más con cuestiones empíricas o de propósitos aplicados, también llamados “tipos externos”.

Vamos a comenzar por la empírica o de criterio , que se divide en concurrente y

predictiva, y

Algunos autores llaman a este tipo o aspecto de la validez empírica, en lugar de llamarla concurrente la llaman convergente. De ahí, que en un video anterior decíamos que algunos autores atribuyen el termino convergente a aspectos teóricos de la variable y otros a aspectos empíricos. Esto depende del autor, pero ustedes pueden usar los términos convergente o concurrente de modo indistinto, y ambos son correctos. Vamos a ver ahora la validez predictiva. También es una validez empírica o de criterio porque utiliza un criterio externo al test, pero no ya es un criterio que mida la misma variable, como en la validez concurrente, sino, mide otra variable teóricamente relacionada con la variable que mide el test. La pregunta es si el test es capaz de predecir otra información, relacionada con otra variable, que está vinculada teóricamente con la variable que mide el test. Hicimos un trabalenguas un poco dudoso. Pero en realidad la pregunta también apunta a si el test es capaz de predecir otra información sobre otra variable relacionada con la variable que el test mide. La palabra predicción aquí no es la más feliz, porque la palabra predicción lo hace pensar a uno en el futuro, y no necesariamente. En realidad, la pregunta es si el test es capaz de explicar el comportamiento de otra variable, que no es la variable que mide el test, midiendo con el test otra variable distinta, una variable distinta, que esta teóricamente relacionada con aquella que queremos explicar. Probablemente no entendieron nada, pero vamos a poner un ejemplo para que se entienda. Habíamos usado el test de Bender para validez concurrente. Se tomaba el test de Bender y se tomaba un criterio externo que media lo mismo, para ver si había concurrencia. Si la correlación era alta, significaba que ambas median prácticamente lo mismo, y que, entonces eso le daba un respaldo al test de Bender y una medida era reemplazable por la otra. En la predictiva, en cambio, podemos apoyarnos en que Lauretta Bender de base que era que la maduración viso motriz de un niño en edad escolar temprana, es decir su capacidad para percibir Gestalt y copiarlas y reproducirlas de manera reconocible como tales, como esas Gestalt, estaba relacionada con su capacidad futura para el aprendizaje de la lecto-escritura. Entonces, si un niño es capaz a los 5 o 6 años, de percibir y copiar una Gestalt de manera coherente con esa percepción o con ese estimulo que está copiando, en teoría debería ser capaz de comprender configuraciones gestálticas similares como pueden ser las letras y las palabras, y por ende estaría lo suficientemente maduro como para comenzar el aprendizaje de la lecto-escritura. Entonces, se hizo un estudio en donde se administró el test de Bender a los niños el primer día de clases de primer grado, cuando todavía no habían aprendido a escribir. Ese test de guardo durante dos años, en donde esos niños recibieron el entrenamiento habitual en lecto-escritura. Luego de esos dos años, se pidió a sus docentes que evaluaran a los niños, no en maduración viso motriz, sino en cuanto habían aprendido, y con qué calidad habían aprendido la lecto-escritura. Resulto que la correlación entre la medida tomada con el test dos años antes y el aprendizaje en lecto-escritura logrado por los niños tenía una correlación del 0,75, es decir, era capaz de predecir en un 75% ese test de Bender tomado en un momento A, lo que pasaba con esa variable de lecto-escritura en un momento B. Es decir que el test que mide la variable A es capaz de predecir o explicar el comportamiento de la variable B, que por supuesto tiene que estar teóricamente relacionada. ¿Para qué nos sirve esto en el sentido práctico, en el aplicado? Nos sirve para poder estar seguros, a partir de investigaciones previas, o tener cierto margen de certeza, que si un niño tiene un buen rendimiento en el test de Bender antes de ser entrenado en la lecto-escritura, es probable que no tenga dificultades en su aprendizaje a futuro. La validez predictiva no necesariamente implica una predicción a futuro, sino la explicación del comportamiento de una variable a partir de otra. Se puede trabajar en el futuro, o prácticamente en el mismo momento. Si es simplemente la capacidad o potencia de una medición, en este caso el test, para predecir el comportamiento de otra variable que está teóricamente relacionada con este test.

No todos los test tienen estudios de validez predictiva, porque no todos los tests son capaces de predecir el comportamiento de otra variable, y no todas las variables son capaces de ser predichas. Si todos los tests deben tener estudios de validez concurrente. En el caso de la validez de criterio, concurrente, predictiva y retrospectiva (cuando la lean), el propósito de estos estudios es aplicado o empírico porque nos dice a quienes usamos estos tests, en la práctica, qué tipo de información nos dan o que tipo son capaz de preveer o predecir, y siempre se utiliza en el estudio el test y un criterio externo:

  • que mida lo mismo si es concurrente o convergente
  • que mida una variable teóricamente relacionada si es predictiva

Video 8

Sobre Evidencias de Validez de un Test Psicométrico

Los dos últimos tipos de validez externa o relacionada con cuestiones empíricas: Evidencia de validez aparente o de facies (validez rostro/cara) → (algo bastante sencillo de obtener) se pregunta sobre si el test aparece válido a los ojos del sujeto. Esto por ejemplo lo podemos ver en tests originalmente diseñados para niños, y que se extiende su administración a edades superiores, complejizando la dificultad de los ítems. Pero los materiales de los ítems más fáciles, por ejemplo en un test de inteligencia, siguen siendo adecuados para niños pequeños. Imagínense si a un adolescente le presentamos un test donde en los primeros ítems tiene que contar pollitos, o tiene que identificar un autito o un avioncito (no va a ser la misma la presentación de un test para un niño que para un adolescente- imaginar la actitud hacia los evaluadores y hacia el test, quizás no den el mejor raport si no consideran que la presentación sea la adecuada). Cómo se estudia→ en el estudio piloto (confiabilidad) y en las adaptaciones regionales y contextuales. El estudio piloto (ver clase de confiabilidad, último video) se habla de los distintos pasos para construir un instrumento psicométrico, es una de las primeras operaciones que se hace sobre el test cuando todavía este no tiene su forma definitiva, estudiándolo con una muestra pequeña de sujetos, en este caso sujetos homogéneos a las características que pueden tener los sujetos que pueden ser evaluados con ese test, se les administra el test de manera habitual, y luego se les pide que hagan criticas acerca de que dificultades tuvieron con la consigna, con los materiales, con el estilo de respuesta, el tiempo límite si lo hay, etc. en base a esas observaciones se corrigen todas estas cuestiones, tanto lingüísticas (en un sentido verbal y un sentido icónico, como cuestiones de apariencia del test, que lo hagan válido a los ojos del sujeto, sin hacer ninguna investigación demasiado profunda ni cálculos estadísticos complejos, sino lo adecuamos para que el sujeto tenga la mejor actitud y el mejor raport. Cuando también se vulnera la validez aparente o de facies cuando éste instrumente aparece en las redes, en una revista, y cuando el que va a ser evaluado, se encuentra con lo mismo que ya leyó antes (se violan cuestiones de copyright); no va a tener mucha confianza ni en la evaluación ni en el evaluador. ❖ Evidencia de validez ecológica→ es sencillo en la cuestión de que pregunta si el test está adaptado a las diferentes poblaciones y a diferentes contextos o ámbitos de trabajo. Es decir, si el test que fue originado en la Ciudad de Buenos Aires y debe ser utilizado en la provincia de Córdoba está adaptado a la población cordobesa, si está adaptado a diferentes contextos o ámbitos. Si es un test creado con propósitos clínicos y se puede utilizar en el ámbito laboral o en el ámbito forense, si está adaptado también mediante investigaciones