






Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
La propiedad de validez de los tests y cómo se relaciona con la fiabilidad y la longitud del test, así como cómo se puede estimar la validez predictiva utilizando la regresión lineal múltiple. Además, se discuten conceptos relacionados como el coeficiente de determinación ajustado y la multicolinealidad.
Tipo: Apuntes
1 / 12
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!







· La validez es una propiedad de los datos, no del test: es una propiedad contextual. · La validez es la capacidad de predecir una conducta vinculada a otra. · La validez se cuantifica usando el Coeficiente de Validez: es un coeficiente de correlación entre “algo” y otro “algo” que quiero predecir. El Coeficiente de Validez es una versión del coeficiente de correlación de Pearson. · Se considera la relación entre un test y una conducta a predecir como una relación lineal.
FACTORES QUE INFLUYEN sobre el COEFICIENTE DE VALIDEZ de un TEST.
En el proceso de medición al aplicar un test, hay cosas que influyen sobre el coeficiente de validez de los datos obtenidos. Son:
La fiabilidad de los datos obtenidos establece un techo, un límite, para la validez. Este se expresa en la Correlación entre un test y un criterio; éste siempre será menor o igual que el producto de las raices de las correlaciones del test y del criterio.
Ese techo o límite puede generalizarse a casos en los que quiera valorar la validez al modificar las fiabilidades:
de modificar sus fiabilidades; es decir, con su fiabilidad original.
es decir, con su fiabilidad modificada.
modificar sus fiabilidades.
·· Si al modificar la fiabilidad del test y/o del criterio esta fiabilidad modificada (2) es mayor que la original (1) sabremos que la fiabilidad del test ha aumentado y con ella habrá aumentado también su validez. Al contrario, si disminuye la fiabilidad del test y/o del criterio, disminuirá también la validez del test.
·· Hay tres casos particulares dignos de mención:
·1· En los casos en los que esté midiendo el rendimiento de los sujetos en un área determinada este rendimiento será el criterio. Y en este caso, no se permite modificar la fiabilidad del criterio. En estos casos, sólo podré modificar la fiabilidad del test, y asumiré que la fiabilidad inicial (1) del criterio y la final (2) son las mismas:
·2· Otra cuestión interesante es plantearse que pasaría con la fiabilidad si pudieramos eliminar todos los errores de medida en el test y en el criterio. En la práctica nunca podría
lograrse, pero teóricamente plantearnos esto sería pensar cuál es el valor máximo que puede tener el coeficiente de validez predictiva; es decir, cúál sería la máxima correlación posible de todas entre el test y el criterio.
·3· Si pudieramos eliminar los errores de medida en el test:
medidas
· La relación entre longitud y validez es lineal; si aumento la longitud del test, del criterio o de ambos también aumentará la validez. Puedo querer aumentar la longitud de ambos o sólo la del test.
· Si quiero modificar la longitud del test y del criterio:
· Si sólo quiero modificar la longitud del test:
VARIABILIDAD / varianza de sus datos. Es un impacto lineal: si aumento la variabilidad, aumentaré la validez predictiva. Sin embargo, este impacto no tiene una fórmula única, sino varias, dependientes del contexto. Por tanto, nosotros no valoraremos cuantitativamente este impacto.
En ocasiones quiero saber la validez que tienen varios predictores (por ejemplo, un conjunto de tests) para predecir un determinado comportamiento / criterio en sujetos de una población.
En esos casos, lo que hago es seleccionar los mejores tests predictores y combinarlos: así, reduzco por ejemplo 40 tests a 5 tests muy predictores y combino esos 5. Para ayudarme a decidir cuales son los tests mejores predictores uso la REGRESIÓN LINEAL MÚLTIPLE:
Por tanto, excluyendo el término error:
y con el término error:
(4º) Y, para finalizar, hago uso, aplico, el modelo que he diseñado con el fín de realizar predicciones individuales.
Sin embargo, en la práctica la valoración de la validez de un conjunto de tests / predictores no se hace a mano sino que la ejecutan algoritmos de ordenador:
A la hora de diseñar un modelo, hay que valorar antes la multicolinealidad que posea éste.
Hay dos métodos para detectar la multico: dependiendo de si queremos detectar la multicolinealidad de todos nuestros predictores (para lo que usaremos el Índice de Condicionamiento) o sólo de uno en concreto (para lo cual podemos usar el Coeficiente de Determinación, el índice de Tolerancia o el Factor de Inflación de la Varianza).
A – El Índice de Condicionamiento / Singularidad.
· Es un indicador GLOBAL: detecta la multico de un conjunto de predictores, pero no señala a cual en concreto afecta.
· A la hora de haber pasado un test, obtenemos un conjunto de dimensiones, que son el conjunto de predictores. Hay, por tanto, tantas dimensiones como predictores.
· Un autovalor es una dimensión de ese test, que expresa además el tamaño de los ejes de referencia. Un eje de referencia es el autovalor con mayor valor de todos.
· Si un autovalor es mayor que el resto inferimos que hay una dimensión dominante y otras dimensiones menores, que son irrelevantes. El Índice de Condicionamiento / de Singularidad de ese conjunto de predictores tendrá un valor alto. Un IC tiene valor alto si es mayor que 30.
· Si no hay ningún autovalor dominante (todos los autovalores son similares) el IC tendrá un valor bajo, con un valor menor a 10.
· En el primero caso, con un autovalor dominante y un IC consecuentemente alto, habrá alta multicolinealidad. Es decir: las correlaciones entre predictores serán altas, lo que significa que éstos no son independientes entre sí. En este caso, no debemos usar el modelo lineal de predicción.
· En el segundo caso, con ningún autovalor dominante / más alto que otro entre el conjunto de predictores y un IC consecuentemente bajo, habrá baja multicolinealidad. Es decir, las correlaciones entre predictores serán bajas, lo que significa que éstos son independientes entre sí y podemos usar el modelo lineal de predicción.
· Este último caso es una situación ideal, casi utópica: lo que predomina a la hora de detectar la presencia o ausencia de multicolinealidad entre varios predictores es encontranos con un IC de valor medio. Es decir, habrá algunos autovalores mayores, pero no demasiado, respecto a otros menores, encontrándonos una multicolinealidad
Imaginemos que estamos usando un determinado test para una investigación y se nos ocurre: “Oye, ¿que validez general tiene este test? ¿Puede calcularse? Para hacerlo, podría calcular el Coeficiente de Validez de todo mi test?”
Pues sí, podría. Lo que tendría que hacer si quiero encontrar la validez general de un test; su validez universal o su “verdadero coeficiente de validez” sería encontrar todos los estudios en los que ese test fue usado y en los que además se hubiera calculado su coeficiente de validez y resumirlos todos en uno sólo.
En un momento dado de la historia psicométrica se propuso que esto se podía hacer, que la forma de hallar la existencia de un posible Coeficiente de Validez General o Universal era realizar estudios de meta-análisis y así poder llegar a saber “el verdadero coeficiente de validez” de cada test.
Sin embargo, se echaron campanas al vuelo. Lo que se halla al resumir todos esos coeficientes de validez en uno solo no es el “verdadero coeficiente” de cada test, sino sólo una estimación más de su validez. Lo único que se hace es resumir la media de los coeficientes de los estudios encontrados.
Lo que se hace, por tanto, a la hora de calcular este Coeficiente de Validez Generalizado ) es asumir que los coeficientes de validez encontrados se distribuyen normalmente / Gaussianamente y:
Debemos pensar que, aunque hayamos calculado lo anterior, cada estudio donde aparezca calculado el Coeficiente de Validez de mi test es un mundo, con características diferentes que muchas veces desconocemos. Por tanto, se hace necesario realizar inferencias sobre el verdadero Coeficiente de Validez de mi test.
Estas inferencias son de dos tipos:
encontrado es realmente la mejor estimación posible del Coeficiente de Validez Verdadero comparando el mayor y el menor coeficiente de validez encontrado.
Y luego calculo un Estadístico de Contraste:
diferente a 0:
Ahora dejamos el estudio de la Validez Predictiva para estudiar aspectos teóricos de la Validez.
Spearmen definió la validez como “la capacidad predictiva”: pero eso no significa que un test mida lo que deba medir; lo único que hace es contribuir a predecir un criterio, nada más.
Para subsanar esta laguna de conocimiento se creó una base teórica para la validez, formándose el concepto de Validez de Constructo. Así, si dicha validez fuera adecuada significaría que mi test está midiendo lo que se supone que debe (y dice) medir. Sin embargo, realmente sólo estamos renombrando el fenómeno, y es que un test con una adecuada validez de constructo tiene que estas referido a una variable relevante; que aporte algo a una determinada conducta: si un determinado constructo / variable es irrelevante, no hay validez ninguna.
La manera, por tanto, de deducir que un constructo es relevante es mediante la pura práctica: si compruebo en la práctica que un determinado constructo es útil en varios estudios diferentes. Esto supone, sin embargo, un proceso circular inacabado: nunca podré saber si un test tiene una adecuada validez de constructo recabando únicamente indicios. Necesito, por tanto, construir un proceso en el que la teoría y la práctica se retroalimenten.
Lo que nosotros haremos será abordar los ASPECTOS INSTRUMENTALES de la valoración de la Validez de Constructo, y lo haremos valorando cuatro elementos importantes: cuatro instrumentos de la validez de Constructo de un test:
· Es la correlación de un determinado test consigo mismo: es decir, indica la fiabilidad de ese determinado test. Es decir, es el Coeficiente de Fiabilidad.
· Indica fiabilidad, nada de validez.
· Siempre será la correlación más alta de la matriz. En la práctica, debería ser mayor que 0.
· Es una correlación que indica la Validez Convergente del test: es decir, la correlación que tiene un determinado test con otros que miden lo mismo.
· Deben ser las correlaciones más altas de todas, después del Coeficiente de Fiabilidad. Si lo son, sabremos que ese test posee una adecuada Validez Convergente.
· Es la correlación entre mi test y otros tests similares pero que miden variables diferentes
· Indica, por tanto, la Validez Discriminante de mi test.
· Cuanto más bajo sea el valor de esta correlación, mayor Validez Discriminante tendrá mi test
· Es la correlación entre mi test y otros test diferentes que miden variables diferentes.
· Indica, también, la Validez Discriminante de mi test.
· Debería ser la correlación más baja de todas. Cuanto más baja sea, mayor Validez Discriminante tendrá mi test.
··· EJEMPLO de una Matriz de Correlaciones Multirasgo – Multimétodo ···
dos procedimientos para medirlas, es decir, dos tests: un autoinforme (método 1) y una evaluación por parte de los compañeros (método 2)