Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Fiabilidad: Concepto básico y obtención - Prof. Herrando, Apuntes de Psicometría

Una introducción a la fiabilidad en el contexto de la medición, diferenciaría el concepto de precisión y exactitud, y explicaría la ley de varianzas de suma y cómo se relaciona con la fiabilidad. Además, se presentan diferentes métodos para obtener un indicador de fiabilidad, como el coeficiente de fiabilidad y el error tipo estándar de medida (sem).

Tipo: Apuntes

2013/2014

Subido el 02/10/2014

sheixs_81
sheixs_81 🇪🇸

3.7

(112)

42 documentos

1 / 13

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Dossier UB. Psicometría. Esquemas. Fiabilidad S. Herrando
Fiabilidad
Conceptos básicos
Precisión y exactitud fiabilidad y validez
Aunque los términos precisión y exactitud son en muchos contextos lingüísticos considerados como
sinónimos, cuando hablamos de teoría de la medición, adquieren matices bien diferenciados, que
conviene tener bien presentes:
Se llama exactitud a la mayor proximidad entre los valores
que arroja el aparato de medida y la medida real de aquello
que pretendemos medir.
En cambio por precisión entendemos la mayor proximidad
entre los diferentes valores que obtenemos al intentar medir
un mismo objeto varias veces.
Aunque en un contexto algo diferente, la diana de la figura 1
ilustra la diferencia entre ambos conceptos: el autor de los
disparos verdes, diremos que ha resultado ser más exacto que
el de los rojos. En cambio es el de los rojos quien ha sido más
preciso pero menos exacto que el primero.
Traslademos el ejemplo al campo de la medición: Una balanza que acaba de ser
construida con pretensiones de gran precisión y para valores entre cero y 10 Kgs., es probada pesando
en ella 5 veces una réplica exacta (¡?) del kilogramo patrón de la oficina de pesos y medidas de
París, que pesa exactamente un millón de miligramos. Los resultados se comparan con la vieja
balanza a la que debería sustituir, obteniendo los siguientes resultados:
Una atenta observación de esta tabla y, si es
preciso, la ayuda de algunos cálculos
estadísticos sencillos, permitirá afirmar que la
balanza nueva es considerablemente más
precisa que la antigua, pero la antigua, con su
imprecisión, es, sin embargo más exacta.
Tanto el ejemplo de la diana como el de las
balanzas permiten inferir que la falta de
exactitud implica un error sistemático. Es
decir, un error provocado por alguna causa desconocida en principio, pero posiblemente identificable
y que una vez identificada, podría tal vez corregirse. Así, el lanzador de los dardos rojos tiene una
tendencia a desviarse en una determinada dirección. Si consigue corregir ese vicio, será mejor
lanzador que el de los verdes. En cuanto a la balanza nueva, se ve que tiende a sobrevalorar el peso.
Bastaría restarle unos 700 miligramos para conseguir medidas bastante mejores que con la antigua.
En cambio la imprecisión es aleatoria y no se ve otra forma de reducirla, que afinar el aparato de
medida.
Si intentamos adaptar los ejemplos anteriores a la psicología, topamos con insuperables
dificultades. Pues ¿Cómo encontrar la verdadera y exacta medida de la inteligencia de una sola
persona para aplicarle varias veces un test y realizar comprobaciones como la tabla anterior de las
balanzas? Y es que al tratar de mediciones psicológicas, aunque también tratamos de valorar su
Intento
Balanza nueva
Balanza antigua
1
1000,656 grs.
1001,22 grs.
2
1000,485 grs.
998,88 grs.
3
1000,788 grs.
999,76 grs.
4
1001,002 grs.
1001,2 grs.
5
1000,803 grs.
998,97 grs.
Figura 1
pf3
pf4
pf5
pf8
pf9
pfa
pfd

Vista previa parcial del texto

¡Descarga Fiabilidad: Concepto básico y obtención - Prof. Herrando y más Apuntes en PDF de Psicometría solo en Docsity!

Fiabilidad

Conceptos básicos

  • Precisión y exactitud – fiabilidad y validez

Aunque los términos precisión y exactitud son en muchos contextos lingüísticos considerados como sinónimos, cuando hablamos de teoría de la medición, adquieren matices bien diferenciados, que conviene tener bien presentes:

Se llama exactitud a la mayor proximidad entre los valores que arroja el aparato de medida y la medida real de aquello que pretendemos medir. En cambio por precisión entendemos la mayor proximidad entre los diferentes valores que obtenemos al intentar medir un mismo objeto varias veces.

Aunque en un contexto algo diferente, la diana de la figura 1 ilustra la diferencia entre ambos conceptos: el autor de los disparos verdes, diremos que ha resultado ser más exacto que el de los rojos. En cambio es el de los rojos quien ha sido más preciso pero menos exacto que el primero.

Traslademos el ejemplo al campo de la medición: Una balanza que acaba de ser construida con pretensiones de gran precisión y para valores entre cero y 10 Kgs., es probada pesando en ella 5 veces una réplica “exacta” (¡?) del kilogramo patrón de la oficina de pesos y medidas de París, que pesa “exactamente” un millón de miligramos. Los resultados se comparan con la vieja balanza a la que debería sustituir, obteniendo los siguientes resultados:

Una atenta observación de esta tabla y, si es preciso, la ayuda de algunos cálculos estadísticos sencillos, permitirá afirmar que la balanza nueva es considerablemente más precisa que la antigua, pero la antigua, con su imprecisión, es, sin embargo más exacta. Tanto el ejemplo de la diana como el de las balanzas permiten inferir que la falta de exactitud implica un error “sistemático”. Es decir, un error provocado por alguna causa desconocida en principio, pero posiblemente identificable y que una vez identificada, podría tal vez corregirse. Así, el lanzador de los dardos rojos tiene una tendencia a desviarse en una determinada dirección. Si consigue corregir ese “vicio”, será mejor lanzador que el de los verdes. En cuanto a la balanza nueva, se ve que tiende a sobrevalorar el peso. Bastaría restarle unos 700 miligramos para conseguir medidas bastante mejores que con la antigua. En cambio la imprecisión es aleatoria y no se ve otra forma de reducirla, que “afinar” el aparato de medida.

Si intentamos adaptar los ejemplos anteriores a la psicología, topamos con insuperables dificultades. Pues ¿Cómo encontrar la verdadera y exacta medida de la inteligencia de una sola persona para aplicarle varias veces un test y realizar comprobaciones como la tabla anterior de las balanzas? Y es que al tratar de mediciones psicológicas, aunque también tratamos de valorar su

Intento Balanza nueva Balanza antigua 1 1000,656 grs. 1001,22 grs. 2 1000,485 grs. 998,88 grs. 3 1000,788 grs. 999,76 grs. 4 1001,002 grs. 1001,2 grs.

5 1000,803 grs. 998,97 grs.

Figura 1

precisión y exactitud, la peculiaridad de los problemas con que topamos ha hecho que esos conceptos, aunque en esencia los mismos, sean denominados con diferente terminología: fiabilidad y validez y su obtención es algo más complicada que la de los ejemplos anteriores.

  • Errores de medida

En el caso de las balanzas, se ve cómo al tomar una medida se comete un error: es el error de medida. Aunque no tan evidente, supondremos que eso ocurre siempre que se toma una medida psicológica.

  • Distribución de una variable y distribución del error

Se sabe que variables como la estatura, peso... se distribuyen en la naturaleza siguiendo la ley normal, que refleja cómo aumenta o disminuye la probabilidad de encontrar un individuo con una medida determinada, según esa medida se acerque o se aleje del valor medio que es a su vez el más probable. La velocidad con que se produce ese aumento o disminución lo determina un segundo parámetro: la desviación típica. La curva grande de la figura 2 representa esa distribución normal, con media x y desviación típica s. Ahora bien: cada uno de los valores ahí representados ha sido obtenido mediante una operación de medición, y por tanto, está sujeto a una imprecisión, de modo que cada medida contendrá el valor verdadero más un valor (deseablemente pequeño) de error de medida. Y ese error de medida también se distribuye normalmente: si realizamos cientos de mediciones de un mismo objeto, es evidente que sus diferencias sólo pueden deberse al error de medida. Las curvas pequeñas de la figura 2 representan esta distribución: todas la medidas empíricas que se obtengan de un mismo objeto i se distribuirán en torno a su valor verdadero vi y tendrán una media vi y una desviación típica se , también llamada error típico de medida. Este planteamiento, en psicología, ha dado lugar a la

Teoría de la puntuación verdadera

Juna sencilla ecuación que refleja lo que ocurre en los ejemplos anteriores, y parece plausible que ocurra en las mediciones psicológicas, es:

x = v + e

Puntuación

empírica

error

Puntuación

verdadera

Figura 2

𝑠𝑣^2

𝑠𝑥^2

lo que hace que todo lo que parecía meramente teórico e inalcanzable (varianza verdadera, correlación entre valores empíricos y verdaderos...), pase a ser calculable. Así, el índice de fiabilidad se obtiene simplemente como la raíz cuadrada del coeficiente:

𝑠𝑣^2

𝑠𝑥^2

Ampliando la consideración como medidas repetidas a las medidas obtenidas por tests

equivalentes o formas paralelas y la consideración de formas paralelas a diferentes

partes de un test y los propios ítems y teniendo en cuenta la relación matemática entre

fiabilidad del test y su longitud, estaremos en disposición de alcanzar los

procedimientos más conocidos para obtener la fiabilidad del test:

Ideas para un indicador de fiabilidad

1. Coincidencia de x con v rxv índice de fiabilidad 2. Proporción de varianza verdadera: sx 2

Ideas para un indicador de fiabilidad

1. Coincidencia de x con v rxv índice de fiabilidad 2. Proporción de varianza verdadera: sx sv 2 2

se 2 sv 2

sx 2

sv 2

sx 2

sv 2

sx 2

O 1 -

se 2

sx 2

se 2

sx 2

se 2

sx 2

sx

2

= sv

2

+ se

2

Basándose en la ecuación “ x=v+e ”, las propiedades de v y e y la ley de varianzas de suma…, puede demostrarse que :

sv

sx

y^ rxv=

Y por tanto, de

SEM =se=sx 1 - rxx

Se obtiene el error tipo o “error estandar de medida” (SEM)

coeficiente índice

sv

2

vv

” 22

2

2

sx

2

rxx =

Ideas para un indicador de fiabilidad

Coincidencia de x con x’, x’’… : rxx

coeficiente de fiabilidad

3. Entre test y re-test: r 12

4. Entre formas paralelas rAB

5. Entre partes de un test:

• Dos mitades:^ r2m

• Alfa

Fiabilidad y longitud 3

1 6 11 16 21 26 Longitud

0

0,

0,

0,

0,

0,

0,

0,

0,

0,

1

1,

Fiabilidad

Sparman-Brown

Coeficiente alfa

x = v + e

Basándose en esta ecuación, las propiedades de v y e y la ley de varianzas de suma…, puede demostrarse que : Donde

  •  coeficiente alfa de fiabilidad o consistencia interna
  • sj^2 suma de varianzas de los ítems
  • sx^2 varianza del test
  • n el número de ítems

 (^) 

s

s 1 - n- 1

_n

2 x_

j

2

n- 1

n s - s

SEM=

(^2) i (^2) x n i=

A partir de alfa puede obtenerse^ 

directamente el error tipo según la fórmula:

Fiabilidad y longitud 4

Longitud necesaria para una fiabilidad dada

La ecuación de Spearman-Brown puede ser útil para averiguar cuántos ítems se necesitaría añadir a un test de fiabilidad conocida, para conseguir la fiabilidad deseada. Así, despejando n de dicha ecuación se obtiene:

r(1-R)

R(1-r) n=

Así, si el test anterior ( rxx = 0,72) tenía 9 ítems, ¿Cuántos deberían añadirse similares a esos 9, para conseguir una fiabilidad de 0.92? Aplicando la fórmula, obtenemos: n = 0,92x(1-0,72)/(0,72x(1-0,92)) = 4,47222, y puesto que el tamaño de referencia es de 9 ítems, el número definitivo será: 9x4,47222 = 40,25, así que deberán añadirse 32 ítems (nótese que, al no existir fracciones de ítem, la consecución del objetivo obliga a redondear al entero superior)

Fiabilidad de dos mitades 1

Recordemos que rAB es la fiabilidad de las formas paralelas A y B. Podemos considerar que con los ítems que ya tiene el test, podríamos configurar dos test equivalentes (con la mitad de los ítems cada uno, sean m y m’ ), y por tanto, rmm’ será la fiabilidad de medio test. Sólo nos queda ahora tener en cuenta a Spearman- Brown para obtener la fiabilidad del test total, que tiene por estructura, el doble de longitud. Así, pues,

1 +r

(^2) r r = mm

mm 2m

Siendo r2m la fiabilidad obtenida por este método

Aplicación

Aplicaciones 1

Intervalo de confianza de "v“ =z  se

(normalmente α=0.05 y ( dos colas ) z0.025= 1.96)

Así, si una puntuación empírica dada es de 12, siendo la media 10 y la s = 2.5 y la fiabilidad de 0.9, el intervalo de confianza de la puntuación verdadera, con riesgo alfa 0.05, es:

121,96x2,5xRaiz(1-0,9) = 121,55 = 10,45 ÷ 13,

Aplicaciones 2

Dα =zsd

Diferencias entre puntuaciones

Diferencia máxima atribuible al error (con riesgo α) (normalmente α=0.05 y ( una cola ) z0.05= 1.65)

Entre rasgos (intra-individual) s (^) d=sx 2 - rxx-rxx

Ejemplo: John puntúa 4 en un test de habilidad numérica y 6 en uno de fluidez verbal, puntuaciones dadas en “escala de 11 clases” así que su sx es 2,5. Puede “considerarse” esa diferencia atribuible al error si el test de HN tiene una fiablidad de 0.8 y el de FV 0.7?

Dα = 1,65x2,5xRaiz(2-0,8-0,7) = 2,

Puesto que 2,92 > 6-4, la diferencia observada,

es atribuible al error

Compruébese lo mismo si la fiabilidad de los dos tests utilizados fuera de 0.

Aplicaciones 3

Diferencias entre puntuaciones

Diferencia máxima atribuible al error (con riesgo α)

Entre personas (mismo rasgo)

Ejemplo: John puntúa 3 y Alí 5 en un test de razonamiento, puntuaciones expresadas en decatipos y por tanto su sx es 2. Puede “considerarse” esa diferecia atribuible al error si el test empleado tiene una fiablidad de 0.89?

Dα = 1,65x2xRaiz(1-0,89)xRaiz(2) = 1,

Puesto que 1,55 < 5-3, la diferencia observada,

No es atribuible al error

Compruébese lo mismo con otros valores

s d=se^2

Aplicaciones 4

Fiabilidad necesaria para algunas decisiones

2 z s

D

r (D )=^1 - 2

x

2

2 xx

 

Desarrollando la expresión Dα=zsd y despejando de ella la fiabilidad, puede obtenerse:

r (^) xx(^ D)^ Representa la fiabilidad requerida para que la diferencia máxima atribuible al error con riesgo , sea D Así, en el problema anterior, puede interesar saber qué fiabilidad debería tener como mínimo un test para poder decidir ante diferencias de dos puntos con un  de 0.05 en una escala de sten (s=2). Apliquemos la fórmula:

1-2^2 /(2x1,65^2 x2^2 ) = 0.816345271  0.

Fiabilidad y homogeneidad de la muestra de sujetos

empleada 2

Lo anterior permite estimar la fiabilidad que se hubiera obtenido si la muestra fuera de una heterogeneidad diferente

s

s (1-r ) r =^1 - 2 u

xx

x uu

  • sx^2 es la varianza del test en la muestra utilizada
  • rxx la fiabilidad obtenida
  • su^2 es la varianza del test en una muestra alternativa
  • ruu la fiabilidad estimada si se utilizara la muestra alternativa

Fiabilidad y homogeneidad de la muestra de sujetos

empleada 3

La fiabilidad de un test obtenida al aplicarlo a compañeros de curso, fue de 0.82. y la varianza 12. ¿Qué fiabilidad podemos esperar si se aplica a una muestra más heterogénea, suponiendo una varianza en la segunda, de 18?

Problema

ruu = 1-12x(1-0.82)/18 = 0.

Reflexiones:

  • ¿Qué fiabilidad obtendríamos al aplicar el test a una muestra de sujetos clónicos?
  • Según todo esto, ¿Cómo debe ser seleccionada la muestra con la que se ha de obtener la fiabilidad del test?