En el contexto que nos encontramos, la medición (assessment) de rasgos psicológicos, la fiabilidad hace referencia a una propiedad de un instrumento de medida, concretamente a una propiedad de las puntuaciones de los tests psicométricos, que pretenden medir estados, atributos o constructos mentales, tales como la personalidad, la inteligencia, la motivación, el conocimiento, etc…
Se suele decir que una medida es precisa o fiable si al utilizar un instrumento (test) éste genera resultados similares o muy parecidos cuando se mide a la misma persona, en distintos momentos, respetando el contexto para el que fue diseñado y su forma de aplicación. Esto se traduce en que las puntuaciones de dicho test son estables dentro de un rango determinado de tiempo.
La forma de determinar la fiabilidad de las puntuaciones de un test está basada en la asunción del modelo de Spearman, que distingue entre el valor real del atributo que se mide (puntuación verdadera) y la medida obtenida directamente del test (puntuación observada), y cuyos valores serán más similares cuanto más fiable sea dicho test. Un indicador típico que hace referencia a esta concordancia entre la puntuación verdadera y puntuación observada es el llamado α de Cronbach, cuyos valores oscilan normalmente entre 0 y 1. Cuanto más cerca de 0 esté el valor del este indicador, menos concordancia habrá entre el verdadero rasgo de una persona y el valor del rasgo que se determina a través del test: estamos hablando del error de medida.
Por ejemplo, realizar un test de inteligencia (que tenga alta fiabilidad) en condiciones inadecuadas (con ruido, poca luminosidad, o que el participante haya dormido pocas horas) hará que la medida de inteligencia proporcionada por el test esté contaminada por variables que no tienen que ver con el rasgo que se está midiendo y que no se tuvieron en cuenta cuando se diseñó el test. Por lo tanto en este ejemplo, muy posiblemente se estaría infravalorando la inteligencia de la persona, en comparación con si el test hubiera sido administrado en las condiciones adecuadas. En este caso, a pesar de los indicadores de fiabilidad, el test habría dejado de ser estable, debido a que no se está usando de la forma adecuada.
La mayoría de las veces, las condiciones de aplicación de los tests son respetadas, lo que hace que la fiabilidad de sus puntuaciones estén en función de las relaciones entre los ítems o elementos del test. Una baja fiabilidad es garantía de que de que se está midiendo un atributo de forma imprecisa, al contrario, una alta fiabilidad no implica necesariamente que el test esté midiendo el atributo que se pretende medir. Este asunto es tratado por la cuestión de la validez de las puntuaciones, que será tratada en próximos números de The Assessment Corner.