Antes de hablar sobre el contraste de hipótesis es necesario definir qué es una hipótesis. Una hipótesis consiste en una afirmación que se hace sobre la población, por ejemplo: “la media en inteligencia emocional será diferente entre mujeres y hombres en España”. Nuestro ejemplo cumple las características de una hipótesis, se trata de una afirmación y está referida a una población: las mujeres y los hombres españoles.
Si quisiéramos comprobar dicha hipótesis resultaría demasiado costoso evaluar la inteligencia emocional de todas las mujeres y hombres del país, sin embargo, sí que podríamos abordar la evaluación de una muestra (representativa) de 300 mujeres y 300 hombres procedentes de dicha población. Aquí es donde entra en juego el contraste de hipótesis, que se define como una técnica estadística con la que juzgar si los datos observados en una muestra aportan evidencia suficiente para confirmar una hipótesis.
En el contexto del contraste de hipótesis, la afirmación para la que queremos encontrar evidencia se denomina “hipótesis alternativa” (H1). La afirmación opuesta a H1 se denomina “hipótesis nula” (H0) y será ésta última la que intentemos rechazar mediante el contraste, del que se pueden derivar dos posibles resultados:
- Rechazar H0, debido a que en la muestra observamos evidencia suficiente en su contra, y, consecuentemente, aceptar H1.
- No rechazar H0, debido a que en la muestra no observamos evidencia suficiente en su contra.
Es muy importante destacar aquí que el hecho de no rechazar H0 no implica que la hipótesis nula sea verdadera. En un contraste de hipótesis nunca podríamos concluir que “aceptamos H0”. En este caso, la única conclusión válida sería que no se ha encontrado evidencia suficiente ni para falsar H0 ni para apoyar H1.
Si trasladamos los conceptos de hipótesis nula e hipótesis alternativa a nuestro ejemplo anterior tendremos:
- H0: “La media en inteligencia emocional será igual entre las mujeres y los hombres en España”.
- H1: “La media en inteligencia emocional será diferente entre mujeres y hombres en España”.
Para poder ser contrastadas, estas hipótesis deben ser traducidas a términos estadísticos:
- H0: “La diferencia entre las medias de la inteligencia emocional de las mujeres y de los hombres en España no será estadísticamente significativa”.
- H1: “Habrá diferencias estadísticamente significativas entre la media de inteligencia emocional de las mujeres y los hombres en España”.
La siguiente pregunta que se estará formulando el lector será: ¿cómo establecemos si existen o no diferencias estadísticamente significativas?
Consideramos que existen diferencias estadísticamente significativas cuando es poco probable que dichas diferencias sean fruto del mero azar. La significación se representa mediante el símbolo p, y sus valores se sitúan entre 0 y 1, siendo una significación más intensa, o menos justificable por el efecto del azar, cuanto más próximo a 0 sea su valor. La significación se define como la probabilidad de obtener al azar unas diferencias determinadas asumiendo como cierta la H0.
Siguiendo con nuestro ejemplo, supongamos que tras evaluar la inteligencia emocional en una muestra de 300 mujeres y 300 hombres españoles, a través de un test diseñado con ese fin, obtuviésemos unas medias de 45 y 43, respectivamente. Como puede observarse, la media de las mujeres es superior, pero ¿es significativamente diferente a la de los hombres? Supongamos ahora que tras un contraste de diferencia de medias obtenemos una p de 0,003. Este resultado se interpretaría como “obtener al azar una diferencia de 2 puntos aceptando como cierto que en la población no existen diferencias (H0) tiene una probabilidad asociada del 0,3%”.
El umbral que, por convenio, suele utilizarse para decidir si los efectos observados en un contraste son significativos es cuando la p es igual o menor que 0,05. Como nuestra p ficticia (0,003) es más pequeña que 0,05, rechazaríamos la H0 y aceptaríamos la H1. Se concluiría entonces que “existen diferencias significativas en inteligencia emocional entre mujeres y hombres, siendo superior la media de las mujeres”.
Es reseñable que la significación depende de dos componentes principales: la magnitud la diferencia entre las medias, y el tamaño de la muestra, siendo más intensa la significación (más próxima a 0) cuanto mayores sean ambos factores.
Para finalizar con una breve descripción de sus aplicaciones, tanto en el contexto de las ciencias sociales como en el de las ciencias de la salud, los contrastes de hipótesis son las herramientas fundamentales sobre la que se sustentan todos los artículos y publicaciones científicas de dichas áreas a la hora de demostrar o refutar diferentes teorías y sus predicciones.
En el ámbito de la evaluación, los contrastes de hipótesis se emplean principalmente para aportar evidencias a favor de la validez de los test, por poner algunos ejemplos específicos:
- Un cuestionario que evalúe la ansiedad estado deberá ser lo suficientemente sensible como para mostrar puntuaciones significativamente mayores cuando los evaluados se encuentran en un contexto ansiógeno frente a encontrarse en un contexto relajado.
- Un test de razonamiento verbal deberá correlacionar de forma positiva y significativa con otros test de capacidades cognitivas.
- Un cuestionario de personalidad que pretenda evaluar el modelo de los “cinco grandes” deberá mostrar una estructura interna de cinco factores cuyos índices de bondad ajuste sean significativamente mejores que los de una estructura de cuatro factores.