La fiabilidad y la validez son conceptos utilizados para evaluar la calidad de la investigación. Indican lo bien que un método, técnica o prueba mide algo. La fiabilidad tiene que ver con la consistencia de una medida, y la validez con la precisión de una medida.
Es importante tener en cuenta la fiabilidad y la validez cuando se crea el diseño de la investigación, se planifican los métodos y se redactan los resultados, especialmente en la investigación cuantitativa.
Fiabilidad | Validez | |
---|---|---|
¿Qué te dice? | Hasta qué punto los resultados pueden reproducirse cuando se repite la investigación en las mismas condiciones. | Hasta qué punto los resultados miden realmente lo que se supone que miden. |
Comprobando la consistencia de los resultados a lo largo del tiempo, entre diferentes observadores y entre partes de la propia prueba. | Comprobando la correspondencia de los resultados con las teorías establecidas y otras medidas del mismo concepto. | |
¿Cómo se relacionan? | Una medición fiable no siempre es válida: los resultados pueden ser reproducibles, pero no son necesariamente correctos. | Una medición válida es generalmente fiable: si una prueba produce resultados precisos, deberían ser reproducibles. |
Entender la fiabilidad frente a la validez
La fiabilidad y la validez están estrechamente relacionadas, pero significan cosas diferentes. Una medición puede ser fiable sin ser válida. Sin embargo, si una medición es válida, normalmente también es fiable.
¿Qué es la fiabilidad?
La fiabilidad se refiere a la consistencia con la que un método mide algo. Si se puede obtener el mismo resultado de forma consistente utilizando los mismos métodos bajo las mismas circunstancias, la medición se considera fiable.
¿Qué es la validez?
La validez se refiere a la precisión con la que un método mide lo que pretende medir. Si la investigación tiene una alta validez, eso significa que produce resultados que se corresponden con las propiedades, características y variaciones reales del mundo físico o social.
Una alta fiabilidad es un indicador de que una medición es válida. Si un método no es fiable, probablemente no sea válido.
Si el termómetro muestra temperaturas diferentes cada vez, aunque haya controlado cuidadosamente las condiciones para asegurar que la temperatura de la muestra se mantiene igual, probablemente el termómetro esté funcionando mal, y por tanto sus mediciones no son válidas.
Sin embargo, la fiabilidad por sí sola no es suficiente para garantizar la validez. Incluso si una prueba es fiable, puede que no refleje con exactitud la situación real.
La validez es más difícil de evaluar que la fiabilidad, pero es aún más importante. Para obtener resultados útiles, los métodos que utilice para recoger sus datos deben ser válidos: la investigación debe medir lo que dice medir. Esto garantiza que la discusión de los datos y las conclusiones que se extraigan también sean válidas.
¿Cómo se evalúan la fiabilidad y la validez?
La fiabilidad puede estimarse comparando diferentes versiones de la misma medición. La validez es más difícil de evaluar, pero puede estimarse comparando los resultados con otros datos relevantes o con la teoría. Los métodos para estimar la fiabilidad y la validez suelen dividirse en diferentes tipos.
Tipos de fiabilidad
Los diferentes tipos de fiabilidad pueden estimarse a través de varios métodos estadísticos.
Tipo de fiabilidad | ¿Qué evalúa? | Ejemplo |
---|---|---|
Test-retest | La consistencia de una medida a lo largo del tiempo: ¿se obtienen los mismos resultados al repetir la medición? | Un grupo de participantes completa un cuestionario diseñado para medir rasgos de personalidad. Si repiten el cuestionario con días, semanas o meses de diferencia y dan las mismas respuestas, esto indica una alta fiabilidad de test-retest. |
Intercaladores | La consistencia de una medida a través de calificadores u observadores: ¿se obtienen los mismos resultados cuando diferentes personas realizan la misma medición? | Basándose en una lista de verificación de criterios de evaluación, cinco examinadores presentan resultados sustancialmente diferentes para el mismo proyecto de un estudiante. Esto indica que la lista de comprobación de la evaluación tiene una baja fiabilidad entre examinadores (por ejemplo, porque los criterios son demasiado subjetivos). |
Consistencia interna | La consistencia de la propia medición: ¿se obtienen los mismos resultados de diferentes partes de una prueba que están diseñadas para medir lo mismo? | Se diseña un cuestionario para medir la autoestima. Si divides al azar los resultados en dos mitades, debería haber una fuerte correlación entre los dos conjuntos de resultados. Si los dos resultados son muy diferentes, esto indica una baja consistencia interna. |
Tipos de validez
La validez de una medida puede estimarse basándose en tres tipos principales de evidencia. Cada tipo puede evaluarse mediante el juicio de expertos o métodos estadísticos.
Tipo de validez | ¿Qué evalúa? | Ejemplo |
---|---|---|
Construcción | La adherencia de una medida a la teoría y al conocimiento existentes del concepto que se mide. | Un cuestionario de autoestima podría evaluarse midiendo otros rasgos conocidos o que se supone que están relacionados con el concepto de autoestima (como las habilidades sociales y el optimismo). Una fuerte correlación entre las puntuaciones de autoestima y los rasgos asociados indicaría una alta validez de constructo. |
La medida en que la medición cubre todos los aspectos del concepto que se está midiendo. | Un test que pretende medir el nivel de español de una clase de estudiantes contiene componentes de lectura, escritura y expresión oral, pero no un componente de comprensión auditiva. Los expertos coinciden en que la comprensión auditiva es un aspecto esencial de la capacidad lingüística, por lo que la prueba carece de validez de contenido para medir el nivel general de capacidad en español. | |
Criterio | El grado en que el resultado de una medida se corresponde con otras medidas válidas del mismo concepto. | Se realiza una encuesta para medir las opiniones políticas de los votantes de una región. Si los resultados predicen con exactitud el resultado posterior de unas elecciones en esa región, esto indica que la encuesta tiene una alta validez de criterio. |
Para evaluar la validez de una relación causa-efecto, también hay que considerar la validez interna (el diseño del experimento) y la validez externa (la generalización de los resultados).