Validez de los Instrumentos de Medición

Unidad de Apoyo para el Aprendizaje

Iniciar

Introducción

Para generar trabajos como los grandes científicos que hoy en día contribuyen a la generación de conocimiento, es necesario que verifiques la confiabilidad y la validez de los instrumentos de medición que utilices para recolectar información y que den respuesta a nuestros objetivos y, con base en esto, se emprendan estrategias de intervención.

Para aprender cómo realizar lo anterior, revisarás el término validez y confiabilidad; enseguida, revisarás la importancia de la validez y su tipología, de acuerdo con la American Psychological Association (APA); también estudiarás los factores que la afectan, y, finalmente, revisarás el proceso a seguir para dar validez a los instrumentos de medición.



Mujer llevando a cabo un análisis de su investigación frente a la computadora, con el apoyo de un libro

Investigadora efectuando un análisis


Identificar los procesos a seguir para dar validez a los instrumentos de medición, a partir de su terminología, tipología y factores que la afectan, para recabar e interpretar los datos obtenidos de una investigación eficientemente.

Usos del término validez

La validez en la investigación se refiere al grado en el que un instrumento realmente mide la variable, que es su objetivo medir. Cuanto mayor es la evidencia de validez de contenido, de criterio y de constructo en un instrumento de medición, más se acercará a representar las variables respectivas.

La validez es un término usado para denotar cualidades; una de éstas es el grado en que una explicación es aceptada para ser generalizable; por ejemplo, la teoría de la relatividad. Einstein postuló que el universo es un todo absoluto, finito y, en ocasiones, ilimitado; además, indicó que el universo contiene materia y energía distribuida; así, creó la fórmula E = mc2.



Imagen del rostro de Albert Einstein


Turner, O. J. (1947). Albert Einstein [imagen].
Tomada de https://es.wikipedia.org/wiki/Albert_Einstein#/media/Archivo:Albert_Einstein_Head.jpg



El término validez también es usado en la construcción de instrumentos de investigación, para hacer referencia a que éstos serán válidos, en gran medida, si cumplen con la función para la que se han concebido; por tanto, si están correctamente formulados, será posible recabar información confiable; por ejemplo, si una persona requiere atención psicológica para mejorar la confianza en sí misma, ya que se considera insegura y pesimista, y que tal atención le permita adquirir habilidades para lograr un desempeño laboral que considere más satisfactorio, dicha persona calificó la intensidad de su problemática en cinco, de una escala de 0 a 10; se deberá construir un instrumento que permita obtener información válida.

Importancia de la validez de un instrumento de evaluación


El estudio de la validez de un instrumento permite contestar las siguientes preguntas:




¿Qué mide?

• Mide realmente lo que se ha propuesto medir.

¿Qué tan bien mide?

• Mide lo suficiente o no lo que se ha propuesto medir.

¿Qué se puede inferir?

• Los resultados pueden ser utilizados para desarrollar conclusiones.


Validez en los test



Considerando lo anterior, siempre debes tener presente que lo que se valida no es el instrumento, sino la interpretación de los datos obtenidos por medio de un procedimiento específico.

Validez de un instrumento de evaluación


La validez de un instrumento es referida típicamente a si la conducta mostrada en la situación de test es o no un reflejo de la conducta habitual del sujeto en situaciones naturales; hay otras metas de la validez igualmente importantes; la evaluación de la validez de un instrumento implica considerar también los siguientes aspectos: la adecuación con que se mide la conducta sujeta a estudio, la capacidad para diagnosticar la conducta real de una persona, la sensibilidad para detectar el objetivo, la seguridad de las decisiones y la utilidad (Martínez, 1981, citado en Fernández-Ballesteros, 2014).

Uno de los temas de interés fundamental en la evaluación conductual es precisamente el de la validación de sus técnicas. Los teóricos de la evaluación comenzaron a plantearse la cuestión de si todas estas técnicas desarrolladas en el marco teórico de la psicometría serían o no adecuadas para la evaluación conductual, diseñadas con esquemas teóricos totalmente distintos. Lo anterior supone lo siguiente:




Evaluaciones tradicionales

Han sido construidas para poner de manifiesto diferencias interindividuales.

Evaluaciones conductuales

Revelan diferencias intrasujeto, esto es, antes y después de un tratamiento (Martínez, 1981, citado en Fernández-Ballesteros, 2014).


Test tradicionales y conductuales



Con el transcurso del tiempo y ya demostrada la aparente utilidad de los tratamientos derivados de la evaluación conductual, cabe plantear en este enfoque algunos problemas metodológicos:


• ¿Hasta qué punto podemos considerar eficaz el tratamiento?
• ¿Cuál es el mejor de varios tratamientos, teniendo en cuenta los resultados obtenidos?
• ¿Se reflejan las diferencias entre las puntuaciones pre y postratamiento, cambios, males en la conducta o simplemente errores de medida de los procedimientos utilizados en su obtención?
• ¿Son los instrumentos utilizados los adecuados para poner de relieve las conductas de interés?


Evidentemente, cualquiera que sea el enfoque de instrumento de medición o sin importar a que disciplina pertenezca debe presentar ciertas cualidades que demuestren su valor científico, su confiabilidad y su validez. En este sentido, tanto los instrumentos de medición procedentes de la evaluación tradicional como los construidos desde el enfoque conductual participan de la misma teoría de la medición. El asunto está en preguntarse cuáles procedimientos de obtención de la confiabilidad y la validez de un instrumento deben ser utilizados por uno u otro enfoque en la construcción de dispositivos de medida (Aragón y Silva, 2002).

Para contestar la pregunta sobre qué tipo de validez corresponde según la orientación teórica en que hayamos construido un instrumento de medición, enseguida, se explicarán los tipos de validez considerados.

Tipos de validez


Generalmente, los procedimientos para determinar la validez de un instrumento se enfocan en las relaciones entre la ejecución de una prueba y otros hechos observables acerca de las características de lo que se desea medir o evaluar; así, la validez ha sido tratada con los tipos establecidos por los estándares de la American Psychological Association (Aragón y Silva, 2002), que se establecerán en los siguientes apartados.


Validez de contenido


Se refiere al grado en que un instrumento refleja un dominio específico del contenido de lo que se quiere medir; se trata de determinar hasta dónde los reactivos de un instrumento son representativos del universo de contenido de la característica o rasgo a evaluar; responde a la siguiente pregunta: cuán representativo es el comportamiento elegido como muestra del universo que se intenta representar; por ejemplo, un cuestionario sobre la actitud de los alumnos ante la investigación no tendrá validez de contenido si explora la opinión de ellos sobre las características de los docentes dentro de la cátedra de estadística.

A la validez de contenido también se le denomina validez racional o lógica; no puede expresarse de manera cuantitativa; es más bien una cuestión de juicio; se estima de manera subjetiva o intersubjetiva empleando, usualmente, el denominado juicio de expertos.


Validez de constructo


Esta validez es útil cuando se quiere usar el desempeño de los sujetos con el instrumento, para inferir la posesión de ciertos rasgos; intenta responder la siguiente pregunta:



¿Hasta dónde el instrumento mide realmente un rasgo determinado y con cuánta eficiencia lo hace?


Para estudiar este tipo de validez, es necesario que exista una conceptualización clara del rasgo estudiado, basada en una teoría determinada. La teoría sugiere las tareas o pruebas que son apropiadas para observar el atributo o rasgo y las evidencias a considerarse en la evaluación. Para el estudio de esta validez, se sugieren los siguientes pasos:





Identifica...


Formula...


Recopila...




Validez de criterio


También se le conoce como predictiva, de criterio externo o empírica; se asocia con la visión de futuro; determina hasta dónde se puede anticipar el desempeño futuro de una persona en una actividad determinada. Esta validez se estudia comparando los puntajes de un instrumento con una o más variables externas denominadas variables de criterio; aquí, se establece una correlación, la cual se interpreta como índice de validez. Las cualidades deseables en una medida de criterio en orden son:




Confiabilidad

• Debe ser estable o reproducible si ha de ser predicha por algún tipo de prueba.

Atingencia

• Se considera que un criterio es atingente en la medida en que esta medida o criterio corresponde con el éxito en el trabajo o lo ejemplifica.

Libre de sesgo

• La medida debería ser aquella en la que cada persona tiene las mismas oportunidades de obtener una buena puntuación.

Disponibilidad

• Debe tener en cuenta límites prácticos como qué tanto se debe esperar para obtener una puntuación o cuánto dinero costarán las interrupciones de las actividades.


Cualidades en la medida de criterio

Factores que afectan la validez


Existen varios factores que tienden a distorsionar los coeficientes de validez y a complicar su interpretación; entre ellos, encontramos:

 


No han sido validados en nuestro contexto, cultura y tiempo. Traducir un instrumento, aun cuando adaptemos los términos a nuestro lenguaje y los contextualicemos, no es ni remotamente una validación; es un primer y necesario paso. En el caso de traducciones, los términos centrales deben tener referentes con el mismo significado o alguno muy parecido en la cultura en la que se va a utilizar dicho instrumento —vincular términos entre la cultura de origen y la destinataria—. A veces se traduce, se obtiene una versión y ésta, a su vez, se vuelve a traducir de nuevo al idioma original.

Por otra parte, existen instrumentos que fueron validados en nuestro contexto, pero hace mucho tiempo. Hay instrumentos en los que hasta el lenguaje nos suena “anticuado”. Las culturas, los grupos y las personas cambian; esto debemos tomarlo en cuenta al elegir o desarrollar un instrumento de medición.

Es ajeno para las personas a quienes se les aplica: no es empático. Utilizar un lenguaje muy elevado para el sujeto participante, no tomar en cuenta diferencias en cuanto a género, edad, conocimientos, memoria, nivel ocupacional y educativo, motivación para contestar, capacidades de conceptualización y otras diferencias en los participantes son errores que llegan a afectar la validez y confiabilidad del instrumento de medición. Este error ocurre a menudo cuando los instrumentos deben aplicarse a niños; asimismo, hay grupos de la población que requieren instrumentos apropiados para ellos, tal es el caso de las personas con discapacidad. En la actualidad, se han desarrollado diversas pruebas que las toman en cuenta; por ejemplo, pruebas en sistema Braille para personas con discapacidad visual u orales para individuos que no pueden escribir. Otro ejemplo lo son los indígenas o inmigrantes de otras culturas; en ocasiones, se les administran instrumentos que no toman en cuenta su lenguaje y contexto.

Algunos de los factores a evitar para que el instrumento sea válido son instrucciones imprecisas o vagas, estructura sintáctica de las oraciones muy difícil, preguntas inadecuadas respecto con las especificaciones, sobre todo, en pruebas escritas y orales, preguntas que sugieren la respuesta, ambigüedad en la formulación de los reactivos que lleve a diferentes interpretaciones, cuestionarios demasiado cortos —no incluyen una muestra adecuada de los indicadores a medir—, con pocos reactivos, ítems incongruentes con el universo de contenido, sin relación con los rasgos o características a medir, ordenamiento inadecuado de los ítems y patrón identificable de respuestas, sobre todo, en pruebas de selección.

Entre estos factores, se encuentran tiempo insuficiente para responder, ayuda adicional de otros sujetos; en caso de pruebas, se hallan las “chuletas” o copias y la subjetividad en los puntajes de las preguntas.

Debe ser aplicado el instrumento para el grupo al que fue diseñado; puede ser inapropiado para otros.

Algunos factores que se deben tener en cuenta son el bloqueo de los sujetos al responder debido a situaciones emocionales y las respuestas al azar.

Proceso de validez del contenido de un instrumento de evaluación


Respecto a la validez de contenido, se siguen los siguientes pasos:

Seis pasos para realizar una validación

Revisar cómo ha sido medida la variable por otros investigadores. Elaborar un universo de ítems o reactivos posibles para medir la variable y sus dimensiones; el universo debe ser lo más exhaustivo que sea posible.

Consultar a investigadores familiarizados con la variable para ver si el universo es verdaderamente exhaustivo.

Seleccionar los ítems bajo una cuidadosa evaluación, uno por uno.

Extraer una muestra probabilística de reactivos, ya sea al azar o estratificada; cada dimensión constituiría un estrato, esto si la variable está compuesta por diversas dimensiones o facetas.

Administrar los ítems; se correlacionan las puntuaciones de éstos entre sí; tiene que haber correlaciones altas, en especial entre ítems que miden una misma dimensión, pero teniendo cuidado que sean capaces de discriminar entre participantes.

Estimar estadísticas para ver si la muestra es representativa. Para calcular la validez de contenido, son necesarios varios coeficientes.


Pasos para la validez

La validez de criterio se estima al correlacionar la medición con el criterio externo: puntuaciones del instrumento frente a las del criterio; esto se toma como coeficiente de validez. La validez de constructo suele determinarse mediante procedimientos de análisis estadístico multivariado: análisis de factores, discriminante, regresiones múltiples, etc.

Actividad. Tipos de validez

Una vez que pudiste revisar en qué consiste el concepto de validez, cómo se clasifica de acuerdo con los estándares de la APA y los factores que la afectan, ahora toca realizar una actividad donde pongas en práctica el manejo de dicha información.


Autoevaluación. Validez y factores que la afectan

En esta actividad, tienes la posibilidad de corroborar la información asimilada de lo revisado con anterioridad sobre la validez de instrumentos de medición y sus características fundamentales.


Fuentes de información

Básicas

Bibliografía


Aragón, L. E. y Silva, A. (2002). Fundamentos teóricos de la evaluación psicológica. Pax.


Corral, Y. (2009, enero-junio). Validez y confiabilidad de los instrumentos de investigación para la recolección de datos. Revista Ciencias de la Educación,19(33), 228-249.


Fernández-Ballesteros, R. (2014). Evaluación conductual. Conceptos, métodos y estudio de casos (2.a ed.). Pirámide. 


Hernández, R., Fernández, C. y Baptista, P. (2010). Metodología de la investigación (5.a ed.). McGraw-Hill.


Documentos electrónicos


Romero, S. (s. f.). El legado de Albert Einstein: la Teoría de la Relatividad. Muy Interesante. https://www.muyinteresante.es/ciencia/fotos/100-anos-de-la-teoria-de-la-relatividad/curiosidades-sobre-la-teoria-de-la-relatividad

Complementarias

Bibliografía


Aiken, L. R. (2003). Test psicológicos y evaluación. Pearson Educación.


Documentos electrónicos


Prieto, G. y Delgado, A. R. (2010). Fiabilidad y validez. Papeles del Psicólogo, 31(1), 67-74. http://www.papelesdelpsicologo.es/pdf/1797.pdf

 

Cómo citar

 

Reveles, L. P. (2020). Validez de los instrumentos de medición. Unidades de Apoyo para el Aprendizaje. CUAIEED/FES Iztacala-UNAM. (Vínculo)