Metodología de Investigación Científica.

lunes, 12 de agosto de 2013

Diseños cuasi-experimentales


1.1.        Definición y características
El concepto de cuasi-experimento fue propuesto por primera vez por Campbell y Stanley (1966) y fue ampliado más tarde por Cook y Campbell (1979). A partir de entonces muchos autores han propuesto definiciones de este concepto, algunas de las cuales figuran a continuación.
Cook y Campbell (1986) afirman que los cuasi-experimentos son como experimentos de asignación aleatoria en todos los aspectos excepto en que no se puede presumir que los diversos grupos de tratamiento sean inicialmente equivalentes dentro de los límites del error muestral (p. 142). Esta es la razón por la cual estos autores utilizan el término experimento verdadero en oposición al término cuasi-experimento.
Mientras Kirk (1995) afirma que los diseños cuasi-experimentales son similares a los experimentos excepto en que los sujetos no se asignan aleatoriamente a la variable independiente. Se trata de diseños que se utilizan cuando la asignación aleatoria no es posible o cuando por razones prácticas o éticas se recurre al uso de grupos naturales o preexistentes como, por ejemplo, sujetos con una determinada enfermedad o sujetos que han sido sometidos a abuso sexual (p. 6). Por lo tanto, los diseños cuasi-experimentales se utilizan cuando el investigador no puede presentar los niveles de la variable independiente a voluntad ni puede crear los grupos experimentales mediante la aleatorización.
Otra postura expresa Arnau (1995) define el diseño cuasi-experimental como un plan de trabajo con el que se pretende estudiar el impacto de los tratamientos y/o los procesos de cambio, en situaciones donde los sujetos o unidades de observación no han sido asignados de acuerdo con un criterio aleatorio.
A partir de las definiciones anteriores se puede elaborar un listado con las principales características del diseño cuasi-experimental. Son las siguientes:
a)    Manipulación de la variable independiente. Esta es una característica que comparten los diseños cuasi-experimentales y los diseños experimentales. Ambos tipos de diseño tienen como objetivo el estudio del efecto de la variable independiente sobre la variable dependiente de la investigación. En definitiva, los dos tipos de diseños persiguen el establecimiento de relaciones causales.
b)    No aleatorización en la formación de los grupos. En el diseño cuasi-experimental el investigador no interviene en la formación de los grupos, de manera que recurre a grupos intactos o naturales. Se trata de grupos de individuos que ya están formados -como, por ejemplo, los niños de un mismo grupo en una escuela o los trabajadores de un departamento en una empresa-, por lo que el investigador no tiene garantías de la equivalencia inicial de éstos. De hecho, estos grupos naturales, también se denominan grupos no equivalentes. Esta característica constituye el principal inconveniente que presenta este tipo de diseños. El problema radica en que si la equivalencia inicial de los grupos no está garantizada, se puede cuestionar que las diferencias que se encuentren entre los grupos después de la intervención se deban al efecto del tratamiento. En definitiva, esta característica atenta contra la validez interna de la investigación, es decir, pone en cuestión la relación causal que se pretende establecer con ésta.
c)    Escaso control de las variables de confundido. Los diseños cuasi-experimentales se suelen utilizar en investigaciones de carácter aplicado, por lo que se desarrollarán, principalmente, en contextos naturales alejados del laboratorio. En estos contextos el control de todas las variables de posible confundido resulta complicado y, en muchas ocasiones, imposible. Estos contextos naturales pueden ser, entre otros, hospitales, escuelas o empresas. Esta tercera característica, al igual que la anterior, pone en peligro la validez interna de la investigación. Debido al deficiente control de los diseños cuasi-experimentales.
Las características anteriores ponen de manifiesto cuál es el principal problema de los diseños cuasi-experimentales respecto al diseño experimental. Si bien en el diseño experimental se alcanza un alto grado de validez interna, en el diseño cuasi-experimental, por el contrario, la validez interna de la investigación se puede cuestionar. Esto se debe a que los cuasi-experimentos no permiten elaborar conclusiones consistentes acerca de la efectividad del tratamiento, puesto que existen explicaciones alternativas, distintas del efecto de la intervención, para justificar las diferencias que se observan en la variable dependiente. En definitiva, los diseños cuasi-experimentales no nos permiten rechazar completamente otras explicaciones causales distintas a la que nos interesa establecer. Esta es la razón por la que Campbell y Standley (1966) recomiendan la utilización de los diseños cuasi-experimentales únicamente cuando no se puedan asignar aleatoriamente los sujetos a las diferentes condiciones.
Posteriormente Cook y Campbell (1979), señalaron cuáles son las potenciales amenazas contra la validez interna que pueden darse en los diseños cuasi-experimentales, también pueden encontrarse en Shadish, Cook y Campbell, 2002. Tales amenazas son las que presentamos a continuación:
a)    Historia. Son hechos o circunstancias externas que ocurren simultáneamente con la aplicación del tratamiento. El problema es que en este caso el investigador no podrá estar seguro de que los cambios observados en la variable dependiente de su investigación se deban al tratamiento, puesto que podrían deberse al factor de historia.
b)    Maduración. Se refiere a cambios en las condiciones internas de los individuos que coinciden con la aplicación del tratamiento. Se trata de cambios debidos a procesos biológicos o psicológicos, como, por ejemplo, la edad, la fatiga o el aburrimiento.
c)    Efecto de la administración de pruebas previas. Este efecto se produce en los diseños en los que toman medidas pre-test. En principio las diferencias que se observen entre las medidas pre-test y las medidas pos-test se tendrían que atribuir al efecto del tratamiento, no obstante, en ocasiones, una buena parte de esos cambios pueden deberse a la práctica o entrenamiento en el pre-test.
d)    Instrumentación. Se refiere a cambios que se producen en el calibrado de los instrumentos de medida o a problemas con los observadores que coinciden con la aplicación del tratamiento.
e)    Regresión estadística. Se refiere a la tendencia hacia la centralidad que se produce cuando el criterio para formar los grupos es que los individuos presenten puntuaciones extremas. Dicho de otro modo, las puntuaciones extremas tienden a acercarse a la media en el pos-test.
f)     Selección diferencial de los sujetos. Se refiere al sesgo en la formación de los grupos y se produce cuando en la investigación se recurre a grupos naturales o intactos. El problema que se presenta en estos casos es que no queda garantizada la equivalencia inicial de los grupos, por lo que las diferencias que se observen entre éstos después de la intervención pueden deberse a la ausencia de equivalencia inicial y no al efecto del tratamiento.
g)    Mortalidad selectiva. Se refiere a la pérdida no aleatoria de los individuos que forman parte de los grupos. Este problema aparece en los diseños en los que se requiere tomar dos o más medidas de cada individuo en momentos temporales diferentes. Puede ocurrir, en estos casos, que a medida que se desarrolla la investigación se vaya reduciendo el tamaño de la muestra, porque haya individuos para los que no se consiga tomar medidas de todas las observaciones previstas inicialmente.
h)   Interacciones entre la selección y algunas de las amenazas anteriores. Las interacciones más frecuentes se producen entre la selección y la historia -por ejemplo, puede ocurrir que un factor de historia afecte sólo a uno de los grupos de la investigación, introduciendo un sesgo sistemático en la variable dependiente-, y entre la selección y la maduración -que se produce cuando los grupos maduran con un ritmo diferente-.
i)     Ambigüedad acerca de la dirección de la inferencia causal. En algunas investigaciones puede ser difícil determinar si X es responsable del cambio en Y o viceversa. Esta ambigüedad no se producirá si sabemos que X ocurrió antes que Y. Aunque reconocemos que la lectura del listado anterior puede desanimar a un investigador respecto a la utilización de los diseños cuasi-experimentales, queremos recordar que estas amenazas son potenciales, lo cual quiere decir que no necesariamente se producirán en todo diseño cuasi-experimental. Tal como señalan:
León y Montero (1997) no todas las amenazas a la validez interna tienen por qué presentarse siempre a lo menos, no todas a la vez[1]. Por otra parte, si bien un diseño experimental superaría la mayoría de estas amenazas, también sabemos que no siempre es viable llevar a cabo una investigación de este tipo. En consecuencia, siempre será mejor obtener información acerca de un fenómeno, aunque no se disponga de una garantía total de la validez interna, que renunciar al estudio de ese fenómeno. En definitiva, lo que sí es esencial es que el investigador conozca las limitaciones del diseño que ha utilizado para recoger sus datos y actúe en consecuencia cuando se disponga a elaborar sus conclusiones.
1.2.        Clasificación de los diseños cuasi-experimentales
Si bien existen distintas clasificaciones de los diseños cuasi-experimentales, la mayoría de ellas coinciden en proponer dos grupos de diseños. De una parte, están los diseños transversales, y, de otra parte, están los diseños longitudinales (véase por ejemplo: Arnau, 1997, 2003; Ato y Vallejo, 2007). En concreto, vamos a presentar aquí la clasificación propuesta por Arnau (2003).
a.    Los diseños transversales se caracterizan porque estudian el fenómeno en un momento temporal concreto, de manera que la variable de respuesta o variable dependiente se mide en un único momento temporal -como mucho tomaríamos otra medida de la variable de respuesta antes de la intervención o, lo que es lo mismo, tomaríamos una medida pre-test o pre-tratamiento-. Se trata de diseños en los que se comparan grupos.
b.    Los diseños longitudinales, por el contrario, se caracterizan porque en ellos se toman varias medidas de la variable de respuesta para los distintos individuos -que pueden ser uno solo o más de uno (aulas, escuelas, poblaciones)- a lo largo del tiempo. Su objetivo es estudiar los procesos de cambio en función del tiempo y explicarlos.
c.    Los diseños transversales se clasifican a su vez en función de la regla de asignación de los sujetos a los grupos. Así, se distingue entre los diseños con regla de asignación desconocida -el diseño de grupo control no equivalente y el diseño de grupos no equivalentes- y los diseños con regla de asignación conocida -el diseño de discontinuidad en la regresión-.
Los diseños longitudinales se clasifican en:
·         Diseños de series temporales interrumpidas
·         Diseños de medidas repetidas
·         Diseños de cohortes y
·         Diseños en panel.
Vamos a presentar ahora una breve descripción de cada uno de estos diseños.
El diseño de grupo control no equivalente, en su forma básica, se caracteriza porque utiliza dos grupos: uno recibe el tratamiento, intervención o programa cuyo efecto se pretende estudiar, y otro no recibe tratamiento o recibe un tratamiento medianamente. Ato y Vallejo (2007). Así se dispone de un grupo experimental y un grupo control. En su forma más simple se toman medidas sólo después de la intervención -el diseño de grupo control no equivalente con medidas sólo pos test-. No obstante, en este caso, los problemas de control son tan grandes que muchos autores no incluyen este diseño en la categoría de cuasi-experimento, sino en la de pre-experimento. Si al diseño anterior se le añaden unas medidas pre-test, alcanzará la categoría de diseño cuasi-experimental. En este caso, las medidas pre-test permitirán, en primer lugar, valorar la equivalencia inicial de los grupos y, en segundo, controlarla en caso de que se dé la no equivalencia. Este diseño se denomina diseño de grupo control no equivalente con pre-test y pos-test.
El diseño de grupos no equivalentes es similar al diseño anterior, no obstante, en este caso, los grupos reciben tratamientos distintos. Además, se trata de grupos naturales, por lo que se tomarán medidas pre-test como elemento de control de la equivalencia de los mismos.
El diseño de discontinuidad en la regresión se caracteriza porque, a diferencia de los anteriores, se conoce la variable de asignación de los sujetos a los grupos Trochim (2006)[2]. Esta variable de asignación es una medida pre-test.
La forma de proceder para formar los grupos es la siguiente: una vez tenemos la medida pre-test para todos los sujetos, éstos se ordenan en función de esa medida y se establece una puntuación de corte para asignar los sujetos a los grupos. Los sujetos con una puntuación por encima del punto de corte formarán parte de uno de los grupos y los sujetos con una puntuación por debajo del punto de corte pasarán a formar parte del otro grupo. Se trata de un diseño que goza de mucho prestigio porque incrementa las posibilidades interpretativas respecto a los otros diseños cuasi-experimentales, aproximándose incluso al diseño experimental. Shadish, Cook y Campbell (2002).
·         Los diseños de series temporales interrumpidas presentan como característica fundamental el registro de múltiples medidas previas y múltiples medidas posteriores a la introducción de un tratamiento o de un programa de intervención.
Dentro de este grupo de diseños se distingue, a su vez, entre el diseño de series temporales simple y el diseño de series temporales con grupo control no equivalente. Arnau (1995). El primer diseño es aquél en el que se trabaja con un solo grupo de individuos, mientras que el segundo es aquél en el que se emplea un grupo experimental y un grupo control, con la finalidad de valorar de forma más rigurosa si los cambios producidos entre las fases pre y post-intervención son iguales en ambos grupos. Este segundo diseño tiene mayor validez interna que el primero.
·         Los diseños longitudinales de medidas repetidas son aquellos en los que se registran más de dos medidas repetidas en el tiempo con el propósito de conocer el proceso de crecimiento de una muestra de sujetos. En estos diseños lo que se hace es modelar los datos con ajustes de polinomios con el fin de estudiar las curvas de crecimiento. Este tipo de diseño también se denomina diseño longitudinal de múltiples observaciones. Un tipo especial de diseño longitudinal de medidas repetidas es el diseño de muestra dividida. En este diseño se trabaja con dos o más grupos de sujetos que se han formado en función de una variable de carácter social, biológica o psicológica, y se toman medidas para cada individuo en momentos temporales diferentes.
·         El diseño longitudinal de cohortes nos permite estimar los efectos de la edad, el periodo y la cohorte en un proceso de cambio. Una cohorte es un grupo o agregado de individuos, dentro de una población específica, que ha experimentado el mismo acontecimiento vital en un intervalo de tiempo determinado. Visser (1985)[3]. Aunque la variable más usada para delimitar la cohorte es la fecha de nacimiento, pueden utilizarse otras: los individuos casados en un período de tiempo establecido, los individuos que asistieron a la escuela en un determinado año, etc.
·         El diseño longitudinal en panel consiste, en la situación más simple, en medir dos variables de una misma muestra de sujetos a lo largo de una serie de tandas o momentos históricos. El objetivo es establecer, mediante la técnica de correlación cruzada en panel, la posible relación causal entre las variables medidas y el sentido de la causalidad. Se trata de un tipo de diseño que se utiliza mucho en el ámbito social para el estudio de intenciones políticas, preferencias, actitudes u opiniones.





[1] León y Montero (1997) Diseño de investigaciones. Introducción a la lógica de la investigación en Psicología y Educación. (2da. Edic.) Madrid: Editorial Mc Graw-Hill, p. 291.
[2] Trochim, W. M.  (2006). Los métodos de investigación de la base de conocimientos (2da. ed.).  Disponible en http://www.atomicdog.com. Visitado en: abril 2013. 
[3] Visser, R. A. (1985). Análisis de datos longitudinales en la investigación conductual y social.  Leiden: DSWO Press.