Metodología de Investigación Científica.

sábado, 17 de agosto de 2013

REPRESENTATIVIDAD DE LA MUESTRA


Al reflexionar sobre tema afirmamos que uno de los problemas elementales que se le presenta al investigador referente con el muestreo consiste en saber si el grupo designado es verdaderamente representativo del conjunto; para que lo sea, los rasgos de los elementos o individuos elegidos para la muestra deben ser similares a los de toda la población (Marín Ibáñez, 1990).

La característica más trascendente de una muestra es la representatividad. El muestreo obtiene todo su sentido en tanto que garantiza que las características que se quieren observar en la población quedan expresadas apropiadamente en la muestra. De manera que generalizar a la población desde la muestra sólo está justificado si ésta representa realmente a la población. Preservar la representatividad es el atributo más importante que debe reunir el muestreo, lo que nos permitirá generalizar a la población los resultados obtenidos en la muestra[1].

Otra perspectiva sobre el tema es de Fox (1990) señala que para lograr la representatividad se requiere lo siguiente:
·         Conocer qué características (variables) están relacionadas con el problema que se estudia.
·         Capacidad para medir esas variables.
·         Poseer datos de la población sobre estas características o variables para usarlos como variable de comparación. 
El mismo autor señala que si no se cumple alguna de estas condiciones, para algunas de las características, se pierde la capacidad de buscar deliberadamente la representatividad en cuanto a ella.

En virtud de lo señalado afirmamos que la selección aleatoria de la muestra garantiza la ausencia de sesgo en el proceso de selección de la misma, ayuda a garantizar su  representatividad, sin embargo esta circunstancia no es garantía total para que estemos seguros de que la muestra al azar es representativa de la población de la que se ha extraído (Kerlinger, 1985). Se espera que sea representativa de las características relevantes de la población, pero pudiera no serlo. Lo normal es que lo sea, ya que lo típico, lo representativo de la población, es lo que aparece con más frecuencia, pero no hay seguridad total. El muestreo estratificado proporcional asegura, en cambio, la representatividad en cuanto a una o dos características (Jiménez Fernández, 1983).
El factor del impacto según Fox (1990) que otra forma de examinar el problema de la representatividad de la muestra consiste en distinguir entre la muestra invitada, la muestra aceptante y la muestra productora de datos. La primera corresponde al conjunto de individuos “invitados” del conjunto de la población, la segunda hace referencia al grupo de individuos que aceptan participar y la muestra productora de datos coincide con la muestra real del estudio. Si se poseen datos sobre la población se pueden comparar con ellos la muestra invitada o la aceptante y, mediante algún contraste de significación adecuado (por ejemplo chi-cuadrado), determinar si difieren de ella en las características que interesa en una investigación dada. Si el contraste indica que no hay diferencias significativas en las variables consideradas, se puede admitir la representatividad de la muestra para las características en cuestión, pero nada se puede afirmar sobre la representatividad de la muestra respecto de cualquier otra variable

Ahora bien, si en caso, no se ha logrado representatividad en una o varias variables, el investigador tiene dos opciones:
  • Trabajar con la muestra no representativa y contar con ese límite.
  • Seleccionar más elementos de la población, con la esperanza de que una muestra mayor sí sea representativa, aunque el estudio tenga una muestra mayor de buscada inicialmente.
Finalmente, es preciso preguntarse qué pérdida puede tolerarse desde la selección de la muestra inicial hasta llegar a la que proporciona los datos. Al mismo tiempo, hay que tener en cuenta que se tiene constancia probada de que las personas que no responden tienen opiniones o patrones de conducta distintos de las que responden; y que el porcentaje de la pérdida también depende, para su representatividad, de cómo se distribuyan las respuestas en la diferentes categorías de la variable. No es igual un 48% de “sí” y un 52% de “no” ante determinada pregunta que un 16% y un 84%[2]. En cualquier caso, no existe una única respuesta cuantitativa. Se suele considerar que una pérdida del 25% debe preocupar, aun cuando no existan diferencias estadísticamente significativas; cuando sea inferior al 50% -se debe leer y escribir con cuidado-; y cuando la proporción es menor del 40% no se deberían dar a conocer los datos, ni considerarlos como conclusiones válidas. Son útiles como estudios pilotos, pero no se pueden aceptar sin hacer un estudio posterior más exhaustivo (La Torre, Rincón y Arnal, 2003, p. 83).

2.    TAMAÑO DE LA MUESTRA.

El tamaño de la muestra va estrechamente unido con la representatividad, no tiene fácil solución.  En  un inicio hay que rechazar la idea, demasiado extendida, de que la muestra debe ser proporcional a la población. De hecho, a medida que aumenta ésta con una menor proporción podemos alcanzar la representatividad. Sin embargo, en igualdad de otras condiciones, los estadísticos calculados con muestras grandes son más precisos que los calculados con muestras pequeñas, pero una muestra representativa de 50 elementos es preferible a otra no representativa de 100 (Jiménez, 1983).

En la investigación no existe un tamaño ideal de la muestra. A efectos descriptivos, se considera una muestra grande cuando n > 30. Una muestra debe ser lo suficientemente grande como para ser representativa, pero el número de elementos necesarios para lograr la representatividad varía en un estudio a otra. Cuanto más homogénea es una población en las características objeto de estudio, más fácil resulta conseguir muestras representativas sin necesidad de que sean grandes. Es decir, el tamaño de la muestra está en relación directa con la desviación típica de las puntuaciones en las características de la variable a estudiar.

El tamaño de la muestra viene condicionado por el tanto por ciento de la característica que estamos estudiando. Cuando no se conoce es conveniente hacer algún pequeño estudio inicial con una muestra mucho menor para tener alguna idea de ese porcentaje. Por ejemplo: alumnos que se matriculan Seminario II y después no asisten o abandonan. Cuando tenemos una proporción de la característica del 50% estamos ante lo que se designa como el caso más desfavorable porque exige la muestra mayor.  Si no conocemos la proporción se asigna el 50% como la opción más segura en los cálculos de la muestra.

Según Fernández (1983) el tipo de datos que se desea recoger y el medio que para ello se va a emplear son condicionantes que influyen en la menor o mayor reducción de la muestra seleccionada. No es igual seleccionar, por ejemplo, aulas ya organizadas y recoger la información en días y horas lectivos que hacerlo a través de un cuestionario enviado por correo.

Otro autor sostiene que el tamaño de la muestra también depende del tipo de muestreo que se ha llevado a cabo. Por ejemplo: en las muestras estratificadas, el error es menor que en las no estratificadas, y también lo es el tamaño de la muestra necesario[3].

En lo referente a la finalidad del nivel de confianza que queramos que alcancen nuestros resultados también influye en el tamaño que debamos dar a la muestra. Entre +2 y -2 sigmas de la curva de distribución normal de Gauss, a partir de la media, está incluido el 95.5% de la población. Esto quiere decir que tenemos una probabilidad de que 955/1000 coincidan con los de la población total. Si queremos alcanzar una mayor certidumbre hemos de abarcar entre +3 y -3 sigmas, en cuyo caso el riesgo de que exista diferencia entre los estadísticos de la muestra y los parámetros de la población sean distintos será de 997/100, pero naturalmente tendremos que elevar el número de elementos de la muestra.

Otro dato determinante del tamaño de la muestra es el error de estimación. Es lógico pensar que no haya una coincidencia total entre los datos de la población y los de la muestra. Hemos de indicar el máximo error tolerable, que suele establecerse en el 5%. Pero si queremos rebajar ese error tendremos que aumentar el volumen de la muestra.

En consecuencia, señalamos que determinar el tamaño de la muestra es un tema complejo. Por tanto, el investigador habrá de tener en cuenta: la amplitud del universo (infinito o no), representatividad,  las variables (tipo de datos, valores de la misma, homogeneidad/variabilidad de los datos), el tipo de muestreo, el proceso y medios de recogida de datos, los análisis estadísticos que se planifiquen, el error muestral, el error de estimación y el nivel de confianza con el que deseemos trabajar entre otras consideraciones. Con esta base se tendrán los referentes necesarios para determinar el tamaño de la muestra.


[1] La Torre, A.; Rincón, D. y Arnal, J. (2003) Bases Metodológicas de la Investigación Educativa. Barcelona: Experiencia S.L., p. 82.
[2] Jiménez, C. (1983) Población y muestra. El muestreo. Madrid. UNED, p. 249.
[3] Sierra Bravo, R. (1988) Técnicas de investigación Social. Teoría y Ejercicios. Madrid: Paraninfo, p. 226.