Capítulo 4. Selección y Asignación de los elementos a un estudio.

 

Concepto de Universo y Muestra

En matemática los conceptos de elemento y conjunto no se definen. Se les consideran conceptos primarios reconocidos desde la infancia. En estadística ocasionalmente se trabaja con todos los elementos de un conjunto y otras veces se trabaja con solo una parte del mismo. En muchas ocasiones cuando se va a realizar un estudio o investigación resulta imposible, difícil o costoso trabajar con todos los elementos involucrados en el mismo, así se forman los conceptos de Universo o Población (identificado con conjunto) y Muestra como solo una parte de los elementos del conjunto que se quiere estudiar.

Ejemplos.

1) En una fábrica se quiere realizar un estudio sobre la duración de los bombillos incandescentes para lo cual se procedió de la siguiente manera, se seleccionaron al azar el 5% de los bombillos producidos cada día durante una semana, posteriormente se iluminaron todos y se procedió a anotar la duración de cada uno, después se promediaron los tiempos para hallar el tiempo promedio de vida de todo el lote.

2) Se quiere determinar la estatura promedio de los niños cubanos de 5 años de edad. Para lo anterior se selecciona un grupo de niños mediante un procedimiento que garantice se encuentren bien representados los niños cubanos por sexo, razas y lugares de residencia (urbano y rural).

En el primer ejemplo se ve que es imposible probar todos los elementos de la población porque de ser así no quedarían bombillos para comercializar, en el segundo ejemplo se aprecia que es muy difícil y costoso trabajar con todos los niños de cinco años de Cuba por lo tanto es necesario tomar una muestra de ellos, en la misma todos los niños de cinco años, cubanos, deben estar bien representados.

El hecho de que todos los elementos de la población estén bien representados en la muestra es una condición necesaria para poder realizar un buen trabajo estadístico. En efecto, la estadística se divide para dar solución a los problemas en dos partes. Por una parte encontramos a los procedimientos descriptivos y por otra a los inferenciales.

Con los procedimientos descriptivos solo se describe al conjunto. Estos procedimientos no se aplican al trabajo con muestras. Las conclusiones a las que se llega son aplicadas al propio conjunto de elementos que se estudió, en consecuencia es valido para todo él. A los valores así determinados se les llaman parámetros.

Un procedimiento estadístico descriptivo no hace referencia a muestra ni a población. Los conceptos de población y muestra están íntimamente ligados y tiene sentido determinarlos cuando se va a proceder a realizar lo que se conoce como inferencia estadística.

La inferencia estadística realiza un estudio sobre una o varias muestras extraidas de una población o universo y las conclusiones a las que se arriban son aplicables a todos los elementos de dicha población.

Estas conclusiones se aplican a todos los elementos de la población pero ello no quiere decir que todos (absolutamente todos) tienen que cumplir con las características determinadas. Para ello se utiliza la teoría de probabilidades, en el trabajo estadístico de un estudio las pruebas se diseñan de modo que se puede determinar con qué grado de probabilidad se encontrarán las características determinadas en la muestra, entre los elementos que componen la población.

Los estadígrafos muestrales son los valores de la característica estudiada en la muestra y que se pueden considerar coinciden con los de la población con una determinada probabilidad de error.

Existe un concepto mucho mas refinado para el trabajo con poblaciones y es lo que se conoce como población objetivo. Desde el punto de vista de la metodología de la investigación la población objetivo podemos considerarla como aquella población que está limitada por los objetivos de la investigación que queremos realizar.

Ejemplos.

  1. Objetivo: Determinar el peso promedio al nacer de los niños, hijos de madres aparentemente sanas.
  2. Objetivo: Determinar en el municipio Jaruco el peso promedio al nacer de los niños, hijos de madres aparentemente sanas.

En el primer objetivo para conducir con propiedad las acciones tendríamos que considerar a todas las madres del mundo y si se selecciona una muestra para que realmente sea representativa el esfuerzo sería titánico. En el segundo objetivo la población de madres se acota solo al municipio Jaruco.

Lo anterior puede servir para darnos cuenta de lo que significa población objetivo y de la relatividad de los conceptos de muestra y población.

El uso de muestras tiene el objetivo de extraer conclusiones que sean válidas para el universo del cuál se obtuvo dicha muestra. Estas conclusiones tienen 2 propósitos fundamentales:

  1. Estimar el valor de determinada característica de la población (problema de estimación).
  2. Verificación de hipótesis en relación con las características (problemas de pruebas de hipótesis).

Condiciones de una buena muestra

Mientras mayor sea el tamaño de una muestra menor es el error de muestreo que se comete, aunque esto depende de muchos factores como recursos, tiempo disponible, etc. Se considera como error de muestreo a las diferencias que existen entre los valores parámetros y los estadígrafos.

Muestra representativa es aquella que posee calidad y tamaño apropiado para hacer mínimos los errores de muestreo. Si la inferencia estadística realiza generalizaciones sobre el comportamiento de una población estudiando solo una parte limitada de ella (muestra) entonces si la muestra (o las muestras) no es representativa la inferencia carecerá de valor científico.

En virtud de que la selección de la muestra resulta de interés fundamental para que la inferencia sea válida debemos pasar a estudiar los métodos de muestreo.

Métodos de muestreo.

Los métodos de muestreo se conforman en correspondencia con los tipos de muestras que se necesitan seleccionar. Es evidente que el tipo de muestra está en relación directa con los objetivos del trabajo y el tipo de estudio que se necesita hacer.

En general se plantea que existen dos grandes tipos de muestreo que son el muestreo probabilístico, cuando todos los elementos de la población tienen la misma probabilidad de ser seleccionados y el no probabilístico, cuando no se cumple lo anterior.

Las métodos de muestreo pueden ser de conveniencia, opinático, aleatorio simple, sistemático, estratificado, de conglomerado y combinado.

Ejemplo: Se pretende conocer el estado de opinión de la comunidad con respecto a la calidad de la atención que le brinda un centro hospitalario. Para ello se decide encuestar a todas las personas de dicha población que acudan al mismo en el horario de visita un día determinado.

Ejemplo: Se desea determinar cuales son, a criterio de los profesores de una escuela, las cualidades que debe reunir un buen alumno. Para ello se decide entrevistar a aquellos profesores que, según la opinión del investigador, tienen el más alto nivel pedagógico dentro del claustro.

Ejemplo: Se asigna un número diferente a cada elemento del Universo y se seleccionan los que integrarán la muestra por medio de una Tabla de números aleatorios o por fichas numeradas que se extraen de un bombo.

k: número entero que representa al intervalo de selección

N: tamaño del Universo o Población

n: tamaño que se fijó para la Muestra

Se toma como punto de arranque cualquier punto situado entre 1 y k, a partir del cual se va adicionando el valor k.

Ejemplo: Para controlar la calidad de los exámenes complementarios realizados en un laboratorio clínico, el jefe de laboratorio decide repetir personalmente la prueba a 10 de las 250 extracciones de sangre realizadas ese día.

N = 250 n =10 k =250/10 =25

Se escoge como punto de arranque cualquier número entero entre 1 y 25 para inicial la selección. Supongamos que se escoge el 8, la muestra quedará entonces integrada por las extracciones número: 8 ; 33 ; 58 ; 83 ; 108 ; 133 ; 158 ; 183 ; 208 y 233.

Ejemplo: Se quiere determinar la proporción de fumadores entre los pobladores de una comunidad, según el sexo. Se fijó que el tamaño de la muestra debe ser de 300 individuos. Si las mujeres representan el 55% de los habitantes y por tanto los hombres el 45% restante, se escogerían al azar para integrar la muestra un total de 165 mujeres y 135 hombres. Ellos representan el 55% y el 45% respectivamente de 300.

Queda así constituida la muestra con una representación de cada sexo en la misma proporción en que lo está en la población.

También pudo haberse operado de la manera siguiente: si el tamaño de la muestra representa, por ejemplo, el 20% del tamaño del Universo, se seleccionan el 20% del total de mujeres y de hombres respectivamente.

Ejemplo: Para identificar los factores de riesgo vulnerables de la enfermedad ateroesclerótica en los trabajadores agrícolas de una provincia, se seleccionan aleatoriamente un número de cooperativas de producción agropecuaria y se estudian a todos los trabajadores de dichos centros.

Ejemplo: Para un estudio sobre Enfermedades de Transmisión Sexual en un municipio, se selecciona una tercera parte de los consultorios del Médico de la Familia del área urbana y del área rural respectivamente (Estratificado). La muestra quedará integrada por todos los adultos de los consultorios seleccionados ( por Conglomerados).