NOTAS CONCEPTUALES SOBRE MUESTREO Básicamente

Introducción a los Métodos Estadísticos
Profesor: Jaime Mosquera Restrepo
NOTAS CONCEPTUALES SOBRE MUESTREO
Básicamente existen dos formas de acceder a la información en un estudio investigativo,
a través de Censo o Muestreo, siendo la primera alternativa muy restringida en cuanto a
su aspecto logístico y económico, mientras que mediante la utilización de la metodología
del muestreo es posible reducir dichas restricciones, sacrificando de alguna manera
confiabilidad y validez en los resultados obtenidos.
La manera de aplicar las técnicas de muestro puede darse mediante la utilización de dos
metodologías: Muestreo Probabilístico y Muestreo no Probabilístico, los cuales
presentan diferencias en cuanto a la forma de elección de las unidades muestrales.
A través del muestreo probabilistico, la elección de las unidades muestrales está basada
en el calculo de probabilidades, mientras que en el muestreo no probabilistico dicha
elección se da a través de juicios subjetivos de los investigadores.
De esta manera, se define un procedimiento de muestreo como no probabilistico si las
unidades muestrales son elegidas en forma subjetiva, como es el caso de la selección
dirigida, donde las unidades son tomadas en forma “caprichosa”. La muestra dirigida está
constituida por una parte de la población que el investigador considera representativa.
También existe el denominado muestreo de voluntarios, en el cual las unidades
muestrales se presentan en forma voluntaria para proporcionar información sobre alguna
característica en particular, obteniéndose en ambos casos un grado de representatividad
satisfactorio solo cuando las unidades muestrales son homogéneas respecto a la
característica estudiada. Por ejemplo: en un restaurante, una cucharada de sopa o un
sorbo de vino; en un almacén, un trozo de tela o un par de zapatos; en un laboratorio
clínico; 1 cm3 de sangre, situaciones en las cuales los resultados obtenidos al evaluar la
característica estudiada no presentan una variación significativa al elegir una u otra
unidad muestral.
Existen otros métodos de muestreo no probabilistico, entre ellos se encuentran: de
expertos o decisional, en el cual la unidad se selecciona según la opinión del investigador;
el intencional, donde hay una intención marcada al seleccionar; por cuotas, ya que se
define de antemano, por ejemplo, el número de hombres y mujeres que se deben
entrevistar, es decir se fijan cuotas; por agrupación casual, en el cual la muestra se
determina por las unidades que se han reunido de manera casual en un sitio determinado;
de unidades accesibles, donde el criterio de selección es la facilidad de acceso a las
unidades y muestreo de bola de nieve, mediante el cual la conformación de la muestra se
Introducción a los Métodos Estadísticos
Profesor: Jaime Mosquera Restrepo
da a través de la motivación de una pequeña muestra, los cuales a su vez invitan a otras
unidades a participar permitiendo de esta manera integrar una muestra lo suficientemente
grande. En todos estos casos, esta metodología de muestreo carece de validez, debido a
que no es posible cuantificar el error que se comete en la estimación de un parámetro
mediante una muestra, por tal razón algunos autores lo han denominado como muestreo
deterministico o muestreo errático.
Debido a las características poco deseables que presentan los procedimientos de muestro
no probabilísticos, la mayoría de los investigadores optan por escoger una de las técnicas
de muestreo probabilistico para llevar a cabo sus estudios. El presente documento
presenta un resumen conceptual de las diferentes técnicas de muestreo probabilistico, así
como sus ventajas y formas de aplicación, sin llegar a hacer énfasis en el formalismo
matemático y probabilistico del desarrollo del método, calculo de tamaño de muestra o
procedimientos de estimación.
Introducción a los Métodos Estadísticos
Profesor: Jaime Mosquera Restrepo
MUESTREO PROBABILISTICO
El objetivo del Muestreo Probabilistico es seleccionar una parte representativa de la
población con el fin de obtener estimación de uno o un conjunto de parámetros
desconocidos. Para lograrlo existen varios métodos y para cada uno de ellos debe
tenerse en cuenta lo siguiente:
•
El grado de precisión requerido de los estimadores
•
Tamaño de la muestra
•
Costo y Tiempo
En este sentido, se define un estimador como una medida que describe una
característica de la muestra, obtenido a través del cálculo de promedios, tasas,
proporciones, razones, varianzas, desviaciones estándar, etc. A dicho estimador se le
atribuye la propiedad de ser el mejor valor que sustituye a los valores numéricos
poblacionales, generalmente desconocidos, los cuales reciben el nombre de parámetros.
Quizás la decisión más importante que se debe tomar en una investigación por muestreo,
consiste en la determinación del tamaño óptimo de la muestra, simbolizado por n. se dice
que una muestra debe ser pequeña, con el fin de que el costo de la investigación sea lo
suficientemente bajo, y bastante grande para que el error de muestreo sea tolerable.
Para el cálculo del tamaño óptimo de la muestra se deben tener en cuenta los siguientes
componentes:
(1) Error de Muestreo: Se define como la diferencia tolerable entre el valor
poblacional (parámetro) y su estimación.
E = φˆ − φ
En muchos casos este error es determinado por el investigador, basándose en su
experiencia y en el conocimiento previo que posee de la característica de interés
(2) La Varianza: La investigación por muestreo seria una actividad muy sencilla si
todas las características presentarán un alto grado de homogeneidad, pero está
situación no se da en la mayoría de las investigaciones; por lo tanto el tamaño de
la muestra deberá aumentarse conforme al nivel de variabilidad de la
característica de interés, de tal forma que la muestra pueda recoger todos estos
valores extremos que toma la variable.
Introducción a los Métodos Estadísticos
Profesor: Jaime Mosquera Restrepo
En el cálculo del tamaño de la muestra es necesario tener una idea sobre la
variabilidad de la característica de interés, de ahí que surga la necesidad de
estimarla mediante:
o
o
o
Prueba piloto
Referencias obtenidas en censos o investigaciones similares
Conjeturas sobre la población
(3) La Confianza: Se define como la probabilidad deseada de que no se presente
una diferencia mayor a la fijada como error de muestreo E entre el parámetro y
su respectivo estimador.
(4) Tamaño de la Población: Es el ultimo componente de la formula, para calcular el
tamaño de la muestra, cuando se trata de poblaciones finitas. En algunos medios
se presenta la tendencia a creer que el tamaño de la muestra crece
indefinidamente a medida que aumenta el tamaño de la población, lo anterior no
es cierto, ya que existe un punto n el cual el tamaño de la muestra tiende a
estabilizarse, sin importar el tamaño de la población
La aplicación de muestreo probabilística permite la posibilidad de cuantificar la
probabilidad de incluir una unidad determinada en la muestra y su selección se realiza a
través de procedimientos aleatorios, estos métodos satisfacen dos características que los
hacen deseables en las investigaciones por muestreo:
Permiten realizar estimaciones aplicables a la población de la cual proceden, sobre la
base de la información obtenida en la muestra.
Posibilitan la evaluación de la exactitud de dichas estimaciones, mediante el cálculo
de errores y coeficientes de dispersión.
Elimina los posibles sesgos producto de las escogencia subjetiva de las unidades
muestrales.
Existen numerosos procedimientos en la aplicación del muestreo probabilistico. Dentro
de ellos, los de mayor uso en procedimientos de muestreo son:
Introducción a los Métodos Estadísticos
Profesor: Jaime Mosquera Restrepo
MUESTREO ALEATORIO SIMPLE (MAS)
Se trata de un procedimiento de selección de unidades muestrales mediante el cual la
probabilidad de elección es la misma para cualquier unidad, es decir todas las unidades
van a tener la misma probabilidad de pertenecer a la muestra, de tal manera que todas
las posibles muestras son equiprobables.
Este procedimiento es recomendable, en especial cuando la población no es numerosa y
las unidades se concentran en un área pequeña; por otra parte, la característica de
estudio no debe presentar gran variabilidad, ya que implicaría tamaños muestrales muy
amplios, lo que a su vez, incrementaría los costos y tiempos del estudio; por ultimo, se
debe disponer de un marco muestral que facilite la enumeración de las unidades
muestrales para que permita la aplicación de este método.
Procedimiento para seleccionar una Muestra Aleatoria Simple
1. Seleccionar el marco de muestreo adecuado
2. Asignar a cada elemento de la población un número entre 1 y N (tamaño de la
población)
3. Generar n (tamaño de la muestra) números aleatorios diferentes entre 1 y N.
4. Los n números aleatorios generados indicarán los elementos de la población que
conformarán las muestras.
Inconvenientes:
Se requiere de un listado de unidades de la población, lo cual en muchos casos no
es una tarea fácil.
Si área de estudio es grande, es probable que haya la necesidad de desplazarse
hasta lugares lejanos, para investigar unas cuantas unidades, dificultando su
aplicación (costo y tiempo).
No existe garantía de que todas las unidades queden representadas en la muestra.
Nota: Si el coeficiente de variación de la característica en estudio es superior del 30%,
el tamaño de la muestra se incrementará considerablemente.
Ventajas:
El procedimiento para la aplicación de este método es sencillo
Introducción a los Métodos Estadísticos
Profesor: Jaime Mosquera Restrepo
MUESTREO ALEATORIO ESTRATIFICADO (MAE)
Es denominado también como Muestreo Aleatorio Restringido. Este procedimiento
implica una división de la población en grupos, denominados Estratos, de tal forma que el
elemento presenta una característica tan definida que solo le permitirá pertenecer a un
estrato. Por lo tanto, para que la división por grupos sea efectiva, los factores de
estratificación deberán guardar una estrecha relación con los factores que se investiguen
y con el objetivo o finalidad del estudio. De esta manera se asegura una mayor precisión
en los resultados.
Procedimiento para seleccionar una Muestra Aleatoria Estratificada.
1.
2.
3.
4.
5.
6.
Seleccionar el marco de muestreo adecuado
Seleccionar las variables de estratificación y definir el número de estratos L
Dividir la población en L estratos, con base en la característica de clasificación:
cada elemento debes ser asignado solo a un estrato.
Para cada estrato, se enumera las unidades de 1 a Nh (Tamaño poblacional del
estrato h)
Determinar el tamaño de la muestra gomal n y realizar la afinación en cada estrato
de acuerdo con la regla que se ha escogido previamente.
La muestra debe ser conformada dentro de cada estrato. Los tamaños muestrales
para estrato nh podrán obtenerse mediante alguno de estos procedimientos:
a. Asignación Uniforme: El tamaño muestral de los estratos es igual
b. Asignación Proporcional: El tamaño muestral n se distribuyen en los estratos
muestrales en la misma proporción que esta distribuidos en la población.
c. Asignación Optima: Tanto el tamaño de muestra global n como el tamaño de
muestra para cada estrato nh dependen del grado de variabilidad de la
característica en cada estrato y del costo mínimo para un nivel de precisión
dado.
d. Asignación de Mínima Varianza: El tamaño muestral de cada estrato nh es
calculado de forma tal que permita minimizar la varianza del estimador.
Introducción a los Métodos Estadísticos
Profesor: Jaime Mosquera Restrepo
Inconvenientes:
Al igual que el MAS, requiere de un listado de las unidades que constituyen la
población, con el fin de conformar los estratos o subpoblaciones.
Requiere del conocimiento previo de la relación existente entre una característica
adicional y la variación de la característica de interés de tal manera que permita
conformar grupos muy homogéneos pero que de un grupo a otro exista la mayor
heterogeneidad posible.
El procedimiento de elección de las unidades muestrales es mas dispendioso que
para el caso del MAS
Ventajas:
Este método es más eficiente que el MAS, pese al grado de heterogeneidad y
dispersión que pueda presentar la característica analizada, con la ventajas de
conformar grupos homogéneos, las muestras son mas pequeñas y representativas.
Existe la garantía de que los elementos de la población queden bien representados
en la muestra.
Es un método muy útil cuando se presentan situaciones de conveniencia de tipo
administrativo
Nota: si el coeficiente de variación de la variable a estudiar es menor o igual al 30% es
conveniente realizar un muestreo aleatorio simple.
MUESTREO SISTEMATICO (MS)
Este método de muestreo probabilistico es frecuentemente utilizado por su facilidad en lo
que respecta a la selección de la muestra. Se usa principalmente en procedimientos de
muestro sobre archivos físicos y/o magnéticos. Su aplicación requiere que la población
siga una secuencia ordenada que le permita seleccionar la muestra a intervalos
constantes con base en el marco de muestreo.
En pocas palabras se denomina una Muestra Sistemática de 1 en k, a la selección
aleatoria de un elemento de entre los k primeros de un marco de muestreo ordenado y
después cada k del mismo, hasta completar a muestra de tamaño n.
Introducción a los Métodos Estadísticos
Profesor: Jaime Mosquera Restrepo
Procedimiento para seleccionar una Muestra Sistemática.
1.
2.
3.
4.
5.
Seleccionar un marco de muestreo adecuado
Listar los elementos de la población de 1 a N
Dividir el tamaño de la población N entre el tamaño de la muestra n y de esta
manera se determina el intervalo muestral k (k es el entero más próximo a N/n).
Se genera un número aleatorio entre 1 y k, el cual se denominara L y corresponderá
al primer elemento de la muestra.
Los (n-1) elementos restantes deben seguir la secuencia: L+k; L+2k;………..L+(n1)k
Inconvenientes:
Cuando existe periodicidad en el ordenamiento de la población con respecto a la
característica de interés aumenta la varianza del estimador
No existe independencia entre la selección de unidades en las distintas zonas, ya
que las unidades extraídas en cada zona dependen de la seleccionada en la primera
zona
En general solo hay selección aleatoria para la primera unidad de la muestra.
Ventajas:
Extiende la muestra a toda la población
Recoge el posible efecto de estratificación debido al orden en que figuran las
unidades en la población
Permite la consideración de conglomerados en la población
Su procedimiento de aplicación presenta facilidad de aplicación y comprobación
Si la disposición de los elementos en la población es aleatoria, la selección
sistemática equivale a un Muestreo Aleatorio Simple
El error de Muestreo suele ser inferior en un Muestreo Aleatorio Simple e incluso que
en un Muestreo Aleatorio Estratificado
Introducción a los Métodos Estadísticos
Profesor: Jaime Mosquera Restrepo
MUESTREO POR CONGLOMERADOS (MACON)
Una Muestra por Conglomerados puede verse de alguna manera como el equivalente a
una Muestra Aleatoria Simple en la cual las unidades muestrales son colecciones o
grupos de elementos (Conglomerados). Los conglomerados están conformados por
unidades que se encuentran, por lo regular, cercanas geográficamente, como por
ejemplo: barrios, ciudades, departamentos, etc.
En el instante de seleccionar una Muestra por Conglomerados, es necesario tener en
cuenta los siguientes puntos:
Los conglomerados deben estar bien definidos de manera que todos los elementos
de la población pertenezcan solamente a un conglomerado. (No deben haber
traslapes)
El número de elementos que conforman cada conglomerado debe ser conocido o
fácilmente estimable
Por razones de costos, los conglomerados deben ser lo suficientemente pequeños
La escogencia de los conglomerados debe realizarse en forma tal que se minimice el
incremento en el error de muestreo debido a los agrupamientos
Se debe lograr un equilibrio entre el número de conglomerados y el tamaño de los
mismos, ya que muchos conglomerados pequeños permiten controlar la variabilidad,
pero pocos conglomerados grandes son económicamente recomendables
Hay ciertas situaciones en las cuales el Muestreo por Conglomerados surge como
solución a particulares de la investigación, entre ellos los siguientes:
No se tiene un adecuado marco de muestreo de la población objeto de estudio o
su obtención es muy costosa
El costo de obtener la información de las unidades muestrales se incrementa con
la distancia entre ellas
Procedimiento para seleccionar una Muestra por Conglomerados.
1.
2.
3.
Especificación clara de los conglomerados (Delimitación geográfica)
Creación de un marco de muestreo de los conglomerados
Selección de un Muestra Aleatoria Simple de conglomerados
Introducción a los Métodos Estadísticos
Profesor: Jaime Mosquera Restrepo
Inconvenientes:
Menor precisión en las estimaciones, debido a que en la mayoría de los casos existe
un cierto grado de homogeneidad dentro de los conglomerados
La eficiencia de este tipo de muestreo disminuye al aumentar el tamaño de los
conglomerados. Este tipo de muestreo es mas útil cuando la población es numerosa
y permite la conformación de conglomerados grandes
Ventajas:
No necesita un marco de muestreo muy especifico, a diferencia del Muestreo
Aleatorio Simple donde se necesitaba disponer de un listado de las unidades
muestrales o como en el Estratificado donde era necesario disponer de un listado de
las unidades por estrato. Tan solo es necesario un marco de conglomerados, el cual
es mas fácil de construir y menos costoso
El criterio para la conformación de conglomerados puede estar definido por
divisiones territoriales ya establecidas o por necesidades administrativas para las
cuales ya exista información. Se pueden utilizar también áreas geográficas cuyas
características ya estén muy delimitadas
Este aplicación de este método de muestreo es mas rápida y económica, ya que la
concentración de unidades muestrales reduce la necesidad de desplazamiento
recomendables
Hay ciertas situaciones en las cuales el Muestreo por Conglomerados surge como
solución a particulares de la investigación, entre ellos los siguientes:
No se tiene un adecuado marco de muestreo de la población objeto de estudio o
su obtención es muy costosa
El costo de obtener la información de las unidades muestrales se incrementa con
la distancia entre ellas