5. Muestreo y tamaño de la muestra

Muestreo
Muestreo
Si la Estadística solo tuviera como objetivo la determinación y la representación gráfica de
las características de un conjunto de datos (describirlos); tal vez no tendría el carácter de
ciencia. El principal objetivo de la Estadística con lo cual actualmente le da una
importancia relevante, es el de hacer inferencias acerca de una población a partir de una
muestra; es decir hacer válido el resultado del análisis de un conjunto de elementos
extraídos de una población (denominado muestra) para la población de la cual se obtuvo.
Entendiendo por población a la colección de toda la posible información que caracteriza
un fenómeno. Entendiendo por población, un concepto mucho más general del que tiene
el significado común esta palabra, no necesariamente implica que está constituida por
personas. En este sentido una población es cualquier colección ya sea de un número finito
de mediciones o una colección grande, virtualmente infinita de datos acerca de algo de
interés.
Estadísticamente hablando de una población interesa conocer determinadas
características de ella, las cuales se presentan en diferentes magnitudes en forma de
valores; dichas características denominadas parámetros se pueden describir
matemáticamente. Para llegar a conocer su valor, se puede proceder de dos formas: El
Censo y El Muestreo.
 CENSO, consiste en analizar el 100% de los elementos que constituyen la población.
 MUESTREO, hace referencia al análisis de solo una parte representativa de los
elementos que tiene la población. Una buena muestra es aquella que refleja las
características esenciales de la población de la cual se obtuvo.
En problemas cotidianos y reales se puede considerar que presenta mayores ventajas el
muestreo con respecto al censo, algunas de las ventajas y desventajas se comentan a
continuación.
Ventajas del muestreo
 Más económico que el censo.
 Reduce considerablemente el tiempo de aplicación.
 Proporciona resultados más oportunos, dado que permite la obtención rápida de
información sobre un proceso variable y de alguna forma la determinación de su
estado en un tiempo fijo.
 Cuando la población es dinámica y no puede mantenerse el tiempo suficiente para su
estudio.
Desventajas del muestreo.
 Los resultados no son tan exactos como con el censo.
1
Muestreo

Requiere de una preparación o capacitación de la persona que lo aplica. Pero respecto
al muestreo. ¿Qué tan válida sería el resultado o la conclusión a la cual se llegara; si la
muestra en la cual se tomara la decisión estuviera basada en un segmento de la
población que no fuera representativo de la misma?
Ejemplos:
¿Qué tanta validez, confiabilidad o certeza, se tendría…?
 Si para obtener el grado de contaminación de un río, la muestra se obtuviera de las
aguas del nacimiento del mismo.
 Si para obtener el índice de personas analfabetas en el país la muestra se obtuviera de
la población que vive en las zonas urbanas.
 Si para definir al candidato ganador en unas elecciones para ocupar un puesto a nivel
nacional, la muestra se obtuviera de una determinada ciudad o estado del país.
 Si para obtener el índice de desempleo en un estado, la muestra se obtuviera de la
población de una ciudad industrial del mismo.
 Por último, si para aceptar o rechazar el embarque relacionado con un pedido de 200
rollos de tela de 150 mts. c/u. El encargado o responsable tomará la decisión del
resultado de la inspección efectuada a los rollos de tela seleccionados de aquellos de
más fácil accesibilidad.
La respuesta a cada uno de los ejemplos sería la misma:
¡Ninguna validez… Ninguna confianza… Ninguna certeza!
Pero, la pregunta o preguntas ahora serían…
 ¿Cuándo es o no válida una muestra?
 ¿Cuándo es o no confiable una muestra?
 ¿Cuándo es o no certera una muestra?
De igual manera, podría existir una sola respuesta a cualquiera de estos tres
cuestionamientos:
Tiene validez, es confiable o certero el resultado, cuando la muestra está compuesta por
elementos que representen las características de la población.
Tipos de muestreo
Hay dos maneras de seleccionar elementos de una población para conformar una
muestra:


Muestreo no aleatorio o a juicio.
Muestreo aleatorio o probabilístico.
2
Muestreo
Muestreo no aleatorio o a juicio
Está basado en el siguiente criterio:
“No todas las muestras tienen un interés de generalización, pudiendo tener un interés de
tipo analítico".
Debido a ello, las muestras son seleccionadas de manera tal que contengan el tipo de
elementos sobre los cuales hacen referencia las proposiciones de la hipótesis que está
siendo sometida a prueba. El muestreo a juicio, también llamado no probabilístico o no
aleatorio, se realiza, teniendo conocimiento de las características de los elementos de la
población; situación que se toma en cuenta al momento de seleccionar los elementos que
pasarán a formar parte de la muestra en la realización del estudio. Ejemplo:
 Un ama de casa que acude al súper a comprar manzanas; seleccionará para compra
solo aquellas manzanas que cubren las características para el fin que persigue en su
utilización; aquellas que son las “mejores”. Y puede ser, que para un ama de casa
diferente, seleccionará manzanas con otras características, pero para ella serán las
“mejores”.
 El entrenador de la selección nacional de fútbol, seleccionará solo los “mejores”
jugadores. Que serán aquellos jugadores que piense les serán aptos para el sistema
que desea implantar.
Por lo expuesto anteriormente, la selección de los elementos que constituyen la muestra
se realiza en base al criterio o juicio del investigador. Estos no se seleccionan por
procedimientos al azar sino en base al conocimiento o interés que el investigador muestre
sobre un determinado elemento, lo que genera que no todos los elementos que forman
parte de la población que se está analizando tienen probabilidad de ser seleccionados. En
lo general estos métodos no probabilísticos carecen de validez científica, además que no
tienen una base teórica para calcular la escala de error ni la representatividad de la
muestra, dado que los elementos seleccionados solo representan las características de la
persona que los elige.
De lo visto, puede decirse que son dos las principales características de los elementos
seleccionados de esta manera.
1. Los elementos de la muestra obtenida no representan las características de los
elementos que componen la población.
2. No todos los elementos que componen la población tienen la misma oportunidad de
ser elegidos.
Los principales métodos de muestreo no probabilístico son:
3
Muestreo
MUESTREO DECISIONAL.
Se presenta cuando los entrevistadores o investigadores de campo utilizan su criterio para
elegir a los elementos con los cuales formarán la muestra. En este tipo de muestreo, el
elemento seleccionado cubre determinadas características las cuales son definidas a juicio
del entrevistador. Este tipo de muestreo es empleado en las llamadas " encuestas de
opinión ", donde las personas que se toman en cuenta para la muestra deben de cubrir
determinadas características con el tema tratado.
MUESTREO DE CUOTA.
Se realiza una clasificación de la población en estudio en función al objetivo del estudio y
se utilizan estas categorías previamente fijadas para obtener un número predeterminado
de elementos de cada categoría. Son muestras casi estratificadas y son utilizadas por las
agencias de investigación de mercados. Esta técnica consiste en fijar un número de
individuos por entrevistar y dejar totalmente al entrevistador (profesional o no), su
localización. El sesgo que introduce el entrevistador, al seleccionar únicamente elementos
que de acuerdo a su interés o facilidad determine que serán parte de la muestra. Es una
de las desventajas más importantes que tiene este tipo de muestreo.
MUESTREO BASADO EN EXPERTOS.
Los elementos se eligen con base en la opinión de personas con autoridad y
suficientemente informadas acerca de la población bajo estudio. Los elementos que
formarán la muestra serán resultado de la de la experiencia o conocimiento del
comportamiento de la población analizada.
Por ejemplo en una investigación sobre la problemática de la educación en el bachillerato.
Al entrevistar a los directores de escuelas de este nivel; la muestra estará formada por
aquellos dirigentes de las instituciones que se consideren más apropiadas al problema
planteado.
MUESTRAS CASUALES.
Este método consiste en investigar a cualquier grupo de personas que son de fácil acceso
o que acuden a un lugar determinado. Son las muestras más utilizadas por los reporteros
de los medios de comunicación (prensa, radio, televisión), así como de algunas agencias
que realizan estudios de mercadeo de opinión. La técnica consiste en entrevistar a los
individuos en forma casual, por ejemplo a uno de cada cinco individuos que pasen por la
calle.
Muestreo aleatorio o probabilístico
Tiene como objetivo obtener muestras representativas de la población que se analiza
basado en la aleatoriedad en la selección de los elementos que formarán la muestra.
Puede decirse que son dos las principales características de los elementos seleccionados
de esta manera.
4
Muestreo
1. Los elementos de la muestra obtenida representan las características de los elementos
que componen la población.
2. Todos los elementos que componen la población tienen la misma oportunidad de ser
elegidos.
En lo general estos métodos tienen una base teórica para calcular la escala de error y la
representatividad de la muestra. Los principales métodos de muestreo aleatorio o
probabilístico son:
MUESTREO ALEATORIO SIMPLE.
Procedimiento:
1. Asignar un número a cada uno de los elementos que constituyen la población.
2. Utilizando la tabla de números aleatorios (también llamada de dígitos aleatorios) ó
bien, introduciendo en un recipiente tantos papelitos numerados como elementos
tiene la población y una vez revueltos estos, extraer del recipiente tantos papeles
como elementos formen la muestra.
Tabla de número aleatorios.
Está formada por filas (→) y columnas (↓). Dependiendo del autor, cada columna está
formada de diferente número de dígitos (2, 5, 10,…). Los dígitos que forman las filas y
columnas se han generado por un proceso completamente aleatorio. La probabilidad que
aparezca cualquier dígito entre cero y nueve o una secuencia de dígitos es la misma en
toda la tabla.
Ventajas del muestreo aleatorio simple.
a) De fácil aplicación.
b) Muy utilizado cuando la población de la cual se extraerán las muestras es finita.
c) Es el indicado cuando no se pueden formar grupos (estratos o conglomerados), con la
población.
Desventajas del muestreo aleatorio simple.
a) Es difícil aplicarlo para poblaciones muy grandes.
b) Se requiere tener una lista completa de los elementos de la población.
MUESTREO ESTRATIFICADO.
Es empleado este tipo de muestreo cuando la naturaleza de la población y el objetivo del
estudio lo permiten. Consiste en formar grupos (estratos) con elementos que presentan
pequeñas diferencias entre sí; pero una diferencia significativa entre grupos o estratos.
Procedimiento
1. Definir de una manera clara y detallada la manera en que se formarán los estratos
(elementos con similares características). Asociando a cada elemento con uno y solo
un estrato.
5
Muestreo
2. Una vez especificados los estratos, se selecciona aleatoriamente de cada uno de ellos
el número de elementos que participarán en la muestra.
Ventajas del muestreo estratificado.
a) Frecuentemente el costo de la recolección de los datos en el muestreo estratificado se
reduce al estratificar en grupos cuyos elementos tienen características similares pero
que difieren de un grupo a otro.
b) Garantiza que en la muestra estén participando elementos de los diferentes grupos
que constituyen la población, los cuales representan las diferentes características que
están contenidas en la misma, generando con ello mayor representatividad de la
muestra.
c) Ofrece la oportunidad de comparación entre los diferentes estratos.
Desventajas del muestreo estratificado.
a) La principal y posiblemente la única, es que no siempre es posible conformar grupos o
estratos con elementos que presenten similitud en cuanto a las características del
objetivo del estudio y ello debido a que la naturaleza de la población no lo permite.
MUESTREO POR CONGLOMERADOS.
Se emplea el muestreo por conglomerados cuando por la naturaleza de la población y el
objetivo del estudio es posible formar grupos (llamados conglomerados), con elementos
que presentan significativas variaciones entre sí, pero existe similitud en cuanto a su
conformación entre grupos o conglomerados.
Procedimiento.
1. Se divide la población en grupos con elementos heterogéneos en cuanto a las
características; objeto del estudio.
2. Definidos estos se seleccionan aleatoriamente uno a uno los conglomerados hasta
completar el tamaño de la muestra.
3. Se efectúa un censo en los conglomerados seleccionados.
Ventajas del muestreo por conglomerados.
a) No se requiere tener una lista completa de los elementos de la población.
b) Para poblaciones grandes o dispersas reduce significativamente los costos con su
aplicación.
Desventajas del muestreo por conglomerados.
Si al conformar los conglomerados no se tiene el cuidado de que estos queden integrados
con elementos que difieren en sus características, en caso de ser estos seleccionados;
desplazarán a otros conglomerados más representativos de la población dado que si
cubren condiciones de heterogeneidad, provocando con ello que la muestra no
represente adecuadamente a la población al quedar excluidos por haberse completado el
tamaño la muestra.
6
Muestreo
Una manera de reducir el error de muestreo, es disminuir el número de elementos que
integran los conglomerados, lo que incrementará el número de conglomerados.
MUESTREO SISTEMATICO.
En el muestreo sistemático, los elementos se seleccionan de la población a un intervalo
uniforme que es medido en tiempo, orden o espacio.
Procedimiento
1. Se define la magnitud del intervalo, la cual se obtiene al dividir el total de elementos
de la población entre el número de elementos que constituirán la muestra.
2. Se elige aleatoriamente un elemento dentro de los primeros "k" elementos que
constituyen el primer intervalo formado dentro del marco muestral y posteriormente
se selecciona en forma sucesiva el "k- ésimo " elemento que sigue al último que se
obtuvo.
Ventajas del muestreo sistemático.
Es especialmente útil en auditorias, cuando la información relevante se registra en forma
ordenada; por ejemplo en computadora o en un archivo de tarjetas. La selección de
cuentas de crédito, registro de mantenimiento de equipo o datos de ventas de los
registros de la compañía.
Desventajas del muestreo sistemático.
Hay situaciones en las que no debe emplearse. Por ejemplo, cuando existe una
periodicidad en el comportamiento de la población; en este caso el muestreo sistemático
puede causar un sesgo, al introducir el error de muestreo que resulta de la influencia
periódica.
Frecuentemente los registros de ventas y los datos financieros que se observan en el
tiempo, tienen un comportamiento cíclico: las ventas en los restaurantes son mayores
durante el fin de semana que durante el resto de los días, los niveles de dinero en efectivo
son más altos alrededor de los días 15 y 30 de cada mes, los préstamos personales son
más frecuentes en los meses de invierno.
Cuestionario:
1.
2.
3.
4.
5.
¿Cuál es el objetivo del muestreo?
¿Cuál es la relación del muestreo con la Estadística?
¿Cuándo es más conveniente el muestreo respecto al censo?
¿Qué significado tiene denominar a una muestra como muestra aleatoria?
¿Cuáles de los siguientes ejemplos están relacionados con muestras aleatorias y cuáles
no? Explique en cada caso:
a) Preguntas que de parte de la Gerencia de una tienda se aplican a cada décimo
cliente respecto a las ofertas que se realizan.
b) Selección de arboles de un aserradero para ser convertidos en madera.
7
Muestreo
c) Selección de “n” alumnos por el Director de una Escuela, para representar en un
concurso de conocimientos.
d) Integrar a la selección de fútbol para representar a México en la próxima Copa del
Mundo.
e) Control del contenido en peso de las cajas de una fábrica de galletas.
Comentarios referentes a la aplicación del muestreo
Antes de definir el tipo de muestreo a utilizar para la conformación de la muestra es
necesario identificar y delimitar los factores que afectan o modifican el resultado del
análisis, que se pretende realizar.
De los siguientes ejemplos, ¿Cuáles consideraría que son factores a tomar en cuenta
relacionados con el objetivo que se plantea?:
Ejemplos:
1. Objetivo: Estimar el tiempo promedio en realizar el maquinado de una pieza.
Factores:
2. Objetivo: Estimar la preferencia por el consumo de una determinada marca de
refresco.
Factores:
3. Objetivo: Estimar el tiempo promedio en realizar el recorrido de una distancia de
una empresa de transporte de carga.
Factores:
8
Muestreo
Tamaño de la muestra
9
Cuando se hace una muestra probabilística, uno debe preguntarse: dado que una
población es de N tamaño, ¿Cuál es el menor número de unidades muestrales (personas,
organizaciones, capítulos de telenovelas, etc.) que necesito para conformar una muestra
(n) que me asegure un determinado nivel de error estándar, digamos menor a 0.01?
La respuesta a esta pregunta busca encontrar una muestra que sea representativa del
universo o población con cierta posibilidad de error (se pretende minimizar) y nivel de
confianza (maximizar), así como probabilidad.
Existen diferentes formulas para calcular el tamaño de la muestra, así como calculadoras
en internet y software estadístico. Veamos el cálculo del tamaño de la muestra aplicando
formulas.
Tamaño de la muestra para datos globales
Una fórmula muy extendida que orienta sobre el cálculo del tamaño de la muestra para
datos globales es la siguiente:
N: es el tamaño de la población o universo (número total de posibles encuestados).
k: es una constante que depende del nivel de confianza que asignemos. El nivel de
confianza indica la probabilidad de que los resultados de nuestra investigación sean
ciertos: un 95 % de confianza es lo mismo que decir que nos podemos equivocar con una
probabilidad del 5%. Los valores de k se obtienen de la tabla de la distribución normal
estándar N (0,1).
Los valores de k más utilizados y sus niveles de confianza son:
Valor k
Nivel de
confianza
1.15
1.28
1.44
1.65
1.96
2.24
2.58
75%
80%
85%
90%
95%
97.5%
99%
e: es el error muestral deseado, en tanto por uno. El error muestral es la diferencia que
puede haber entre el resultado que obtenemos preguntando a una muestra de la
población y el que obtendríamos si preguntáramos al total de ella. El error máximo
aceptable se refiere a un porcentaje de error potencial que admitimos tolerar de que
nuestra muestra no sea representativa de la población (de equivocarnos). Los niveles de
error pueden ir de 20 a 1%. Los más comunes son 5% y 1% (uno implica tolerar muy poco
Muestreo
error, 1 en 100, por así decirlo; mientras que 5%, es aceptar en 100, 5 posibilidades de
10
equivocarnos).
p: porcentaje estimado de la muestra. Es la probabilidad de ocurrencia del fenómeno
(representatividad de la muestra vs no representatividad), esta probabilidad se estima
sobre marcos de muestreo previos o se define. La certeza total siempre es igual a uno, las
posibilidades a partir de esto son “p” de que si ocurra y “q” de que no ocurra (p + q = 1).
Cuando no tenemos marcos de muestreo previos, usamos un porcentaje estimado de
50%, es decir asumimos que p y q serán del 50% (0.50), y que resulta lo más común,
particularmente cuando seleccionamos por primera vez una muestra en una población.
Altos niveles de confianza y bajo margen de error no significan que la encuesta sea de
mayor confianza o esté más libre de error necesariamente; antes es preciso minimizar la
principal fuente de error que tiene lugar en la recogida de datos.
Otra fórmula utilizada para el cálculo de la muestra de datos globales es:
n = (Nσ^2 Z^2) / ((N-1) e^2+σ^2 Z^2)
N = tamaño de la población.
σ = Desviación estándar de la población, que generalmente cuando no se tiene su valor,
suele utilizarse un valor constante de 0,5.
Z = Valor obtenido mediante niveles de confianza. Es un valor constante que, si no se tiene
su valor, se lo toma en relación al 95% de confianza equivale a 1,96 (como más usual) o en
relación al 99% de confianza equivale 2,58, valor que queda a criterio del encuestador.
Los valores de Z son los mismos de k (tabla anterior) para ciertos niveles de confianza.
e = Límite aceptable de error muestral que, generalmente cuando no se tiene su valor,
suele utilizarse un valor que varía entre el 1% (0,01) y 9% (0,09), valor que queda a criterio
del encuestador.
Formulas para calcular tamaño de la muestra según Murray y Larry (2005)
Tamaño de la muestra para una población infinita o desconocida:
Tamaño de la muestra para una población finita y conocida:
Muestreo
Donde:
11
n: tamaño muestral
N: tamaño de la población
Z: valor correspondiente a la distribución de gauss, Zα= 0.05 = 1.96 y Zα= 0.01 = 2.58, para
ciertos niveles de confianza.
p: prevalencia esperada del parámetro a evaluar, en caso de desconocerse (p =0.5), que
hace mayor el tamaño muestral
q: 1 – p (si p = 70 %, q = 30 %)
i: error que se prevé cometer si es del 10 %, i = 0.1
La segunda fórmula prácticamente es la misma que mencionamos al principio para datos
globales, solo que con diferente nomenclatura.
Fórmula para tamaño de la muestra para datos cualitativos
Tamaño de la muestra para población finita cuando los datos son cualitativos, es decir
para análisis de fenómenos sociales o cuando se utilizan escalas nominales para verificar
la ausencia o presencia del fenómeno a estudiar:
s2 = p(1-p) y σ2 = (se)2
Donde:
n: tamaño muestral
n’: tamaño provisional de la muestra
N: tamaño de la población
s2: varianza muestral
σ2: varianza poblacional
se: error estándar
p: % de confiabilidad
Muestreo
Tamaño de la muestra por calculadoras en Internet
Son varios los programas de Internet que nos calculan el tamaño necesario de la muestra
y los intervalos de confianza (o márgenes de error) dado el tamaño de la población y
también cuál es el margen de error para un determinado tamaño de la muestra, por
ejemplo:
Creative Research Systems. The Survey System Sample Size Calculador
http://www.surveysystem.com/sscalc.htm
Market Research Surveys Online http://www.macorr.com/ss_calculator.htm
Raosoft sample size calculator, http://www.raosoft.com/samplesize.html
Se pueden buscar en Google con “samples size calculators” o en español.
12