Muestreo Muestreo Si la Estadística solo tuviera como objetivo la determinación y la representación gráfica de las características de un conjunto de datos (describirlos); tal vez no tendría el carácter de ciencia. El principal objetivo de la Estadística con lo cual actualmente le da una importancia relevante, es el de hacer inferencias acerca de una población a partir de una muestra; es decir hacer válido el resultado del análisis de un conjunto de elementos extraídos de una población (denominado muestra) para la población de la cual se obtuvo. Entendiendo por población a la colección de toda la posible información que caracteriza un fenómeno. Entendiendo por población, un concepto mucho más general del que tiene el significado común esta palabra, no necesariamente implica que está constituida por personas. En este sentido una población es cualquier colección ya sea de un número finito de mediciones o una colección grande, virtualmente infinita de datos acerca de algo de interés. Estadísticamente hablando de una población interesa conocer determinadas características de ella, las cuales se presentan en diferentes magnitudes en forma de valores; dichas características denominadas parámetros se pueden describir matemáticamente. Para llegar a conocer su valor, se puede proceder de dos formas: El Censo y El Muestreo. CENSO, consiste en analizar el 100% de los elementos que constituyen la población. MUESTREO, hace referencia al análisis de solo una parte representativa de los elementos que tiene la población. Una buena muestra es aquella que refleja las características esenciales de la población de la cual se obtuvo. En problemas cotidianos y reales se puede considerar que presenta mayores ventajas el muestreo con respecto al censo, algunas de las ventajas y desventajas se comentan a continuación. Ventajas del muestreo Más económico que el censo. Reduce considerablemente el tiempo de aplicación. Proporciona resultados más oportunos, dado que permite la obtención rápida de información sobre un proceso variable y de alguna forma la determinación de su estado en un tiempo fijo. Cuando la población es dinámica y no puede mantenerse el tiempo suficiente para su estudio. Desventajas del muestreo. Los resultados no son tan exactos como con el censo. 1 Muestreo Requiere de una preparación o capacitación de la persona que lo aplica. Pero respecto al muestreo. ¿Qué tan válida sería el resultado o la conclusión a la cual se llegara; si la muestra en la cual se tomara la decisión estuviera basada en un segmento de la población que no fuera representativo de la misma? Ejemplos: ¿Qué tanta validez, confiabilidad o certeza, se tendría…? Si para obtener el grado de contaminación de un río, la muestra se obtuviera de las aguas del nacimiento del mismo. Si para obtener el índice de personas analfabetas en el país la muestra se obtuviera de la población que vive en las zonas urbanas. Si para definir al candidato ganador en unas elecciones para ocupar un puesto a nivel nacional, la muestra se obtuviera de una determinada ciudad o estado del país. Si para obtener el índice de desempleo en un estado, la muestra se obtuviera de la población de una ciudad industrial del mismo. Por último, si para aceptar o rechazar el embarque relacionado con un pedido de 200 rollos de tela de 150 mts. c/u. El encargado o responsable tomará la decisión del resultado de la inspección efectuada a los rollos de tela seleccionados de aquellos de más fácil accesibilidad. La respuesta a cada uno de los ejemplos sería la misma: ¡Ninguna validez… Ninguna confianza… Ninguna certeza! Pero, la pregunta o preguntas ahora serían… ¿Cuándo es o no válida una muestra? ¿Cuándo es o no confiable una muestra? ¿Cuándo es o no certera una muestra? De igual manera, podría existir una sola respuesta a cualquiera de estos tres cuestionamientos: Tiene validez, es confiable o certero el resultado, cuando la muestra está compuesta por elementos que representen las características de la población. Tipos de muestreo Hay dos maneras de seleccionar elementos de una población para conformar una muestra: Muestreo no aleatorio o a juicio. Muestreo aleatorio o probabilístico. 2 Muestreo Muestreo no aleatorio o a juicio Está basado en el siguiente criterio: “No todas las muestras tienen un interés de generalización, pudiendo tener un interés de tipo analítico". Debido a ello, las muestras son seleccionadas de manera tal que contengan el tipo de elementos sobre los cuales hacen referencia las proposiciones de la hipótesis que está siendo sometida a prueba. El muestreo a juicio, también llamado no probabilístico o no aleatorio, se realiza, teniendo conocimiento de las características de los elementos de la población; situación que se toma en cuenta al momento de seleccionar los elementos que pasarán a formar parte de la muestra en la realización del estudio. Ejemplo: Un ama de casa que acude al súper a comprar manzanas; seleccionará para compra solo aquellas manzanas que cubren las características para el fin que persigue en su utilización; aquellas que son las “mejores”. Y puede ser, que para un ama de casa diferente, seleccionará manzanas con otras características, pero para ella serán las “mejores”. El entrenador de la selección nacional de fútbol, seleccionará solo los “mejores” jugadores. Que serán aquellos jugadores que piense les serán aptos para el sistema que desea implantar. Por lo expuesto anteriormente, la selección de los elementos que constituyen la muestra se realiza en base al criterio o juicio del investigador. Estos no se seleccionan por procedimientos al azar sino en base al conocimiento o interés que el investigador muestre sobre un determinado elemento, lo que genera que no todos los elementos que forman parte de la población que se está analizando tienen probabilidad de ser seleccionados. En lo general estos métodos no probabilísticos carecen de validez científica, además que no tienen una base teórica para calcular la escala de error ni la representatividad de la muestra, dado que los elementos seleccionados solo representan las características de la persona que los elige. De lo visto, puede decirse que son dos las principales características de los elementos seleccionados de esta manera. 1. Los elementos de la muestra obtenida no representan las características de los elementos que componen la población. 2. No todos los elementos que componen la población tienen la misma oportunidad de ser elegidos. Los principales métodos de muestreo no probabilístico son: 3 Muestreo MUESTREO DECISIONAL. Se presenta cuando los entrevistadores o investigadores de campo utilizan su criterio para elegir a los elementos con los cuales formarán la muestra. En este tipo de muestreo, el elemento seleccionado cubre determinadas características las cuales son definidas a juicio del entrevistador. Este tipo de muestreo es empleado en las llamadas " encuestas de opinión ", donde las personas que se toman en cuenta para la muestra deben de cubrir determinadas características con el tema tratado. MUESTREO DE CUOTA. Se realiza una clasificación de la población en estudio en función al objetivo del estudio y se utilizan estas categorías previamente fijadas para obtener un número predeterminado de elementos de cada categoría. Son muestras casi estratificadas y son utilizadas por las agencias de investigación de mercados. Esta técnica consiste en fijar un número de individuos por entrevistar y dejar totalmente al entrevistador (profesional o no), su localización. El sesgo que introduce el entrevistador, al seleccionar únicamente elementos que de acuerdo a su interés o facilidad determine que serán parte de la muestra. Es una de las desventajas más importantes que tiene este tipo de muestreo. MUESTREO BASADO EN EXPERTOS. Los elementos se eligen con base en la opinión de personas con autoridad y suficientemente informadas acerca de la población bajo estudio. Los elementos que formarán la muestra serán resultado de la de la experiencia o conocimiento del comportamiento de la población analizada. Por ejemplo en una investigación sobre la problemática de la educación en el bachillerato. Al entrevistar a los directores de escuelas de este nivel; la muestra estará formada por aquellos dirigentes de las instituciones que se consideren más apropiadas al problema planteado. MUESTRAS CASUALES. Este método consiste en investigar a cualquier grupo de personas que son de fácil acceso o que acuden a un lugar determinado. Son las muestras más utilizadas por los reporteros de los medios de comunicación (prensa, radio, televisión), así como de algunas agencias que realizan estudios de mercadeo de opinión. La técnica consiste en entrevistar a los individuos en forma casual, por ejemplo a uno de cada cinco individuos que pasen por la calle. Muestreo aleatorio o probabilístico Tiene como objetivo obtener muestras representativas de la población que se analiza basado en la aleatoriedad en la selección de los elementos que formarán la muestra. Puede decirse que son dos las principales características de los elementos seleccionados de esta manera. 4 Muestreo 1. Los elementos de la muestra obtenida representan las características de los elementos que componen la población. 2. Todos los elementos que componen la población tienen la misma oportunidad de ser elegidos. En lo general estos métodos tienen una base teórica para calcular la escala de error y la representatividad de la muestra. Los principales métodos de muestreo aleatorio o probabilístico son: MUESTREO ALEATORIO SIMPLE. Procedimiento: 1. Asignar un número a cada uno de los elementos que constituyen la población. 2. Utilizando la tabla de números aleatorios (también llamada de dígitos aleatorios) ó bien, introduciendo en un recipiente tantos papelitos numerados como elementos tiene la población y una vez revueltos estos, extraer del recipiente tantos papeles como elementos formen la muestra. Tabla de número aleatorios. Está formada por filas (→) y columnas (↓). Dependiendo del autor, cada columna está formada de diferente número de dígitos (2, 5, 10,…). Los dígitos que forman las filas y columnas se han generado por un proceso completamente aleatorio. La probabilidad que aparezca cualquier dígito entre cero y nueve o una secuencia de dígitos es la misma en toda la tabla. Ventajas del muestreo aleatorio simple. a) De fácil aplicación. b) Muy utilizado cuando la población de la cual se extraerán las muestras es finita. c) Es el indicado cuando no se pueden formar grupos (estratos o conglomerados), con la población. Desventajas del muestreo aleatorio simple. a) Es difícil aplicarlo para poblaciones muy grandes. b) Se requiere tener una lista completa de los elementos de la población. MUESTREO ESTRATIFICADO. Es empleado este tipo de muestreo cuando la naturaleza de la población y el objetivo del estudio lo permiten. Consiste en formar grupos (estratos) con elementos que presentan pequeñas diferencias entre sí; pero una diferencia significativa entre grupos o estratos. Procedimiento 1. Definir de una manera clara y detallada la manera en que se formarán los estratos (elementos con similares características). Asociando a cada elemento con uno y solo un estrato. 5 Muestreo 2. Una vez especificados los estratos, se selecciona aleatoriamente de cada uno de ellos el número de elementos que participarán en la muestra. Ventajas del muestreo estratificado. a) Frecuentemente el costo de la recolección de los datos en el muestreo estratificado se reduce al estratificar en grupos cuyos elementos tienen características similares pero que difieren de un grupo a otro. b) Garantiza que en la muestra estén participando elementos de los diferentes grupos que constituyen la población, los cuales representan las diferentes características que están contenidas en la misma, generando con ello mayor representatividad de la muestra. c) Ofrece la oportunidad de comparación entre los diferentes estratos. Desventajas del muestreo estratificado. a) La principal y posiblemente la única, es que no siempre es posible conformar grupos o estratos con elementos que presenten similitud en cuanto a las características del objetivo del estudio y ello debido a que la naturaleza de la población no lo permite. MUESTREO POR CONGLOMERADOS. Se emplea el muestreo por conglomerados cuando por la naturaleza de la población y el objetivo del estudio es posible formar grupos (llamados conglomerados), con elementos que presentan significativas variaciones entre sí, pero existe similitud en cuanto a su conformación entre grupos o conglomerados. Procedimiento. 1. Se divide la población en grupos con elementos heterogéneos en cuanto a las características; objeto del estudio. 2. Definidos estos se seleccionan aleatoriamente uno a uno los conglomerados hasta completar el tamaño de la muestra. 3. Se efectúa un censo en los conglomerados seleccionados. Ventajas del muestreo por conglomerados. a) No se requiere tener una lista completa de los elementos de la población. b) Para poblaciones grandes o dispersas reduce significativamente los costos con su aplicación. Desventajas del muestreo por conglomerados. Si al conformar los conglomerados no se tiene el cuidado de que estos queden integrados con elementos que difieren en sus características, en caso de ser estos seleccionados; desplazarán a otros conglomerados más representativos de la población dado que si cubren condiciones de heterogeneidad, provocando con ello que la muestra no represente adecuadamente a la población al quedar excluidos por haberse completado el tamaño la muestra. 6 Muestreo Una manera de reducir el error de muestreo, es disminuir el número de elementos que integran los conglomerados, lo que incrementará el número de conglomerados. MUESTREO SISTEMATICO. En el muestreo sistemático, los elementos se seleccionan de la población a un intervalo uniforme que es medido en tiempo, orden o espacio. Procedimiento 1. Se define la magnitud del intervalo, la cual se obtiene al dividir el total de elementos de la población entre el número de elementos que constituirán la muestra. 2. Se elige aleatoriamente un elemento dentro de los primeros "k" elementos que constituyen el primer intervalo formado dentro del marco muestral y posteriormente se selecciona en forma sucesiva el "k- ésimo " elemento que sigue al último que se obtuvo. Ventajas del muestreo sistemático. Es especialmente útil en auditorias, cuando la información relevante se registra en forma ordenada; por ejemplo en computadora o en un archivo de tarjetas. La selección de cuentas de crédito, registro de mantenimiento de equipo o datos de ventas de los registros de la compañía. Desventajas del muestreo sistemático. Hay situaciones en las que no debe emplearse. Por ejemplo, cuando existe una periodicidad en el comportamiento de la población; en este caso el muestreo sistemático puede causar un sesgo, al introducir el error de muestreo que resulta de la influencia periódica. Frecuentemente los registros de ventas y los datos financieros que se observan en el tiempo, tienen un comportamiento cíclico: las ventas en los restaurantes son mayores durante el fin de semana que durante el resto de los días, los niveles de dinero en efectivo son más altos alrededor de los días 15 y 30 de cada mes, los préstamos personales son más frecuentes en los meses de invierno. Cuestionario: 1. 2. 3. 4. 5. ¿Cuál es el objetivo del muestreo? ¿Cuál es la relación del muestreo con la Estadística? ¿Cuándo es más conveniente el muestreo respecto al censo? ¿Qué significado tiene denominar a una muestra como muestra aleatoria? ¿Cuáles de los siguientes ejemplos están relacionados con muestras aleatorias y cuáles no? Explique en cada caso: a) Preguntas que de parte de la Gerencia de una tienda se aplican a cada décimo cliente respecto a las ofertas que se realizan. b) Selección de arboles de un aserradero para ser convertidos en madera. 7 Muestreo c) Selección de “n” alumnos por el Director de una Escuela, para representar en un concurso de conocimientos. d) Integrar a la selección de fútbol para representar a México en la próxima Copa del Mundo. e) Control del contenido en peso de las cajas de una fábrica de galletas. Comentarios referentes a la aplicación del muestreo Antes de definir el tipo de muestreo a utilizar para la conformación de la muestra es necesario identificar y delimitar los factores que afectan o modifican el resultado del análisis, que se pretende realizar. De los siguientes ejemplos, ¿Cuáles consideraría que son factores a tomar en cuenta relacionados con el objetivo que se plantea?: Ejemplos: 1. Objetivo: Estimar el tiempo promedio en realizar el maquinado de una pieza. Factores: 2. Objetivo: Estimar la preferencia por el consumo de una determinada marca de refresco. Factores: 3. Objetivo: Estimar el tiempo promedio en realizar el recorrido de una distancia de una empresa de transporte de carga. Factores: 8 Muestreo Tamaño de la muestra 9 Cuando se hace una muestra probabilística, uno debe preguntarse: dado que una población es de N tamaño, ¿Cuál es el menor número de unidades muestrales (personas, organizaciones, capítulos de telenovelas, etc.) que necesito para conformar una muestra (n) que me asegure un determinado nivel de error estándar, digamos menor a 0.01? La respuesta a esta pregunta busca encontrar una muestra que sea representativa del universo o población con cierta posibilidad de error (se pretende minimizar) y nivel de confianza (maximizar), así como probabilidad. Existen diferentes formulas para calcular el tamaño de la muestra, así como calculadoras en internet y software estadístico. Veamos el cálculo del tamaño de la muestra aplicando formulas. Tamaño de la muestra para datos globales Una fórmula muy extendida que orienta sobre el cálculo del tamaño de la muestra para datos globales es la siguiente: N: es el tamaño de la población o universo (número total de posibles encuestados). k: es una constante que depende del nivel de confianza que asignemos. El nivel de confianza indica la probabilidad de que los resultados de nuestra investigación sean ciertos: un 95 % de confianza es lo mismo que decir que nos podemos equivocar con una probabilidad del 5%. Los valores de k se obtienen de la tabla de la distribución normal estándar N (0,1). Los valores de k más utilizados y sus niveles de confianza son: Valor k Nivel de confianza 1.15 1.28 1.44 1.65 1.96 2.24 2.58 75% 80% 85% 90% 95% 97.5% 99% e: es el error muestral deseado, en tanto por uno. El error muestral es la diferencia que puede haber entre el resultado que obtenemos preguntando a una muestra de la población y el que obtendríamos si preguntáramos al total de ella. El error máximo aceptable se refiere a un porcentaje de error potencial que admitimos tolerar de que nuestra muestra no sea representativa de la población (de equivocarnos). Los niveles de error pueden ir de 20 a 1%. Los más comunes son 5% y 1% (uno implica tolerar muy poco Muestreo error, 1 en 100, por así decirlo; mientras que 5%, es aceptar en 100, 5 posibilidades de 10 equivocarnos). p: porcentaje estimado de la muestra. Es la probabilidad de ocurrencia del fenómeno (representatividad de la muestra vs no representatividad), esta probabilidad se estima sobre marcos de muestreo previos o se define. La certeza total siempre es igual a uno, las posibilidades a partir de esto son “p” de que si ocurra y “q” de que no ocurra (p + q = 1). Cuando no tenemos marcos de muestreo previos, usamos un porcentaje estimado de 50%, es decir asumimos que p y q serán del 50% (0.50), y que resulta lo más común, particularmente cuando seleccionamos por primera vez una muestra en una población. Altos niveles de confianza y bajo margen de error no significan que la encuesta sea de mayor confianza o esté más libre de error necesariamente; antes es preciso minimizar la principal fuente de error que tiene lugar en la recogida de datos. Otra fórmula utilizada para el cálculo de la muestra de datos globales es: n = (Nσ^2 Z^2) / ((N-1) e^2+σ^2 Z^2) N = tamaño de la población. σ = Desviación estándar de la población, que generalmente cuando no se tiene su valor, suele utilizarse un valor constante de 0,5. Z = Valor obtenido mediante niveles de confianza. Es un valor constante que, si no se tiene su valor, se lo toma en relación al 95% de confianza equivale a 1,96 (como más usual) o en relación al 99% de confianza equivale 2,58, valor que queda a criterio del encuestador. Los valores de Z son los mismos de k (tabla anterior) para ciertos niveles de confianza. e = Límite aceptable de error muestral que, generalmente cuando no se tiene su valor, suele utilizarse un valor que varía entre el 1% (0,01) y 9% (0,09), valor que queda a criterio del encuestador. Formulas para calcular tamaño de la muestra según Murray y Larry (2005) Tamaño de la muestra para una población infinita o desconocida: Tamaño de la muestra para una población finita y conocida: Muestreo Donde: 11 n: tamaño muestral N: tamaño de la población Z: valor correspondiente a la distribución de gauss, Zα= 0.05 = 1.96 y Zα= 0.01 = 2.58, para ciertos niveles de confianza. p: prevalencia esperada del parámetro a evaluar, en caso de desconocerse (p =0.5), que hace mayor el tamaño muestral q: 1 – p (si p = 70 %, q = 30 %) i: error que se prevé cometer si es del 10 %, i = 0.1 La segunda fórmula prácticamente es la misma que mencionamos al principio para datos globales, solo que con diferente nomenclatura. Fórmula para tamaño de la muestra para datos cualitativos Tamaño de la muestra para población finita cuando los datos son cualitativos, es decir para análisis de fenómenos sociales o cuando se utilizan escalas nominales para verificar la ausencia o presencia del fenómeno a estudiar: s2 = p(1-p) y σ2 = (se)2 Donde: n: tamaño muestral n’: tamaño provisional de la muestra N: tamaño de la población s2: varianza muestral σ2: varianza poblacional se: error estándar p: % de confiabilidad Muestreo Tamaño de la muestra por calculadoras en Internet Son varios los programas de Internet que nos calculan el tamaño necesario de la muestra y los intervalos de confianza (o márgenes de error) dado el tamaño de la población y también cuál es el margen de error para un determinado tamaño de la muestra, por ejemplo: Creative Research Systems. The Survey System Sample Size Calculador http://www.surveysystem.com/sscalc.htm Market Research Surveys Online http://www.macorr.com/ss_calculator.htm Raosoft sample size calculator, http://www.raosoft.com/samplesize.html Se pueden buscar en Google con “samples size calculators” o en español. 12
© Copyright 2025