´ Tecnicas de Muestreo I Patricia Isabel Romero Mares Departamento de Probabilidad y Estad´ıstica IIMAS UNAM octubre 2014 1 / 19 Muestreo de conglomerados 2 / 19 Muestreo por conglomerados (una etapa) Un conglomerado es un conjunto de elementos de la ´ poblacion. Una muestra de conglomerados es una muestra aleatoria en ´ o conglomerado la cual cada unidad muestral es una coleccion de elementos. El uso de conglomerados se debe a dos razones principalmente: 1 No existen marcos de elementos, o son muy caros de construir, o es imposible construirlos. 2 Muestrear conglomerados es menos costoso que un m.a.s. de elementos, sobre todo cuando el costo de ´ se incrementa al aumentar la obtener la informacion distancia entre los elementos. 3 / 19 Muestreo por conglomerados (una etapa) ´ Por ejemplo, una m.a.s. de 600 casas cubre una ciudad mas uniformemente que una m.a.s. de 20 manzanas con un promedio de 30 casas en cada manzana. Pero se incurre en mayores gastos el localizar 600 casas y ´ de 20 manzanas y la viajar entre ellas, que en la localizacion visita a todas las casas en esas manzanas. ´ el m.a.s. de las 600 casas supone que tenemos un Ademas, marco de casas. En cambio, s´ı podemos tener un marco de manzanas. 4 / 19 ˜ de los conglomerados Tamano ˜ de los conglomerados En algunas situaciones el tamano (numero de elementos que los componen) esta´ dado. Por ´ ejemplo, si los conglomerados son las casillas electorales y los elementos de cada conglomerado son los votantes de la ˜ esta´ fijo. casilla, el tamano ˜ de los En otros casos, nosotros definimos el tamano conglomerados, por ejemplo, si queremos estimar la ´ de arboles ´ proporcion muertos en cierto bosque, debemos ´ definir el area de bosque de cada conglomerado. ´ Si existe variabilidad en la densidad de arboles muertos a lo ´ largo del bosque, entonces, ser´ıa deseable muestrear areas ˜ seleccionadas al azar o sistematicamente. ´ pequenas 5 / 19 ˜ de los conglomerados Tamano 6 / 19 ˜ de los conglomerados Tamano ´ ˜ ⇒ control variabilidad. Muchas areas pequenas ´ Pocas areas grandes ⇒ econom´ıa. Elementos dentro del conglomerado pueden estar correlacionados. ˜ y numero Balance entre tamano de conglomerados. ´ ˜ de conglomerado. Pruebas piloto con varios tamanos 7 / 19 muestreo por conglomerados En muestreo estratificado queremos que los estratos ´ ´ contengan unidades muy homogeneas dentro y heterogeneas entre estratos. En muestreo por conglomerados queremos que los ´ conglomerados contengan unidades muy heterogeneas dentro ´ y homogeneas entre ellos. 8 / 19 ´ Notacion A nivel poblacional: ´ N No. de conglomerados en la poblacion n Mi M = ∑Ni=1 Mi Yij i Yi = ∑M j=1 Yij No. de conglomerados en muestra No. de elementos en el conglomerado i,i = 1, . . . , N ´ Total de elementos en la poblacion ´ del elemento j Valor de la medicion del conglomerado i (a veces no lo tenemos) Total del conglomerado i (a veces es lo que tenemos) 9 / 19 ´ Notacion Y¯ i = 1 Mi M i Yij ∑j=1 i Y = ∑Ni=1 Yi = ∑Ni=1 ∑M j=1 Yij Y¯ = Y¯ e = Y M 1 N ∑Ni=1 Yi = ∑N i=1 Yi ∑N i=1 Mi Promedio del conglomerado i Total poblacional Promedio de totales de conglomerados (generalmente no interesa) Promedio por elemento (es el que interesa) Sb2 = 1 N−1 ∑Ni=1 Yi − Y¯ 2 Varianza entre totales de conglomerados 10 / 19 Estimador del Total poblacional Suponga que tenemos una m.a.s. de n conglomerados. El estimador del promedio por conglomerado es: 1 n Yˆ¯ = ∑ yi n i=1 i donde yi = ∑M j=1 yij es el total observado del conglomerado i. El estimador del total poblacional Y es: N n Mi N n Yˆ = N Yˆ¯ = ∑ yi = ∑ ∑ yij n i=1 n i=1 j=1 11 / 19 Estimador del Total poblacional Con varianza y estimador de varianza: n Sb2 N n n Sˆ b2 1− N n V Yˆ = N2 1 − Vˆ Yˆ = N2 donde Sˆ b2 = 1 n ∑ yi − Yˆ¯ n − 1 i=1 2 12 / 19 Estimador de la Media poblacional (por elemento) ´ Si se conoce M, el total de elementos en la poblacion, entonces, el estimador de la Media poblacional por elemento es: Yˆ N n Yˆ¯ e = = ∑ yi M Mn i=1 Con varianza y estimador de varianza: V Yˆ¯ e = 1 V Yˆ M2 Vˆ Y¯ˆ e = 1 ˆ ˆ V Y M2 13 / 19 Caracter´ısticas de estos estimadores Estos dos estimadores, el del total poblacional y de la media poblacional por elemento, son insesgados, pero frecuentemente tienen varianzas grandes, ya que si el numero ´ de elementos en los conglomerados (Mi ) es muy diferente, genera variabilidad entre los totales de los conglomerados. ˜ del conglomerado Mi esta´ fuertemente Si el tamano relacionado con el total del conglomerado, lo que generalmente ´ sucede, entonces se prefieren estimadores de razon. 14 / 19 ´ Estimador de la Media poblacional por elemento. (Razon) Yˆ = Yˆ¯ e = ˆ M N n n ∑i=1 yi N n n ∑i=1 Mi = ∑ni=1 yi ∑ni=1 Mi con varianza: n 1 1 N Yi − Y¯ e Mi V Yˆ¯ e = 1 − ¯2∑ N nM N −1 i=1 2 donde, ¯ = M es el tamano ˜ promedio de los conglomerados M N 15 / 19 ´ Estimador de la Media poblacional por elemento. (Razon) Estimador de varianza: n n 1 1 Vˆ Yˆ¯ e = 1 − ∑ N nM ¯ˆ 2 i=1 donde ˆ ˆ¯ = M = M N N n yi − Yˆ¯ e Mi 2 n−1 n Mi ∑ni=1 Mi =∑ N i=1 n 16 / 19 ´ Estimador del Total poblacional. (Razon) Yˆ = M Yˆ¯ e con M conocida. Con varianza y estimador de varianza: V Yˆ = M 2 V Yˆ¯ e Vˆ Yˆ = M 2 Vˆ Yˆ¯ e 17 / 19 ´ poblacional. (Razon) ´ Estimador de una Proporcion Sea Yij = 1 Uij tiene la caracter´ıstica 0 Uij no tiene la caracter´ıstica ´ de unidades con la caracter´ıstica El estimador de la proporcion es: ∑n yi Pˆ = ni=1 ∑i=1 Mi con varianza estimada: ˆ i n 1 1 n yi − PM Vˆ Pˆ = 1 − ∑ ˆ¯ 2 i=1 N nM n−1 2 18 / 19 ˜ de muestra Tamano ´ δ y la confianza 1 − α Se fijan la precision = z1−α/2 V Yˆ¯ e δ 2 = z21−α/2 1 1 − n N δ 1 2 ¯ 2 Sb M Despejando n: n= Nz21−α/2 Sb2 = 2 ¯ 2 + z2 Nδ 2 M 1−α/2 Sb NSb2 ¯2 Nδ 2 M z21−α/2 + Sb2 19 / 19
© Copyright 2025