Técnicas de Muestreo I - Departamento de Probabilidad y Estadística

´
Tecnicas
de Muestreo I
Patricia Isabel Romero Mares
Departamento de Probabilidad y Estad´ıstica
IIMAS UNAM
octubre 2014
1 / 19
Muestreo de conglomerados
2 / 19
Muestreo por conglomerados (una etapa)
Un conglomerado es un conjunto de elementos de la
´
poblacion.
Una muestra de conglomerados es una muestra aleatoria en
´ o conglomerado
la cual cada unidad muestral es una coleccion
de elementos.
El uso de conglomerados se debe a dos razones
principalmente:
1
No existen marcos de elementos, o son muy caros de
construir, o es imposible construirlos.
2
Muestrear conglomerados es menos costoso que un
m.a.s. de elementos, sobre todo cuando el costo de
´ se incrementa al aumentar la
obtener la informacion
distancia entre los elementos.
3 / 19
Muestreo por conglomerados (una etapa)
´
Por ejemplo, una m.a.s. de 600 casas cubre una ciudad mas
uniformemente que una m.a.s. de 20 manzanas con un
promedio de 30 casas en cada manzana.
Pero se incurre en mayores gastos el localizar 600 casas y
´ de 20 manzanas y la
viajar entre ellas, que en la localizacion
visita a todas las casas en esas manzanas.
´ el m.a.s. de las 600 casas supone que tenemos un
Ademas,
marco de casas. En cambio, s´ı podemos tener un marco de
manzanas.
4 / 19
˜ de los conglomerados
Tamano
˜ de los conglomerados
En algunas situaciones el tamano
(numero
de elementos que los componen) esta´ dado. Por
´
ejemplo, si los conglomerados son las casillas electorales y los
elementos de cada conglomerado son los votantes de la
˜ esta´ fijo.
casilla, el tamano
˜ de los
En otros casos, nosotros definimos el tamano
conglomerados, por ejemplo, si queremos estimar la
´ de arboles
´
proporcion
muertos en cierto bosque, debemos
´
definir el area
de bosque de cada conglomerado.
´
Si existe variabilidad en la densidad de arboles
muertos a lo
´
largo del bosque, entonces, ser´ıa deseable muestrear areas
˜ seleccionadas al azar o sistematicamente.
´
pequenas
5 / 19
˜ de los conglomerados
Tamano
6 / 19
˜ de los conglomerados
Tamano
´
˜ ⇒ control variabilidad.
Muchas areas
pequenas
´
Pocas areas
grandes ⇒ econom´ıa.
Elementos dentro del conglomerado pueden estar
correlacionados.
˜ y numero
Balance entre tamano
de conglomerados.
´
˜ de conglomerado.
Pruebas piloto con varios tamanos
7 / 19
muestreo por conglomerados
En muestreo estratificado queremos que los estratos
´
´
contengan unidades muy homogeneas
dentro y heterogeneas
entre estratos.
En muestreo por conglomerados queremos que los
´
conglomerados contengan unidades muy heterogeneas
dentro
´
y homogeneas entre ellos.
8 / 19
´
Notacion
A nivel poblacional:
´
N No. de conglomerados en la poblacion
n
Mi
M = ∑Ni=1 Mi
Yij
i
Yi = ∑M
j=1 Yij
No. de conglomerados en muestra
No. de elementos en el conglomerado i,i = 1, . . . , N
´
Total de elementos en la poblacion
´ del elemento j
Valor de la medicion
del conglomerado i (a veces no lo tenemos)
Total del conglomerado i
(a veces es lo que tenemos)
9 / 19
´
Notacion
Y¯ i =
1
Mi
M
i
Yij
∑j=1
i
Y = ∑Ni=1 Yi = ∑Ni=1 ∑M
j=1 Yij
Y¯ =
Y¯ e =
Y
M
1
N
∑Ni=1 Yi
=
∑N
i=1 Yi
∑N
i=1 Mi
Promedio del conglomerado i
Total poblacional
Promedio de totales de conglomerados
(generalmente no interesa)
Promedio por elemento
(es el que interesa)
Sb2 =
1
N−1
∑Ni=1 Yi − Y¯
2
Varianza entre totales
de conglomerados
10 / 19
Estimador del Total poblacional
Suponga que tenemos una m.a.s. de n conglomerados.
El estimador del promedio por conglomerado es:
1 n
Yˆ¯ = ∑ yi
n i=1
i
donde yi = ∑M
j=1 yij es el total observado del conglomerado i.
El estimador del total poblacional Y es:
N n Mi
N n
Yˆ = N Yˆ¯ = ∑ yi = ∑ ∑ yij
n i=1
n i=1 j=1
11 / 19
Estimador del Total poblacional
Con varianza y estimador de varianza:
n Sb2
N n
n Sˆ b2
1−
N n
V Yˆ
= N2 1 −
Vˆ Yˆ
= N2
donde
Sˆ b2 =
1 n
∑ yi − Yˆ¯
n − 1 i=1
2
12 / 19
Estimador de la Media poblacional (por elemento)
´
Si se conoce M, el total de elementos en la poblacion,
entonces, el estimador de la Media poblacional por elemento
es:
Yˆ
N n
Yˆ¯ e =
=
∑ yi
M Mn i=1
Con varianza y estimador de varianza:
V Yˆ¯ e
=
1
V Yˆ
M2
Vˆ Y¯ˆ e
=
1 ˆ ˆ
V Y
M2
13 / 19
Caracter´ısticas de estos estimadores
Estos dos estimadores, el del total poblacional y de la media
poblacional por elemento, son insesgados, pero
frecuentemente tienen varianzas grandes, ya que si el numero
´
de elementos en los conglomerados (Mi ) es muy diferente,
genera variabilidad entre los totales de los conglomerados.
˜ del conglomerado Mi esta´ fuertemente
Si el tamano
relacionado con el total del conglomerado, lo que generalmente
´
sucede, entonces se prefieren estimadores de razon.
14 / 19
´
Estimador de la Media poblacional por elemento. (Razon)
Yˆ
=
Yˆ¯ e =
ˆ
M
N n
n ∑i=1 yi
N n
n ∑i=1 Mi
=
∑ni=1 yi
∑ni=1 Mi
con varianza:
n 1 1 N Yi − Y¯ e Mi
V Yˆ¯ e = 1 −
¯2∑
N nM
N −1
i=1
2
donde,
¯ = M es el tamano
˜ promedio de los conglomerados
M
N
15 / 19
´
Estimador de la Media poblacional por elemento. (Razon)
Estimador de varianza:
n
n 1 1
Vˆ Yˆ¯ e = 1 −
∑
N nM
¯ˆ 2 i=1
donde
ˆ
ˆ¯ = M =
M
N
N
n
yi − Yˆ¯ e Mi
2
n−1
n
Mi
∑ni=1 Mi
=∑
N
i=1 n
16 / 19
´
Estimador del Total poblacional. (Razon)
Yˆ = M Yˆ¯ e
con M conocida.
Con varianza y estimador de varianza:
V Yˆ
= M 2 V Yˆ¯ e
Vˆ Yˆ
= M 2 Vˆ Yˆ¯ e
17 / 19
´ poblacional. (Razon)
´
Estimador de una Proporcion
Sea
Yij =
1 Uij tiene la caracter´ıstica
0 Uij no tiene la caracter´ıstica
´ de unidades con la caracter´ıstica
El estimador de la proporcion
es:
∑n yi
Pˆ = ni=1
∑i=1 Mi
con varianza estimada:
ˆ i
n 1 1 n yi − PM
Vˆ Pˆ = 1 −
∑
ˆ¯ 2 i=1
N nM
n−1
2
18 / 19
˜ de muestra
Tamano
´ δ y la confianza 1 − α
Se fijan la precision
= z1−α/2
V Yˆ¯ e
δ 2 = z21−α/2
1 1
−
n N
δ
1 2
¯ 2 Sb
M
Despejando n:
n=
Nz21−α/2 Sb2
=
2
¯ 2 + z2
Nδ 2 M
1−α/2 Sb
NSb2
¯2
Nδ 2 M
z21−α/2
+ Sb2
19 / 19