distribuciones_19082015

Distribuciones de muestreo fundamentales y descripciones de datos
Muestreo aleatorio
En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de
una población), se selecciona una muestra, entendiendo por tal una parte representativa de la
población. El muestreo es por lo tanto una herramienta de la investigación científica, cuya función
básica es determinar que parte de una población debe examinarse, con la finalidad de hacer
inferencias sobre dicha población.
Poblaciones y muestras
Una población consta de la totalidad de las observaciones en las que estamos
interesados.
Una muestra es un subconjunto de una población.
Algunos estadísticos importantes
Cualquier función de las variables aleatorias que forman una muestra aleatoria se llama estadístico.
Medidas de localización de una muestra: la media, la mediana y la moda
muestrales
a) Media muestral:
Medidas de localización de una muestra: la media, la mediana y la moda
muestrales
b) Mediana muestral:
c) La moda muestral es el valor que ocurre con mayor frecuencia en la muestra.
Ejercicio capítulo 8
8.3 Los tiempos que los 9 individuos de una muestra aleatoria tardan en reaccionar
ante un estimulante se registraron como 2.5, 3.6, 3.1, 4.3, 2.9, 2.3, 2.6, 4.1 y 3.4
segundos. Calcule
a) la media;
b) la mediana.
Solución
a) 𝑿 =
𝟐.πŸ“+πŸ‘.πŸ”+β‹―+πŸ‘.πŸ’
πŸ—
=
πŸπŸ–,πŸ–
πŸ—
= πŸ‘, 𝟐
b) Ordenamos los datos de menor a mayor
2,3
2,5
2,6
2,9
3,1
3,4
3,6
4,1
4,3
Las medidas de variabilidad de una muestra: la varianza, la desviación estándar y
el rango de la muestra
a) La varianza muestral:
Ejercicio capítulo 8
8.12 El contenido de alquitrán de 8 marcas de cigarrillos que se seleccionan al azar de la
lista mas reciente publicada por la Comisión Federal de Comercio es el siguiente: 7.3, 8.6,
10.4, 16.1, 12.2, 15.1, 14.5 y 9.3 miligramos. Calcule
a) la media;
b) la varianza.
Solución
a) 𝑿 =
πŸ•.πŸ‘+πŸ–.πŸ”+β‹―+πŸ—.πŸ‘
πŸ–
=
πŸ—πŸ‘,πŸ“
πŸ–
= 𝟏𝟏,6875
Ejercicio capítulo 8
8.12 El contenido de alquitrán de 8 marcas de cigarrillos que se seleccionan al azar de la
lista mas reciente publicada por la Comisión Federal de Comercio es el siguiente: 7.3, 8.6,
10.4, 16.1, 12.2, 15.1, 14.5 y 9.3 miligramos. Calcule
a) la media;
b) la varianza.
Solución
b)
π‘ΊπŸ
=
πŸ•,πŸ‘βˆ’πŸπŸ,πŸ”πŸ–πŸ•πŸ“ 𝟐 +β‹―+ πŸ—,πŸ‘βˆ’πŸπŸ,πŸ”πŸ–πŸ•πŸ“ 𝟐
πŸ–βˆ’πŸ
= 𝟏𝟎, πŸ•πŸ•
Distribuciones muestrales
El campo de la inferencia estadística trata básicamente con generalizaciones y predicciones.
Definición: La distribución de probabilidad de un estadístico se denomina distribución muestral.
La distribución muestral de un estadístico depende de la distribución de la población, del tamaño de las
muestras y del método de selección de las muestras.
Distribución muestral de medias y el teorema del límite central
La primera distribución muestral importante a considerar es la de la media 𝑋. Suponga que de una población
normal con media ΞΌ y varianza Οƒ2 se toma una muestra aleatoria de n observaciones.
Teorema del límite central: Si 𝑋 es la media de una muestra aleatoria de tamaño n, tomada de una población
con media ΞΌ y varianza finita Οƒ2 entonces la forma límite de la distribución de
π‘‹βˆ’πœ‡
𝑍=
𝜎/ 𝑛
a medida que n β†’ ∞, es la distribución normal estándar n(z; 0, 1).
Distribución muestral de la diferencia entre dos medias
Ejercicio capítulo 8
825.La vida media de una máquina para hacer pan es de siete años, con
una desviación estándar de un año. Suponga que las vidas de estas
máquinas siguen aproximadamente una distribución normal y calcule:
a) la probabilidad de que la vida media de una muestra aleatoria de nueve
de estas máquinas caiga entre 6.4 y 7.2 años;
b) el valor de x a la derecha del cual caería 15% delas medias calculadas de
muestras aleatorias de tamaño 9.
8.26 La cantidad de tiempo que le toma al cajero de un banco con servicio en el
automóvil atender a un cliente es una variable aleatoria con una media ΞΌ = 3.2 minutos
y una desviación estándar Οƒ = 1.6 minutos. Si se observa una muestra aleatoria de 64
clientes, calcule la probabilidad de que el tiempo medio que el cliente pasa en la
ventanilla del cajero sea
a) a lo sumo 2.7 minutos;
b) mas de 3.5 minutos;
c) al menos 3.2 minutos pero menos de 3.4 minutos.
828. Se toma una muestra aleatoria de tamaño 25 de una población normal que tiene
una media de 80 y una desviación estándar de 5. Una segunda muestra aleatoria
de tamaño 36 se toma de una población normal diferente que tiene una media de
75 y una desviación estándar de 3. Calcule la probabilidad de que la media
muestral calculada de las 25 mediciones exceda la media muestral calculada de las
36 mediciones por lo menos 3.4 pero menos de 5.9. Suponga que las diferencias de
las medias se miden al décimo más cercano.
829.La distribución de alturas de cierta raza de perros terrier tiene una media de 72
centímetros y una desviación estándar de 10 centímetros; en tanto que la
distribución de alturas de cierta raza de poodles tiene una media de 28
centímetros con una desviación estándar de 5 centímetros. Suponga que las
medias muestrales se pueden medir con cualquier grado de precisión y calcule la
probabilidad de que la media muestral de una muestra aleatoria de alturas de 64
terriers exceda la media muestral para una muestra aleatoria de alturas de 100
poodles a lo sumo 44.2 centímetros.
Distribución muestral de la media muestral para muestras pequeñas
Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de
tamaño n < 30, entonces, la distribución muestral de la media muestral X es la t de Student con n βˆ’ 1 grados de
libertad.
Este teorema implica que la variable aleatoria 𝑑 =
Donde πœ‡π‘‹ es la media de la población y πœŽπ‘‹ =
π‘‹βˆ’πœ‡π‘‹
πœŽπ‘‹
tiene distribución t con n βˆ’ 1 grados de libertad.
𝑠
𝑛
Ejemplos
1. Suponga que de una población normal con media 20 se toma una muestra de tamaño 16. Si la desviación
estándar muestral es 4, encuentre la probabilidad de que la media muestral sea estrictamente mayor que 21,753.
2. Una muestra aleatoria de seis autos de un determinado modelo consumen las siguientes cantidades en
kilómetros por litro:
18, 6 18, 4 19, 2 20, 8 19, 4 20, 5.
Determine la probabilidad de que el consumo de gasolina medio muestral de los automóviles de este modelo sea
menor que 17,6 kilómetros por litro, suponiendo que la distribución de la población es normal con media 17.
Distribución muestral de una proporción muestral
Sea X el número de éxitos en una muestra binomial de n observaciones, donde la probabilidad de éxito es p. Entonces, la
𝑋
proporción de éxitos en la muestra 𝑝 = 𝑛 recibe el nombre de PROPORCIÓN MUESTRAL.
En la mayoría de las aplicaciones, el parámetro p será la proporción de individuos de una gran población que posean la
característica de interés.
Teorema Sea p la proporción de éxitos en una muestra aleatoria de n observaciones. Sea p la proporción de éxitos en la
población. Entonces, la distribución muestral de la proporción muestral 𝑝 tiene media πœ‡π‘ = 𝑝 y varianza πœŽπ‘2 dada por
(Teorema de De Moivre-Laplace) Sea 𝑝 la proporción de éxitos en una muestra aleatoria de n
observaciones. Si se cumple alguna de las dos condiciones siguientes:
β€’ n β‰₯ 30 o
β€’ np β‰₯ 5 y n(1 βˆ’ p) β‰₯ 5,
entonces, la distribución muestral de la proporción muestral p se puede aproximar con una distribución normal.
Este teorema implica que la variable aleatoria 𝑍 =
π‘βˆ’πœ‡π‘
πœŽπ‘
tiene distribución normal. Aquí, πœ‡π‘ y varianza πœŽπ‘ se calculan
de acuerdo al teorema anterior.
Ejemplos
1. Se toma una muestra de 250 casas de una población de edificios antiguos para estimar la proporción de casas de
este tipo cuya instalación eléctrica resulta insegura. Supongamos que, de hecho, el 30% de todos los edificios de
esta población tienen una instalación insegura. Hallar la probabilidad de que la proporción de edificios de la
muestra con instalación insegura esté entre 0,25 y 0,35.
2. Hallar la probabilidad de que en 200 lanzamientos de una moneda no falsa, el número de caras esté
comprendido en el 40% y el 60%.
Distribución muestral de diferencia de dos proporciones muestrales
Ejemplos
1. Los hombres y mujeres adultos radicados en una ciudad grande del norte de cierto país difieren en sus
opiniones sobre la promulgación de la pena de muerte para personas culpables de asesinato. Se cree
que el 12% de los hombres adultos están a favor de la pena de muerte, mientras que sólo el 10% de las
mujeres adultas lo están. Si se pregunta a dos muestras aleatorias, una de 150 hombres y otra de 100
mujeres, su opinión sobre la promulgación de la pena de muerte para personas culpables de asesinato,
determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de
mujeres.
2. Se cree que 0,16 de las industrias de un ´área metropolitana I son textiles. Se cree además que en un
área metropolitana II esta proporción es de 0,11. Si estas cifras son exactas, ¿cuál es la probabilidad de
que una muestra aleatoria simple de 200 industrias del ´área I y una muestra aleatoria simple
independiente de 225 industrias del área II arrojen una diferencia entre las proporciones muestrales
mayor o igual que 0,10?
Distribución muestral de diferencia de medias
Primer caso: varianzas poblacionales conocidas o desconocidas y muestras grandes
1
Segundo caso: varianzas poblacionales desconocidas, iguales y muestras pequeñas.
2
Tercer caso: varianzas poblacionales desconocidas, diferentes y muestras pequeñas.
3
1. La distribución de pesos de los animales de cierto pueblo asiático tiene un peso medio de 72 kilogramos y una
desviación estándar de 10 kilogramos, mientras que la distribución de pesos de los animales de cierto pueblo
africano tiene un peso medio de 28 kilogramos con una desviación estándar de 5 kilogramos. Suponga que las
medias muestrales se pueden medir con cualquier grado de precisión. Encuentre la probabilidad de que la media
muestral para una muestra aleatoria de pesos de 64 animales del pueblo asiático exceda la media muestral para
una muestra aleatoria de alturas de 100 animales del pueblo africano por cuando mucho 44,2 kilogramos.
2. Suponga que dos drogas A y B, de las que se dice que reducen el tiempo de respuesta de las ratas a determinado
estímulo, se están comparando en un experimento de laboratorio. El experimentador supone que las respectivas
poblaciones de los tiempos de respuesta al estímulo están distribuidos normalmente y que sus varianzas
poblacionales son iguales y desconocidas. Se administra la droga A a 12 ratas y la droga B a 13. Cuando se lleva a
cabo el experimento, la reducción promedio de tiempo de respuesta al estímulo por parte de las ratas que están
recibiendo la droga A es 30,45 milisegundos con una desviación típica de 5 milisegundos. Los datos
correspondientes a la droga B son 24,9 y 6 milisegundos. ¿Cuál es la probabilidad de que la diferencia entre la
reducción promedio de tiempo de respuesta al estímulo por parte de las ratas que están recibiendo la droga A y
la reducción promedio de tiempo de respuesta al estímulo por parte de las ratas que están recibiendo la droga B
sea menor o igual a la que se observó en el experimento? Suponga que no hay diferencia alguna entre las dos
drogas con respecto a la reducción promedio en tiempos de respuestas y que las drogas son igualmente efectivas.
Distribución muestral de S2
Si S2 es la varianza de una muestra aleatoria de tamaño n que se toma de una población normal que tiene la varianza Οƒ2,
entonces el estadístico
tiene una distribución chi cuadrada con v = n – 1 grados de libertad.
Los valores de la variable aleatoria 2 se calculan de cada muestra mediante la fórmula
La probabilidad de que una muestra aleatoria produzca un valor Ο‡2 mayor que algún valor específico es igual al área bajo
la curva a la derecha de este valor. El valor Ο‡2 por arriba del cual se encuentra un área de Ξ± por lo general se representa
con Ο‡2Ξ±. Esto se ilustra mediante la región sombreada de la figura
1. Cuando un proceso de producción está funcionando correctamente, la resistencia en ohmios de los
componentes que produce sigue una distribución normal con desviación típica 3,6. Se toma una muestra
aleatoria de cuatro componentes. ¿Cuál es la probabilidad de que la varianza muestral sea mayor a 27?
2. Un fabricante de latas de guisantes está interesado en que el peso medio de su producto esté próximo al peso
anunciado. Además, desea que no haya mucha variabilidad en los pesos de las latas de guisantes, ya que de lo
contrario, una gran proporción de latas diferiría sensiblemente del peso anunciado. Asumamos que la
distribución poblacional de los pesos es normal. Se toma una muestra aleatoria de veinte latas. Hallar el valor
de k que verifica la relación 𝑃
𝑠2
𝜎2
= 0,05
Entonces, 𝑃 πœ’ 2 19 > 19π‘˜ = 0,95. Por tanto, de la tabla, encontramos que 19k = 10,12. De donde k = 0, 533.
La conclusión es que la probabilidad de que la varianza muestral sea menor que un 53% de la varianza
poblacional es 0,05.
Distribución muestral de la razón de dos varianzas
En una prueba sobre la efectividad de dos tipos de píldoras para dormir, A y B, se utilizarán dos grupos
independientes de personas con insomnio. A un grupo de tamaño 61 se le administrará la píldora A y al otro grupo,
de tamaño 41, se le administrará la B, registrándose el número de horas de sueño de cada individuo participante en
el estudio. Suponiendo que el número de hora de sueño de quienes usan cada tipo de píldora se distribuye
normalmente y que s2A = s2B, calcule la probabilidad de que la razón de las varianzas muestrales de A y B sea mayor
que 1,64.