Distribuciones de muestreo fundamentales y descripciones de datos Muestreo aleatorio En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de una población), se selecciona una muestra, entendiendo por tal una parte representativa de la población. El muestreo es por lo tanto una herramienta de la investigación científica, cuya función básica es determinar que parte de una población debe examinarse, con la finalidad de hacer inferencias sobre dicha población. Poblaciones y muestras Una población consta de la totalidad de las observaciones en las que estamos interesados. Una muestra es un subconjunto de una población. Algunos estadísticos importantes Cualquier función de las variables aleatorias que forman una muestra aleatoria se llama estadístico. Medidas de localización de una muestra: la media, la mediana y la moda muestrales a) Media muestral: Medidas de localización de una muestra: la media, la mediana y la moda muestrales b) Mediana muestral: c) La moda muestral es el valor que ocurre con mayor frecuencia en la muestra. Ejercicio capítulo 8 8.3 Los tiempos que los 9 individuos de una muestra aleatoria tardan en reaccionar ante un estimulante se registraron como 2.5, 3.6, 3.1, 4.3, 2.9, 2.3, 2.6, 4.1 y 3.4 segundos. Calcule a) la media; b) la mediana. Solución a) πΏ = π.π+π.π+β―+π.π π = ππ,π π = π, π b) Ordenamos los datos de menor a mayor 2,3 2,5 2,6 2,9 3,1 3,4 3,6 4,1 4,3 Las medidas de variabilidad de una muestra: la varianza, la desviación estándar y el rango de la muestra a) La varianza muestral: Ejercicio capítulo 8 8.12 El contenido de alquitrán de 8 marcas de cigarrillos que se seleccionan al azar de la lista mas reciente publicada por la Comisión Federal de Comercio es el siguiente: 7.3, 8.6, 10.4, 16.1, 12.2, 15.1, 14.5 y 9.3 miligramos. Calcule a) la media; b) la varianza. Solución a) πΏ = π.π+π.π+β―+π.π π = ππ,π π = ππ,6875 Ejercicio capítulo 8 8.12 El contenido de alquitrán de 8 marcas de cigarrillos que se seleccionan al azar de la lista mas reciente publicada por la Comisión Federal de Comercio es el siguiente: 7.3, 8.6, 10.4, 16.1, 12.2, 15.1, 14.5 y 9.3 miligramos. Calcule a) la media; b) la varianza. Solución b) πΊπ = π,πβππ,ππππ π +β―+ π,πβππ,ππππ π πβπ = ππ, ππ Distribuciones muestrales El campo de la inferencia estadística trata básicamente con generalizaciones y predicciones. Definición: La distribución de probabilidad de un estadístico se denomina distribución muestral. La distribución muestral de un estadístico depende de la distribución de la población, del tamaño de las muestras y del método de selección de las muestras. Distribución muestral de medias y el teorema del límite central La primera distribución muestral importante a considerar es la de la media π. Suponga que de una población normal con media ΞΌ y varianza Ο2 se toma una muestra aleatoria de n observaciones. Teorema del límite central: Si π es la media de una muestra aleatoria de tamaño n, tomada de una población con media ΞΌ y varianza finita Ο2 entonces la forma límite de la distribución de πβπ π= π/ π a medida que n β β, es la distribución normal estándar n(z; 0, 1). Distribución muestral de la diferencia entre dos medias Ejercicio capítulo 8 825.La vida media de una máquina para hacer pan es de siete años, con una desviación estándar de un año. Suponga que las vidas de estas máquinas siguen aproximadamente una distribución normal y calcule: a) la probabilidad de que la vida media de una muestra aleatoria de nueve de estas máquinas caiga entre 6.4 y 7.2 años; b) el valor de x a la derecha del cual caería 15% delas medias calculadas de muestras aleatorias de tamaño 9. 8.26 La cantidad de tiempo que le toma al cajero de un banco con servicio en el automóvil atender a un cliente es una variable aleatoria con una media ΞΌ = 3.2 minutos y una desviación estándar Ο = 1.6 minutos. Si se observa una muestra aleatoria de 64 clientes, calcule la probabilidad de que el tiempo medio que el cliente pasa en la ventanilla del cajero sea a) a lo sumo 2.7 minutos; b) mas de 3.5 minutos; c) al menos 3.2 minutos pero menos de 3.4 minutos. 828. Se toma una muestra aleatoria de tamaño 25 de una población normal que tiene una media de 80 y una desviación estándar de 5. Una segunda muestra aleatoria de tamaño 36 se toma de una población normal diferente que tiene una media de 75 y una desviación estándar de 3. Calcule la probabilidad de que la media muestral calculada de las 25 mediciones exceda la media muestral calculada de las 36 mediciones por lo menos 3.4 pero menos de 5.9. Suponga que las diferencias de las medias se miden al décimo más cercano. 829.La distribución de alturas de cierta raza de perros terrier tiene una media de 72 centímetros y una desviación estándar de 10 centímetros; en tanto que la distribución de alturas de cierta raza de poodles tiene una media de 28 centímetros con una desviación estándar de 5 centímetros. Suponga que las medias muestrales se pueden medir con cualquier grado de precisión y calcule la probabilidad de que la media muestral de una muestra aleatoria de alturas de 64 terriers exceda la media muestral para una muestra aleatoria de alturas de 100 poodles a lo sumo 44.2 centímetros. Distribución muestral de la media muestral para muestras pequeñas Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces, la distribución muestral de la media muestral X es la t de Student con n β 1 grados de libertad. Este teorema implica que la variable aleatoria π‘ = Donde ππ es la media de la población y ππ = πβππ ππ tiene distribución t con n β 1 grados de libertad. π π Ejemplos 1. Suponga que de una población normal con media 20 se toma una muestra de tamaño 16. Si la desviación estándar muestral es 4, encuentre la probabilidad de que la media muestral sea estrictamente mayor que 21,753. 2. Una muestra aleatoria de seis autos de un determinado modelo consumen las siguientes cantidades en kilómetros por litro: 18, 6 18, 4 19, 2 20, 8 19, 4 20, 5. Determine la probabilidad de que el consumo de gasolina medio muestral de los automóviles de este modelo sea menor que 17,6 kilómetros por litro, suponiendo que la distribución de la población es normal con media 17. Distribución muestral de una proporción muestral Sea X el número de éxitos en una muestra binomial de n observaciones, donde la probabilidad de éxito es p. Entonces, la π proporción de éxitos en la muestra π = π recibe el nombre de PROPORCIÓN MUESTRAL. En la mayoría de las aplicaciones, el parámetro p será la proporción de individuos de una gran población que posean la característica de interés. Teorema Sea p la proporción de éxitos en una muestra aleatoria de n observaciones. Sea p la proporción de éxitos en la población. Entonces, la distribución muestral de la proporción muestral π tiene media ππ = π y varianza ππ2 dada por (Teorema de De Moivre-Laplace) Sea π la proporción de éxitos en una muestra aleatoria de n observaciones. Si se cumple alguna de las dos condiciones siguientes: β’ n β₯ 30 o β’ np β₯ 5 y n(1 β p) β₯ 5, entonces, la distribución muestral de la proporción muestral p se puede aproximar con una distribución normal. Este teorema implica que la variable aleatoria π = πβππ ππ tiene distribución normal. Aquí, ππ y varianza ππ se calculan de acuerdo al teorema anterior. Ejemplos 1. Se toma una muestra de 250 casas de una población de edificios antiguos para estimar la proporción de casas de este tipo cuya instalación eléctrica resulta insegura. Supongamos que, de hecho, el 30% de todos los edificios de esta población tienen una instalación insegura. Hallar la probabilidad de que la proporción de edificios de la muestra con instalación insegura esté entre 0,25 y 0,35. 2. Hallar la probabilidad de que en 200 lanzamientos de una moneda no falsa, el número de caras esté comprendido en el 40% y el 60%. Distribución muestral de diferencia de dos proporciones muestrales Ejemplos 1. Los hombres y mujeres adultos radicados en una ciudad grande del norte de cierto país difieren en sus opiniones sobre la promulgación de la pena de muerte para personas culpables de asesinato. Se cree que el 12% de los hombres adultos están a favor de la pena de muerte, mientras que sólo el 10% de las mujeres adultas lo están. Si se pregunta a dos muestras aleatorias, una de 150 hombres y otra de 100 mujeres, su opinión sobre la promulgación de la pena de muerte para personas culpables de asesinato, determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de mujeres. 2. Se cree que 0,16 de las industrias de un ´área metropolitana I son textiles. Se cree además que en un área metropolitana II esta proporción es de 0,11. Si estas cifras son exactas, ¿cuál es la probabilidad de que una muestra aleatoria simple de 200 industrias del ´área I y una muestra aleatoria simple independiente de 225 industrias del área II arrojen una diferencia entre las proporciones muestrales mayor o igual que 0,10? Distribución muestral de diferencia de medias Primer caso: varianzas poblacionales conocidas o desconocidas y muestras grandes 1 Segundo caso: varianzas poblacionales desconocidas, iguales y muestras pequeñas. 2 Tercer caso: varianzas poblacionales desconocidas, diferentes y muestras pequeñas. 3 1. La distribución de pesos de los animales de cierto pueblo asiático tiene un peso medio de 72 kilogramos y una desviación estándar de 10 kilogramos, mientras que la distribución de pesos de los animales de cierto pueblo africano tiene un peso medio de 28 kilogramos con una desviación estándar de 5 kilogramos. Suponga que las medias muestrales se pueden medir con cualquier grado de precisión. Encuentre la probabilidad de que la media muestral para una muestra aleatoria de pesos de 64 animales del pueblo asiático exceda la media muestral para una muestra aleatoria de alturas de 100 animales del pueblo africano por cuando mucho 44,2 kilogramos. 2. Suponga que dos drogas A y B, de las que se dice que reducen el tiempo de respuesta de las ratas a determinado estímulo, se están comparando en un experimento de laboratorio. El experimentador supone que las respectivas poblaciones de los tiempos de respuesta al estímulo están distribuidos normalmente y que sus varianzas poblacionales son iguales y desconocidas. Se administra la droga A a 12 ratas y la droga B a 13. Cuando se lleva a cabo el experimento, la reducción promedio de tiempo de respuesta al estímulo por parte de las ratas que están recibiendo la droga A es 30,45 milisegundos con una desviación típica de 5 milisegundos. Los datos correspondientes a la droga B son 24,9 y 6 milisegundos. ¿Cuál es la probabilidad de que la diferencia entre la reducción promedio de tiempo de respuesta al estímulo por parte de las ratas que están recibiendo la droga A y la reducción promedio de tiempo de respuesta al estímulo por parte de las ratas que están recibiendo la droga B sea menor o igual a la que se observó en el experimento? Suponga que no hay diferencia alguna entre las dos drogas con respecto a la reducción promedio en tiempos de respuestas y que las drogas son igualmente efectivas. Distribución muestral de S2 Si S2 es la varianza de una muestra aleatoria de tamaño n que se toma de una población normal que tiene la varianza Ο2, entonces el estadístico tiene una distribución chi cuadrada con v = n β 1 grados de libertad. Los valores de la variable aleatoria ο£2 se calculan de cada muestra mediante la fórmula La probabilidad de que una muestra aleatoria produzca un valor Ο2 mayor que algún valor específico es igual al área bajo la curva a la derecha de este valor. El valor Ο2 por arriba del cual se encuentra un área de Ξ± por lo general se representa con Ο2Ξ±. Esto se ilustra mediante la región sombreada de la figura 1. Cuando un proceso de producción está funcionando correctamente, la resistencia en ohmios de los componentes que produce sigue una distribución normal con desviación típica 3,6. Se toma una muestra aleatoria de cuatro componentes. ¿Cuál es la probabilidad de que la varianza muestral sea mayor a 27? 2. Un fabricante de latas de guisantes está interesado en que el peso medio de su producto esté próximo al peso anunciado. Además, desea que no haya mucha variabilidad en los pesos de las latas de guisantes, ya que de lo contrario, una gran proporción de latas diferiría sensiblemente del peso anunciado. Asumamos que la distribución poblacional de los pesos es normal. Se toma una muestra aleatoria de veinte latas. Hallar el valor de k que verifica la relación π π 2 π2 = 0,05 Entonces, π π 2 19 > 19π = 0,95. Por tanto, de la tabla, encontramos que 19k = 10,12. De donde k = 0, 533. La conclusión es que la probabilidad de que la varianza muestral sea menor que un 53% de la varianza poblacional es 0,05. Distribución muestral de la razón de dos varianzas En una prueba sobre la efectividad de dos tipos de píldoras para dormir, A y B, se utilizarán dos grupos independientes de personas con insomnio. A un grupo de tamaño 61 se le administrará la píldora A y al otro grupo, de tamaño 41, se le administrará la B, registrándose el número de horas de sueño de cada individuo participante en el estudio. Suponiendo que el número de hora de sueño de quienes usan cada tipo de píldora se distribuye normalmente y que s2A = s2B, calcule la probabilidad de que la razón de las varianzas muestrales de A y B sea mayor que 1,64.
© Copyright 2024