UNIVERSIDAD JOSE CARLOS MARIATEGUI ESTADISTICA NO PARAMETRICA LECCIÓN Nº 09 DISTRIBUCIONES JI-CUADRADO 9.1. DEFINICION.Antes de entrar en la estimacion de parametros por el metodo de intervalos de confianza son necesarias algunas distribuciones importantes que vamos a enunciar. Una propiedad importante de la distribuion es que esta tiende a la distribucion normal cuando el numero de grados de libertad tiende a La Distribución Ji cuadrada tiene por objeto comparar la media de una muestra hipotética de una población, en un muestreo pequeño. Se utiliza para comprara la varianza de una muestra con la varianza Hipotética de una población. Se denota con la letra griega X(Ji) elevada al cuadrado. Este método corresponde al campo de la estadística paramétrica. Igual que la distribución t depende del numero de grados de libertad asociados al problema. 9.2. PRUEBA DE BONDAD DE AJUSTE Consiste en probar la hipotesisi nula que cierta funcion F(x) es la funcion de distribución de una población a partir de una muestra tomada de ella, o, consiste en probar que los datos muestrale se distribuyen como F un metodo usual consiste en verificar la concordancia entre las frecuencias observadas(0i) y las frecuencias esperadas (ei), usando la prueba de bondad de ajuste X2(chi – Cuadrado) propuesta por Kart Pearson. Un experimento multinomial es la generalización de un experimento binomial: 1. Consiste en n pruebas idénticas e independientes. EDUCA INTERACTIVA Pág. 36 UNIVERSIDAD JOSE CARLOS MARIATEGUI 2. Para cada prueba, hay un número k de resultados posibles. 3. Cada uno de los k posibles resultados tiene una probabilidad de ocurrencia pi asociada (p1 + p2 + ... + pk = 1), la cual permanece constante durante el desarrollo del experimento. 4. El experimento dará lugar a un conjunto de frecuencias observadas (O1, O2, ..., Ok) para cada resultado. Obviamente, O1 + O2 + ... + Ok = n. En ocasiones estaremos interesados en comparar los resultados obtenidos al realizar un experimento multinomial con los resultados esperados (teóricos). Ello nos permitirá saber si nuestro modelo teórico se ajusta bien o no a las observaciones. Para ello, recurriremos a la distribución Chi-cuadrado, la cual nos permitirá realizar un contraste sobre la bondad del ajuste. Concretamente, usaremos el estadístico con k – 1 grados de libertad. Donde: Oi = frecuencia observada en la i-esima celda Ei = frecuencia esperada en la i-esima celda si Ho es cierta k = numero de celdas Podemos calcular cada frecuencia esperada (teórica) multiplicando el número total de pruebas n por la probabilidad de ocurrencia asociada, es decir: Notas: (1) El valor del estadístico χ2* se podrá aproximar por una distribución Chi-cuadrado cuando el tamaño muestral n sea grande (n > 30), y todas las frecuencias esperadas sean iguales o mayores a 5 (en ocasiones deberemos agrupar varias categorías a fin de que se cumpla este requisito). (2) Las observaciones son obtenidas mediante muestreo aleatorio a partir de una población particionada en categorías. EJEMPLO: En cierta máquina Expendedora de Refrescos existen 4 canales que expiden el mismo tipo de bebida. Estamos interesados en averiguar si la elección de cualquiera de estos canales se hace de forma aleatoria o por el contrario existe algún tipo de preferencia en la selección de alguno de ellos por los consumidores. La siguiente tabla muestra el número de bebidas vendidas en cada uno de los 4 canales durante una semana. Pág. 37 EDUCA INTERACTIVA UNIVERSIDAD JOSE CARLOS MARIATEGUI Contrastar la hipótesis de que los canales son seleccionados al azar a un nivel de significación del 5%. SOLUCIÓN: Para realizar el contraste de Bondad de Ajuste debemos calcular las frecuencias esperadas de cada suceso bajo la hipótesis de uniformidad entre los valores. Si la selección del canal fuera aleatoria, todos los canales tendrían la misma probabilidad de selección y por lo tanto la frecuencia esperada de bebidas vendidas en cada uno de ellos debería ser aproximadamente la misma. Como se han vendido en total 70 refrescos, la frecuencia esperada en cada canal es Ei = n * pi = 70* ¼ = 17.5 i = 1, ..., k El estadístico del contraste sería: Este valor debemos compararlo con el valor crítico de la distribución con (4-1)=3 grados de libertad. Este valor es: Puesto que el valor del estadístico (2.34) es menor que el valor crítico, no podemos rechazar la hipótesis de que los datos se ajustan a una distribución uniforme. Es decir, que los canales son seleccionados aleatoriamente entre los consumidores. 9.3 PROBLEMAS 1. si X ~ t (k), ¿Cuál es la distribución de X2? 2. se supone que el peso de unos insectos de determinada especie esta normalmente distribuido con una desviaron estandar de 0.7 gramos. Si estas suposiciones son correctas, ¿Cuál es la probabilidad de que una muestra aleatoria de 10 insectos arroje una varianza mayor o igual a 0.85? EDUCA INTERACTIVA Pág. 38 UNIVERSIDAD JOSE CARLOS MARIATEGUI 3. El numero de defectos por unidad observada en una muestra de 100 radios dio la siguiente distribución de frecuencias Numero de defectos Numero de radios 0 28 1 32 2 15 3 10 4 6 5 4 6 3 7 2 Verificar si la distribución de estos datos se aproxima a una distribución Poisson. Use α = 0.05 Pág. 39 EDUCA INTERACTIVA
© Copyright 2024