UNIVERSIDAD JOSE CARLOS MARIATEGUI LECCION Nº 3 MEDIDAS DE TENDENCIA CENTRAL OBJETIVOS ESPECIFICOS • • • • • • Identificar la definición de medidas de tendencia central. Discriminar los conceptos de media aritmética, mediana y modo. Calcular los valores de las medidas de tendencia central en una distribución de frecuencias dé datos agrupados y no agrupados. Graficar la ubicación de las medidas de tendencia central en un polígono de frecuencias e interpretar dicha graficación. Determinar el valor de los cuartiles. Manejar el procedimiento para hallar el valor de los percentiles. 1. MEDIDAS DE TENDENCIA CENTRAL Concepto. Son “valores numéricos" estadígrafos, que representan la tendencia de todo el conjunto de datos estadísticos. Las representaciones gráficas nos demuestran de una vez, toda una serie estadística o distribución de frecuencias. Pero en ocasiones se desea un valor numérico que presente a toda la población o muestra que se estudia. Estos números reciben el nombre de valores centrales de la distribución porque, a su alrededor, se agrupan todos los demás. Es decir, se denominan medidas de tendencia central a los promedios o valores alrededor de los cuales se agrupan todos los demás. Las medidas de tendencia central más conocidas o importantes son: la media aritmética, la mediana y el modo o moda. También son, la media geométrica, la media armónica, la media cuadrática, la media bicuadrática y los cuartiles. 1. MEDIA ARITMETICA Es el cociente que resulta de dividir la suma de los valores de los datos entre el número de los mismos. Se simboliza por M. 1.1. Cálculo en una distribución de frecuencias de datos no agrupados Para calcular la media aritmética en una distribución de datos no agrupados se suman todas las calificaciones, puntajes, datos, etc. y el total se divide entre el número de ellos. La fórmula para calcular la media aritmética en datos no agrupados es: 42 UNIVERSIDAD JOSE CARLOS MARIATEGUI M=ΣX N Donde: M = media aritmética Σ X = suma de datos N = número de datos Ejemplo: En los diferentes meses del año académico, un alumno obtuvo las calificaciones: 12, 16, 13, 08, 15, 14, en la asignatura de Matemática. La calificación media de la asignatura será. 1.2. Cálculo en una distribución de frecuencias de datos agrupados Para calcular el valor de la media aritmética en una distribución de frecuencia de datos agrupados, se divide la suma total del producto de las frecuencias (f) por puntos medios o marcas de clases (pm) entre la suma total de, frecuencias (f). La fórmula para calcular la media aritmética en datos agrupados es: Donde: M = media aritmética Σ f.pm. = suma de frecuencias por puntos medios o clases. Σ f = suma de frecuencias. Observemos la siguiente tabla de distribución de frecuencias de datos agrupados: 43 UNIVERSIDAD JOSE CARLOS MARIATEGUI Reemplazando la fórmula con los datos obtenidos tendremos: Quiere decir, que la nota promedio obtenida por el grupo de alumnos de la muestra es de 105. Para obtener la media aritmética de esta distribución hemos seguido el procedimiento siguiente: a) Se han determinado las clases ( CI ) cuya amplitud o intervalo de clase es 5. b) Se han indicado las frecuencias ( f ), o sea, las veces que se repite un dato o valor. c) Se han escrito los puntos medios o marca de clases (pm). d) Se ha determinado la frecuencia por punto medio (f. pm) multiplicando cada frecuencia por su respectivo punto medio o marca de clase. e) Se ha sumado la columna de f. pm. f) Luego, se aplicó la fórmula. 1.3. Importancia Es importante porque: • La media aritmética es el centro de gravedad de la distribución, si los puntajes están distribuidos simétricamente. • Es la medida de tendencia central más estable. • Es el valor preferido en los cálculos estadísticos por ser el más fiable. Es el promedio que representa mejor al grupo. 44 UNIVERSIDAD JOSE CARLOS MARIATEGUI 2. MEDIANA Es el valor que divide a una distribución en dos partes iguales, se simboliza por Mdn. 2.1. Cálculo en una distribución de' frecuencias de datos no agrupados Se ordenan los puntajes en forma ascendente o descendente. Al determinar la mediana pueden presentarse dos casos: • Si el número de datos es impar, la mediana será el dato que ocupa el centro de la distribución. Por ejemplo: 7. 9, 12, 16, 18, 19.20. Observando la distribución, encontramos que la calificación 16 está ubicada al centro; luego la mediana es 16. • Si el número de datos es par, en este caso. se suman las dos calificaciones que ocupan el lugar central y el resultado se divide entre 2. Por ejemplo: 19, 17, 16, 15, 13, 12, 10, 9. Observando la distribución, encontramos que los datos o puntajes que ocupan el lugar central son 15 y 13. Por tanto, la mediana será 14: Mdn = 15 + 13 = 14 2 Es decir, la mediana es la media aritmética de los dos valores centrales. Para determinar el lugar que ocupa el valor de la mediana en cualquiera de los dos casos, se utiliza la siguiente fórmula: Mdn = N + 1 2 Donde: Mdn = Mediana N = Número de datos 2.2. Cálculo en una distribución de frecuencias de datos agrupados. Para calcular la mediana, en una distribución de datos agrupados se aplica la siguiente fórmula: Donde: Mdn = mediana Li = límite inferior de la clase donde está ubicada la mediana. 45 UNIVERSIDAD JOSE CARLOS MARIATEGUI Σ f = suma total de frecuencias fa = frecuencia acumulada de la clase que precede a la clase que contiene la mediana. f = frecuencia de la clase que contiene a la mediana. i = amplitud del intervalo. Observemos la siguiente tabla de distribución de frecuencias del cuadro No. 8. Antes de reemplazar la fórmula con los datos de la tabla de frecuencias, se .ubica el lugar donde se halla la mediana, para lo cual se aplica la fórmula ya estudiada: Vemos que la mediana se encuentra en el intervalo de clase 105 - 109 porque, hasta su límite superior, suman 33 las frecuencias acumuladas y 25.5 está comprendida en este intervalo de clase. Luego, para calcular el valor de la mediana sustituimos la fórmula con los datos respectivos Mdn = 106 2.3. Importancia Es importante porque: 46 UNIVERSIDAD JOSE CARLOS MARIATEGUI • Da a conocer el punto medio exacto de la distribución, o sea, el punto correspondiente al 50% de la serie, cuando entre los datos hay valores extremos, ya que éstos afectan el valor de la media aritmética. • Los valores extremos no la alteran. 3. MODO O MODA Es el valor que se repite con mayor frecuencia. Se simboliza por Mo. 3.1. Métodos para calcular el modo Para calcular el valor del modo se utilizan dos métodos: Método directo o empírico En una distribución de frecuencias de datos no agrupados. Se determina, observando qué datos se repiten el mayor número de veces. Ejemplo: 9, 10, 10, 12, 14, 14, 14, 16, 16, 18. En esta distribución el dato más frecuente es 14. Luego, 14 es el modo obtenido por el método empírico. En una distribución de frecuencias de datos agrupados. Cuando los datos se agrupan en una tabla de distribución de frecuencias, el modo es el punto medio o marca de clase que contiene la mayor frecuencia. Por ejemplo, en nuestra tabla de distribución (cuadro No. 10) el intervalo de la clase 105 - 109 tiene la mayor frecuencia. A este intervalo de clase se denomina clase modal. El punto medio de este intervalo de clase es 107. Luego, 107 es el modo obtenido por el método directo o empírico. Método corregido o aproximado. Se aplica la siguiente fórmula: Sustituyendo la fórmula con los datos de nuestra tabla de frecuencia (cuadro No. 10) tenemos: 47 UNIVERSIDAD JOSE CARLOS MARIATEGUI 3.2. Importancia Es importante porque: Da a conocer en forma inmediata qué puntaje es el más frecuente. Observaciones • La moda no siempre existe en una distribución de frecuencias. • Puede existir 2 ó más modos para una distribución de frecuencias. 4. GRAFICACION E INTERPRETACION DE LAS MEDIDAS DE TENDENCIA CENTRAL En la construcción de la gráfica que muestra la ubicación de las tres medidas de tendencia central: media aritmética, mediana y modo, pueden presentarse los siguientes casos: La curva normal o simétrica o Campana de Gauss, se denomina así, cuando las tres medidas coinciden en un mismo punto. Observa la siguiente figura: 48 UNIVERSIDAD JOSE CARLOS MARIATEGUI La curva asimétrica negativa, se denomina así cuando la mediana se encuentra a la derecha de la moda. Observa el gráfico siguiente: La curva asimétrica positiva, se denomina así cuando la media aritmética y la mediana se encuentran hacia la izquierda de la muda. Veamos la siguiente figura: Ahora bien, teniendo en cuenta estas consideraciones grafiquemos la ubicación de las medidas de tendencia central, cuyos valores han sido calculados en base a los puntajes de rendimiento de nuestro ejemplo. Observa detenidamente el siguiente polígono de frecuencias: 49 UNIVERSIDAD JOSE CARLOS MARIATEGUI Analizando el polígono vemos que: • Los valores de la media aritmética, la mediana y el modo están ubicados en el intervalo de clase 105 - 109. • Estas tres medidas se encuentran ubicadas en tres puntos diferentes de la curva. • El modo ocupa el punto más alto de la curva, cuyo valor es 107. La mediana se ubica hacia la izquierda cuyo valor es 106 y la media aritmética ocupa el punto más bajo, cuyo valor es 105. En consecuencia, la curva es ligeramente asimétrica positiva. Sin embargo sus valores están comprendidos en la clase 105 - 109. Interpretación • La curva obtenida guarda cierta simetría porque se desplaza o inclina, ligeramente, hacia el lado izquierdo, es decir, hacia los puntajes bajos. • Esta curva indica que la prueba ha sido ligeramente difícil o. que los alumnos lograron parcialmente los objetivos propuestos. • El valor de la media aritmética nos indica el puntaje promedio obtenido por los alumnos, que es de 105 • El valor del modo de 107 es el puntaje alcanzado por el mayor número de alumnos. . En consecuencia, el polígono muestra que: • La curva obtenida guarda cierta simetría. • El puntaje promedio logrado por los alumnos es de 105. • El puntaje obtenido por el mayor número de alumnos es 107 y que el 50% de alumnos obtuvieron un puntaje de 106. 5. PERCENTILES, CUARTILES y DECILES 5.1. Percentiles Son aquellos que dividen una serie estadística en cien partes iguales, cada parte contiene el 1% de la serie. Los percentiles se representan por la letra P seguida de un subíndice que indica el lugar porcentual o percentilar. Así, para representar el percentil 25 se escribe P25 y para el percentil 75, se escribe P75. P25 representa 25 centésimos y, P75 representa 75 centésimos. Es decir, representan el 25% y el 75% de elementos de la muestra respectivamente. 5.1.1. Procedimientos para ubicar los percentiles Se emplean las siguientes fórmulas: 50 UNIVERSIDAD JOSE CARLOS MARIATEGUI Dónde: L¡ = Límite inferior de la clase percentilar N = número total de frecuencia fa = frecuencia acumulada de la clase que precede al percentil ¡ = intervalo fm = frecuencia de la clase percentil 100 = constante Analizando las, fórmulas, vemos que todas son parecidas, salvo el elemento determinante del percentil, es decir, el elemento que determina la ubicación del percentil. Así: 51 UNIVERSIDAD JOSE CARLOS MARIATEGUI Por ejemplo, determinemos los valores del percentil 10 (P10) y del percentil 90 (P90) . Valor del percentil 10 (P10) Para lo cual utilicemos la tabla de distribución de frecuencias de nuestro ejemplo (cuadro No. 10). Para calcular el valor del P10 se procede de la siguiente manera: • Hallar el valor del elemento determinante 10N; donde N = 50. 100 • Ubicar el valor del elemento determinante 5 en la columna fa. Este valor 5 no coincide exactamente con ninguno de los valores de la tabla, entonces se elige el valor inmediato superior, es decir 11. • Ubicar la clase percentilar y su límite inferior. En nuestro ejemplo, la clase percentilar es 90 – 94 y su Li es 90. • Determinar la frecuencia acumulada (fa) precedente. En nuestro ejemplo, el elemento determinante es 5 y se ubica en el valor 11, luego, la frecuencia acumulada (fa) precedente es 3, porque está antes del 11. • Ubicar la frecuencia de la clase percentilar (fm). Hemos visto que la clase percentilar donde se ubica el percentil 10 (P10) es 90 - 94. A esta clase le corresponde una frecuencia de 8. Luego, 8 es la frecuencia percentilar (fm). • Aplicar la fórmula: 52 UNIVERSIDAD JOSE CARLOS MARIATEGUI Reemplazando datos tenemos: • Valor del percentil 90 (P90). Utilicemos la tabla de distribución de frecuencias del cuadro No. 11 Para determinar el valor de P90 se consideran los siguientes pasos: o Hallar el valor del elemento determinante. 53 UNIVERSIDAD JOSE CARLOS MARIATEGUI • Ubicar el valor del elemento determinante 45 en la columna fa. En nuestro ejemplo, este valor no coincide exactamente con los valores de la tabla, entonces se elige el valor inmediato superior, o sea, 47. • Ubicar la clase percentilar y el límite inferior de clase. En nuestro ejemplo, el valor del elemento determinante es 47, y el intervalo de clase que le corresponde es 120 - 124 cuyo límite inferior (Li) es 120. Luego, la clase percentilar es 120 - 124 Y su límite inferior (Li) 120. • Determinar la frecuencia acumulada (fa) precedente. Como en nuestro ejemplo, el valor del elemento determinante es 47, y la frecuencia acumulada precedente es 44. Entonces 44 es la frecuencia acumulada precedente. • Ubicar la frecuencia de la clase percentilar (fm). En nuestro caso, a la clase percentilar 120 - 124 le corresponde una frecuencia (fm) de 3. • Luego, 3 es la frecuencia de la clase percentilar (fm). • Reemplazar los valores hallados, en la fórmula para determinar el valor del percentil 90 (P9O) Veamos: Luego, el valor del percentil 90 es 121.67. 5.2. Cuartiles Los cuartiles dividen a una distribución en cuatro partes iguales o cuartos. Se representan por la letra. Q. Observemos el siguiente cuadro: 54 UNIVERSIDAD JOSE CARLOS MARIATEGUI Corno se puede apreciar, el primer cuartil (Q1) contiene hasta el 25% de los valores de la serie; es decir la cuarta parte. El segundo cuartil (Q2) contiene hasta el 50% del total de los valores de la serie, es decir la mitad. El tercer cuartil (Q3) contiene hasta el 75% de los valores de la serie; es decir, los tres cuartos de ella. 5.2.1. Procedimientos para ubicar los cuarteles Para ubicar los cuartiles en una distribución de frecuencias de datos agrupados se aplican las siguientes fórmulas: Donde: Li = Límite inferior de la clase en la que cae el cuartil. N = número total de datos o suma de frecuencias. fa = frecuencia acumulada de la clase que precede al cuartil. i = intervalo fm = frecuencia de la clase donde se ubica el cuartil 55 UNIVERSIDAD JOSE CARLOS MARIATEGUI Aplicando estas fórmulas determinemos el valor de cada uno de los cuartiles. • Valor del primer cuartil (Q1) Se procede de la siguiente manera: Se halla el valor del elemento determinante, para lo cual se divide el número total de datos entre 4. Es decir: Se compara el valor del elemento determinante (12.5) con los valores de las frecuencias acumuladas (fa). En nuestro ejemplo el valor 12.5 no. coincide con ningún valor de la frecuencia acumulada, entonces se toma el valor inmediato superior que es 17. Veamos: Se ubica el intervalo de clase y el limite inferior de la misma, correspondiente al elemento determinante. En nuestro caso el intervalo de clase que le corresponde al elemento determinante (17), es 95 - 99 y su límite inferior (Li) es 95. Se ubica la frecuencia acumulada (fa) precedente al elemento determinante. En nuestro ejemplo la frecuencia acumulada precedente es 11. En la columna de las frecuencias, se ubica la frecuencia cuartilar (fm) correspondiente al intervalo de clase, donde se localiza el primer cuartil. En la distribución de nuestro ejemplo la clase cuartilar es 95 - 99 y la frecuencia cuartilar es 6. Finalmente, para determinar el valor del primer cuartil (Q1) se aplica la siguiente fórmula: 56 UNIVERSIDAD JOSE CARLOS MARIATEGUI Reemplazando con nuestros datos tenemos: Luego, el valor del primer cuartil (Q1) es 96.25 que está ubicado en la clase 95 - 99. • Valor del segundo cuartil (Q2) Para encontrar este valor se aplica cualquiera de las fórmulas que se presentan a continuación: Reemplazando con los datos de nuestro ejemplo (cuadro No.13) tendremos: • Valor del tercer cuartil (Q3) Con los datos de la siguiente tabla de distribución de frecuencias (cuadro No. 13) 57 UNIVERSIDAD JOSE CARLOS MARIATEGUI Calculemos el valor del tercer cuartil aplicando el procedimiento siguiente: o Se halla el valor del elemento determinante dividiendo el número total de datos entre 4: 3N = 3 x 50 = 150 = 37.5 4 4 4 o Se ubica el valor del elemento determinante 37.5 en la columna de la fa; como en nuestro ejemplo el valor 37.5 no coincide con ningún valor de las frecuencias acumuladas, entonces se toma el valor inmediato superior que es 41. o Se ubica el intervalo de clase y el límite inferior de la misma, donde se halla el elemento determinante. En nuestro ejemplo, (cuadro No. 14), el intervalo de clase donde se encuentra dicho elemento determinante es 110 - 114 y su límite inferior es 110. o Se ubica la frecuencia acumulada (fa) precedente al elemento determinante. En nuestro caso la fa precedente es 33. o En la columna de las frecuencias (f) se ubica la frecuencia cuartilar (fm) correspondiente al intervalo de clase, donde se localiza el tercer cuartil. En nuestra distribución, (cuadro No. 14), la clase cuartilar es 110 - 114 y la frecuencia cuartilar es 8. Finalmente, para calcular el valor propiamente dicho del tercer cuartil se aplicará la fórmula: 58 UNIVERSIDAD JOSE CARLOS MARIATEGUI Reemplazando tenemos: 5.2.2. El recorrido o amplitud intercuartilar (Aq) Es la diferencia que hay entre los cuartiles extremos de una serie de valores. Es decir, es la distancia que existe entre el tercer cuartil (Q3) y el primer cuartil (Q1) Para determinar el valor de la amplitud intercuartilar se utiliza la siguiente fórmula: Aq = Q3 – Q1 En nuestro ejemplo, los valores de los cuartiles son: Q3 = 112.81 Q1 = 96.25 Reemplazando estos valores en la fórmula tenemos: Aq = 112.81 - 96.25 Aq = 16.56 Luego, 16.56 es el valor de la amplitud intercuartilar. 5.2.3. La desviación cuartil o semi-intercuartilar (Q) Esta medida de dispersión está dada por la mitad de la amplitud intercartilar. Es decir, por la mitad de la diferencia entre el tercer y el primer cuartil (Q3 y Q1). Para determinar su valor se aplica la siguiente fórmula: En nuestro ejemplo, los valores de: Q3 = 112.81 y Q1 = 96.25 Reemplazando en la fórmula con estos valores tenemos: 59 UNIVERSIDAD JOSE CARLOS MARIATEGUI 5.3. Deciles Los deciles dividen a una distribución en diez partes iguales o décimos. Se representa por la letra D. Así por ejemplo, al decil uno se representará por D1, al decil 2 por D2 y así sucesivamente. Es decir, representan respectivamente al 10%, 20%, etc. de la muestra. 60 UNIVERSIDAD JOSE CARLOS MARIATEGUI EJERCICIOS 1. Calcula el valor de la media aritmética (M), mediana (Mdn) y modo o moda (Mo) de las siguientes distribuciones de frecuencias de datos no agrupados: a) 10, 18, 13, 13, 13, 09, 17, 14 Md = _______________________________________________________ Mdn = _______________________________________________________ Mo = _______________________________________________________ b) 98, 90, 83, 80, 80, 80, 75, 72, 63, 48 __________________________________________________________________ __________________________________________________________________ __________________________________________________________________ c) 70, 30, 80, 50, 45, 45, 45 __________________________________________________________________ __________________________________________________________________ __________________________________________________________________ d) 19, 20, 16, 16, 15, 15, 15, 15, 11, 13, 12, 10 __________________________________________________________________ __________________________________________________________________ __________________________________________________________________ e) 63, 55, 90, 48, 83, 95, 63, 63, 50, 75, 40 __________________________________________________________________ __________________________________________________________________ __________________________________________________________________ 61 UNIVERSIDAD JOSE CARLOS MARIATEGUI 2. Completa los datos que faltan de la siguiente tabla de distribución de frecuencias de datos agrupados (ejercicio No. 2 de la primera unidad). 3. En base a los datos del ejercicio anterior determina: a) El valor de la media aritmética (M) __________________________________________________________________ __________________________________________________________________ __________________________________________________________________ ___ 62 UNIVERSIDAD JOSE CARLOS MARIATEGUI b) El valor de la mediana (Mdn) __________________________________________________________________ __________________________________________________________________ __________________________________________________________________ ___ c) El valor del modo o moda (Mo) __________________________________________________________________ __________________________________________________________________ __________________________________________________________________ ___ d) La ubicación de las tres medidas de tendencia central, utilizando el poligono de frecuencias e interpreta dicho grafico INTERPRETACION: __________________________________________________________________ __________________________________________________________________ __________________________________________________________________ ___ e) El valor de los cuarteles 1 y 2 Q1 = ____________________________________________________________ Q2 = ____________________________________________________________ f) El valor de los percentiles 10 y 90: P10 = ____________________________________________________________ P90 = ____________________________________________________________ 63
© Copyright 2024