MEDIDAS DE TENDENCIA CENTRAL

UNIVERSIDAD JOSE CARLOS MARIATEGUI
LECCION Nº 3
MEDIDAS DE TENDENCIA CENTRAL
OBJETIVOS ESPECIFICOS
•
•
•
•
•
•
Identificar la definición de medidas de tendencia central.
Discriminar los conceptos de media aritmética, mediana y modo.
Calcular los valores de las medidas de tendencia central en una distribución de
frecuencias dé datos agrupados y no agrupados.
Graficar la ubicación de las medidas de tendencia central en un polígono de
frecuencias e interpretar dicha graficación.
Determinar el valor de los cuartiles.
Manejar el procedimiento para hallar el valor de los percentiles.
1. MEDIDAS DE TENDENCIA CENTRAL
Concepto. Son “valores numéricos" estadígrafos, que representan la tendencia de
todo el conjunto de datos estadísticos.
Las representaciones gráficas nos demuestran de una vez, toda una serie estadística
o distribución de frecuencias. Pero en ocasiones se desea un valor numérico que
presente a toda la población o muestra que se estudia. Estos números reciben el
nombre de valores centrales de la distribución porque, a su alrededor, se agrupan
todos los demás. Es decir, se denominan medidas de tendencia central a los
promedios o valores alrededor de los cuales se agrupan todos los demás.
Las medidas de tendencia central más conocidas o importantes son: la media
aritmética, la mediana y el modo o moda.
También son, la media geométrica, la media armónica, la media cuadrática, la media
bicuadrática y los cuartiles.
1. MEDIA ARITMETICA
Es el cociente que resulta de dividir la suma de los valores de los datos entre el
número de los mismos. Se simboliza por M.
1.1. Cálculo en una distribución de frecuencias de datos no agrupados
Para calcular la media aritmética en una distribución de datos no agrupados se
suman todas las calificaciones, puntajes, datos, etc. y el total se divide entre el
número de ellos.
La fórmula para calcular la media aritmética en datos no agrupados es:
42
UNIVERSIDAD JOSE CARLOS MARIATEGUI
M=ΣX
N
Donde:
M = media aritmética
Σ X = suma de datos
N = número de datos
Ejemplo: En los diferentes meses del año académico, un alumno obtuvo las
calificaciones: 12, 16, 13, 08, 15, 14, en la asignatura de Matemática. La
calificación media de la asignatura será.
1.2. Cálculo en una distribución de frecuencias de datos agrupados
Para calcular el valor de la media aritmética en una distribución de frecuencia
de datos agrupados, se divide la suma total del producto de las frecuencias (f)
por puntos medios o marcas de clases (pm) entre la suma total de, frecuencias
(f).
La fórmula para calcular la media aritmética en datos agrupados es:
Donde:
M = media aritmética
Σ f.pm. = suma de frecuencias por puntos medios o clases.
Σ f = suma de frecuencias.
Observemos la siguiente tabla de distribución de frecuencias de datos
agrupados:
43
UNIVERSIDAD JOSE CARLOS MARIATEGUI
Reemplazando la fórmula con los datos obtenidos tendremos:
Quiere decir, que la nota promedio obtenida por el grupo de alumnos de la
muestra es de 105.
Para obtener la media aritmética de esta distribución hemos seguido el
procedimiento siguiente:
a) Se han determinado las clases ( CI ) cuya amplitud o intervalo de clase
es 5.
b) Se han indicado las frecuencias ( f ), o sea, las veces que se repite un
dato o valor.
c) Se han escrito los puntos medios o marca de clases (pm).
d) Se ha determinado la frecuencia por punto medio (f. pm) multiplicando
cada frecuencia por su respectivo punto medio o marca de clase.
e) Se ha sumado la columna de f. pm.
f) Luego, se aplicó la fórmula.
1.3. Importancia
Es importante porque:
• La media aritmética es el centro de gravedad de la distribución, si los
puntajes están distribuidos simétricamente.
• Es la medida de tendencia central más estable.
• Es el valor preferido en los cálculos estadísticos por ser el más fiable. Es el
promedio que representa mejor al grupo.
44
UNIVERSIDAD JOSE CARLOS MARIATEGUI
2. MEDIANA
Es el valor que divide a una distribución en dos partes iguales, se simboliza por
Mdn.
2.1. Cálculo en una distribución de' frecuencias de datos no agrupados
Se ordenan los puntajes en forma ascendente o descendente. Al determinar la
mediana pueden presentarse dos casos:
• Si el número de datos es impar, la mediana será el dato que ocupa el
centro de la distribución. Por ejemplo:
7. 9, 12, 16, 18, 19.20.
Observando la distribución, encontramos que la calificación 16 está
ubicada al centro; luego la mediana es 16.
• Si el número de datos es par, en este caso. se suman las dos
calificaciones que ocupan el lugar central y el resultado se divide entre
2. Por ejemplo:
19, 17, 16, 15, 13, 12, 10, 9.
Observando la distribución, encontramos que los datos o puntajes que
ocupan el lugar central son 15 y 13. Por tanto, la mediana será 14:
Mdn = 15 + 13 = 14
2
Es decir, la mediana es la media aritmética de los dos valores centrales.
Para determinar el lugar que ocupa el valor de la mediana en cualquiera de los
dos casos, se utiliza la siguiente fórmula:
Mdn = N + 1
2
Donde:
Mdn = Mediana
N = Número de datos
2.2. Cálculo en una distribución de frecuencias de datos agrupados.
Para calcular la mediana, en una distribución de datos agrupados se aplica la
siguiente fórmula:
Donde:
Mdn = mediana
Li = límite inferior de la clase donde está ubicada la mediana.
45
UNIVERSIDAD JOSE CARLOS MARIATEGUI
Σ f = suma total de frecuencias
fa = frecuencia acumulada de la clase que precede a la clase que contiene
la mediana.
f = frecuencia de la clase que contiene a la mediana.
i = amplitud del intervalo.
Observemos la siguiente tabla de distribución de frecuencias del cuadro No. 8.
Antes de reemplazar la fórmula con los datos de la tabla de frecuencias, se
.ubica el lugar donde se halla la mediana, para lo cual se aplica la fórmula ya
estudiada:
Vemos que la mediana se encuentra en el intervalo de clase 105 - 109 porque,
hasta su límite superior, suman 33 las frecuencias acumuladas y 25.5 está
comprendida en este intervalo de clase.
Luego, para calcular el valor de la mediana sustituimos la fórmula con los
datos respectivos
Mdn = 106
2.3. Importancia
Es importante porque:
46
UNIVERSIDAD JOSE CARLOS MARIATEGUI
• Da a conocer el punto medio exacto de la distribución, o sea, el punto
correspondiente al 50% de la serie, cuando entre los datos hay valores
extremos, ya que éstos afectan el valor de la media aritmética.
• Los valores extremos no la alteran.
3. MODO O MODA
Es el valor que se repite con mayor frecuencia. Se simboliza por Mo.
3.1. Métodos para calcular el modo
Para calcular el valor del modo se utilizan dos métodos:
Método directo o empírico
En una distribución de frecuencias de datos no agrupados. Se determina,
observando qué datos se repiten el mayor número de veces. Ejemplo:
9, 10, 10, 12, 14, 14, 14, 16, 16, 18.
En esta distribución el dato más frecuente es 14. Luego, 14 es el modo obtenido
por el método empírico.
En una distribución de frecuencias de datos agrupados. Cuando los datos se
agrupan en una tabla de distribución de frecuencias, el modo es el punto medio
o marca de clase que contiene la mayor frecuencia. Por ejemplo, en nuestra
tabla de distribución (cuadro No. 10) el intervalo de la clase 105 - 109 tiene la
mayor frecuencia. A este intervalo de clase se denomina clase modal. El punto
medio de este intervalo de clase es 107. Luego, 107 es el modo obtenido por el
método directo o empírico.
Método corregido o aproximado.
Se aplica la siguiente fórmula:
Sustituyendo la fórmula con los datos de nuestra tabla de frecuencia (cuadro No.
10) tenemos:
47
UNIVERSIDAD JOSE CARLOS MARIATEGUI
3.2. Importancia
Es importante porque:
Da a conocer en forma inmediata qué puntaje es el más frecuente.
Observaciones
• La moda no siempre existe en una distribución de frecuencias.
• Puede existir 2 ó más modos para una distribución de frecuencias.
4. GRAFICACION E INTERPRETACION DE LAS MEDIDAS DE TENDENCIA CENTRAL
En la construcción de la gráfica que muestra la ubicación de las tres medidas de
tendencia central: media aritmética, mediana y modo, pueden presentarse los
siguientes casos:
La curva normal o simétrica o Campana de Gauss, se denomina así, cuando las
tres medidas coinciden en un mismo punto. Observa la siguiente figura:
48
UNIVERSIDAD JOSE CARLOS MARIATEGUI
La curva asimétrica negativa, se denomina así cuando la mediana se encuentra a
la derecha de la moda. Observa el gráfico siguiente:
La curva asimétrica positiva, se denomina así cuando la media aritmética y la
mediana se encuentran hacia la izquierda de la muda. Veamos la siguiente figura:
Ahora bien, teniendo en cuenta estas consideraciones grafiquemos la ubicación de
las medidas de tendencia central, cuyos valores han sido calculados en base a los
puntajes de rendimiento de nuestro ejemplo. Observa detenidamente el siguiente
polígono de frecuencias:
49
UNIVERSIDAD JOSE CARLOS MARIATEGUI
Analizando el polígono vemos que:
• Los valores de la media aritmética, la mediana y el modo están ubicados en el
intervalo de clase 105 - 109.
• Estas tres medidas se encuentran ubicadas en tres puntos diferentes de la
curva.
• El modo ocupa el punto más alto de la curva, cuyo valor es 107. La mediana se
ubica hacia la izquierda cuyo valor es 106 y la media aritmética ocupa el punto
más bajo, cuyo valor es 105.
En consecuencia, la curva es ligeramente asimétrica positiva. Sin embargo sus
valores están comprendidos en la clase 105 - 109.
Interpretación
• La curva obtenida guarda cierta simetría porque se desplaza o inclina,
ligeramente, hacia el lado izquierdo, es decir, hacia los puntajes bajos.
• Esta curva indica que la prueba ha sido ligeramente difícil o. que los alumnos
lograron parcialmente los objetivos propuestos.
• El valor de la media aritmética nos indica el puntaje promedio obtenido por los
alumnos, que es de 105
• El valor del modo de 107 es el puntaje alcanzado por el mayor número de
alumnos.
.
En consecuencia, el polígono muestra que:
• La curva obtenida guarda cierta simetría.
• El puntaje promedio logrado por los alumnos es de 105.
• El puntaje obtenido por el mayor número de alumnos es 107 y que el 50% de
alumnos obtuvieron un puntaje de 106.
5. PERCENTILES, CUARTILES y DECILES
5.1. Percentiles
Son aquellos que dividen una serie estadística en cien partes iguales, cada parte
contiene el 1% de la serie. Los percentiles se representan por la letra P seguida
de un subíndice que indica el lugar porcentual o percentilar. Así, para representar
el percentil 25 se escribe P25 y para el percentil 75, se escribe P75.
P25 representa 25 centésimos y, P75 representa 75 centésimos. Es decir,
representan el 25% y el 75% de elementos de la muestra respectivamente.
5.1.1. Procedimientos para ubicar los percentiles
Se emplean las siguientes fórmulas:
50
UNIVERSIDAD JOSE CARLOS MARIATEGUI
Dónde:
L¡ = Límite inferior de la clase percentilar
N = número total de frecuencia
fa = frecuencia acumulada de la clase que precede al percentil
¡ = intervalo
fm = frecuencia de la clase percentil
100 = constante
Analizando las, fórmulas, vemos que todas son parecidas, salvo el elemento
determinante del percentil, es decir, el elemento que determina la ubicación del
percentil. Así:
51
UNIVERSIDAD JOSE CARLOS MARIATEGUI
Por ejemplo, determinemos los valores del percentil 10 (P10) y del percentil 90
(P90) .
Valor del percentil 10 (P10) Para lo cual utilicemos la tabla de distribución de
frecuencias de nuestro ejemplo (cuadro No. 10).
Para calcular el valor del P10 se procede de la siguiente manera:
• Hallar el valor del elemento determinante 10N; donde N = 50.
100
• Ubicar el valor del elemento determinante 5 en la columna fa. Este valor 5
no coincide exactamente con ninguno de los valores de la tabla, entonces
se elige el valor inmediato superior, es decir 11.
• Ubicar la clase percentilar y su límite inferior. En nuestro ejemplo, la clase
percentilar es 90 – 94 y su Li es 90.
• Determinar la frecuencia acumulada (fa) precedente. En nuestro ejemplo,
el elemento determinante es 5 y se ubica en el valor 11, luego, la
frecuencia acumulada (fa) precedente es 3, porque está antes del 11.
• Ubicar la frecuencia de la clase percentilar (fm). Hemos visto que la clase
percentilar donde se ubica el percentil 10 (P10) es 90 - 94. A esta clase le
corresponde una frecuencia de 8. Luego, 8 es la frecuencia percentilar
(fm).
• Aplicar la fórmula:
52
UNIVERSIDAD JOSE CARLOS MARIATEGUI
Reemplazando datos tenemos:
•
Valor del percentil 90 (P90). Utilicemos la tabla de distribución de
frecuencias del cuadro No. 11
Para determinar el valor de P90 se consideran los siguientes pasos:
o
Hallar el valor del elemento determinante.
53
UNIVERSIDAD JOSE CARLOS MARIATEGUI
• Ubicar el valor del elemento determinante 45 en la columna fa. En nuestro
ejemplo, este valor no coincide exactamente con los valores de la tabla,
entonces se elige el valor inmediato superior, o sea, 47.
• Ubicar la clase percentilar y el límite inferior de clase. En nuestro ejemplo, el
valor del elemento determinante es 47, y el intervalo de clase que le
corresponde es 120 - 124 cuyo límite inferior (Li) es 120.
Luego, la clase percentilar es 120 - 124 Y su límite inferior (Li) 120.
• Determinar la frecuencia acumulada (fa) precedente. Como en nuestro
ejemplo, el valor del elemento determinante es 47, y la frecuencia acumulada
precedente es 44. Entonces 44 es la frecuencia acumulada precedente.
• Ubicar la frecuencia de la clase percentilar (fm). En nuestro caso, a la clase
percentilar 120 - 124 le corresponde una frecuencia (fm) de 3.
• Luego, 3 es la frecuencia de la clase percentilar (fm).
• Reemplazar los valores hallados, en la fórmula para determinar el valor del
percentil 90 (P9O) Veamos:
Luego, el valor del percentil 90 es 121.67.
5.2. Cuartiles
Los cuartiles dividen a una distribución en cuatro partes iguales o cuartos. Se
representan por la letra. Q. Observemos el siguiente cuadro:
54
UNIVERSIDAD JOSE CARLOS MARIATEGUI
Corno se puede apreciar, el primer cuartil (Q1) contiene hasta el 25% de los
valores de la serie; es decir la cuarta parte. El segundo cuartil (Q2) contiene hasta
el 50% del total de los valores de la serie, es decir la mitad. El tercer cuartil (Q3)
contiene hasta el 75% de los valores de la serie; es decir, los tres cuartos de ella.
5.2.1. Procedimientos para ubicar los cuarteles
Para ubicar los cuartiles en una distribución de frecuencias de datos
agrupados se aplican las siguientes fórmulas:
Donde:
Li = Límite inferior de la clase en la que cae el cuartil.
N = número total de datos o suma de frecuencias.
fa = frecuencia acumulada de la clase que precede al cuartil.
i = intervalo
fm = frecuencia de la clase donde se ubica el cuartil
55
UNIVERSIDAD JOSE CARLOS MARIATEGUI
Aplicando estas fórmulas determinemos el valor de cada uno de los
cuartiles.
• Valor del primer cuartil (Q1) Se procede de la siguiente manera:
Se halla el valor del elemento determinante, para lo cual se divide el
número total de datos entre 4. Es decir:
Se compara el valor del elemento determinante (12.5) con los valores de
las frecuencias acumuladas (fa). En nuestro ejemplo el valor 12.5 no.
coincide con ningún valor de la frecuencia acumulada, entonces se toma el
valor inmediato superior que es 17.
Veamos:
Se ubica el intervalo de clase y el limite inferior de la misma,
correspondiente al elemento determinante. En nuestro caso el intervalo de
clase que le corresponde al elemento determinante (17), es 95 - 99 y su
límite inferior (Li) es 95.
Se ubica la frecuencia acumulada (fa) precedente al elemento
determinante. En nuestro ejemplo la frecuencia acumulada precedente es
11.
En la columna de las frecuencias, se ubica la frecuencia cuartilar (fm)
correspondiente al intervalo de clase, donde se localiza el primer cuartil.
En la distribución de nuestro ejemplo la clase cuartilar es 95 - 99 y la
frecuencia cuartilar es 6.
Finalmente, para determinar el valor del primer cuartil (Q1) se aplica la
siguiente fórmula:
56
UNIVERSIDAD JOSE CARLOS MARIATEGUI
Reemplazando con nuestros datos tenemos:
Luego, el valor del primer cuartil (Q1) es 96.25 que está ubicado en la clase
95 - 99.
•
Valor del segundo cuartil (Q2) Para encontrar este valor se aplica cualquiera
de las fórmulas que se presentan a continuación:
Reemplazando con los datos de nuestro ejemplo (cuadro No.13) tendremos:
• Valor del tercer cuartil (Q3) Con los datos de la siguiente tabla de distribución
de frecuencias (cuadro No. 13)
57
UNIVERSIDAD JOSE CARLOS MARIATEGUI
Calculemos el valor del tercer cuartil aplicando el procedimiento siguiente:
o
Se halla el valor del elemento determinante dividiendo el número total
de datos entre 4:
3N = 3 x 50 = 150 = 37.5
4
4
4
o
Se ubica el valor del elemento determinante 37.5 en la columna de la fa;
como en nuestro ejemplo el valor 37.5 no coincide con ningún valor de
las frecuencias acumuladas, entonces se toma el valor inmediato
superior que es 41.
o
Se ubica el intervalo de clase y el límite inferior de la misma, donde se
halla el elemento determinante. En nuestro ejemplo, (cuadro No. 14), el
intervalo de clase donde se encuentra dicho elemento determinante es
110 - 114 y su límite inferior es 110.
o
Se ubica la frecuencia acumulada (fa) precedente al elemento
determinante. En nuestro caso la fa precedente es 33.
o
En la columna de las frecuencias (f) se ubica la frecuencia cuartilar (fm)
correspondiente al intervalo de clase, donde se localiza el tercer cuartil.
En nuestra distribución, (cuadro No. 14), la clase cuartilar es 110 - 114 y
la frecuencia cuartilar es 8.
Finalmente, para calcular el valor propiamente dicho del tercer cuartil se
aplicará la fórmula:
58
UNIVERSIDAD JOSE CARLOS MARIATEGUI
Reemplazando tenemos:
5.2.2. El recorrido o amplitud intercuartilar (Aq)
Es la diferencia que hay entre los cuartiles extremos de una serie de
valores. Es decir, es la distancia que existe entre el tercer cuartil (Q3) y el
primer cuartil (Q1)
Para determinar el valor de la amplitud intercuartilar se utiliza la siguiente
fórmula:
Aq = Q3 – Q1
En nuestro ejemplo, los valores de los cuartiles son:
Q3 = 112.81
Q1 = 96.25
Reemplazando estos valores en la fórmula tenemos:
Aq = 112.81 - 96.25
Aq = 16.56
Luego, 16.56 es el valor de la amplitud intercuartilar.
5.2.3. La desviación cuartil o semi-intercuartilar (Q)
Esta medida de dispersión está dada por la mitad de la amplitud intercartilar. Es decir, por la mitad de la diferencia entre el tercer y el primer
cuartil (Q3 y Q1). Para determinar su valor se aplica la siguiente fórmula:
En nuestro ejemplo, los valores de:
Q3 = 112.81 y
Q1 = 96.25
Reemplazando en la fórmula con estos valores tenemos:
59
UNIVERSIDAD JOSE CARLOS MARIATEGUI
5.3. Deciles
Los deciles dividen a una distribución en diez partes iguales o décimos. Se
representa por la letra D. Así por ejemplo, al decil uno se representará por D1, al
decil 2 por D2 y así sucesivamente. Es decir, representan respectivamente al 10%,
20%, etc. de la muestra.
60
UNIVERSIDAD JOSE CARLOS MARIATEGUI
EJERCICIOS
1. Calcula el valor de la media aritmética (M), mediana (Mdn) y modo o moda (Mo)
de las siguientes distribuciones de frecuencias de datos no agrupados:
a) 10, 18, 13, 13, 13, 09, 17, 14
Md
=
_______________________________________________________
Mdn =
_______________________________________________________
Mo
=
_______________________________________________________
b) 98, 90, 83, 80, 80, 80, 75, 72, 63, 48
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
c) 70, 30, 80, 50, 45, 45, 45
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
d) 19, 20, 16, 16, 15, 15, 15, 15, 11, 13, 12, 10
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
e) 63, 55, 90, 48, 83, 95, 63, 63, 50, 75, 40
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
61
UNIVERSIDAD JOSE CARLOS MARIATEGUI
2. Completa los datos que faltan de la siguiente tabla de distribución de
frecuencias de datos agrupados (ejercicio No. 2 de la primera unidad).
3. En base a los datos del ejercicio anterior determina:
a) El valor de la media aritmética (M)
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
___
62
UNIVERSIDAD JOSE CARLOS MARIATEGUI
b) El valor de la mediana (Mdn)
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
___
c) El valor del modo o moda (Mo)
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
___
d) La ubicación de las tres medidas de tendencia central, utilizando el poligono
de frecuencias e interpreta dicho grafico
INTERPRETACION:
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
___
e) El valor de los cuarteles 1 y 2
Q1 =
____________________________________________________________
Q2 =
____________________________________________________________
f) El valor de los percentiles 10 y 90:
P10 =
____________________________________________________________
P90 =
____________________________________________________________
63