0500 MEDIDAS D VARIABILIDAD

Medidas de Variabilidad
Trabajo a realizar de este tema:
En Excel 2003 hoja 1, prepara un(os) cuadro(s) sinópticos o mapas
conceptuales o mapas mentales que sinteticen éste capítulo.
En la hoja 2 y en la hoja 3 del mismo libro de Excel resuelve los problemas 8 y
15 que están al final de este tema. Los ejercicios 5 y 9 los realizarás a mano y
los entregarás en sobre conforme al protocolo indicado. Anota las fórmulas
empleadas en ambos trabajos.
El nombre del archivo deberá ser:
05 MEDIDAS D VARIABILIDAD APELLIDO NOMBRE
Se calificará de la siguiente manera:
+ Ortografía (2 puntos)
Protocolo de envío:
+ Asunto: mal anotado el 100% del trabajo
+ Nombre (1 punto)
+ Comentario (2 punto)
+ Nombre del archivo (1 punto)
+ Versión diferente a 2003 (7 puntos)
En el trabajo solución, tanto en Excel como el trabajo escrito:
Comentario o conclusión del trabajo
(2 punto)
Ortografía: (1 punto)
Nombre
Universidad
Carrera
Materia
Tema
Fecha
(La ausencia total o de alguna parte
restará 1 punto)
A continuación, y sin dejar hoja en blanco, el desarrollo del trabajo (1 punto
menos de no cumplirlo). Se calificará la realización de las síntesis.
MEDIDAS DE VARIABILIDAD
0500 MEDIDAS D VARIABILIDAD.doc
1
Medidas de Variabilidad
¿Qué son las medidas de variabilidad?
Rango
Desviación media
La varianza y la desviación estándar
Coeficiente de variación
Rango intercuartilar
Problemas
¿Qué son las medidas de variabilidad?
La puntuación media en una distribución es importante en muchos contextos de
investigación. Pero también lo es otro conjunto de estadísticos que cuantifican que
tan variables, o que tan dispersas, tienden a ser las puntuaciones. ¿Las
puntuaciones varían mucho, o tienden a tener valores muy similares. A veces, la
variabilidad en las puntuaciones es la cuestión central en una investigación. La
variabilidad es un concepto cuantitativo, de modo que nada de esto se aplica a las
distribuciones de datos cualitativos.
Hay varias razones para analizar la variabilidad en una serie de datos. Primero, al
aplicar una medida de variabilidad podemos evaluar la medida de tendencia
central utilizada. Una medida de variabilidad pequeña indica que los datos están
agrupados muy cerca, digamos, de la media. La media, por lo tanto es
considerada bastante representativa de la serie de datos. Inversamente, una gran
medida de variabilidad indica que la media no es muy representativa de los datos.
Una segunda razón para estudiar la variabilidad de una serie de datos es para
comparar como están esparcidos los datos en dos o más distribuciones. Por
ejemplo, la calificación promedio de dos estudiantes, A = {90, 80, 75, 75 } y B =
{90, 55, 85, 90 }, es de 80. Basados en esto podríamos pensar que sus
calificaciones son idénticas. Pero si revisamos el detalle de sus calificaciones
vemos que esta conclusión no es correcta.
Hay muchas medidas de variabilidad intuitivamente atractivas, pero poco
utilizadas, como el rango, la desviación media y la desviación cuartilar. De
lejos, las medidas de variabilidad más ampliamente utilizadas son las que tienen
que ver con cómo extender los resultados a partir de la media. Estas son la
desviación estándar (s), y la varianza (s² o "var").
MEDIDAS DE VARIABILIDAD
0500 MEDIDAS D VARIABILIDAD.doc
2
Rango
La forma más sencilla de medir la variabilidad es el rango. Es la diferencia entre
los más altos y más bajos valores en un conjunto de datos no agrupados. En la
forma de una ecuación:
Rango = valor más alto - valor más bajo
El rango tiene la ventaja de ser fácil de calcular y entender.
Ejemplo:
Las calificaciones de cinco estudiantes de estadística son: 8, 8, 10, 6, y 8. ¿Cuál
es el rango de las calificaciones?
Rango = valor más alto - valor más bajo = 10 - 6 = 4
Rango para datos agrupados
Para estimar el rango de una distribución de frecuencia se resta el límite inferior
del intervalo de clase más chico del límite superior del intervalo de clase más
grande
Ejemplo:
Una muestra de las edades del público de un concierto se encuentra distribuida de
la siguiente manera:
Edades Número de personas
15 - 19
2
20 - 24
1
25 - 29
4
30 - 34
15
35 - 39
10
40 - 44
5
45 - 49
3
Rango = mayor limite superior - menor límite inferior = 49 - 15 = 34
(Valor absoluto de un número a = | a | es el número a sin su signo.)
MEDIDAS DE VARIABILIDAD
0500 MEDIDAS D VARIABILIDAD.doc
3
Desviación media (Dm)
La desviación media mide la cantidad promedio que varían los datos respecto a
su media. La definición es:
Desviación media es la media aritmética de los valores absolutos de las
desviaciones de los datos respecto a su media.
La fórmula de la desviación media para datos no agrupados (Dm) es:
Dm =
Σ| X -
|
n
Ejemplo:
Las calificaciones de cinco estudiantes de estadística son: 8, 8, 10, 6, y 8. ¿Cuál
es la desviación media de las calificaciones?
X
X-
|X -
8
0
0
8
0
0
10
+2
2
6
-2
2
8
0
0
Σ=4
X=8
Dm =
Σ| X n
MEDIDAS DE VARIABILIDAD
|
|
=
4
= 0.8
5
0500 MEDIDAS D VARIABILIDAD.doc
4
Desviación media para datos agrupados
En el caso de que los datos se encuentren agrupados en una distribución de
frecuencia la fórmula es :
Dm =
Σf | X -
|
n
Ejemplo:
Se tienen los siguientes datos agrupados:
LI LS X
F
FX
|X–X| F|X–X|
15 19 17
2
34
17.12
34.24
20 24 22
1
22
12.12
12.12
25 29 27
4
108
7.12
28.48
30 34 32
15
480
2.12
31.80
35 39 37
10
370
2.88
28.80
40 44 42
5
210
7.88
39.40
45 49 47
3
141
12.88
38.64
n =40 ΣfX = 1365
=
Σfx
n
Dm =
=
1365
Σ 213.48
= 34.12
40
213.48
5.337
40
Ventajas y Desventajas de la desviación media
La desviación media tiene dos ventajas. Utiliza para su cómputo todos los
elementos de la serie de datos y es facil de entender.
MEDIDAS DE VARIABILIDAD
0500 MEDIDAS D VARIABILIDAD.doc
5
La varianza (σ2 ó S2) y la desviación estándar (σ ó S)
Concepto de varianza y desviación estándar
La varianza y la desviación estándar sirven para cuantificar la variabilidad de una
muestra midiendo su dispersión alrededor de la media. La definición es la
siguiente:
2
Varianza. (σ ó S2) (σ = sigma) Es la media aritmética de las desviaciones
cuadradas de los datos respecto a la media.
Desviación estándar. (σ ó S) Es la raíz cuadrada de la varianza.
Varianza y Desviación Estándar para datos no agrupados
Las fórmulas de la varianza de una población y de una muestra son ligeramente
diferentes. Las fórmulas son:
σ 2=
(Σx)2
Σx2 -
(Σx)²
Σx2 -
N
n
S2=
N
n-1
varianza de una población
varianza de una muestra
Las desviaciones estándar de la población y muestra se calculan simplemente
sacando la raíz cuadrada a la respectiva varianza.
desviación estándar de una población
σ = σ2
desviación estándar de una muestra
MEDIDAS DE VARIABILIDAD
0500 MEDIDAS D VARIABILIDAD.doc
S= S2
6
Ejemplo
El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la
línea de producción son (en ml): 85.4, 85.3, 84.9, 85.4, y 84.0. ¿Cuál es la
varianza y la desviación estándar de las observaciones muestreadas?
X
85.4
85.3
84.9
85.4
84.0
Σx= 425.0
Σx 2
(Σx)2
n
S2=
=
36126.42 -
S=
S2 =
(425)2
5
n-1
X2
7293.16
7276.09
7208.01
7293.16
7056.00
2
Σx = 36126.42
= 0.355
5-1
0.355 = 0.5958
Varianza y Desviación Estándar para datos agrupados
Si los datos están agrupados en una distribución de frecuencia, la varianza y la
desviación estándar de la muestra se pueden aproximar sustituyendo Σfx² en Sx²
y Σfx en Sx. Las fórmulas quedarían de la siguiente manera:
σ 2=
(Σfx)2
Σfx2 -
Σfx2 -
N
S2=
N
varianza de una población
desviación estándar de una población
n
n-1
varianza de una muestra
σ = σ2
desviación estándar de una muestra
MEDIDAS DE VARIABILIDAD
(Σfx)2
0500 MEDIDAS D VARIABILIDAD.doc
S= S2
7
Ejemplo:
2
Calcular la varianza (σ ó S2) y la desviación estándar (σ ó S) de la siguiente
distribución de frecuencia del número de meses de duración de una muestra de 40
baterías para coche.
duración de las baterías (meses) Número de baterías
15 - 19
2
20 - 24
1
25 - 29
4
30 - 34
15
35 - 39
10
40 - 44
5
45 - 49
3
Primeramente, calculamos la marca de clase, para después calcular los productos
fX y fx2 para proceder finalmente a calcular las sumatorias ΣfX y Σfx2 y aplicar las
fórmulas.
LI LS X
F
FX
FX2
15
19
17
2
34
588
20
24
22
1
22
484
25
29
27
4
108
2916
30
34
32
15
480
15360
35
39
37
10
370
13690
40
44
42
5
210
8820
45
49
47
3
141
6627
n =40 ΣfX = 1365 Σfx2 = 48475
Σfx 2
(Σfx)2
n
S2=
48475 =
n-1
40
= 48.573
40 - 1
S=
MEDIDAS DE VARIABILIDAD
(1365)2
S2 = 48.573 = 6.969
0500 MEDIDAS D VARIABILIDAD.doc
8
Coeficiente de variación
El coeficiente de variación se define como la razón de la desviación estándar entre
la media aritmética.
C.V. =
σ
x
( 100 )
Ventajas
El coeficiente de variación es útil cuando pretende comparar la variabilidad de dos
o más conjuntos de datos expresados en diferentes unidades de medición, pues el
resultado será señalado en porcentajes.
Desventajas
Cuando el valor de la media es cercano a cero, el coeficiente de variación es muy
sensible a pequeños cambios en la media, limitando su utilidad
A diferencia de la desviación estándar este no puede ser utilizado para elaborar
intervalos de confianza para la media.
1
Interpolación es la construcción de nuevos puntos partiendo del conocimiento de un conjunto discreto de
puntos.
MEDIDAS DE VARIABILIDAD
0500 MEDIDAS D VARIABILIDAD.doc
9
Problemas
Para cada uno de los siguientes problemas calcule :
(a) el rango
(b) la desviación media r
(c) la varianza
(d) la desviación estánda
(e) el coeficiente de variación
1. Los resultados siguientes representan las calificaciones del examen final de un
curso de estadística elemental.
23
60
79
32
57
74
52
70
82
36
80
77
81
95
41
65
92
85
55
76
52
10
64
75
78
25
80
98
81
67
41
71
83
54
64
72
88
62
74
43
60
78
89
76
84
48
84
90
15
79
34
67
17
82
69
74
63
80
85
61
2. El gerente de una firma especializada en renta de condominios para
vacacionistas, quiere saber como están distribuidas los montos de las rentas
mensuales de los departamentos de la firma. Seleccionó una muestra de
departamentos cuyas muestras son mostradas abajo.
Rentas mensuales de los condominios
1170
1207
1581
1277
1305
1472
1077
1319
1537
1849
1332
1418
1949
1403
1744
1532
1219
896
1500
1671
1471
1399
1041
1379
821
1558
1118
1533
1510
1760
1826
1309
1426
1288
1394
1545
1032
1289
695
803
1440
1421
1329
1407
718
1457
1449
1455
2051
1677
1119
1020
1400
1442
1593
1962
1263
1788
1501
1668
1352
1340
1459
1823
1451
1138
1592
982
1981
1091
MEDIDAS DE VARIABILIDAD
0500 MEDIDAS D VARIABILIDAD.doc
10
3. Los siguientes datos representan la duración de la vida en meses de 30 bombas
de combustible similares.
24
36
4
40
16
15
18
6
30
60
3
72
66
78
3
28
67
72
15
3
18
48
71
22
57
9
54
4
12
72
4. Los siguientes datos representan la duración de la vida, en segundos, de 50
moscas sometidas a un nuevo atomizador en un experimento de laboratorio
controlado.
17
20
10
9
23
13
12
19
18
24
12
14
6
9
13
6
7
10
13
7
16
18
8
13
3
32
9
7
10
11
13
7
18
7
10
4
27
19
16
8
7
10
5
14
15
10
9
6
7
15
5. Se aplicó una encuesta donde se les pide indicar el número de amigos o
parientes que visitan cuando menos una vez al mes. Los resultados son los
siguientes:
3
5
2
3
3
4
1
8
4
2
4
2
5
3
3
3
0
3
5
6
4
3
2
2
6
3
5
4
14
3
5
6
3
4
2
4
9
4
1
4
2
4
3
5
0
4
3
5
7
3
5
6
2
2
MEDIDAS DE VARIABILIDAD
0500 MEDIDAS D VARIABILIDAD.doc
11
6. Una compañía de cambio de aceite tiene varias sucursales en la zona
metropolitana. El número de cambios de aceite en la sucursal de la calle Roble en
los pasados 20 días son:
66
98
55
62
79
59
51
90
72
56
70
62
66
80
94
79
63
73
71
85
7. El gerente local un negocio de comida rápida esta interesado en el número de
veces que un cliente compra en su tienda durante un periodo de dos semanas.
Las respuestas de los 51 clientes fueron:
5
3
3
1
4
4
5
6
4
2
6
6
6
7
1
1
14
1
2
4
4
4
5
6
3
5
3
4
5
6
8
4
7
6
5
9
11
3
12
4
7
6
5
15
1
1
10
8
9
2
12
8. El presidente de una agencia de viajes, quiere información sobre las edades de
la gente que toma cruceros por el Caribe. Una muestra de 40 clientes que tomaron
un crucero el año pasado reveló estas edades:
77
18
63
84
38
54
50
59
54
56
36
26
50
34
44
41
58
58
53
51
62
43
52
53
63
62
62
65
61
52
60
45
66
83
71
63
58
61
71
60
9. Una cadena de tiendas de artículos deportivos al servicio de esquiadores
principiantes, planea hacer un estudio de cuanto gasta un esquiador principiante
en su primera compra de equipo. Una muestra de recibos de sus cajas
registradoras reveló esas compras iniciales.
140
82
265
168
90
114
172
230
142
86
125
235
212
171
149
156
162
118
139
149
132
105
162
126
216
195
127
161
135
172
220
229
129
87
128
126
175
127
149
126
121
118
172
126
MEDIDAS DE VARIABILIDAD
0500 MEDIDAS D VARIABILIDAD.doc
12
10.- Se conduce un estudio de los efectos de fumar sobre los patrones de sueño.
La medición que se observa es el tiempo, en minutos, que toma quedar dormido.
Se obtienen estos datos:
69
56
22
28
41
28
47
53
48
30
34
13
52
34
60
25
21
37
43
23
13
31
29
38
26
36
30
11. Un banco seleccionó una muestra de 40 cuentas de cheques de estudiantes.
Abajo aparecen sus saldos de fin de mes.
404
74
234
149
279
215
123
55
43
321
87
234
68
489
57
185
141
758
72
863
703
125
350
440
37
252
27
521
302
127
968
712
503
498
327
608
358
425
303
203
12.- Una compañía de luz seleccionó una muestra de 20 clientes residenciales.
Los siguientes datos son las cuentas que se les facturó el mes pasado:
54
48
58
50
25
47
75
46
60
70
67
68
39
35
56
66
33
62
65
67
13.- Una muestra de suscriptores de una compañía telefónica reveló los siguientes
números de llamadas recibidas en la última semana.
52
43
30
38
30
42
34
46
32
18
41
5
MEDIDAS DE VARIABILIDAD
12
0500 MEDIDAS D VARIABILIDAD.doc
46
39
37
13
14. A los solicitantes del puesto de ensamblador de una empresa mueblera se les
aplica una prueba. La prueba consiste en tomar el tiempo que tardan en
ensamblar cierto mueble.
La siguiente es una distribución de frecuencia los tiempos registrados por una
muestra de 42 solicitantes.
Tiempo (minutos) Número de solicitantes
1-3
4
4-6
8
7-9
14
10 - 12
9
13 - 15
5
16 - 18
2
15. La siguiente es una distribución de frecuencia de una muestra de los pagos
realizados en un estacionamiento del centro de la ciudad el sábado pasado
Cantidad pagada ($) Número de clientes
MEDIDAS DE VARIABILIDAD
5-9
2
10 - 14
7
15 - 19
15
20 - 24
28
25 - 29
14
30 - 34
9
35 - 39
3
40 - 44
2
0500 MEDIDAS D VARIABILIDAD.doc
14