Plásticos Benama

ESTADÍSTICA:
Consideremos la estadística como un conjunto de métodos y técnicas, aplicables a
realidades cuantificables, con el objeto de obtener indicadores que nos permitan
diagnosticar dichas realidades.
Al conjunto de métodos antes mencionados se les denomina Métodos Estadísticos.
Los métodos estadísticos son de gran utilidad en la investigación y análisis, no sólo,
en las ciencias sociales sino también en las ciencias naturales y físicas, no existen
ciencias cuyos fenómenos no puedan ser estudiados estadísticamente.
Es importante destacar que la estadística tiene vigencia o utilidad cuando se estudian
fenómenos masificados y, carecen de ella cuando se trata de estudiar individualmente
una unidad.
TÉRMINOS COMUNES UTILIZADOS EN ESTADÍSTICA:
UNIVERSO POBLACIÓN O COLECTIVO.
Es el conjunto total de individuos, cosas, hechos, situaciones, etc., que se estén
considerando de acuerdo a una característica común observable.
Constituyen ejemplos de población o universo: todos los Bancos de Venezuela, todos
los lápices producidos por una fábrica en un día, todas las empresas constituidas en
el período 1999-2004, etc.
En un sentido más estricto se considera al universo como el conjunto total de
individuos, cosas, etc., y la población el conjunto que se obtiene de las mediciones
realizadas sobre los elementos del universo.
Por ejemplo, si nuestro universo son todos los participantes, podemos obtener la
población formada con las edades de estos participantes, la población formada con
las estaturas de esos mismos participantes, la población formada con los pesos de
esos mismos participantes, etc.
Luego, de un mismo universo se pueden obtener muchas poblaciones.
En el desarrollo de este material, utilizamos este concepto en su sentido más amplio.
La población puede ser finita o infinita, los empleados de una empresa forman una
población finita, mientras que la población formada con todos los posibles resultados
que se obtienen en lanzadas sucesivas de un dado, es infinita.
MUESTRA: Es una parte o subconjunto de la población o universo.
VARIABLE: Las observaciones sobre un determinado fenómeno en una población o
en una muestra generan un conjunto de datos, los cuales son tomados de acuerdo a
características particulares susceptibles de análisis, que se denominan variables.
Las variables pueden ser: cualitativas llamadas también atributos y cuantitativas.
Variables cualitativas o atributos son aquéllas en que las observaciones sobre un
determinado fenómeno se describen sólo como poseedoras o no, de ciertas
cualidades o propiedades, a menudo pueden ser expresadas numéricamente.
Las profesiones de los profesores de una universidad, las diferentes marcas de
cigarrillos existentes en el mercado, etc., son ejemplos de variables cualitativas.
1
Variables cuantitativas son aquellas en que las observaciones de un determinado
fenómeno, pueden hacerse sobre características que pueden ser transformadas en
datos numéricos por simple medición o conteo.
Por ejemplo: número de hijas hembras por matrimonio, montos de préstamos
hipotecarios, número de llamadas recibidas en una central telefónica en una hora,
estaturas, etc.
Las variables cuantitativas se clasifican en discretas y continuas.
Son variables discretas todas aquéllas que sólo toman valores enteros, como: número
de empleados de distintas empresas, cantidad de clientes que llegan a la taquilla de
un banco en una hora, número de habitaciones por apartamento, etc. Mientras que
las variables continuas pueden tomar valores enteros o no enteros, como: precios,
ingresos, temperaturas, velocidades, etc.
UNIDAD ESTADÍSTICA:
La unidad estadística es el sujeto en particular sobre el cual se está observando la
variable.
Por ejemplo: al considerar los diámetros de la producción de tornillos, el tornillo es la
unidad estadística y el diámetro es la variable. Si analizamos el precio actual de la
vivienda, la vivienda es la unidad estadística y un precio un valor particular de la
variable.
DATO ESTADÍSTICO:
Es el indicador estadístico, en otras palabras, es aquel elemento elaborado que surge
de la aplicación de métodos cuantitativos a las observaciones de un fenómeno en
estudio. Por ejemplo el precio promedio de una acción en el mercado de valores, la
proporción de venezolanos de bajos ingresos, la desviación de los pesos de un
determinado compuesto con respecto al peso promedio etc.
PROBLEMA:
Se realiza un estudio en la Parroquia Antímano del Municipio Libertador sobre el tipo
de transporte utilizado por sus residentes, para lo cual se encuestó a un grupo de
ellos, obteniéndose:
TIPO DE TRANSPORTE
NÚMERO DE RESIDENTES
Auto particular
82
Taxi
44
Metro
84
Auto por puesto
104
Autobús
74
Otros
50
¿ Cuál es: a) la población b) la muestra c) la variable y de qué tipo es? d) la unidad
estadística.
PROBLEMA:
2
Una fábrica produce tornillos para los cuales existen estrechos márgenes de
tolerancia en sus diámetros. El departamento de Control de calidad selecciona la
producción de un día y la somete a proceso de control.
¿Cuál es: a) la población? b) la muestra? c) la variable y de qué tipo es? d) la unidad
estadística?
ESTADÍSTICA DESCRIPTIVA:
Es el conjunto de métodos cuantitativos que permiten organizar y analizar
observaciones de un fenómeno en estudio, cuyas conclusiones no trascienden sobre
un conjunto mayor de observaciones (población).
ESTADÍSTICA INDUCTIVA:
Es el conjunto de métodos cuantitativos que permiten organizar y analizar
observaciones de un fenómeno en estudio, con el objeto de obtener conclusiones
sobre un conjunto mayor (población) que dio origen a dichas observaciones
(muestra).
ORGANIZACIÓN DE LOS DATOS:
DISTRIBUCIÓN DE FRECUENCIAS:
El análisis de una variable requiere de un procedimiento previo, que consiste en
recopilar, ordenar y clasificar la información que arroja dicha variable.
1. - Realizada una encuesta sobre el número de personas que habitan por
apartamento en un edificio en particular, se recopiló la información siguiente:
Número de personas por apartamento:
2
1
7
1
2
2
5
4
3
6
4
3
1
4
5
3
3
2
4
3
3
6
6
7
3
4
3
5
2
4
1
2
7
2
6
5
3
5
6
2
2
3
4
2
6
1
3
5
Construir una distribución de frecuencias.
SERIE DE DATOS AGRUPADOS EN CLASE:
Cuando la variable es continua o se desea darle un tratamiento continuo, se recurre a
la construcción de una distribución de frecuencias, que consiste en elaborar
recorridos parciales de la variable (clases) y donde se clasifican los valores
comprendidos en esos recorridos parciales (frecuencias absolutas)
El objeto de esta construcción es observar el comportamiento de la variable en
estudio a través de sus recorridos parciales y abreviar el análisis de la información.
3
COMPONENTES DE UNA DISTRIBUCIÓN DE FRECUENCIAS:
INTERVALO TOTAL-RECORRIDO O RANGO DE LA SERIE DE DATOS ( I T ):
Es la diferencia entre el valor mayor observado ( X M ) y el valor menor observado
( X m ) en una serie de datos.
I
T
=
X
M
-
X
m
CLASES:
Es el fraccionamiento que se hace del intervalo total en recorridos parciales de la
variable.
Las clases constan de un límite superior ( L S ) y un límite inferior ( L I ).
INTERVALOS DE CLASES ( i c ):
Es la amplitud o distancia entre el límite superior y el límite inferior de la clase y se
determina a través de su diferencia:
L
S
-
L
i
En algunos casos se determina por la diferencia de los límites inferiores de dos clases
consecutivas.
FRECUENCIA ABSOLUTA ( f i ):
Es el total de valores iguales o diferentes que están comprendidos dentro de los
límites de una clase.
PUNTO MEDIO O MARCA DE CLASE ( X CI ):
Es el valor que se supone más representativo de todos los comprendidos dentro de
los límites de clase, los cuales se consideran uniformemente distribuidos, se
determina por la semisuma de los límites de la clase:
x =L
ci
i
+ LS
2
CONSTRUCCIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS:
Se puede realizar por la aplicación del método de Sturges o a través del método
empírico o práctico.
Fórmula de Sturges:
i
c
=
I
T
1 + 3,322logN
4
2. - Usando el método de Sturges, construir una distribución de frecuencias con los
siguientes datos:
20
40
24
20
30
34
30
32
39
25
32
27
35
40
24
28
35
32
20
25
22
29
34
30
40
24
21
31
36
30
23
29
34
37
28
22
33
39
24
24
34
36
37
27
23
38
34
38
36
20
38
33
33
37
39
23
25
20
36
32
3. - Usando método empírico, o práctico, construir una distribución de frecuencias con
los datos dados a continuación que corresponden a los sueldos mensuales de 40
empleados del banco. Agrupar la información en 9 clases:
1,45
1,72
1,18
1,34
1,64
1,39
1,38
1,21
1,55
1,70
1,49
1,50
1,71
1,56
1,47
1,39
1,49
1,44
1,36
1,50
TIPOS DE FRECUENCIAS:
FRECUENCIA ABSOLUTA (
f
i
1,43
1,46
1,62
1,36
1,53
1,45
1,27
1,80
1,61
1,51
1,64
1,41
1,48
1,30
1,22
1,57
1,25
1,29
1,43
1,52
):
Es el número de veces que se repite un valor en una serie.
FRECUENCIAS RELATIVAS ( hi ):
Es el cociente entre la frecuencia absoluta y el número total de datos ( N =
n
∑f
i =1
hi = fNi
i
)
n
∑ h =1
i =1
i
FRECUENCIAS ACUMULADAS:
Cuando la frecuencia absoluta o relativa de un determinado valor de la variable,
expresa la suma de las frecuencias (absolutas o relativas) de todos los valores de la
variable precedentes y la suya propia, la frecuencia se denomina, frecuencia
acumulada. La frecuencia acumulada absoluta se denota por F i y con H i la
frecuencia acumulada relativa; donde
H
i
= Fi .
N
5
REPRESENTACIÓN GRÁFICA DE LAS DISTRIBUCIONES DE FRECUENCIAS:
Gráficamente podemos representar una distribución de frecuencias a través de
histogramas o polígonos, usando indiferentemente frecuencias (absolutas o relativas)
absolutas o acumuladas.
Un histograma es un gráfico formado por rectángulos que tienen por base el intervalo
de clases de la distribución y por altura la frecuencia (absoluta o acumulada)
correspondiente a la clase.
Un polígono de frecuencias absolutas es una figura que se forma al unir los puntos
que se determinan levantando en el punto medio de cada clase, una altura igual a la
frecuencia absoluta correspondiente a la clase. Los extremos del polígono se cierran
en puntos situados, antes de la primera clase y a continuación de la última clase, a
una distancia igual a la mitad del intervalo de clase de la serie.
Una ojiva, se obtiene uniendo el límite inferior de la primera clase, con los puntos que
se determinan, levantando en el límite superior de cada clase, una altura igual a la
frecuencia acumulada correspondiente a la clase.
4. - Con los datos de los tres problemas anteriores, construya:
a) histogramas de frecuencias absolutas
b) histogramas de frecuencias acumuladas
c) polígonos de frecuencias absolutas
d) Ojiva.
PORCENTAJE DE DATOS EN UNA DISTRIBUCIÓN DE FRECUENCIAS:
Para determinar el porcentaje de datos menores que un valor de variable dado “r” se
utiliza la fórmula:
⎡
P ( x < r ) = ⎢Fa a +
⎢⎣
f
i
( r - L i ) ⎤ 100
⎥
i c ⎥⎦ n
donde:
P (x < r): porcentaje de datos menores a un determinado valor “r” dado de la variable.
Faa: frecuencia acumulada anterior a la clase que contiene el valor dado “r”.
R: valor de variable dado.
Li: límite inferior de la clase que contiene a “r”.
Ic: intervalo de clase de la clase que contiene a “r”.
N: número total de datos.
5. - La siguiente distribución de frecuencias se refiere a los pesos de un grupo de 160
personas:
6
PESOS (en Kg.)
52
55,9
56
59,9
60
63,9
64
67,9
68
71,9
72
75,9
76
80,0
Nº de personas
8
24
34
40
30
18
6
Calcule:
a) El porcentaje de personas con pesos inferiores a 62Kg.
b) ¿Cuántas personas pesan entre 65 y 74 Kilogramos?
c) El número de personas con pesos superiores a 62 Kilogramos.
d) P(x <?) = 75%.
6. - La distribución del ahorro mensual de 300 personas
Nº DE PERSONAS
AHORRO
100 149,9
24
150 199,9
36
200 249,9
42
250 299,9
96
300 349,9
48
350 399,9
30
400 450,0
24
Se desea conocer:
a) El porcentaje de personas con ahorro mensual menor de 200 mil bolívares.
b) ¿ Cuántas personas ahorran más de 320 mil bolívares al mes?
c) P (x <? ) = 50%
7
MEDIDAS DE TENDENCIA CENTRAL:
El estudio de la tendencia central es la primera etapa del análisis estadístico
propiamente dicho.
De un conjunto de datos, sea una simple lista o una distribución de frecuencias, se
puede obtener un elemento representativo de ese conjunto.
Existen varios elementos que pueden representar todos los datos de los cuales se
han extraído. Los dividiremos en dos categorías:
MEDIAS (promedios matemáticos)
MEDIDAS DE POSICIÓN (promedios no matemáticos).
Las medias al igual que las medidas de posición, son estadísticos representativos de
la serie de datos y reflejan su convergencia, por lo que se llaman medidas de
tendencia central.
MEDIAS
MEDIA ARITMÉTICA
La media aritmética es el valor de la tendencia central que más frecuentemente se
usa para representar los datos de una serie.
La media aritmética es igual al cociente que resulta de dividir la suma de todos los
datos de la serie por el número de ellos.
PROPIEDADES:
Si a todos los valores de la variable se les suma un mismo número “k” entonces, la
media aritmética queda aumentada (disminuida) en el valor “k”.
Si todos los valores de la variable se multiplican por un mismo número “k” la media
aritmética de esos valores quedará multiplicada por “k”.
Si N1 valores de la variable tiene como media aritmética a
N2
“
“ “
.
“
.
“
Nn “
x
1
“ “
“
“
“
“
“
“
“
“
“
“
“
“
“
“
“
“
“
“
“
“
“
“
“
“
“
“
“
“
“
“
“ .
“ .
“ .
“ xn
“
“
“
“
x
2
Y N = N1 + N2 + . . . . Nn, la media aritmética total será:
x =
N x + N x + ... + N x
N + N + ..... N
1
2
1
1
n
2
2
n
∑
N x
∑
N
n
n
=
1 = 1
i
i
n
i = 1
i
8
8. - Los siguientes valores:
1,75
2,25
2,15
2,40
1,90
2,25
1,80
2,15
1,90
2,40
1,80
2,15
2,15
2,60
1,90
2,15
2,15
2,25
2,60
2,25
Corresponden a pesos, en gramos, de una serie de 20 observaciones. Calcular el
peso promedio.
9. – Una empresa tiene 60 ejecutivos que reciben en promedio 4.000.000Bs. al mes y
800 trabajadores que reciben en promedio 700.000Bs. al mes. En tiempo de
depresión todos los salarios se reducen en un 20%, el número de ejecutivos se
reduce en un 10% y se despiden 200 trabajadores. Determine el salario promedio
total en tiempo de depresión.
10. - El gerente de una agencia bancaria, de acuerdo a un estudio del tiempo de
espera de los clientes, antes de ser atendidos en taquilla, obtiene para un día
laborable cualquiera la información siguiente:
Nº de clientes
8
20
32
40
24
16
Tiempo de espera (en minutos)
10
14
14
18
18
22
22
26
26
30
30
34
Calcule el tiempo de espera promedio.
MEDIA GEOMÉTRICA:
Si los “n” valores de una variable son x1, x2,......., xn, con xi > o ( i = 1,2,3,....,n), su
media geométrica representada por “G” viene dada por:
G =n
x . x .............. x
1
2
n
Ejemplo:
Halle la media geométrica de 5; 9; 20 y 39
TASA PROMEDIO DE CRECIMIENTO:
9
Una de las aplicaciones de uso frecuente de la media geométrica es su utilización
para el cálculo de tasas de crecimiento interperíodos, ya que se asume que la
evolución en el tiempo de series es geométrica, y por tanto quien interpreta la
tendencia central de esos crecimientos es la media geométrica.
La tasa promedio de crecimiento se calcula a través de la siguiente fórmula.
i=n
P
P
F
-1
o
siendo:
i: tasa promedio de crecimiento
n: número de períodos
PF : valor final de la serie
Po : valor inicial de la serie.
11. - Se pretende construir un hospital en un municipio del país, a tal objeto es
necesario dimensionarlo en cuanto al número de camas a instalar.
Para realizar tal trabajo se dispone de la información siguiente:
AÑO
1999
2004
POBLACIÓN (en 10 miles de habitantes)
13,9
15,4
De acuerdo a coeficientes técnicos, por cada 1000 habitantes debe instalarse una
cama, ¿ cuántas camas debe tener dicho hospital para el año 2.007?
10. - Se tiene la distribución del ingreso familiar mensual en una comunidad “A” en la
forma siguiente:
Nº DE FAMILIAS
INGRESO FAMILIAR MENSUAL
500
1000
6
1000
1500
12
1500
2000
14
2000
2500
10
2500
3000
8
Para otra comunidad “B” el ingreso promedio mensual es de 1450 y dicha comunidad
está formada por 120 familias. La información anterior para ambas comunidades
corresponde al año 1998. Sí la comunidad “A” crece en 4% interanual y la comunidad
“B” en un 2% interanual. ¿ Cuál será el ingreso promedio total para 2007 de ambas
comunidades, si los valores de los ingresos promedios de ambas comunidades se
incrementan en un 98%?.
MEDIDAS DE POSICIÓN:
10
LA MEDIANA:
Este promedio quizás sea uno de los que más responde intuitivamente al concepto
del valor medio y en la práctica es uno de los más usados.
La mediana, denotada por Md es el valor central de “n” datos x1, x2, x3.,.....,xn
dispuestos en forma creciente, si “n” es impar, por ejemplo: para los datos 105; 98;
137; 82; 36; 84; 72, se ordenan en forma creciente 36; 72; 82; 84; 98; 105; 137 en
donde Md = 84.
En el caso de que “n” sea par, la mediana será la semisuma de los datos centrales,
por ejemplo: para los valores ordenados 15; 18; 20; 24; 31; 35, se obtiene
20 + 24
= 22
2
Md =
Para el caso de datos agrupados en clases usaremos la fórmula:
∑f
M
d
= Li +
2
i
−
f
F
aa
* ic
i
Li: Límite inferior de la clase medianal.
∑f
2
i
Posición de a mediana (para la localización de la clase medianal)
fi: Frecuencia absoluta correspondiente a la clase medianal
ic: intervalo de clase de la clase medianal.
11. - Un estudio sobre remuneraciones realizado tomando como muestra 100
profesionales de una determinada especialidad, arrojó el siguiente resultado:
REMUNERACIONES
3000
3600
4200
4800
5400
6000
6600
Determine la mediana.
3600
4200
4800
5400
6000
6600
7200
Nº DE PROFESIONALES
6
10
20
22
18
14
10
MODO:
11
Llamaremos modo o moda, al valor que se presenta más frecuentemente en una
serie, en otras palabras es el dato afectado de la mayor frecuencia.
Dados los valores:
5 7 6 5 4 3 5 4 3 6 6 5
se obtiene la serie:
fi
xi
3
2
4
2
5
4
6
3
7
1
La moda es el valor 5.
Para determinar la moda (Mo) si el recorrido de la variable se ha dividido en
clases, usaremos la fórmula:
M =L +
o
i
∆
1
∆
1
+
∆
* ic
2
En donde:
Li: Límite inferior de la clase modal
∆1: Diferencia entre la frecuencia modal y la frecuencia pre-modal
∆2: Diferencia entre la frecuencia modal y la frecuencia post-modal
ic: Intervalo de clase de la clase modal.
12. - La siguiente información se refiere a una muestra de 120 componentes
electrónicos y su duración.
Nº DE COMPONENTES
DURACIÓN (en miles de horas)
10
14,99
8
15
19,99
24
20
24,99
44
25
29,99
28
30
35,00
16
Calcule la duración que se presenta más comúnmente.
12
FRACTILES:
Dentro de los estadísticos de posición se encuentran unos muy importantes para
indicar el fraccionamiento de una distribución de datos, que se denominan fractiles,
de los cuales los más usuales son: los deciles, los cuartiles y los percentiles.
Los cuartiles fraccionan la distribución en cuatro partes iguales: 25% de los valores
serán menores que el cuartil uno (Q1).
Fórmula para calcular los cuartiles Qi; con i = 1, 2, 3.
i∑
Q
i
=
L
i
f
i
4
+
f
-
F
aa
* ic
i
Siendo:
Li: Límite inferior de la clase cuartil
i∑
4
f
i
: Posición de la clase cuartil
Faa: Frecuencia acumulada anterior a la frecuencia acumulada a la clase cuartil
Fi: Frecuencia absoluta correspondiente a la clase cuartil
Ic: Intervalo de clase de la clase cuartil.
Los deciles fraccionan la distribución en 10 partes iguales. Por ejemplo, el 70% de los
valores serán menores que el decil 7 (D7).
La fórmula para calcular los deciles Di, con i = 1, 2, 3,......, 8,9
i∑
D
i
=
L
i
+
f
i
10
f
-
F
aa
* ic
i
Los percentiles fraccionan la distribución en 100 partes iguales. Por ejemplo, el 37%
de los valores serán menores que P37.
La fórmula para calcular los percentiles Pi, con i = 1, 2, 3,............., 99 es:
13
i∑
P
i
=
L
i
+
f
i
100
f
-
F
aa
* ic
i
13. - Observados los alquileres de 480 viviendas se obtuvo la siguiente distribución:
Nº de viviendas
Alquileres Bs. /mes(miles)
500 --- 600
30
600 --- 700
40
700 --- 800
140
800 --- 900
160
900 --- 1000
50
1000 --- 1100
60
a) Determine el alquiler que se presenta más frecuentemente b) determine el alquiler
más barato de los comprendidos en el 40% más caro c) ¿Cuál es el alquiler más
alto del 15% de las viviendas de más bajo alquiler? (D) ¿Cuántas viviendas pagan
de alquiler 650.000Bs.por mes, o menos?.
14. - El departamento de control de calidad de una fábrica de baterías, de acuerdo a
la duración de las mismas, obtiene la información siguiente:
Nº de baterías
DURACIÓN(en miles de horas)
Menos de 3
7
3 -----6
14
6 -----9
28
9 ------ 12
40
12 ------ 15
22
15 ------ 18
16
18 y más
13
Estratificar esta información, por tipo de batería, según su duración en de: a) muy
baja duración b) baja duración c) duración media d) alta duración.
A) ¿En cuál estrato se ubica la duración que se presenta más frecuentemente y cuál
es?
B) ¿Cuántas baterías tienen una duración menor a 16.000 horas?.
MEDIDAS DE DISPERSIÓN O INDICADORES DE DISPERSIÓN:
Cuando se dice que una medida de la tendencia central es un valor que está
representando a una masa de datos, es necesario conocer, si realmente este valor
cumple con tal papel. En este estudio es imprescindible conocer la variabilidad
existente entre los diferentes valores de la serie con respecto al valor central, para
llegar a tal conclusión.
Por ejemplo si consideramos las series:
Serie 1:
52
54
56
61
62
14
Serie 2:
15
22
25
103 120
Ambas tienen la misma media aritmética 57, pero las dos son muy diferentes,
mientras una de ellas(serie 1) está formada por valores parecidos al promedio; la otra
(serie 2) sus valores son poco parecidos al valor promedio.
Entonces se hace necesaria una medida que refleje la disposición de la variable en
torno a la medida de la tendencia central, es decir que indique cuan representativa es
ella de la serie.
Las medidas o indicadores de dispersión se clasifican en absolutos y relativos:
Los principales estadísticos de dispersión absolutos son:
a) Recorrido, rango o intervalo total, que es la diferencia existente entre el valor
mayor y el menor de la serie.
I
=
T
X
-
M
X
m
b) Desviación media, que es el promedio aritmético de los valores absolutos de las
desviaciones de los valores de la serie con respecto a la medida de la tendencia
central; las cuales son:
Desviación media con respecto a la media aritmética.
Datos no agrupados:
D
x
=
∑x
i
- x
N
Datos agrupados:
D
x
=
∑ x -x f
∑ f
i
i
i
Desviación media con respecto a la mediana (
Datos no agrupados:
D
Md
=
∑x
i
D
Md
)
− Md
N
15
Datos agrupados:
∑x - M f
D =
∑f
i
d
i
Md
i
En una distribución simétrica, aproximadamente el 58% de los datos están
comprendidos en el intervalo:
x ±
D
Md
(C) Desviación típica o estándar (σ), es la raíz cuadrada de la media aritmética de los
cuadrados de los desvíos de los valores de la serie con respecto a su media
aritmética.
Datos no agrupados:
σ =
(
∑ xi - x
)
2
∑x
2
σ=
ó
N
i
n
2
-x
Datos agrupados:
σ =
∑ ⎛⎜⎝ xi - x
∑f
)
2
f
i
σ =
ó
i
∑ f i xi
∑f
2
-
2
x
i
d) Variancia o varianza, es el cuadrado de la desviación típica o estándar (σ2).
e) Desviación cuartil ( DQ ), es la diferencia entre el tercer cuartil ( Q 3 ) y el primer
cuartil ( Q 1 )
D
Q
=
Q
3
-
Q
1
f) Que cubre el 50% central de los datos de la distribución.
g) Desviación semicuartil (Q):
16
Q =
Q
3
−
Q
1
2
Los principales estadísticos de dispersión relativos son. A) coeficiente de variación
(CV), es la relación entre la desviación típica y la media aritmética, se expresa en
porcentaje.
CV =
σ
x
. 100
B) Coeficiente de variación medianal (CVM), es el cociente entre la desviación cuartil
y la mediana, se expresa en porcentaje.
CVM =
D
M
Q
.100
d
15. – El departamento de crédito de un banco basándose en un estudio sobre 80
solicitudes de préstamos para adquisición de viviendas, obtiene para el monto de los
mismos la siguiente distribución:
Nº DE SOLICITUDES
MONTOS (en 10.000 de Bs.)
1.000 --- 1.200
6
1.200 --- 1.400
20
1.400 --- 1.600
28
1.600 --- 1.800
21
1.800 --- 2.000
5
Dentro de un análisis estadístico de esta serie se requiere lo siguiente:
a) ¿A partir de qué monto estará el 60% de las solicitudes?
b) Caracterizar la serie a través de su promedio adecuado y su correspondiente
indicador de variabilidad. ¿Cree Ud., que el promedio es representativo?
VARIABLE TIPIFICADA:
Una variable de valores
z
i
z
=
i
x
carente de unidades, que se obtiene mediante la fórmula:
i
σ
-x
, Se denomina variable tipificada.
17
Cada valor o dato ( xi ) de la distribución original se puede transformar en un valor
tipificado ( z i ), en donde cada z i representará la desviación de un dato específico
( xi ) respecto a la media aritmética ( x ) expresada en unidades de desviación típica.
Las características más importantes de esta variable tipificada, son que su media
aritmética es igual a cero, y su desviación estándar es igual a 1.
16. – Una encuesta realizada entre dos grupos de familias arrojó la información
siguiente:
GRUPO 2
GRUPO 1
Gastos Medios por mes
1.200
1.400
Desviación típica por mes
30
40
Se conoce que una familia del grupo 1, tiene un gasto que corresponde en variable
( z i ) al valor –1,4 y otra del grupo 2 que corresponde a 0,8. ¿Cuál es el gasto por mes
de cada familia?
17. – El gerente de una flotilla de automóviles de acuerdo a las investigaciones
realizadas sobre los costos de mantenimiento y reparación de dos marcas de
automóviles de su flotilla, obtiene la información siguiente:
COSTOS
Bs./Km.
MARCAS
A
B
x
0,12
0,10
Bs./Km.
σ
0,025
0,04
Si un automóvil de cada marca se selecciona al azar, obteniéndose:
Marca “A” costo 0,08 Bs. /Km. Marca “B” costo 0,06 Bs./Km. ¿Cuál automóvil está
mejor calificado de acuerdo al aspecto en estudio?
18. – Dos empresas filiales “A” y “B” desean premiar al vendedor de cualquiera de
ellas que obtuvo mejores ventas durante el mes, para el premio hay dos candidatos,
uno de la empresa “A” y otro de la empresa “B”; se tiene la información siguiente:
EMPRESA “A”
Ventas del candidato en el mes 84.000
CV = 16%
σ = 12.000
EMPRESA “B”
Ventas del candidato en el mes 90.000
Venta promedio por vendedor por mes
82.000
σ = 16.000
18
¿Cuál vendedor recibirá el premio?
19