notas 3 - UNAM

Curso Inferencia
Estad´ıstica
Antonio Soriano Flores
[email protected]
Estad´ısticaAntonio Soriano Flores [email protected]
Inferencia
Correlaci´on
El coeficiente de correlaci´
on lineal lo definimos como
Cov (X , Y )
σX Y
, y mide el grado de
ρ=
=
σX σY
Var (X ) Var (Y )
asociaci´on lineal entre las variables aleatorias X y Y , y se
puede probar que −1 ≤ ρ ≤ 1.
Estad´ısticaAntonio Soriano Flores [email protected]
Inferencia
µ3
El coeficiente de asimetr´ıa lo definiremos como γ1 = 3 , bajo
σ
este contexto
γ1 = 0 nos indica una distribuci´
on sim´etrica con respecto a µ.
γ1 < 0 nos indica una distribuci´
on asim´etrica positiva con
respecto a µ.
γ1 > 0 nos indica una distribuci´
on asim´etrica negativa con
respecto a µ.
Estad´ısticaAntonio Soriano Flores [email protected]
Inferencia
µ4
La kurtosis la definiremos como γ2 = 4 − 3, bajo este
σ
contexto
γ2 = 0 nos indica una distribuci´
on mesocurtica
γ2 < 0 nos indica una distribuci´
on platocurtica o aplanada
γ2 > 0 nos indica una distribuci´
on leptocurtica o puntiaguda.
Estad´ısticaAntonio Soriano Flores [email protected]
Inferencia
Algunas funciones de distribuci´
on discretas
Nombre
Par´
ametro
Bernoulli
p ∈ (0, 1)
Binomial
n ∈ N, p ∈ (0, 1)
Geom´
etrica
p ∈ (0, 1)
Binomial Negativa
Poisson
p ∈ (0, 1) , k ∈ N
λ ∈ (0, ∞)
P (X = x)
p x (1 − p)1−x
n
x
x
p (1 − p)
n−x
(1 − p)x p
x−1
k−1
k
p (1 − p)
x−k
e −λ λx
x!
Estad´ısticaAntonio Soriano Flores [email protected]
Inferencia
Rango
E (X )
Var (X )
x ∈ {0, 1}
p
p(1 − p)
x ∈ {0, 1, . . . , n}
np
np(1 − p)
x ∈ {0, 1, 2, . . .}
1
p
(1−p)
p2
x ∈ {k, k + 1, . . . , }
k
p
k(1−p)
p2
x ∈ {0, 1, 2, . . .}
λ
λ
Algunas funciones de distribuci´
on continuas
Nombre
Par´
ametro
fX (x)
Rango
E (X )
Var (X )
Uniforme
a < b, a, b ∈ R
1
b−a
x ∈ (a, b)
b+a
2
(b−a)2
12
Exponencial
λ ∈ R+
λe −λx
x ∈ (0, ∞)
1
λ
1
λ2
α, β ∈ R+
β α α−1 −βx
x
e
Γ(α)
x ∈ (0, ∞)
α
β
α
β2
x ∈ (0, 1)
α
α+β
αβ
(α+β+1)(α+β)2
x ∈R
µ
σ2
Gamma
Beta
Normal
Γ(α+β) α−1
x
Γ(α)Γ(β)
+
α, β ∈ R
2
+
µ ∈ R,σ ∈ R
√ 1
2πσ 2
exp
(1 − x)
β−1
(x−µ)2
−
2σ 2
Estad´ısticaAntonio Soriano Flores [email protected]
Inferencia
Variables aleatorias bidimensionales
Si el resultado del experimento aleatorio que hacemos da como
resultado dos observaciones conjuntas entonces tenemos una
variable aleatoria bidimensional (X , Y ). Este vector puede ser
cualquier punto del plano R × R. Cada entrada del vector es una
variable aleatoria unidimensional con su respectivo campo de
variaci´on o rango que nos determinan el rango del vector conjunto.
El vector aleatorio (X , Y ) tendr´a un campo de variaci´on y una
funci´on distribuci´on de probabilidad, que denotaremos FX Y (·, ·) o
distribuci´on conjunta, donde
FX Y (x, y ) = P ({X ≤ x} ∩ {Y ≤ y })
= P (X ≤ x, Y ≤ y ) .
Estad´ısticaAntonio Soriano Flores [email protected]
Inferencia
A partir de la FX Y (x, y ) podemos obtener FX (x) y FY (y ) de la
siguiente manera
FX (x) = lim FX Y (x, y )
y →∞
y
FY (y ) = lim FX Y (x, y ) ,
x→∞
a estas funciones las llamaremos las funciones de distribuci´on
marginales.
Estad´ısticaAntonio Soriano Flores [email protected]
Inferencia
La manera de definir FX Y (x, y ) nos permite calcular la
probabilidad de un rect´angulo, en t´erminos de la funci´on de
distribuci´on conjunta FX Y (·, ·). Supongamos que x1 < x2 y
y1 < y2 , entonces la probabilidad del rect´angulo (x1 , x2 ] × (y1 , y2 ]
est´a dada por:
P (x1 < X ≤ x2 , y1 < Y ≤ y2 )
=
P (X ≤ x2 , Y ≤ y2 ) − P (X ≤ x1 , Y ≤ y2 )
−
P (X ≤ x2 , Y ≤ y1 ) + P (X ≤ x1 , Y ≤ y1 )
=
FX Y (x2 , y2 ) − FX Y (x1 , y2 ) − FX Y (x2 , y1 )
+
FX Y (x1 , y1 ) .
Estad´ısticaAntonio Soriano Flores [email protected]
Inferencia
Propiedades de FX Y (·, ·)
1
Se verifica que para FX Y (·, ·)
1
2
2
Si y0 es un valor fijo y x es una variable entonces FX Y (x, y0 )
es continua por la derecha.
Si x0 es un valor fijo y y es una variable entonces FX Y (x0 , y )
es continua por la derecha
FX Y (·, ·) cumple lo siguiente
1
lim FX Y (x, y ) = 0
y →−∞
2
lim FX Y (x, y ) = 0 y
x→−∞
3
lim
x→∞y →∞
3
FX Y (x, y ) = 1.
Y si x1 < x2 y y1 < y2 , entonces
FX Y (x2 , y2 ) − FX Y (x1 , y2 ) − FX Y (x2 , y1 ) + FX Y (x1 , y1 ) ≥ 0.
Estad´ısticaAntonio Soriano Flores [email protected]
Inferencia
Variables Aleatorias bidimensionales discretas
Una variable aleatoria bidimensional es discreta cuando las dos
variables que componen al vector tienen una distribuci´on discreta y
por lo tanto (X , Y ) toma una cantidad finita o numerable de
puntos con masa positiva.
Supongamos que el rango del vector aleatorio (X , Y ) son los
puntos {(x1 , y1 ) , (x2 , y2 ) , (x3 , y3 ) , . . .} donde
P [X = xi , Y = yi ] > 0, entonces debe pasar que
∞
P [X = xi , Y = yi ] = 1.
i=1
Estad´ısticaAntonio Soriano Flores [email protected]
Inferencia
Ejemplo
Se lanzan dos tetraedros con caras
del experimento es

(1, 1)



(2, 1)
Ω=
(3, 1)



(4, 1)
numeradas del 1 al 4. El espacio muestral
(1, 2)
(2, 2)
(3, 2)
(4, 2)
(1, 3)
(2, 3)
(3, 3)
(4, 3)
(1, 4)
(2, 4)
(3, 4)
(4, 4)







Sea X la variable aleatoria que indica el n´
umero obtenido en el primer tetraedro
y Y indica el m´
aximo de las dos caras obtenidas.
De acuerdo a las definiciones de las variables aleatorias, ambas toman los
valores 1, 2, 3 y 4; adem´
as si X = j entonces Y ≥ j, as´ı que las parejas de
valores que puede tomar el vector aleatorio (X , Y ) (con probabilidad positiva)
s´
olo pueden ser parejas (x, y ) donde x ≤ y .
Estad´ısticaAntonio Soriano Flores [email protected]
Inferencia
Continuaci´on de Ej.
Como se trata de dos variables aleatorias que son discretas, podemos calcular
las densidades conjuntas:
(x, y )
resultados de Ω
P [X = x, Y = y ]
(x, y )
resultados de E
P [X = x, Y = y ]
(1, 1)
(1, 1)
(1, 2)
(1, 2)
(1, 3)
(1, 3)
(1, 4)
(1, 4)
(2, 2)
(2, 1) , (2, 2)
1
16
1
16
1
16
1
16
2
16
(2, 3)
(2, 3)
(2, 4)
(2, 4)
(3, 3)
(3, 1) , (3, 2) , (3, 3)
(3, 4)
(3, 4)
(4, 4)
(4, 1) . . . (4, 4)
1
16
1
16
3
16
1
16
4
16
de manera que, por ejemplo, fXY (3, 3) =
Estad´ısticaAntonio Soriano Flores [email protected]
3
,
16
fXY (2, 3) =
Inferencia
1
.
16
Continuaci´on de Ej.
continuaci´
on de ejemplo
Para calcular la distribuci´
on conjunta FXY (x, y ) llenemos la siguiente tabla:
y <1
1≤y <2
2≤y <3
3≤y <4
4≤y
x <1
0
0
0
0
0
1≤x <2
0
2≤x <3
0
3≤x <4
0
4≤x
0
1
16
2
16
3
16
4
16
1
16
4
16
6
16
8
16
1
16
4
16
9
16
12
16
1
16
4
16
9
16
16
16
3
. N´
otese que FXY es una funci´
on de R2 al
As´ı por ejemplo, FXY (1.5, 3.2) = 16
[0, 1] que es no decreciente en cada una de las dos direcciones de su dominio.
Estad´ısticaAntonio Soriano Flores [email protected]
Inferencia
Variables Aleatorias bidimensionales continuas
Una variable aleatoria bidimensional es continua cuando la funci´on
de distribuci´on FX Y : R × R → R es continua y existe una funci´on
fX Y : R2 → R que llamaremos funci´
on de densidad conjunta,
que cumple con
x
y
−∞
−∞
FXY (x, y ) =
fXY (u, v ) dvdu,
adem´as de que fXY (x, y ) ≥ 0 para todo (x, y ) ∈ R2 y por u
´ltimo
∞
∞
−∞ −∞ fXY (x, y ) dydx = 1.
Estad´ısticaAntonio Soriano Flores [email protected]
Inferencia
Independencia entre variables aleatorias
Diremos que las variables aleatorias X y Y son independientes, si y
s´olo si FX Y (x, y ) = FX (x) FY (y ) para todo (x, y ) ∈ R × R ´o
tambi´en si fX Y (x, y ) = fX (x) fY (y ) para todo (x, y ) ∈ R2 .
Estad´ısticaAntonio Soriano Flores [email protected]
Inferencia
Podemos hablar de vectores aleatorios de dimensi´
on mayor a tres. Supongamos
que tenemos n variables aleatorias unidimensionales X1 , X2 , . . . , Xn . Entonces
podemos definir la
La funci´
on de distribuci´
on conjunta de X1 , X2 , . . . , Xn como
FX1 X2 ···Xn : Rn → [0, 1] dada por
FX1 X2 ···Xn (x1 , x2 , . . . , xn ) = P (X1 ≤ x1 , X2 ≤ x2 , . . . , Xn ≤ xn ) .
Si suponemos independencias entre las variables aleatorias X1 , X2 , . . . , Xn
entonces tenemos que
FX1 X2 ···Xn (x1 , x2 , . . . , xn )
=
P (X1 ≤ x1 ) P (X2 ≤ x2 ) × . . . × P (Xn ≤ xn )
n
P (Xi ≤ xi )
=
i=1
n
=
F (xi ) .
i=1
o equivalentemente
n
fX1 X2 ···Xn (x1 , x2 , . . . , xn )
=
f (xi ) .
i=1
Estad´ısticaAntonio Soriano Flores [email protected]
Inferencia