Capítulo 3 Distribuciones de Probabilidades 7

Capítulo 3 Distribuciones de Probabilidades ____________________________________ 7 Objetivos __________________________________________________________________________ 7 Introducción ___________________________________________________________________ 8 Variable aleatoria, v.a. _______________________________________________________________ 8 Distribución de probabilidades ________________________________________________________ 9 Ia Una variable _________________________________________________________________ 10 1 Métodos tabulares y gráficos _______________________________________________________ 10 a Variables cuantitativas discretas _____________________________________________________ 10 Tablas _________________________________________________________________________ 10 Diagramas ______________________________________________________________________ 10 PF ____________________________________________________________________________ 10 CDF ___________________________________________________________________________ 11 b. Variables cuantitativas de escala ____________________________________________________ 15 Diagramas ______________________________________________________________________ 15 PDF ___________________________________________________________________________ 15 Probabilidad de masas ____________________________________________________________ 16 CDF ___________________________________________________________________________ 16 2. Métodos numéricos ______________________________________________________________ 17 Medidas de posición ________________________________________________________________ 17 Modo _________________________________________________________________________ 17 Mediana _______________________________________________________________________ 17 Valor esperado __________________________________________________________________ 17 Medidas de dispersión ______________________________________________________________ 18 Amplitudes _____________________________________________________________________ 18 Desviación Media ________________________________________________________________ 18 Varianza _______________________________________________________________________ 18 Desviación estándar ______________________________________________________________ 19 Propiedades ______________________________________________________________________ 19 Desigualdad de Tchebyscheff _________________________________________________________ 19 Problema resuelto 3.1 Selección de 3 esferas ________________________________________ 20 Problema resuelto 3.2 Dado 1 ____________________________________________________ 20 Problema resuelto 3.3 Dado 2 ____________________________________________________ 22 Problema resuelto 3.4 Clientes de un supermercado __________________________________ 22 Problema resuelto 3.5 Demanda de nafta ___________________________________________ 23 Suceso poco común: criterio con probabilidades _________________________________________ 23 Problema resuelto 3.6 Dados de distintos colores ____________________________________ 24 Ib Funciones de variables aleatorias (una variable) ___________________________________ 25 Eventos equivalentes _____________________________________________________________ 25 Métodos _________________________________________________________________________ 26 1 Caso discreto __________________________________________________________________ 26 Método de la PF _________________________________________________________________ 26 Problema resuelto 3.7 Transformación cuadrática ____________________________________ 26 2 Caso contínuo _________________________________________________________________ 26 Método de la CDF ________________________________________________________________ 26 Problema resuelto 3.8 Transformación cuadrática ____________________________________ 27 Método de la PDF ________________________________________________________________ 28 Problema resuelto 3.9 Transformación lineal ________________________________________ 29 Método de la MGF _______________________________________________________________ 30 Métodos numéricos ________________________________________________________________ 30 Valor esperado de Y ______________________________________________________________ 30 Ic Modelos teóricos de una variable _______________________________________________ 31 SPSS y EXCEL ____________________________________________________________________ 31 1
Capítulo 3 Distribuciones de Probabilidades
1. Modelos discretos _______________________________________________________________ 32 Distribución de Bernoulli, b(y,1,p) _____________________________________________________ 32 Supuestos ______________________________________________________________________ 32 Caracterización __________________________________________________________________ 33 Distribución Binomial, b(y,n,p) ________________________________________________________ 33 Supuestos ______________________________________________________________________ 33 Problema resuelto 3.10 Fiesta numerosa ___________________________________________ 35 Expresiones generales ____________________________________________________________ 37 Caracterización __________________________________________________________________ 37 Proporción muestral ______________________________________________________________ 39 Uso de tablas ___________________________________________________________________ 39 Problema resuelto 3.11 Paquetes de una distribuidora ________________________________ 39 Distribución Hipergeométrica, h(y,N,n,k) _______________________________________________ 40 Supuestos ______________________________________________________________________ 40 Problema resuelto 3.12 Fiesta no numerosa _________________________________________ 41 Expresiones generales ____________________________________________________________ 42 Caracterización __________________________________________________________________ 43 Aproximación de una hipergeométrica _______________________________________________ 44 Distribución geométrica, g(y,p) _______________________________________________________ 44 Supuestos ______________________________________________________________________ 44 Expresiones generales ____________________________________________________________ 45 Caracterización __________________________________________________________________ 45 Pérdida de la memoria ____________________________________________________________ 46 Problema resuelto 3.13 Auditorías con errores _______________________________________ 47 Distribución binomial negativa o de Pascal, bn(y,r,p) ______________________________________ 48 Supuestos ______________________________________________________________________ 48 Expresiones generales ____________________________________________________________ 49 Caracterización __________________________________________________________________ 49 Relaciones entre las CDF Binomial y Pascal ____________________________________________ 50 Pascal y Binomial ________________________________________________________________ 50 Geométrica y Binomial ____________________________________________________________ 51 Problema resuelto 3.14 Gripe H1N1 _______________________________________________ 51 Problema resuelto 3.15 Falla de un motor __________________________________________ 52 Distribuciones multinomial y multihipergeométrica _______________________________________ 53 Distribución de Poisson, p(y,λ) ________________________________________________________ 53 Supuestos ______________________________________________________________________ 53 Caracterización __________________________________________________________________ 56 Problema resuelto 3.16 Preguntas a un consultor _____________________________________ 57 Aproximación de una binomial _____________________________________________________ 59 Uso de tablas ___________________________________________________________________ 59 Problema resuelto 3.17 Errores en un libro __________________________________________ 60 Diseños con tabla de contingencias ____________________________________________________ 60 2. Modelos contínuos _______________________________________________________________ 63 Distribución Uniforme, r(x,a,b) ________________________________________________________ 63 Caracterización __________________________________________________________________ 64 Problema resuelto 3.18 Distribución uniforme _______________________________________ 65 Problema resuelto 3.19 Espera del ómnibus _________________________________________ 65 Distribución Exponencial, e(t,ω) _______________________________________________________ 66 Caracterización __________________________________________________________________ 67 Pérdida de la memoria ____________________________________________________________ 68 Distribución Gamma ________________________________________________________________ 68 Función Gamma _________________________________________________________________ 68 Problema resuelto 3.20 Γ(1/2) ____________________________________________________ 69 Distribución Gamma(x,r,α) _________________________________________________________ 69 Caracterización __________________________________________________________________ 70 2
Jorge Carlos Carrá
Introducción – Objetivos
Exponencial _____________________________________________________________________ 70 Relaciones entre las CDF de Gamma y Poisson _________________________________________ 71 Gamma y Poisson ________________________________________________________________ 71 Exponencial y Poisson _____________________________________________________________ 72 Problema resuelto 3.21 Distribución exponencial _____________________________________ 73 Problema resuelto 3.22 Reparación de aviones ______________________________________ 75 Distribución Normal, n(z,0,1) _________________________________________________________ 76 Supuestos ______________________________________________________________________ 76 PDF ___________________________________________________________________________ 77 CDF ___________________________________________________________________________ 80 Caracterización __________________________________________________________________ 80 Propiedades ____________________________________________________________________ 82 Uso de tablas ___________________________________________________________________ 82 Problema resuelto 3.23 Distribución normal _________________________________________ 82 Problema resuelto 3.24 Método de Sympson ________________________________________ 83 Problema resuelto 3.25 Coeficiente de inteligencia ___________________________________ 83 Regla empírica __________________________________________________________________ 85 Aproximación de una binomial y de una Poisson _______________________________________ 86 Problema resuelto 3.26 Estudiantes promocionados __________________________________ 87 Distribución t de Student, f(t,ν) _______________________________________________________ 88 Caracterización __________________________________________________________________ 89 Propiedades ____________________________________________________________________ 90 Uso de tablas ___________________________________________________________________ 90 Problema resuelto 3.27 Distribución t de Student ____________________________________ 90 Distribución chi cuadrado, f(χ2, ν) _____________________________________________________ 91 Caracterización __________________________________________________________________ 93 Propiedades ____________________________________________________________________ 93 Uso de tablas ___________________________________________________________________ 95 Problema resuelto 3.28 Distribución χ2 ____________________________________________ 96 Distribución F, f(F,ν1, ν2)_____________________________________________________________ 96 Caracterización __________________________________________________________________ 98 Propiedades ____________________________________________________________________ 98 Uso de tablas __________________________________________________________________ 100 Problema resuelto 3.29 Distribución F _____________________________________________ 100 Problema resuelto 3.30 Propiedad reciproca _______________________________________ 101 Estimador de Densidad Kernel, Kernel Density Estimate, KDE. ____________________________ 101 Distribuciones truncadas ___________________________________________________________ 101 Problema resuelto 3.31 Normal truncada a la izquierda _______________________________ 102 Momentos de orden n _____________________________________________________________ 103 Función generadora de momentos, MGF m(t) __________________________________________ 103 Problema resuelto 3.32 Obtención de MX(t) ________________________________________ 105 Propiedades de la MGF __________________________________________________________ 107 IIa Dos variables ______________________________________________________________ 109 1. Métodos tabulares y gráficos ______________________________________________________ 109 a Variables discretas _______________________________________________________________ 109 PF ___________________________________________________________________________ 109 CDF __________________________________________________________________________ 109 PF marginales __________________________________________________________________ 110 PF condicionales ________________________________________________________________ 110 Independencia _________________________________________________________________ 110 b Variables contínuas ______________________________________________________________ 110 CDF __________________________________________________________________________ 110 PDF __________________________________________________________________________ 110 PDF marginales _________________________________________________________________ 111 PDF condicionales _______________________________________________________________ 111 3
Capítulo 3 Distribuciones de Probabilidades
Independencia _________________________________________________________________ 111 2. Métodos numéricos _____________________________________________________________ 111 Medidas de posición _______________________________________________________________ 112 Vector esperanza _______________________________________________________________ 112 Esperanza conjunta _____________________________________________________________ 112 Esperanza condicional ___________________________________________________________ 112 Medidas de dispersión _____________________________________________________________ 112 Vector varianza _________________________________________________________________ 112 Varianza conjunta _______________________________________________________________ 113 Varianza condicional _____________________________________________________________ 113 Medidas de asociación _____________________________________________________________ 113 Covarianza ____________________________________________________________________ 113 Correlación lineal _______________________________________________________________ 113 Matriz Covarianzas, P ____________________________________________________________ 113 Matriz de correlaciones, R ________________________________________________________ 114 Problema resuelto 3.33. Género de los hijos ________________________________________ 114 Problema resuelto 3.34. Demanda diaria __________________________________________ 115 Problema resuelto 3.35. Tiempo de vida de 2 dispositivos electrónicos __________________ 116 IIb Funciones de variables aleatorias (dos variables) _________________________________ 118 Métodos ________________________________________________________________________ 118 1 Caso discreto _________________________________________________________________ 118 Método de la PF ________________________________________________________________ 118 Problema resuelto 3.36 Defectuosos en 2 líneas de producción ________________________ 118 2 Caso contínuo ________________________________________________________________ 119 Método de la CDF _______________________________________________________________ 119 Problema resuelto 3.37 Transformación suma ______________________________________ 120 Método de la PDF _______________________________________________________________ 121 Funciones Y = H ( X1 , X 2 ) importantes ____________________________________________ 122 Problema resuelto 3.38 Transformación suma ______________________________________ 123 Métodos numéricos _______________________________________________________________ 124 Valor esperado de Y _____________________________________________________________ 125 H lineal _______________________________________________________________________ 125 Problema resuelto 3.39 Distribución hipergeométrica ________________________________ 126 IIc Modelos teóricos de dos variables _____________________________________________ 129 1 Modelos discretos _______________________________________________________________ 129 Multinomial, m(yA,yB,yC,n,pA,pB,pC) ___________________________________________________ 129 Supuestos _____________________________________________________________________ 129 Expresiones generales ___________________________________________________________ 129 PDF conjunta ___________________________________________________________________ 130 Relación con la binomial __________________________________________________________ 130 Caracterización _________________________________________________________________ 130 Problema resuelto 3.40 Examen de selección múltiple ________________________________ 131 Distribución Multihipergeométrica ___________________________________________________ 131 PDF conjunta ___________________________________________________________________ 131 Relación con la hipergeométrica ___________________________________________________ 132 Caracterización _________________________________________________________________ 132 Esperanza _____________________________________________________________________ 132 2 Modelos contínuos ______________________________________________________________ 133 Distribución uniforme ______________________________________________________________ 133 PDF conjunta ___________________________________________________________________ 133 Problema resuelto 3.41 Encuentro _______________________________________________ 133 Distribución binormal ______________________________________________________________ 133 nXY(μx, μy, σx, σy, ρ) ______________________________________________________________ 134 PDF conjunta ___________________________________________________________________ 134 4
Jorge Carlos Carrá
Introducción – Objetivos
PDF marginales _________________________________________________________________ 134 Caracterización _________________________________________________________________ 134 III Confiabilidad, R(t) ___________________________________________________________ 136 Distribución exponencial _________________________________________________________ 139 Distribución Gamma, (t,r,α) _______________________________________________________ 141 Distribución de Weibull, (x,ω,β) ____________________________________________________ 141 Distribución normal _____________________________________________________________ 144 Sistemas ______________________________________________________________________ 146 Problema resuelto 3.42. Ley exponencial de fallas ___________________________________ 147 Problema resuelto 3.43. Frecuencia de fallas variable ________________________________ 148 IV Teoría de los juegos _________________________________________________________ 150 1 Simultáneos con estrategias puras __________________________________________________ 152 a Formas del juego ______________________________________________________________ 152 b Equilibrio de Nash _____________________________________________________________ 154 c Eficiencia y justicia _____________________________________________________________ 158 d Estrategias Minimax y MaxiMin __________________________________________________ 159 e Juegos de suma cero ___________________________________________________________ 162 Problema resuelto 3.45 Sistemas de video _________________________________________ 163 Problema resuelto 3.46 El juego de la contaminación ________________________________ 164 Problema resuelto 3.47 Competición Cournot ______________________________________ 165 2 Simultáneos con estrategias mixtas _________________________________________________ 167 a Formas del juego ______________________________________________________________ 167 b Equilibrio de Nash _____________________________________________________________ 168 c Funciones de mejor respuesta (BRF, Best Response Function) __________________________ 169 Problema resuelto 3.48 Estrategia de juego en el saque ______________________________ 169 Problema resuelto 3.49 Estrategia de juego en el saque ______________________________ 176 d Conjunto convexo de ganancias __________________________________________________ 178 3 Secuenciales ____________________________________________________________________ 179 a Formas del juego ______________________________________________________________ 179 b Subjuego ____________________________________________________________________ 181 c Equilibrios ____________________________________________________________________ 181 d Juegos simultáneos ____________________________________________________________ 184 e Racionalidad secuencial y credibilidad _____________________________________________ 187 Problema resuelto 3.50 Educación parental ________________________________________ 187 f Aplicación: juego de ajedrez _____________________________________________________ 189 4 Teoría de las decisiones económicas_________________________________________________ 189 a Formas de la decisión __________________________________________________________ 190 Problema resuelto 3.51 Mejor inversión ___________________________________________ 191 Problema resuelto 3.52 Acciones y la economía _____________________________________ 192 b Caso particular: una sola acción __________________________________________________ 193 Problema resuelto 3.53 Rifa para juntar fondos _____________________________________ 193 Problema resuelto 3.54 Costo de la prima de seguros ________________________________ 194 Problema resuelto 3.55 Ruleta europea ___________________________________________ 196 Problema resuelto 3.56 Estrategias de ventas _______________________________________ 197 V Simulaciones _______________________________________________________________ 199 1 Simulación de distribuciones _________________________________________________________ 199 Problema resuelto 3.57 Simulación Montecarlo _____________________________________ 201 2 Simulación de juegos _______________________________________________________________ 202 ComLabGames ___________________________________________________________________ 202 a Moderador _____________________________________________________________________ 202 a Design ______________________________________________________________________ 203 b Assignment __________________________________________________________________ 206 c Execution ____________________________________________________________________ 207 e Data ________________________________________________________________________ 208 5
Capítulo 3 Distribuciones de Probabilidades
b Jugador (cliente) ________________________________________________________________ 209 Client Play _____________________________________________________________________ 209 Problema resuelto 3.58 El empresario y el capitalista _________________________________ 211 Ensayo: ¿Creer en Dios mejora la existencia? _______________________________________ 215 El peso de la decisión. Blas Pascal ____________________________________________________ 215 Ensayo: Intimidades de un casino ________________________________________________ 217 Introducción _____________________________________________________________________ 217 1. Casinos _______________________________________________________________________ 217 2. Aseguradoras __________________________________________________________________ 222 Problemas ___________________________________________________________________ 224 Ia Una variable ___________________________________________________________________ 224 Ic Modelos teóricos de una variable __________________________________________________ 225 Discretas ______________________________________________________________________ 225 Contínuas _____________________________________________________________________ 228 IV Teoría de los juegos _____________________________________________________________ 231 Problemas con base de datos ________________________________________________________ 234 6
Jorge Carlos Carrá
Introducción – Objetivos
Capítulo 3
Distribuciones
de
Probabilidades
Objetivos
•
•
•
Introducir las distribuciones de probabilidad más comunes en la toma de decisiones.
Mostrar cual distribución utilizar y aprender cómo obtener sus valores.
Apreciar las limitaciones de cada una de las distribuciones que utilice.
7
Capítulo 3 Distribuciones de Probabilidades
Introducción
En este capítulo se estudiará la tercera y última de las bases necesarias para afrontar en los capítulos
restantes, la inferencia estadística. Como su nombre lo indica, esta tercera base, se apoya en realidad
sobre los hombros de las dos anteriores. Este capítulo recorre en gran medida, el esquema del
capítulo 1, distribuciones de frecuencias, pero en lugar de tratar muestras, lo haremos con
poblaciones.
Variable aleatoria, v.a.
Las probabilidades se aplican a eventos A, por ejemplo P(A)=0.5, sin embargo, para realizar estudios
matemáticos como los del capítulo 1, los eventos deben ser numéricos. De aquí que resulte necesario
definir una variable numérica asociada a cada evento, X =X(A). Esta variable se llama aleatoria
(v.a.), pues toma cada uno de sus valores (eventos) con una definida probabilidad.
La función que relaciona los eventos con la variable numérica aleatoria debe ser biyectiva, es decir
para cada evento A le corresponde uno y solo un valor X(A).
EL gráfico de la figura 3-1a indica una v.a. posible para el espacio muestral del lanzamiento de 2
monedas, en el cual la v.a. es el número de Caras. El esquema conceptual general es el de la figura 31b.
a
x=X(A)
A
p=P(x)
x
p=P(A)
b
8
Jorge Carlos Carrá
p
Introducción – Distribución de probabilidades
Figura 3-1
Variable Aleatoria
La expresión p(x) es una simplificación de la notación más precisa:
P ( A ) = P ( A : X ( A) = x ) = P ( X = x ) = p ( x )
De aquí en más utilizaremos en general la notación que prescinde de los eventos A, pero el
estudiante debe comprender el significado que realmente representa esta notación.
En muchos casos, el evento es numérico por sí mismo, como por ejemplo, el número de esferas o
mujeres que se extrae de un grupo, la suma de los números de 2 dados, la ganancia monetaria, etc.
Cuando esta situación no se presente, los números que se asignan a la v.a son en principio
arbitrarios, pero si se relacionan con el evento, mejor.
En general se designa una variable aleatoria con letra mayúscula (con dominio sobre los eventos
experimentales) y a un valor específico o determinista de ella con letra minúscula (con dominio
sobre los números reales), aunque algunas letras configuran la excepción, como por ejemplo: z, t o
p̂ .
Esta notación se aplicará en este libro para X e Y, en especial cuando la variable aleatoria se
encuentre dentro de una función específica para estas variables, tales como: P(X), E(X), V(X) y
Cov(X,Y), dando a entender que su dominio es el de los sucesos experimentales.
Distribución de probabilidades
Es una función que asocia a cada valor de todos los posibles x, su probabilidad p(x).
En el capítulo 1 hemos estudiado las distribuciones de frecuencias de muestras y en el capítulo 2
hemos visto que la frecuencia relativa muestral a largo plazo es la probabilidad en una población.
Uniendo ambos conocimientos, podemos generalizar todos los conceptos vistos cambiando la
frecuencia relativa por probabilidad:
Por esta razón, la siguiente sección es en realidad una adaptación de conceptos anteriores.
9
Capítulo 3 Distribuciones de Probabilidades
Ia Una variable
Comenzamos con los métodos aplicables a una sola variable. Una variable aleatoria es numérica o
cuantitativa y, como vimos en el capítulo 1, se divide en:
1. Discretas
2. Continuas o de escala
1 Métodos tabulares y gráficos
a Variables cuantitativas discretas
Recordemos del capítulo 1 que las variables cuantitativas discretas son las variables que resultan de
contar, por lo tanto generalmente se definen como "X = número de…"
Tablas
Llamamos:
• S, al espacio muestral,
• E, a cada uno de los eventos del mismo,
• X, a la v.a asignada a cada evento,
• p = P(X = x) = p(x), a las probabilidades de cada evento.
La distribución de probabilidades, se puede definir con una tabla como la de la figura 3-2.
S
X=x
p(x)
F(x)
E1
x1
p1
p1
E2
x2
p2
p1 + p2
E3
x3
p3
p1 + p2 + p3
…
…
…
…
En
xn
pn
1
Figura 3-2
Tabla de una distribución de probabilidades categórica
Diagramas
PF
El histograma de probabilidades equivalente a la tabla se suele llamar PF (Probability Function) y
mostrará un valor de p(x) para cada uno de los valores de discretos de la variable. Para que el área
mida una probabilidad, la representación más adecuada es utilizar una flecha para cada x (figura 33). Esta simbología matemática se llama delta de Dirac, δ(x) (ver más adelante) la cual permite
expresar correctamente los cálculos. De todas formas se acepta también un rectángulo para cada x,
10
Jorge Carlos Carrá
Ia Una variable – a V
Variables cuan
ntitativas disc
cretas
ma, no existenn valores paraa la base del
aunquee debe interprretarse que, a diferencia dee un histogram
mismoo, excepto para el punto meedio.
Propiedades
p( x) ≥ 0
+∞
∑ p( x) = 1
−∞
Figura 3-3
Probability Functioon
CDF
F
La ojivva o CDF (Cuumulative Disstribution Funnction), tomarrá el aspecto dde la figura 3--4, mostrandoo
una fun
nción escalónn F ( x ) con discontinuidad
d
des o saltos. Cada
C
escalón incluye el iniicio y excluyee el
extrem
mo.
Con exxcepción del punto
p
siguiennte, no se utilizará para el escalón
e
la notación E ( x ) , usual en
matem
máticas, pues en
e estadística significa la Esperanza
E
de x.
x
Capíítulo 3 Distrib
buciones de Probabilidade
P
es
Figura 3-4
Cumulativee Distribution Function
F
Matem
máticamente:
k
F ( x) = p ( X ≤ x) = ∑ pi
i
Propiedades
F ( −∞ ) = 0
F ( +∞ ) = 1
Relac
ción entre p(x)
p
y F(x)
)
Tal com
mo vimos en el capítulo 1 para las variaables numériccas:
p( x) =
dF ( x)
dx
x
F ( x) = ∫ p( x)dx
d
−∞
Expre
esión mate
emática de la p(x)
1 Delta
a de Dirac
Formallmente la funnción delta de Dirac se defiine a partir dee la función esscalón unitariio E(x), de la
siguiennte forma:
δ ( x) =
dE ( x)
en x = 0
dx
Generaalizando:
δ a = δ ( x − a) =
dE ( x − a )
en x = a
dx
Para innterpretar a essta función, approximemos een forma con
ntínua al escallón unitario, con
c EΔ(t), un
salto de altura unitaria y ancho de longitud Δ, tal como se muestra
m
en la figura 3.7.
12
Jorge
e Carlos Carrrá
Ia Una variable – a Variables cuantitativas discretas
Figura 3-5
EΔ(t), aproximación contínua al escalón unitario
La derivada de EΔ(t) será un pulso de duración Δ, de altura 1/Δ y como su base es Δ, el pulso será por
lo tanto de área 1 para todo Δ, como se muestra en la figura 3.8.
Figura 3-6
Derivada de EΔ(t)
Si Δ tiende a 0, entonces δΔ(t) se vuelve más angosto y alto, pero manteniendo su área unitaria,
tendiendo a δ(t). En el límite se puede expresar que el área es 1.
⎧∞ si x = 0
⎩0 si x ≠ 0
δ ( x) = ⎨
∫
+∞
−∞
δ ( x)dx = 1
2 Expresión de f(x)
Por definición:
⎧∞ si x = a
¨
⎩0 si x ≠ a
δ ( x − a) = ⎨
En general para todos los puntos del espacio muestral, la función densidad es una función definida
por tramos de pulsos modulados por pi (tren de pulsos).
f ( x) = ∑ piδ ( x − xi )
i
Valor de p(x)
Supongamos que en un punto arbitrario a, p(x) tiene el valor pa. La probabilidad es el área de la
función densidad en ese punto, por lo cual debemos integrar entre 2 valores que solo comprendan a
dicho punto:
p( x = a) = ∫
a+
a−
paδ ( x − a)dx = pa 1 = pa
Dado que la delta de Dirac se expresa por una flecha, ésta es la representación más adecuada para la
gráfica de la PF. Estrictamente el valor en cada punto es infinito, pero suele expresarse el valor de la
probabilidad con flechas de altura proporcional a dicho valor, sobreentendiendo que se está
expresando el área.
13
Capítulo 3 Distribuciones de Probabilidades
Expresión de F(x)
Integrando la función densidad pero ahora entre −∞ y el punto a :
F (a) = ∫
a
−∞
( p1δ ( x − x1 ) + ... + paδ ( x − a) ) dx
es decir:
a
F ( a ) = p11 + ... + pa 1 = ∑ pi
−∞
Es también una función definida por tramos, en este caso escalonados.
Notación
La vinculación funcional entre los valores de eje, x y valores acumulados de área por la izquierda,
CDF, se puede expresar de 2 formas alternativas: con subíndice o con paréntesis:
x(CDF ) = xCDF
CDF ( x) = CDFx = P( x < xCDF )
En la unidad 1 usamos en forma indistinta las notaciones de paréntesis y subíndice para CDF, con
F = CDF , aunque el subíndice fue más frecuente para los cuantiles ( xF ). Sin embargo, cuando sea
necesario precisar la dependencia a otras variables (media, desviación estándar, tamaño de la
muestra, tamaño de la población, grados de libertad, etc), es conveniente normalizar la notación y
usar la notación de subíndice para la relación anterior dejando el paréntesis para cualquier
vinculación restante.
Ejemplo:
xCDF ( x , s) = x0.80 ( x , s) = x0.80 (100,15) = 112.6
Esta expresión significa el valor del eje x para una CDF= 0.80, con media 100, y desviación estándar
15 (los números de este ejemplo corresponden a una distribución normal que veremos luego).
SIG
El complementario de la CDF, es decir usando valores acumulados por la derecha, se llama SIG,
SIGnificación, nombre proveniente de la inferencia estadística (capítulo 5), o también α1.
SIG = α = 1 − CDF
Nota
En aplicaciones a la confiabilidad se llama también Función Supervivencia, (Survival Function).
Notación
Nuevamente, la relación entre los valores del eje y del área se puede representan con un paréntesis o
con un subíndice.
x(α ) = xα
α ( x) = α x = P( x > xα )
1
También se usa α para simbolizar el área de ambas colas, incluyendo la cola inferior. El contexto indicará el
significado.
Jorge Carlos Carrá
14
Ia Una variable – b. Variables cuantitativas de escala
b. Variables cuantitativas de escala
Recordemos del capítulo 1 que las variables cuantitativas de escala son las variables que resultan de
medir.
Diagramas
Son la expresión contínua de las relaciones anteriores.
PDF
PDF significa Probability Density Function. El SPSS llama PDF tanto a las PF de las distribuciones
discretas como a las PDF de las continuas, por lo cual seguiremos en general la misma idea.
Un ejemplo se muestra en la figura 3-7.
Figura 3-7
PDF
Propiedades
f ( x) ≥ 0
∫
+∞
−∞
f ( x)dx = 1
Notas
1. La función densidad f(x) no representa la probabilidad de nada. Es el área debajo de ella la que representa
una probabilidad.
2. Para el caso contínuo, debe ser P(x = xi) = 0, pues el área es cero en xi. Desde el punto de vista estadístico
esto se interpreta pensando que entre infinitos valores, es altamente improbable que se presente
exactamente el resultado x = xi. El cálculo de probabilidades de variables contínuas solo tiene sentido si se
utilizan intervalos y no puntos.
De aquí que las siguientes expresiones son todas idénticas:
P ( a ≤ X ≤ b) = P ( a < X ≤ b) = P ( a ≤ X < b) = P ( a < X < b)
15
Capítulo 3 Distribuciones de Probabilidades
Probabilidad de masas
Resulta útil una analogía que surge de considerar a la función densidad como una densidad lineal de
masa en el eje x. Con esta interpretación, la probabilidad sería el área entre la línea f(x) y el eje x. En
particular si la f(x) es constante (distribución uniforme) de valor c y la longitud sobre el eje x es L, la
constante deberá ser 1/ L .
CDF
Se muestra en la figura 3-8.
Figura 3-8
CDF
Propiedades
F ( −∞ ) = 0
F ( +∞ ) = 1
Relación entre f(x) y F(x)
Tal como adelantamos en el capítulo 1:
dF ( x)
dx
f ( x) =
x
F ( x) = ∫ f ( x)dx
−∞
Más formalmente,
por definición de función densidad:
x
P( X ≤ x) =
∫
f ( x)dx
−∞
además por definición de función distribución:
P ( X ≤ x) = F ( x) − F ( −∞) = F ( x )
Vinculando ambas expresiones, se tiene la relación buscada.
16
Jorge Carlos Carrá
Ia Una variable – 2. Métodos numéricos
2. Métodos numéricos
Parámetros y estadísticos
Al igual que la pendiente y la ordenada al origen son parámetros que caracterizan a una recta, los
métodos numéricos que veremos a continuación proveen parámetros que caracterizan a la
distribución de probabilidades.
En cambio, las magnitudes de los métodos numéricos aplicados a muestras aleatorias del capítulo 1,
se llaman estadísticos Y, definidos como cualquier función aplicada a los n valores de la muestra
( x1 , x2 ,...xn ) , es decir Y = H ( x1 , x2 ,...xn ) . Observar que al ser las X variables aleatorias, los
estadísticos Y también lo son.
Así por ejemplo, la media x de la unidad 1 es un estadístico, en cambio la media μ que se verá en
este capítulo es un parámetro de la distribución.
Para obtener la versión para la población, se deberá en:
Discretas
Reemplazar la frecuencia fx por p
Contínuas
Reemplazar la sumatoria por la integral y la frecuencia fx por f(x)dx..
Además, dado que las distribuciones de probabilidades corresponden a una población, en el cálculo
de la varianza se deberá dividir por n en lugar de n − 1 .
Medidas de posición
Modo
M es el valor de x que le corresponde al máximo de la distribución.
Contínua
Como es el máximo de la distribución, surgirá de las raíces de:
df ( x )
=0
dx
Mediana
Q2 se obtiene con las mismas expresiones vistas en el capítulo 1.
Contínua
Q2 será el valor de x que le corresponde a un área del 50% contada desde los extremos.
∫
Q2
−∞
f ( x)dx = 0.5
De forma similar se define cualquier percentil.
Valor esperado
La media de una variable aleatoria poblacional se llama además, valor esperado, pues es el valor
promedio que esperaríamos obtener si las repeticiones se pudieran realizar en forma indefinida. La
notación de la media y la desviación estándar para muestras del capítulo 1, se realizó con letras del
17
Capítulo 3 Distribuciones de Probabilidades
alfabeto latino. Para las distribuciones de probabilidades de poblaciones, se utilizan en cambio, letras
del alfabeto griego.
x → μ = E(X )
s → σ = V (X )
Discretas
Reemplazando la frecuencia relativa por la probabilidad, se tendrá:
μ = ∑ px
El valor esperado es entonces un promedio ponderado de los valores de x, donde el peso está dado
por la probabilidad de cada x.
Contínuas
E ( x) = ∫ x f ( x )dx
Medidas de dispersión
Amplitudes
Son idénticas a las ya vistas para las distribuciones de frecuencias.
Desviación Media
Discretas
DM = ∑ p Δ x
Contínuas
DM = ∫ x − μ f ( x ) dx
Varianza
Discretas
V ( X ) = ∑ pΔ 2x
Suma de cuadrados
Las expresiones de los SSxx se mantienen, cambiando la frecuencia f por p:
SS xx = ∑ px 2 − nμ 2
La varianza será entonces:
V ( x) =
SS xx
=
n
∑ px
n
2
− μ 2 = E( x2 ) − μ 2
La varianza de una población es la media de los cuadrados menos el cuadrado de la media.
Contínuas
V ( x) = ∫ ( x − μ ) 2 f ( x)dx
Suma de cuadrados
18
Jorge Carlos Carrá
Ia Una variable – Propiedades
Las expresiones de los SSxx se mantienen, cambiando la frecuencia f por f ( x ) dx :
SS xx = ∫ x 2 f ( x) dx − nμ 2
La varianza será entonces:
V ( x) =
SS xx
= E ( x2 ) − μ 2
n
Desviación estándar
σ = V (X )
Propiedades
Se repiten a continuación las propiedades ya estudiadas y demostradas en el capítulo 1. Las
demostraciones para variables contínuas son análogas a las de variables discretas, cambiando la
sumatoria por la integral.
1 E (c ) = c
1 V (c ) = 0
E
(
cX
)
=
cE
(
X
)
2
2 V (cX ) = c 2V ( X )
3
4
5
E (c ± X ) = c ± E ( X )
E ( X ± Y ) = E ( X ) ± E (Y )
E ( XY ) = E ( X ) E (Y ) − Cov ( XY )
3
V (c ± X ) = V ( X )
5
6
7
V ( X ± Y ) = V ( X ) + V (Y ) ± 2Cov ( X , Y )
Cov ( aX , bY ) = abCov ( X , Y )
Cov ( a + X , b + Y ) = Cov ( X , Y )
∑
∑
∑
abCov( X , Y )
8 Cov( aX , bY ) =
Recordemos que en las propiedades 5 si los eventos son independientes, la covarianza es cero.
Desigualdad de Tchebyscheff
La demostración de esta desigualdad se realizó en el capítulo 1 (página Tchevy1), simplemente
ahora la expresaremos en términos de probabilidades:
Esto resulta directamente de reconocer que una sumatoria de frecuencias relativas se corresponde
con una probabilidad, la cual se expresa en el campo contínuo con una integral:
∑
2 colas
fx =
∫
f ( x)dz = P(| X − μ |> zkσ )
2 colas
en donde la última expresión indica valores de X en las 2 colas: μ − zkσ > X > μ + zkσ .
Por lo tanto la desigualdad se expresa:
P (| X − μ |> zkσ ) <
1
zk 2
19
Capítulo 3 Distribuciones de Probabilidades
Problema resuelto 3.1 Selección de 3 esferas
Tres esferas se eligen aleatoriamente de una urna conteniendo 20 esferas numeradas. Si X es el mayor número
de las 3 esferas, a) construir la PF, b) ¿cuál es la probabilidad de que solo una de las esferas tenga por lo menos
el número 17?, c) hallar F(6).
a)
Veamos algunos ejemplos:
⎛ 2⎞
⎛ 3⎞
⎛ 4⎞
1⎜ ⎟
1⎜ ⎟
1⎜ ⎟
2
2
2
P ( X = 3) = ⎝ ⎠ = 0.000877 P ( X = 4) = ⎝ ⎠ = 0.00263 P ( X = 5) = ⎝ ⎠ = 0.00526
⎛ 20 ⎞
⎛ 20 ⎞
⎛ 20 ⎞
⎜ ⎟
⎜ ⎟
⎜ ⎟
⎝3⎠
⎝3⎠
⎝3⎠
⎛ 17 ⎞
⎛18 ⎞
⎛19 ⎞
1⎜ ⎟
1⎜ ⎟
1⎜ ⎟
2
2
2
P ( X = 18) = ⎝ ⎠ = 0.119 P( X = 19) = ⎝ ⎠ = 0.134 P ( X = 20) = ⎝ ⎠ = 0.150
⎛ 20 ⎞
⎛ 20 ⎞
⎛ 20 ⎞
⎜ ⎟
⎜ ⎟
⎜ ⎟
⎝3⎠
⎝3⎠
⎝3⎠
La distribución es:
X 3 4
5
6
7
8
9
10
11 P(X) 0.001 0.003 0.005 0.009 0.013 0.018 0.025 0.032 0.039 X 12 13
14
15
16
17
18
19
20 P(X) 0.048 0.058 0.068 0.080 0.092 0.105 0.119 0.134 0.150 Figura 3-9
b)
P ( X ≥ 17) = 0.105 + 0.119 + 0.134 + 0.150 = 0.508
c)
F (6) = P ( X ≤ 6) = 0.00087 + 0.00263 + 0.00526 + 0.00877 = 0.03
Notar que la FDP no es P ( X < 6) pues siempre debe incluir al valor.
Problema resuelto 3.2 Dado 1
Se arroja un dado. Si se define x = número que sale, a) obtener la distribución de probabilidades, b) hallar el
valor esperado y la varianza.
a)
S
X=x
p(x)
F(x)
1
1/6
1/6
2
1/6
2/6
3
1/6
3/6
Figura 3-10
Tabla
20
Jorge Carlos Carrá
4
1/6
4/6
5
1/6
5/6
6
1/6
1
Ia Una variable – Desigualdad de Tchebyscheff
Figura 3-11
PDF
Figura 3-12
CDF
b)
E ( x) =
21
= 3.50
6
V(x)= 2.917 V ( X ) =
σ = 1.707
35
= 2.917
12
21
Capítulo 3 Distribuciones de Probabilidades
Figura 3-13
Caracterización
SPSS
En la figura 3-13 se ha colocado la salida del SPSS. Sin embargo debe tenerse en cuenta que el programa
realiza el cálculo muestral y por lo tanto divide la varianza por n-1. Para obtener el valor poblacional se debe
por lo tanto multiplicar por n-1 y dividir por n. Por lo tanto:
5
V ( x) = 3.5 = 2.917
6
Problema resuelto 3.3 Dado 2
Se arroja un dado 160 veces. Si x es el número que sale, calcular la media y la varianza de:
160
Y =∑X
En lugar de realizar 6 cálculos, resulta mucho más práctico aplicar las propiedades de la esperanza y de la
varianza y utilizar los resultados del problema anterior.
21
= 560
6
35
V (Y ) = V (∑ X ) = ∑ (V ( X ) = 160V ( X ) = 160 = 466.7
12
E (Y ) = E (∑ X ) = ∑ ( E ( X ) = 160 μ x = 160
Problema resuelto 3.4 Clientes de un supermercado
El 20% de los clientes de un supermercado leen los precios antes de comprar un artículo. Si 2 clientes entran,
hallar la distribución de probabilidades de x = número de clientes que leen los precios, su media y su varianza.
Si llamamos N al evento No leen y L al evento Leen, se tiene:
P(N) = 0.8
P(L) = 0.2
Por lo tanto:
22
Jorge Carlos Carrá
Ia Una variable – Suceso poco común: criterio con probabilidades
S
X=x
p(x)
NN
NL LN
LL
0
0.8(0.8)
1
0.8(0.2)2
2
0.2(0.2)
Figura 3-14
Distribución de x
E(x)=0.40
V(x)= 0.32
Problema resuelto 3.5 Demanda de nafta
La función densidad de una variable que representa la demanda semanal de nafta de una estación de servicio
(en miles de litros) es:
⎧2 x 0 ≤ x ≤ 1
f ( x) = ⎨
⎩0 en otro lugar
Obtener a) la F(x), b) la esperanza y la varianza, c) la P(0.5< X < 0.8).
a)
x
F ( x) = P( X ≤ x) = ∫ 2 xdx = x 2
0
b)
1
E ( X ) = ∫ x (2 x ) dx = 2 / 3
0
V ( X ) = E( X 2 ) − ( E( X ))
2
1
E ( X ) = ∫ x 2 (2 x)dx = 1/ 2
2
0
V ( X ) = 1/ 2 − (2 / 3)2 = 1/18
c)
0.8
P(0.5 < x < 0.8) =
2
∫ 2 xdx = x
0.5
0.8
0.5
= 0.39
Suceso poco común: criterio con
probabilidades
La identificación de sucesos poco comunes ya fue presentada en el capítulo 1, en el cual se
utilizaron:
Criterio del diagrama de caja
Este criterio hace uso de los valores extremos a más de 1.5(AIC), página outliers1.
Criterio del intervalo z
Este criterio solo hace uso de la media y de la desviación estándar de la distribución de
probabilidades, página reglaintervalo1.
23
Capítulo 3 Distribuciones de Probabilidades
Veamos ahora otro criterio para una identificación más precisa, pues utiliza las colas de la
distribución de probabilidades.
Criterio con probabilidades
Si bajo determinados supuestos, existe una probabilidad extremadamente pequeña de
obtener resultados al menos tan extremos como los observados, debemos concluir que el suceso
es poco común y por lo tanto los mencionados supuestos probablemente no sean correctos.
Ampliaciones
1. La expresión " resultados al menos tan extremos como los observados" es equivalente a decir
"resultados dentro de la cola de la distribución" a partir del valor observado2.
2. Esta probabilidad extremadamente pequeña que se sitúa en las colas de la distribución, se
llamará valor p en el capítulo 5, constituyendo un aspecto esencial de una prueba de hipótesis.
Este valor p se combina con los valores máximos convencionales, llamados comúnmente valores
α , usualmente 1% y 5% (página 14). A menos que se indique lo contrario adoptaremos
α = 5% .
Luego de estudiar la distribución normal (página 76), podremos concluir que los 2 últimos criterios
coinciden si la distribución es normal y z = 2.
Problema resuelto 3.6 Dados de distintos colores
Se lanzan un dado rojo y otro negro. a) Hallar la distribución de x = suma de los 2 números, la media y la
desviación estándar. Se observa que las probabilidades son simétricas respecto de la suma 7 y que estos valores
siempre suman 14 (en el caso de 3 dados sucede lo mismo y los totales suman 21). ¿Por qué sucede esto?
b) ¿Es un suceso poco común que se lance un par de dados y que la suma sea mayor a 11?
a)
3
4
5
6
7
8
9
10
11
12
X=x 2
p(x) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
Figura 3-15
Distribución de x
E(X)= 7
σ = 2.42
b) Si, es poco común pues la probabilidad es 2.77%, menor al 5%. Si sucede al azar, es lícito dudar de la
confección de los dados.
2
Según el contexto puede interesar la cola derecha, la cola izquierda o ambas colas. Este aspecto se
profundizará en el capítulo 5.
Jorge Carlos Carrá
24
Ib Funciones de variables aleatorias (una variable) – Suceso poco común: criterio con
probabilidades
Ib Funciones de variables
aleatorias (una variable)
Muchas veces se conoce la distribución de probabilidad de una v.a. por ejemplo, X y se desea la
distribución de probabilidad de otra variable Y, relacionada con X a través de: Y=H(X). Este es el
objetivo de esta sección, para el caso de una variable. Más adelante en la sección IIb, se estudiará el
caso de 2 o más variables.
Llamaremos:
f(x), F(x) y RX a la PDF, CDF y campo de valores de X, respectivamente.
g(y, G(y) y RY a la PDF, CDF y campo de valores de Y, respectivamente.
Eventos equivalentes
Si X es una v.a. definida sobre el espacio muestral S y s es un elemento de S, se tiene que por cada
s ∈ S , existe la relación: X ( s ) . Si además Y = H ( X ) , se verificará que y = H [ X ( s )] = Y ( s ) .
Si la relación definida por H es inyectiva, los dos conjuntos, RX y RY, definidos por:
{s | X (s) ∈ Rx } y {s | Y (s) ∈ RY }
son iguales. Por lo tanto:
P(Y ∈ RY ) = P( X ∈ Rx )
El esquema visual se presenta en la figura 3-16.
H
s
P(s)
X
=
P(xeRx)
Y
=.
P(yeRy)
Figura 3-16
Siendo RX el conjunto de valores de x asociado por la función H al conjunto Y ≤ y .
Observar que aunque sea P(Y ∈ RY ) = P(Y ≤ y) = G( y) , P( X ∈ Rx ) no es en general
P ( X ≤ x ) = F ( x ) (solo es cierto para una H creciente, como se intuye si se realizan gráficas de H
tanto creciente como decreciente).
25
Capítulo 3 Distribuciones de Probabilidades
Métodos
Se divide el desarrollo, según sea una variable discreta o contínua.
1 Caso discreto
Se tiene un solo método.
Método de la PF
g ( y) = P(Y = y) = P( H ( X ) = y) = P( X = H −1 ( y)) = P( X = x) = f ( x)
Dado que la distribución no cambia, solo habrá que agrupar las probabilidades para los valores de y
coincidentes.
Problema resuelto 3.7 Transformación cuadrática
Dada la siguiente PF en X y la transformación Y=H(X), hallar la PF en Y y el valor esperado E(Y).
x
-1
0
1
p(x) 0.20 0.30 0.50
y = x2
Figura 3-17
Método PF
y
p(y)
1
0.20
0
0.30
1
0.50
Agrupando valores:
y
0
1
p(y) 0.30 0.70
E(Y) = 0.70
2 Caso contínuo
Se tienen 3 métodos generales:
1. Método de la CDF
2. Método de la PDF
3. Método de la MGF (Función Generadora de Momentos, página 103)
Método de la CDF
Se obtiene la CDF, G(y), integrando f(x) en una región de integración RX, pues:
G( y) = P(Y ≤ y ) = P( X ∈ RX ) =
∫
f ( x)dx
RX
26
Jorge Carlos Carrá
Ib Funciones de variables aleatorias (una variable) – Métodos
Paso 1 Dominio de las x en función de las y
Analítico
Encontrar la región de integración RX en función de Y, a partir de Y ≤ y ⇒ X ≤ H −1 ( y ) . Esto
implica resolver la inversa de H(x).
Numérico
Lo anterior se debe hacer en el dominio numérico de las X de la PDF, por lo cual se deberá obtener
la correspondencia entre los dominios numéricos de las X (en la PDF) y de las Y (función H). Para
esto bastará dibujar la función H(x).
Paso 2 integrar f(x) en ese dominio
Se obtiene la CDF, G(y), integrando f(x) en región anterior.
Se remarca nuevamente que en el caso general, al despejar X, no necesariamente resulta una
expresión del tipo P ( X ≤ x ) , en cuyo caso coincidiría con la F(x) (ver método de la PDF).
Luego se podrá obtener la PDF, g(y), derivando G(y).
Problema resuelto 3.8 Transformación cuadrática
Dada la siguiente PDF en X y la transformación Y=H(X), hallar la PDF en Y.
⎧ x +1
−1 ≤ x ≤ 1
⎪
f ( x) = ⎨ 2
⎪⎩0
en otro punto
y = H ( x) = x 2
Método de la CDF
Paso 1 Dominio de las x en función de las y
Analítico
Implica hallar la inversa de H(x).
Y ≤ y⇒ X2 ≤ y⇒− y < X < y
Numérico
Para obtener el dominio numérico de y, basta dibujar la función H(x) y establecer la correspondencia con el
dominio de x de la PDF. De esta forma se obtiene: 0 ≤ y < 1 .
Paso 2 Integrar f(x) en ese dominio
(
)
G( y ) = P(Y ≤ y ) = P − y < X < y = ∫
y
− y
f ( x)dx = ∫
y
− y
x +1
( x + 1)2
dx =
2
4
y
− y
Observar que la función H(x) solo aparece en los límites de integración.
(
G( y) =
) − (−
y +1
4
2
)
y +1
2
4
Finalmente, derivando la G(y) se obtiene la g(y).
27
Capítulo 3 Distribuciones de Probabilidades
g ( y) =
y +1 1
− y +1 1
1
+
=
2 2 y
2
2 y 2 y
⎧ 1
0 ≤ y <1
⎪
g ( y) = ⎨ 2 y
⎪0
en otro punto
⎩
Observar que las PDF (y CDF) de ambas variables son distintas entre sí.
Nota
Podría obtenerse una ecuación general válida para toda transformación cuadrática.
Sea
y = H ( x) = x 2
G( y ) = P(Y ≤ y ) = P( X 2 ≤ y ) = P(− y ≤ X ≤ y )
es decir:
G( y) = F
( y ) − F (− y )
Por lo tanto:
g ( y ) = G '( y ) =
1 ⎡
f
2 y⎣
( y ) + f ( − y )⎤⎦
Si y = H ( x) = ax , se deja al alumno demostrar que si se opera en forma similar a este ejemplo, se
obtienen:
2
⎛
G ( y ) = F ⎜⎜
⎝
1 ⎡
g ( y) =
⎢f
2 ay ⎣⎢
⎛
y⎞
y⎞
⎟⎟ − F ⎜⎜ −
⎟⎟
a⎠
⎝ a⎠
⎛ y⎞
⎜⎜
⎟⎟ +
⎝ a⎠
⎛
y ⎞⎤
f ⎜⎜ −
⎟⎟ ⎥
⎝ a ⎠ ⎥⎦
Método de la PDF
Continuamos con el desarrollo del método general anterior, para obtener una expresión más simple,
pero válida solo si la función H es monótona (creciente o decreciente), lo cual no sucede en el
problema resuelto anterior.
−1
Si y = H ( x) entonces x = H ( y) .
(
)
Si H es creciente: G ( y ) = P (Y ≤ y ) = P ( H ( X ) ≤ y ) = P X ≤ H −1 ( y ) = F ( x )
(
−1
)
Si H es decreciente: G ( y ) = P (Y ≤ y ) = P ( H ( X ) ≤ y ) = P X ≥ H ( y ) = 1 − F ( x)
Estas relaciones pueden apreciarse claramente si se hacen gráficos de una función creciente y una
decreciente.
Si H es creciente:
x
G ( y ) = F ( x) =
∫
x
f ( x)dx =
−∞
∫
f ( x) x ' dy
−∞
En donde se utilizó la relación de contenidos (que se estudia en análisis matemático): dx = x ' dy
Si se deriva la última ecuación surge finalmente que:
g ( y ) = f ( x) x ' =
28
f ( x)
y'
Jorge Carlos Carrá
Ib Funciones de variables aleatorias (una variable) – Métodos
Si H es decreciente, se razona igual, pues al derivar G(y), se anula el término igual a 1. El resultado
queda afectado por un signo – pero como x ' es negativo al ser H decreciente, pueden resumirse
ambos casos con la expresión general:
g ( y ) = f ( x ) | x ' |=
f ( x)
| y'|
Esta relación que permite resolver el problema (solo para H creciente o decreciente) ya fue obtenida
informalmente en la unidad 1, página CambioVar1.
Como alternativa de demostración se podría derivar la relación G ( y ) = F ( x ) respecto de y:
dG ( y ) dF ( x) dF ( x) dx dF ( x)
x'
=
=
=
dy
dy
dx dy
dy
Finalmente observar que desde el punto de vista dimensional, tanto x ' como y ' cancelan la
dimensión de f ( x ) y establecen la de g ( y ) .
Nota
Puede observarse que la diferencia en el desarrollo de ambos métodos se presenta cuando se despeja X de
H ( X ) ≤ y dentro de la expresión probabilística. Solo resulta la expresión de F(x), si H es creciente o
decreciente. En realidad, podría extenderse el desarrollo del método de la CDF en forma similar al seguido
en el método de la PDF, obteniéndose así una expresión algo más compleja. Esto se realizó en el problema
resuelto anterior, pero para no sobrecargar la memoria, es preferible integrar en cada caso.
Problema resuelto 3.9 Transformación lineal
Dada la siguiente PDF en X y la transformación Y=H(X), hallar la PDF en Y.
⎧2x 0 ≤ x ≤ 1
f ( x) = ⎨
en otro punto
⎩0
y = 3x + 1
La función H es monótona, por lo tanto puede aplicarse tanto el método CDF como el PDF.
Método de la CDF
Paso 1
y −1 ⎞
⎛
G ( y ) = P (Y ≤ y ) = P (3 X + 1 ≤ y ) = P ⎜ X ≤
⎟
3 ⎠
⎝
Paso 2
G( y) = ∫
( y −1)/3
0
⎛ y −1 ⎞
2 xdx = ⎜
⎟
⎝ 3 ⎠
2
Por lo tanto:
g ( y ) = G '( y ) =
2
( y − 1)
9
29
Capítulo 3 Distribuciones de Probabilidades
Método de la PDF
⎛ y −1 ⎞ 1 2
g ( y ) = f ( x) x ' = 2 ⎜
⎟ = ( y − 1)
⎝ 3 ⎠3 9
Método de la MGF
La Función Generadora de Momentos, MGF se desarrollará al final de la sección Ic. Este método se
basa en el teorema de unicidad que establece que si dos MGF son idénticas, entonces tienen la
misma PDF.
Por lo tanto se debe encontrar la MGF de Y y compararla con MGF de funciones conocidas,
obteniendo así su G(y). Este método no se utilizará aquí.
Métodos numéricos
Valor esperado de Y
Si la variable X es discreta con función de probabilidad p( x) :
∞
E (Y ) = ∑ H ( x ) p ( x )
−∞
Si la variable X es contínua con función densidad conjunta f ( x ) :
∞
E (Y ) = ∫ H ( x ) f ( x )dx
−∞
La demostración de la ecuación anterior es difícil y solo la haremos para el siguiente caso particular.
Y estrictamente creciente
En este caso:
∞
∞
−∞
−∞
E (Y ) = ∫ yg ( y )dy = ∫
∞
yf ( x)
dy = ∫ H ( x) f ( x)dx
−∞
y'
En donde se reemplazaron las expresiones:
dy = y ' dx
y = H ( x)
30
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Métodos numéricos
Ic Modelos teóricos de una
variable
La mayoría de las veces las distribuciones utilizadas son modelos teóricos generales que ajustan a las
distribuciones reales y cuyos valores estandarizados se encuentran en tablas o en programas de
computación. Los modelos teóricos constituyen una herramienta que los científicos utilizan para
comprender y explorar los procesos que se presentan en el mundo real. Los juguetes que todos
usamos cuando niños, son modelos físicos que representan artículos del mundo adulto, con los
cuales podemos desarrollar la imaginación, explorar y comprender mejor el mundo en la infancia.
En esta sección realizaremos el estudio detallado de algunos modelos matemáticos que se presentan
con frecuencia en la realidad. De esta forma se podrán sistematizar los cálculos y análisis,
construyendo tablas y elaborando programas y ecuaciones que facilitan sus aplicaciones.
Los modelos más importantes se presentan en la figura 3-18.
Discretas
Bernoulli
Binomial
Hipergeométrica
Geométrica y Binomial Negativa
Poisson
Multinomial
Multihipergeométrica
Contínuas
Constante
Exponencial
Gamma
Normal
t de Student
chi cuadrado
F de Fisher
Figura 3-18
Modelos probabilísticos
SPSS y EXCEL
En el apéndice B se resumen todos los comandos necesarios para generar CDF, PDF y números
aleatorios, con SPSS y EXCEL.
SPSS
PDF
Devuelven la función matemática de la densidad de probabilidades para un determinado valor de x.
Recordemos que SPSS llama PDF tanto a las PF de las distribuciones discretas como a las PDF de
las continuas.
CDF
Devuelven la probabilidad acumulativa menor o igual a un determinado valor de x.
Inversos
Devuelven el valor de x para un valor dado de CDF.
31
Capítulo 3 Distribuciones de Probabilidades
Significance
Devuelven 1-CDF para un determinado valor de x.
Random Numbers
Devuelven números aleatorios de varias distribuciones.
EXCEL
Devuelven la PDF, CDF, el valor de colas o las Inversas, para varios casos.
1. Modelos discretos
Con excepción de la distribución Geométrica y la distribución de Poisson, todos ellos se basan en el
primer modelo, la distribución de Bernoulli.
Distribución de Bernoulli, b(y,1,p)
Supuestos
También conocido como Proceso de Bernoulli. Se caracteriza por los siguientes 3 supuestos:
Supuesto 1 Dicotómica
Los eventos tienen dos resultados posibles, a los que llamaremos en forma genérica E (Éxito) y F
(Fracaso), siendo uno de ellos la negación del otro. Luego podrán ser reemplazados por otros
nombres más apropiados, como por ejemplo, C (Cara) y S (Seca), D (Defectuoso) y N (No
defectuoso), etc.
Este tipo de variable se denomina en estadística, dicotómica.
Llamaremos:
P(E) = p
P(F) = q
Cada uno de estos valores se asume constante al menos durante la duración del estudio.
Supuesto 2 Variable Aleatoria
Se busca la v.a Y = Número de Éxitos, en este caso solo puede tomar los valores 1 o 0 (cuando
sea necesario diferenciarla de la distribución binomial, la llamaremos YB).
Supuesto 3 Tamaño
Las muestras tienen un tamaño n = 1
Proporción Muestral
Es común definir una nueva variable llamada proporción muestral, simbolizada con un acento
circunflejo y por esta razón llamada también "p sombrero":
pˆ =
Número ⋅ de ⋅ Exitos y
=
n
n
En la distribución de Bernoulli, ambos valores y y p̂ coinciden, pero no será así en la Binomial o
Hipergeométrica.
32
Jorge Carlos Carrá
Ic Modelos teóric
cos de una va
ariable – Distribución Bino
omial, b(y,n,p
p)
PDF
Tabla
a
S
YB = yB
p(yB)
F
E
0
0
q
1
1
p
F
Figura 3-19
Modeelo de Bernoullli
Histograma
F
Figura 3-20
Modeelo de Bernoullli
Carracteriz
zación
E (Y ) = μB = 0 ∗ q + 1∗ p = p
V (Y ) = σ 2 B = q(− p)2 + p(q 2 ) = pq(( p + q) = pq
Observvar que si p = 0.5, la distribbución es sim
métrica, si p > 0.5, es sesgadda a la izquierda y si p < 0.5
0
es sesggada a la dereccha. Estos comportamientoos se mantien
nen en la distrribución binom
mial.
Ejemp
plos
Extraccción de un ressultado en jueegos de azar, ruleta, dados, cartas, etc.
Dis
stribu
ución Binom
mial, b(y,n,
b
,p)
Sup
puestos
s
La disttribución llam
mada Binomiaal surge de la de Bernoulli,, alterando el supuesto 3, es
e decir
permitiiendo muestraas con n > 1 y agregando uuna nueva pro
opiedad relaciionada con essta ampliaciónn.
Capítulo 3 Distribuciones de Probabilidades
Supuesto 1 Dicotómica
Una v.a x tiene solo 2 resultados (dicotómica): E y F, nombres genéricos para Éxito y Fracaso, cuyas
probabilidades p y q se mantienen constantes al menos mienras dure el estudio.
Supuesto 2 Variable Aleatoria
Se busca la v.a: Y = Número de Éxitos en la muestra de n elementos.
Podría pensarse que la distribución depende de 2 variables: número de éxitos YE y de fracasos YF
en la muestra, en cuyo caso sería una distribución bivariable. Sin embargo como la suma de ambas
es conocida, YE + YF = n , dada una variable la otra deja de serlo dado que se puede despejar de esta
relación. Esto no ocurre con las distribuciones multinomiales (página 129).
Supuesto 3 Tamaño
Las muestras tienen un tamaño n > 1.
Supuesto 4 Independencia
Esta propiedad establece la independencia de los n elementos del espacio muestral. Si por ejemplo
llamamos E2 a un E en la extracción 2 y E1 a un E en la extracción 1, la definición de independencia
implica:
P( E2 | E1 ) = P( E2 )
Esta propiedad no es relevante para la distribución de Bernoulli, pero sí lo es para distribuciones en
las cuales se toman muestras de n > 1.
Para que exista independencia estadística, es decir que el resultado de cualquier observación sea
independiente del resultado de cualquier otra observación, debe ser:
MCR o N = ∞
a. muestreo con reemplazo, MCR, para cualquier tamaño (extracción de personas de un grupo) de
tal forma que una nueva extracción se realice en las mismas condiciones que las anteriores, o
b. población infinita para cualquier muestreo (juego de ruleta). En la práctica, se considera que una
población es infinita si:
n ≤ 5% N en donde n es el tamaño de la muestra y N es el tamaño de la población. Este criterio
se justificará más adelante.
En base a lo expuesto, una binomial se puede sintetizar con la notación:
b( y, n, p)
En la figura 3-21 se resume gráficamente el proceso.
Figura 3-21
Se puede apreciar que todos los E se consideran indistinguibles entre sí y lo mismo se aplica a los F.
34
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Distribución Binomial, b(y,n,p)
Relación con la distribución de Bernoulli
Si por ejemplo n = 5 y el resultado fuera:
EEEFE
entonces
y=4
Pero por otro lado, puede observarse que cada uno de los eventos es un modelo de Bernoulli, para
los cuales cada variable aleatoria yB (números de E) toma los valores:
11101
Se observa entonces que:
y = ∑ yB
Suele utilizarse la notación iid para una sucesión de v.a. independientes e idénticamente
distribuidas.
Problema resuelto 3.10 Fiesta numerosa
En una fiesta hay un 40 % de chicas (M) y un 60% de chicos (V). a) ¿Cuál es la probabilidad de que en un
grupo de 3 personas elegida al azar haya 2 chicas. b) Construir el histograma con μ y σ. c) Hallar la
probabilidad de que en el grupo extraído haya: al menos 2 chicas, más de 2 chicas, 1 chica o menos, al menos 2
varones. d) ¿Es poco común que en una elección al azar de 3 personas, resulten más de 2 mujeres?
Observar formulaciones equivalentes de estas preguntas. Así por ejemplo la pregunta a) podría preguntarse
así: si se elige un grupo de 3 personas ¿cuál es la probabilidad de que haya una proporción (muestral) de chicas
igual a 2/3?
Recorrido de las propiedades
1. Propiedad 1 Dicotómica
La v.a tiene solo 2 resultados (dicotómica), V y M.
P(M) = p = 0.4,
P(V) = q = 0.6.
2. Propiedad 2 Variable Aleatoria
Se busca la v.a: y = Número de Chicas (M).
3. Propiedad 3 Tamaño
Las muestras tienen un tamaño n = 3 > 1
4. Propiedad 4 Independencia
El problema da la probabilidad (porcentaje) de M y de V y no las cantidades de cada uno. Se debe
interpretar entonces que la fiesta es numerosa en el sentido de que n = 3 es menor que el 5% de N
(desconocido), por lo cual, a pesar de que el muestreo es sin repetición (muestreo simultáneo), se puede
considerar que la probabilidad en la extracción de un joven no influye significativamente en la
probabilidad de la extracción del siguiente. En otras palabras los valores de p y q se mantienen de
extracción en extracción. Al tratar la distribución hipergeométrica de este mismo ejemplo, se apreciará la
diferencia.
a)
P(Y = 2) = P(MMV ) = ppqP3 (2) = 0.288
b)
35
Capítulo 3 Distribuciones de Probabilidades
Tabla
S
Y=y
p̂
p(y)=p( p̂ )
3V
2V1M
2M1V
3M
0
0
q3
0.216
1
0.333
3q2p
0.432
2
0.666
3qp2
0.288
3
1
p3
0.064
Figura 3-22
Modelo Binomial
Histograma de probabilidades
Figura 3-23
PDF Binomial
Caracterización
c)
μ = 0(0.216) + 1(0.432) + 2(0.288) + 3(0.064) = 1.2
V (Y ) = ∑ py 2 − μ 2 = 2.16 − 1.22 = 0.72
σ = 0.848
P (Y ≥ 2) = 0.288 + 0.064 = 0.352
P (Y > 2) = 0.064
P (Y ≤ 1) = 0.216 + 0.432 = 0.648
La probabilidad de que haya al menos 2 varones, es equivalente a que haya a lo sumo 1 chica, es decir 0.648.
d) La P(3M) = 6.4% > 5%, por lo tanto no sería un suceso poco común.
SPSS
Los valores de la PDF se obtienen directamente o por diferencia a partir de los valores CDF. Por ejemplo el
valor de la PDF para
y = 2, se puede obtener así:
36
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Distribución Binomial, b(y,n,p)
Directamente
PDF.BINOM(2,3,0.4)=0.288
Usando la CDF
CDF.BINOM(2,3,0.4)-CDF.BINOM(1,3,0.4)=0.936-0.648=0.288
Expresiones generales
PDF
Demostración
Generalizando las expresiones del problema resuelto anterior:
b( y, n, p) = Pn ( y, n − y) p y q n− y
y≤n
Observar que:
Pn ( y , n − y ) = Cny
La expresión con combinaciones se interpreta considerando que el valor deseado es el número de y
posiciones que se puede extraer de un total de n posiciones.
El nombre de binomial, proviene de que cada p(y) es un término del binomio ( p + q) .
n
b( y, n, p) = Cn0 p 0 q n , Cn1 p1q n−1 ,..., Cnn p n q 0
Esta propiedad puede observarse claramente en la tabla de la figura 3-22.
n
n
La suma de todos los términos es entonces ( p + q) = 1 = 1 .
Notas
• Si bien la distribución binomial puede obtenerse en forma mecánica de las ecuaciones anteriores,
desaconsejo su utilización pues la relación tiempo-beneficio no es mucho más favorable que la
construcción a partir de las relaciones probabilísticas tal como se realizó en el problema resuelto 3.10. Por
otra parte, dado que no son muchas las distribuciones que permiten utilizar conceptos básicos en su
construcción, aprovechemos la oportunidad de aquellas que si los brindan.
• Cuando se dice que una v.a. y tiene una distribución determinada, por ejemplo binomial, se está indicando
la ecuación que sigue su PDF, en este caso
PDF ( y) = Pn ( y, n − y) p y q n− y .
Expresión recursiva
Si se opera sobre la ecuación de cálculo de la probabilidad binomial, se puede obtener en forma
directa que:
b( y + 1) =
n− y p
b( y )
y +1 q
expresión que puede ser útil al calcular la distribución completa, pues obtiene el valor siguiente a
partir de los valores anteriores.
CDF
r
B(r , n, p) = ∑ b( y, n, p)
y =0
Caracterización
Media y Varianza
En principio existen dos formas de deducir la media y la varianza de la distribución.
La primera es aplicar las definiciones de la media y de la varianza a la PDF de la distribución, lo cual
implica trabajar con las expresiones factoriales dentro de la sumatoria de los valores esperados y
37
Capítulo 3 Distribuciones de Probabilidades
utilizar la propiedad de que
∑ p ( x) = 1 :
La otra es vincular la distribución a otra con media y varianza conocidos. Por ser más simple, basaré
las demostraciones siguientes en la propiedad que vincula a la Binomial con la de Bernoulli, de la
que se conocen la media y la varianza.
La relación entre ellas es:
Y = ∑ YB
Aplicando las conocidas propiedades de la media y de la varianza, ya recorridas anteriormente,
resultan:
μ = E (Y ) = ∑ E ( yB ) = np
μ y = np
V (Y ) = V (∑ YB ) = ∑V (YB ) = npq
Por consiguiente:
σ y = npq
Estas expresiones para μ y para σ, resultan esta vez mucho más simples y rápidas que la aplicación
de las definiciones generales.
Modo
Resulta de interés establecer la expresión del modo o valor más probable.
Sea y = nE, la cantidad de éxitos para obtener la probabilidad máxima. En este caso debe cumplirse
que:
Cn nE −1 p nE −1q n−( nE −1) < Cn nE p nE q n−nE > Cn nE +1 p nE +1q n−( nE +1)
Es decir:
Cn nE p
>1 y
Cn nE −1 q
Cn nE q
>1
Cn nE +1 p
Reemplazando las expresiones de cálculo de cada una de las combinaciones y simplificando,
resultan:
( n − nE + 1) p
>1 y
nE
q
( nE + 1) q
>1
n − nE p
Reagrupando, se obtiene finalmente:
(n + 1) p −1 < nE < (n + 1) p
Por lo tanto, el modo se encuentra en el máximo entero comprendido en (n+1)p. En símbolos (la
expresión entre corchetes significa parte entera):
nE = [(n + 1) p]
Si, en particular el valor (n+1)p es entero, entonces existen 2 términos máximos: en (n+1)p y en
(n+1)p–1. En este caso la distribución es bimodal.
Si llamamos nF al número de fracasos y dado que nE+nF = n, se obtiene por reemplazo:
nq − p + 1 > nF > nq − p
38
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Distribución Binomial, b(y,n,p)
Proporción muestral
Con la definición de proporción muestral (p sombrero), resultan:
E ( pˆ ) =
np
=p
n
μ p̂ = p
Esta expresión es intuitiva pues dice que la frecuencia esperada del evento ( E ( pˆ ) es p. Esto
representa la primera verificación teórica de que existe una conexión entre la frecuencia esperada del
evento y su probabilidad. Volvemos sobre este tema en el capítulo 4 al estudiar la ley de los grandes
números.
V ( pˆ ) =
npq pq
=
n2
n
σ p̂ =
pq
n
Cualquier problema binomial, puede resolverse en forma indistinta con la variable "número de
éxitos" o con "proporción de éxitos". En el capítulo de inferencia se presenta con más frecuencia,
esta segunda alternativa.
Los restantes modelos asociados con la distribución de Bernoulli, toman a la Binomial como
referencia, manteniendo su supuesto 3 (tamaño > 1), surgiendo de la modificación de alguno de sus
otros 3 supuestos.
Las más importantes son:
• Si se altera el supuesto 1, permitiendo variables multicotómicas, la distribución se llama
Multinomial.
• Si se altera el supuesto 2, cambiándolo por el Número de Pruebas hasta obtener el primer Éxito,
la distribución se llama Geométrica o Binomial Negativa.
• Finalmente si se altera el supuesto 4, cambiándolo por pruebas dependientes, la distribución se
llama Hipergeométrica y en particular si se alteran los supuestos 2 y 4, la distribución se llama
Hipergeométrica Negativa.
Uso de tablas
Los valores de la distribución Binomial pueden extraerse de paquetes de software como SPSS o
EXCEL cuyas instrucciones se encuentran en el apéndice B. Alternativamente, aunque restringido a
los valores más usuales, se puede hacer uso de tablas, tal como se muestra en el problema resuelto
siguiente. Estas tablas relacionan valores de eje con probabilidades teniendo en cuenta los 2
parámetros de la distribución. Estas 4 magnitudes que se resumen en la siguiente notación:
yCDF (n, p)
Problema resuelto 3.11 Paquetes de una distribuidora
El 30% de los paquetes de una distribuidora no están llegando a destino. Si se envían 10 paquetes, a) ¿Cuál es
la probabilidad de que 3 no lleguen a destino? Observar una formulación equivalente de esta pregunta: Si se
envían 10 paquetes ¿cuál es la probabilidad de que la proporción muestral de los que no lleguen a destino sea
pˆ = 0.3 ? b) ¿Es poco común que más de 5 paquetes no lleguen a destino?
a) Comprobar que se satisfacen las 4 condiciones binomiales.
39
Capíítulo 3 Distrib
buciones de Probabilidade
P
es
Se repro
oduce en la fig
gura 3-24 parte de la tabla Binnomial para n = 10, del Apénndice B. Esta taabla contiene laa
CDF ess decir las probbabilidades acu
umuladas. En laa columna del margen
m
izquierrdo se encuentrra el número de
d
Éxitos. En la columnaa p = 0.3, se enncuentran las accumulaciones en
e orden desceendente, a mediida que aumennta
el númeero de Éxitos. Así
A por ejempllo el valor recuuadrado 0.65 ess la probabilidaad de que se enncuentren 3 o
menos paquetes,
p
en unn envío de 10. Como la preguunta requiere el
e valor de la prrobabilidad parra y = 3, deberáá
realizarrse la cuenta P3 –P2.
F
Figura 3-24
Tabla disstribución Bino
omial
Es decirr:
P3 − P2 = 00.65 − 0.383 = 0.267
b) La P(y >5) = 1–0.9953 = 0.047 <5%, ´por lo cuall es un suceso poco común y si sucede al azzar es lícito duddar
de la tasa del 30%.
SPSS
S
a)
PDF.B
BINOM(3,10,
,0.3)=0.267
Alternaativamente:
CDF.B
BINOM(3,10,
,0.3)-CDF.BINOM(2,10
0,0.3)=0.26
67
b)
1-CDF
F.BINOM(5,1
10,0.3)=0.267
Dis
stribu
ución Hiperrgeom
métric
ca,
h(y
y,N,n,,k)
Sup
puestos
s
Es unaa modificación
n de la Binom
mial, en el suppuesto 4.
Supue
esto 1 Dico
otómica
Una v.a x tiene soloo 2 resultados (dicotómica)): E y F.
Supue
esto 2 Variiable Aleattoria
Se busca la v.a: y = Número de
e Éxitos.
Supue
esto 3 Tam
maño
Las muuestras tienen
n un tamaño n > 1
Supue
esto 4 Dep
pendencia
Los n elementos
e
del espacio mueestral son deppendientes. Paara que no exiista independdencia
estadísstica, es decir que el resultaado de cualquuier observaciión sea depenndiente del ressultado de
cualquier otra obserrvación, la población debe ser finita y el
e muestreo deebe ser sin reeemplazo (es
40
Jorge
e Carlos Carrrá
Ic Modelos teóricos de una variable – Distribución Hipergeométrica, h(y,N,n,k)
decir la negación de las condiciones de la binomial), de tal forma que una nueva extracción se realice
en condiciones distintas a las anteriores.
MSR ∧ N finita
En estos casos, en lugar de proporcionar la probabilidad p, se debe dar el número de éxitos k antes
de la primera extracción.
Recordemos que la población se considera finita si:
n > 5% N
En base a lo expuesto, una hipergeométrica se puede sintetizar con la notación:
h(y,N,n,k)
El segundo término corresponde al tamaño de la población. Veremos luego que los 2 últimos,
tamaño de la muestra y número de éxitos en la población, se pueden colocar en cualquier orden. Sin
embargo el orden expuesto es coherente con el de una binomial b(y,n,p), utilizando el valor
absoluto k en lugar del relativo p =
k
.
N
Problema resuelto 3.12 Fiesta no numerosa
En una fiesta de 10 personas, hay 5 varones V y 5 mujeres M. Si se extraen 3 personas al azar,
a) dibujar el histograma de x = números de M, con μ y σ.
b) obtener la probabilidad de que sean al menos 2 M,
c) hallar la probabilidad de que sean al menos 2 M sabiendo que hay al menos 1M,
d) obtener la probabilidad de que sean 2M, si ya se eligió una M,
e) hallar la probabilidad de que sean 2M sabiendo que hay al menos 1V,
f) si se extrae un grupo de 6 personas, hallar la probabilidad de que haya al menos 5M.
g) ¿Cuál es la diferencia si en la fiesta hay 600 chicos y 400 chicas?
Observar que se satisfacen las 4 condiciones hipergeométricas.
a) Se trata de una h(y,10,3,5).
41
Capítulo 3 Distribuciones de Probabilidades
Figura 3-25
PDF Hipergeométrica
h( y,10,3,5) = P3 (3)
5 43
5 54
5 45
5 43
+ P3 (1, 2)
+ P3 (2,1)
+ P3 (3)
10 9 8
10 9 8
10 9 8
10 9 8
h ( y ,10, 3, 5) = 0.0833 + 0.416 + 0.416 + 0.0833
μ = 1.5
σ 2 = 0.0833 ∗ 1.5 2 + 0.416 ∗ 0.5 2 + 0.416 ∗ 0.5 2 + 0.0833 ∗ 1.5 2 = 0.583
σ = 0.763
b)
P ( A) = 0.0833 + 0.416 = 0.499
c)
P ( B | A) =
0.416
= 0.454
0.915
d)
h(1,9, 2, 4) = P ( MV ) =
45
2 = 0.555
98
e)
P( B | C ) =
0.416
= 0.454
00.833 + 0.416 + 0.416
f)
p5 + p6 =
5 4321
+ 0 = 0.004
10 9 8 7 6
g) En este caso la fiesta es numerosa en el sentido de que n = 3 es menor que el 5% de N, es decir 50, por lo
cual se puede considerar que la probabilidad en la extracción de un joven no influye significativamente en la
probabilidad de la extracción del siguiente.
Si por ejemplo se extraen 3 personas, la probabilidad de que haya 2 mujeres es:
P (Y = 2) = P ( MMV ) =
400 399 600
P3 (2) = 0.288
1000 999 998
Se observa que los valores de P(M) y de P(V) no difieren mayormente de 0.4 y 0.6. En otras palabras podría
aproximarse la hipergeométrica a una binomial con estos valores de p y q:
P(Y = 2) = P(MMV ) = ppqP3 (2) = 0.288
Esta similitud en los resultados es aceptable hasta n = 50 (5% N). Por arriba de este valor se considera que las
fracciones se alejan apreciablemente del valor original. Por ejemplo la probabilidad de obtener 30 M y 1 V
daría para la última M: 371/971 = 0.382, en lugar de 0.4 y para el V: 600/970 = 0.618, en lugar de 0.6.
SPSS
Ejemplo
P(y=3)=PDF.HYPER(3,10,3,5)=0.0833
Alternativamente:
P(y=3)=CDF.HYPER(3,10,3,5)-CDF.HYPER(2,10,3,5)=0.0833
Expresiones generales
PDF
Demostración
Observando la figura 3-26 y utilizando el análisis combinatorio, se obtiene la siguiente expresión
compacta de la función de probabilidad (pero, nuevamente menos instructiva):
42
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Distribución Hipergeométrica, h(y,N,n,k)
h ( y , N , n, k ) =
Cky C Nn −−yk
C Nn
y ≤ k n- y ≤ N −k
Las desigualdades expresan que el número de Éxitos (o Fracasos) de la muestra debe ser,
naturalmente, menor o igual al de la población.
Figura 3-26
Comparar esta figura con la respectiva de la distribución binomial y observar las diferencias en los
datos proporcionados en ambas poblaciones. La detección de estas diferencias elimina toda duda
acerca de qué tipo de distribución se trata. Por otra parte, al resolver una hipergeométrica con las
reglas de las probabilidades en lugar de hacerlo con la expresión combinatoria, anteriormente
presentada, obliga a calcular las probabilidades sucesivas y por lo tanto informa al usuario acerca de
la razonabilidad, o no, de usar una binomial como aproximación. Esta importante información se
pierde con la expresión combinatoria.
CDF
r
H (r , N , n, k ) = ∑ h( y, N , n, k )
y =0
Caracterización
Si llamamos p0 a la probabilidad de éxitos inicial, es decir:
p0 =
k
n
Al igual que en la Binomial, existen dos formas de deducir la media y varianza de la distribución
hipergeométrica. Aplicando las definiciones de la media y de la varianza a la PDF de la distribución
o vinculando la distribución a otra con media y varianza conocidos.
La primera implica trabajar con las expresiones factoriales dentro de la sumatoria de los valores
p ( x) = 1 . Este camino requiere algún esfuerzo para
esperados y utilizar la propiedad de que
∑
obtener las expresiones finales. La segunda es más simple y se presentará en la página 126 pues se
deben utilizar herramientas de las distribuciones multinomiales.
En cualquier caso las expresiones finales son:
μ = np0
σ 2 = np0 q0
N −n
N −1
El factor
43
Capítulo 3 Distribuciones de Probabilidades
cpf =
N −n
<1
N −1
se denomina factor de corrección por población finita y diferencia a las expresiones de σ de la
binomial y de la hipergeométrica. Observar que:
• La cpf es menor que 1 por lo cual la varianza de la hipergeométrica es menor que la de la
Binomial.
• La cpf tiende a 1 cuando N tiende a infinito, como corresponde a su nombre y que es 0 cuando
n = N, pues la dispersión es cero dado que la distribución solo conserva el término en el cual la
selección de la muestra es igual a la población, con probabilidad 1. Como ya se ha dicho, una
población se considera finita si n > 5% N .
Debe puntualizarse que el muestreo con reemplazo, MCR, equivale a una población infinita y por lo
tanto debe considerarse que N tiende a infinito en la ecuación anterior (obteniendo la expresión para
una binomial).
Proporción muestral
Expresiones similares respecto de la proporción muestral, pueden obtenerse, recordando que:
pˆ =
y
n
Aplicando las propiedades de la media y de la varianza, se obtienen:
μ pˆ = p0
σ p2ˆ =
p0 q0 N − n
n N −1
Aproximación de una hipergeométrica
Como la independencia es la única diferencia entre las distribuciones binomial e hipergeométrica y
esta propiedad está asociada al tamaño de la población, puede establecerse que una hipergeométrica
se puede aproximar a una binomial si la población puede considerarse infinita, es decir:
n<5%N
Hipergeométrica
Binomial
Figura 3-27
Aproximación Hipergeométrica a la Binomial
Distribución geométrica, g(y,p)
Supuestos
Es una modificación de la Binomial, en los supuestos 2 y 3.
Supuesto 1 Dicotómica
Una v.a x tiene solo 2 resultados (dicotómica): E y F.
Supuesto 2 Variable Aleatoria
Se busca la v.a: y = Número de Pruebas hasta obtener el primer Éxito.
Supuesto 3 Tamaño
Las muestras tienen un tamaño n variable que puede ser infinito.
44
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Distribución geométrica, g(y,p)
Supuesto 4 Dependencia
Los n elementos del espacio muestral son independientes.
Expresiones generales
Observemos la siguiente tabla de la distribución para los primeros valores de y:
S
Y=y
p(y)
E
FE
FFE
1
p
2
pq
3
pq2
…
…
…
Figura 3-28
Si llamamos x al número de fracasos antes de aparecer el primer éxito, puede observarse que el
número de pruebas y, es igual al número de fracasos más 1:
y = x +1
A partir de esta relación, obtenida la distribución de y se obtiene la de x.
De la tabla se desprenden las siguientes expresiones:
PDF
Demostración
Observando la figura 3-28 se obtiene la siguiente expresión general de la función de probabilidad.
g ( y, p) = q y −1 p
y ≥1
CDF
r
G (r , p ) = ∑ g ( y, p ) =P( y ≤ r ) = 1- P( y > r )
y =1
Por otra parte:
⎛
1 ⎞
r
P ( y > r ) = p (q r + r +1 +...) = p ⎜ q r
⎟=q
⎝ 1− q ⎠
Es decir, la cola de una distribución geométrica es siempre q r .
Caracterización
Media
Aplicando la definición de la media a los valores de la figura 3-28, se obtiene:
μ = E (Y ) = p(1 + 2q + 3q 2 + ...) =
= p[(1 + q + q 2 + ...) + (q + q 2 + ...) + (q 2 + ...) + ...]
Cada una de las expresiones entre paréntesis es una sucesión geométrica (de aquí proviene el nombre
de la distribución), de razón q.
Para proseguir debemos recordar que la suma de una sucesión geométrica de n términos cuyo primer
término es a, y cuya razón es q, es:
S =a
1 − qn
1− q
Tomando el límite de esta suma, cuando n tiende a infinito, si q < 1 , resulta:
45
Capítulo 3 Distribuciones de Probabilidades
S=
a
1− q
Aplicando esta expresión a nuestras sucesiones, se aprecia que los paréntesis finalmente resultan:
⎡1
q
q2 ⎤
1
1
=
μ = p ⎢ + + ...⎥ = 1 + q + q 2 + ... =
1− q p
⎣p p p ⎦
Se tiene entonces que:
μy =
1
p
Una demostración alternativa es a partir de:
∞
E (Y ) = ∑ npq n −1
n =1
Utilizando la identidad:
∞
∑ nxn−1 =
n =1
d ⎛ ∞ n⎞
∑x
dx ⎜⎝ n=1 ⎟⎠
Si x < 1, entonces:
d ⎛ ∞ n⎞ d ⎛ x ⎞
1
x ⎟= ⎜
∑
⎟=
⎜
dx ⎝ n =1 ⎠ dx ⎝ 1 − x ⎠ (1 − x )2
Con lo cual se obtiene:
∞
E (Y ) = ∑ npq n −1 = p
n =1
1
1
=
2
p
(1 − q )
Aplicando la relación y = x + 1 , se obtiene la expresión de la media de x, el número de fracasos
antes de aparecer el primer éxito:
μx =
q
p
Varianza
Se puede demostrar que:
V ( y) =
q
p2
Las varianzas de Y de X son iguales.
Pérdida de la memoria
Decimos que una v.a. Y no tiene memoria si:
P (Y > s + t | Y > s ) = P (Y > t )
Veamos si se cumple para una distribución geométrica.
P(Y > s + t | Y > s) =
q s +t
= q t = P(Y > t )
qs
Esta ecuación dice que si se sabe que no se produjo ningún éxito hasta s, la probabilidad del primer
éxito no depende de s.
46
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Distribución geométrica, g(y,p)
Las v.a. geométricas son las únicas v.a. discretas que no tienen memoria. Luego veremos que en las
variables contínuas la misma propiedad la presenta la distribución exponencial (página 68).
Problema resuelto 3.13 Auditorías con errores
Un contador público ha encontrado que 6 de cada 10 auditorías contienen errores. ¿Cuál es la probabilidad de
que: a) la primera contabilidad con errores sea la cuarta compañía revisada, b) la primera contabilidad con
errores se produzca a partir de la sexta compañía, c) dibujar la PDF y la CDF, d) ¿Es poco común que la
primera contabilidad con errores aparezca a partir de la sexta compañía revisada?
a)
g (4, 0.6) = 0.4003 (0.600) = 0.0384
b)
1 − G (4, 0.6) =
= 1 − 0.600 − 0.4001 (0.600) − 0.400 2 (0.600) − 0.4003 (0.600) − 0.4004 (0.600) =
= 1 − 0.98976 = 0.01024
De otra forma:
P ( y > 5) = q r = 0.45 = 0.01024
c)
PDF
Figura 3-29
47
Capítulo 3 Distribuciones de Probabilidades
CDF
Figura 3-30
d) La P(y > 5) = 0.01024, por lo cual es un suceso poco común y si sucede al azar es lícito dudar de la tasa de
compañías con errores.
SPSS
a)
PDF.GEOM(4,0.6)=0.0384
b)
1-CDF.GEOM(4,0.6)=0.01024
Distribución binomial negativa o de
Pascal, bn(y,r,p)
Supuestos
Esta ampliación de la geométrica es una modificación de la Binomial, en los supuestos 2 y3:
Supuesto 1 Dicotómica
Una v.a x tiene solo 2 resultados (dicotómica): E y F.
Supuesto 2 Variable Aleatoria
Se busca la v.a: y = Número de Pruebas hasta obtener r Éxitos.
Supuesto 3 Tamaño
Las muestras tienen un tamaño n variable que puede ser infinito.
Supuesto 4 Dependencia
Los n elementos del espacio muestral son independientes.
Dado que, respecto de la binomial, el Número de Pruebas es ahora la variable y el Número de Éxitos
está predeterminado, puede decirse que esta distribución es la opuesta de la binomial, de aquí el
nombre.
48
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Distribución binomial negativa o de Pascal, bn(y,r,p)
Expresiones generales
Observemos la siguiente tabla de la distribución para los primeros valores de y si r =2:
S
Y=y
p(y)
EE
EFE
2
p2
3
EFFE
2
P2(1,1) p q
4
P3(2,1) p 2 q 2
EFFFE
5
P4(3,1) p 2 q 3
…
…
…
Figura 3-31
Si llamamos x al número de fracasos antes de aparecer el k-esimo éxito, puede observarse que el
número de pruebas y, es igual al número de fracasos más el número de éxitos:
y = x+r
A partir de esta relación, obtenida la distribución de y se obtiene la de x.
De la tabla se desprenden las siguientes expresiones:
PDF
Demostración
Observando la figura 3-31 se obtiene la siguiente expresión general de la función de probabilidad.
bn( y, r , p ) = Py −1( y − r ,r −1) q y − r p r
y≥r
Se puede observar que solo cambia el coeficiente respecto de la binomial. Como de costumbre
conviene razonar la obtención de la probabilidad con un diagrama de árbol en lugar de recordar esta
expresión.
CDF
a
Bn( a, r , p ) = ∑ bn( y, r , p )
y =r
Caracterización
Se puede ver que una distribución binomial negativa es una suma de k distribuciones geométricas. Si
consideramos por ejemplo r = 3, un resultado genérico puede ser:
FF…FE ..FF…FE FF…FE
X1
X2
X3
Si llamamos:
X1 = número de ensayos hasta el primer E,
X2 = número de ensayos después del primer E hasta el segundo E,
X3 = número de ensayos después del segundo E hasta el tercer E,
entonces cada una de estas v.a. es geométrica y la variable Y3 = número de ensayos hasta el tercer E
(v.a. binomial negativa), será:
Y3 = X1 + X2 + X3
En general:
r
ybn = ∑ y g
1
De aquí, resultan:
49
Capítulo 3 Distribuciones de Probabilidades
Media
μy =
r
p
μx =
rq
p
Aplicando la relación y = x + k :
Varianza
V ( y) =
rq
p2
Las varianzas de Y de X son iguales.
Relaciones entre las CDF Binomial y Pascal
Pascal y Binomial
Pascal
Sea Y el número de pruebas de Bernoulli para obtener k Éxitos E con P ( E ) = p .
Binomial
Sea X el número de Éxitos E en n pruebas de Bernoulli con P ( E ) = p .
a) 1 − CDF .NEGBIN ( n, r , p ) = CDF .BINOM ( r − 1, n, p )
b) CDF .NEGBIN ( n, r , p ) = 1 − CDF .BINOM ( r − 1, n, p )
Demostración
a) Si se requieren más de n pruebas para obtener r E, deberá haber a lo sumo ( r − 1 ) E en estas n
pruebas.
b) Este caso resulta del anterior pasando a los eventos complementarios. Si se requieren a lo sumo n
pruebas para obtener r E, deberá haber más de r E en estas n pruebas.
Una forma equivalente de expresar estas relaciones es:
P (Y > n) = P ( X < r )
P (Y ≤ n) = P ( X ≥ r )
Utilizando la notación con CDF se aprecia el intercambio de parámetros: el valor de n es el mismo
en ambas y el de r disminuye en 1 en la binomial.
A modo de ejemplo:
1 − CDF .NEGBIN (5, 4, 0.5) = CDF .BINOM (3, 5, 0.5)
Las relaciones complementarias se obtienen restando de 1 en ambos lados. Se aprecia que llevan los
mismos valores, intercambiando CDF por 1–CDF.
CDF .NEGBIN (5, 4, 0.5) = 1 − CDF .BINOM (3,5, 0.5)
Se observa entonces que la función acumulativa de una, equivale a la función significación de la
otra.
50
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Distribución binomial negativa o de Pascal, bn(y,r,p)
Geométrica y Binomial
Dado que la distribución geométrica es un caso particular de la de Pascal con r = 1, la relación
anterior subsiste reemplazando r por 1.
1 − CDF .NEGBIN ( n,1, p ) = 1 − CDF .GEOM ( n, p ) = CDF .BINOM (0, n, p )
Análogamente:
CDF .GEOM ( n, p ) = 1 − CDF .BINOM (0, n, p )
Este teorema puede utilizarse para calcular las CDF de una distribución de Pascal o Geométrica a
partir de una Binomial.
Problema resuelto 3.14 Gripe H1N1
Los empleados de su empresa son examinados para detectar la presencia del virus de la gripe H1N1. El
hospital municipal le solicita que le sean enviados 4 empleados con pruebas positivas para profundizar los
exámenes. Si el 45% de los empleados tienen pruebas positivas, a) encuentre la probabilidad de que se tengan
que examinar a 10 empleados hasta encontrar 4 con pruebas positivas, b) dibujar la PDF y la CDF de Y =
número de pruebas hasta obtener k = 4 E, c) ¿Es poco común que se tengan que examinar a menos de 5
empleados hasta encontrar 4 con pruebas positivas?
a)
bn(10, 4, 0.45) = P9(6,3) 0.5560.454 = 0.0953
b)
PDF
Figura 3-32
51
Capítulo 3 Distribuciones de Probabilidades
CDF
Figura 3-33
c) La P(y < 5) = 0.041 < 5%, ´por lo cual es un suceso poco común y si sucede al azar es lícito dudar de la tasa
del 45%.
SPSS
a)
PDF.NEGBIN(10,4,0.45)=0.0953
Problema resuelto 3.15 Falla de un motor
La probabilidad de que falle un motor durante cualquier período de una hora es 0.3. Hallar la probabilidad de
que funcione bien durante 3 horas (es decir que falle luego de 3 horas).
Geométrica g(>3,1,0.3)
Sea Y el número de intervalos de una hora hasta la primer falla.
P (Y > 3) = 1 − P (Y ≤ 3) = 1 − ⎡⎣ 0.7 + 0.3(0.7) + 0.32 (0.7) ⎤⎦ = 0.027
Binomial bn(<1,3,0.3)
Sea X el número de fallas dentro de una hora, en 3 horas.
P( X = 0) = 0.33 = 0.027
52
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Distribuciones multinomial y multihipergeométrica
Distribuciones multinomial y
multihipergeométrica
Por ser modelos multivariables se tratarán en la sección correspondiente en la página 129.
Distribución de Poisson, p(y,λ)
Supuestos
Esta distribución modela una v.a que tiene los siguientes 4 supuestos.
Supuesto 1. Variable Aleatoria y
Se busca la v.a: Y=Número de casos E en un intervalo determinado (de tiempo,
distancia, área, volumen, etc). Este número de casos podría ser, teóricamente infinito. A los efectos
de normalizar la notación, usaremos la letra t para denotar al intervalo como si fuera de tiempo.
Un ejemplo al cual aplicar cada una de las 4 propiedades podría ser la cantidad de errores cometidos
por hoja en un libro.
Supuesto 2. Un evento en dt
La propiedad dice dos cosas:
a) En un intervalo infinitesimal dt puede ocurrir como máximo un solo evento. En otras palabras la
probabilidad de que ocurran 2 o más eventos en un intervalo infinitesimal dt es nula.
P ( n, dt ) = 0 n > 1
b) la probabilidad de que ocurra un evento en un intervalo infinitesimal dt solo depende del ancho
del intervalo.
Frecuencia promedio ω
ω=
Cantidad de casos
Intervalo
Se asume que ω es constante. Observar que ω se mide en cantidad de eventos sobre la unidad del
intervalo. Es importante realizar el cambio de unidades necesario para que el intervalo en el que se
estudia y, sea el mismo que para ω.
Promedio de eventos λ
λ = ωt
Observar que λ se mide en cantidad de eventos.
Por lo tanto la propiedad 2b se puede expresar como:
P (1, dt ) = ω dt
Consecuencia
Como consecuencia de a y b), la probabilidad de que no ocurra ningún evento en dt será:
P(0, dt ) = 1 − ωdt
Supuesto 3. n eventos en t
Si los intervalos fueran iguales establece que la distribución de probabilidades es la misma en cada
uno de ellos, lo cual significa que la probabilidad de que ocurran n Eventos en un intervalo t,
53
Capítulo 3 Distribuciones de Probabilidades
depende solo de la extensión del intervalo (no de la posición del mismo)3. En el ejemplo anterior, la
cantidad de errores cometidos depende solo del tamaño de la hoja y no de la posición de la misma.
Supuesto 4. Independencia
El número de casos m en el tiempo s es independiente del número de casos n en el tiempo t.
P (( m, s ) | ( n, t )) = P ( m, s )
En el ejemplo, la cantidad de errores cometidos en la hoja 4 es independiente de la cantidad de
errores en la hoja 2.
Se supondrá la validez de las propiedades anteriores en los problemas de aplicación. En forma
expresa serán utilizadas las 4 propiedades en la siguiente demostración de la ecuación de la
distribución de Poisson.
PDF
La PDF de esta distribución es la siguiente:
p( y, λ ) =
e−λ λ y
y≥0
y!
Demostración
La ingeniosa demostración que sigue es una excelente oportunidad para observar cómo se obtiene la
expresión de la PDF de Poisson, utilizando los 4 supuestos anteriores y herramientas estándar de la
teoría de las probabilidades y del análisis infinitesimal.
Se parte de expresiones del supuesto 4, utilizando además el supuesto 3 al considerar que la
probabilidad solo depende de n y del ancho del intervalo t. Por lo tanto las probabilidades de que
sucedan 0, 1, …eventos en el intervalo t+dt son:
P (0, t + dt ) = P (0, t ) P (0, dt )
P (1, t + dt ) = P (1, t ) P (0, dt ) + P (0, t ) P (1, dt )
P (2, t + dt ) = P (2, t ) P (0, dt ) + P (1, t ) P (1, dt ) + P (0, t ) P (2, dt )
etc.
Se reemplazan todas las expresiones que contengan dt por las desarrolladas en el supuesto 2.
Reemplazando P(0,dt):
P (0, t + dt ) = P (0, t ) − P (0, t )ω dt
P (1, t + dt ) = P (1, t ) − P (1, t )ω dt + P (0, t ) P (1, dt )
P (2, t + dt ) = P (2, t ) − P (2, t )ω dt + P (1, t ) P (1, dt ) + P (0, t ) P (2, dt )
Reemplazando P(1,dt) y P(2,dt):
P (0, t + dt ) = P (0, t ) − P (0, t )ω dt
P (1, t + dt ) = P (1, t ) − P (1, t )ω dt + P (0, t )ω dt
P (2, t + dt ) = P (2, t ) − P (2, t )ω dt + P (1, t )ω dt
Se forma un cociente incremental pasando el primer miembro del segundo miembro al primer
miembro y dividiendo por dt. Se obtienen así las siguientes ecuaciones diferenciales lineales
invariantes de primer grado:
d ( P (0, t ))
+ ω P (0, t ) = 0
dt
d ( P (1, t ))
+ P (1, t )ω = P (0, t )ω
dt
3
Esta condición es probablemente la más inconveniente para modelar un proceso real por lo cual luego suele
preferirse una generalización dando origen a los llamados procesos de Poisson no homogéneos.
Jorge Carlos Carrá
54
Ic Modelos teóricos de una variable – Distribución de Poisson, p(y, )
d ( P (2, t ))
+ P (2, t )ω = P (1, t )ω
dt
Se puede observar que la expresión general de estas ecuaciones diferenciales es recursiva:
yn '+ ω yn = ω yn−1
La primera es una ecuación homogénea y '+ ω y = 0 que se resuelve directamente por el método de
αt
los coeficientes indeterminados (sustitución de D´Alambert y = e ).
Reemplazando en la siguiente se obtiene una ecuación del tipo y '+ ω y = u(t ) = ωe
−ωt
ecuación se puede resolver por el método de variación de parámetros: y = ϕ y H = ϕ e
. Esta
−ω t
, el cual
consigue reducir el término en la variable y, conduciendo a la ecuación: ϕ ' e = u(t ) .
Las restantes ecuaciones se resuelven en forma similar por el método de variación de parámetros.
Las soluciones de las mismas son, en sucesión:
−ωt
P(0, t ) = e−ωt
P(1, t ) = ωte−ωt
(ωt ) 2 −ωt
P (2, t ) =
e
2
La solución general se obtiene razonando por inducción, resultando:
P( y, t ) = e− λ
(λ ) y
y!
En definitiva:
p( y, λ ) =
e−λ λ y
y≥0
y!
Observar que esta ecuación depende naturalmente del y deseado y de λ (la expresión en y es una
exponencial sobre un factorial), de aquí la notación general p(y,λ), para una distribución de Poisson.
Expresión recursiva
Si se opera sobre la ecuación de cálculo de la probabilidad de Poisson se puede obtener en forma
directa que:
e − λ λ y +1
p ( y + 1)
λ
y + 1!
= −λ y =
e λ
p( y )
y +1
y!
Por lo tanto:
p ( y + 1) =
λ
y +1
p( y)
expresión que puede ser útil al calcular la distribución completa, pues obtiene el valor siguiente a
partir de los valores anteriores.
CDF
r
P(r , λ ) = ∑ p( y, λ )
y =0
55
Capítulo 3 Distribuciones de Probabilidades
Verificación PDF
p( x) > 0
∞
∑ p ( x) = 1
−∞
Esta última propiedad se visualiza fácilmente recordando el desarrollo en serie de una expresión
exponencial:
eλ = 1 + λ +
λ2
2!
+
λ3
3!
∞
+ ... = ∑
0
λk
k!
Caracterización
Demostraremos analíticamente (la demostración elegida requiere algún conocimiento de series) que:
μ =λ
V (Y ) = λ
Media
La tabla de la distribución se muestra en la figura 3-34:
0
e-λ
Y=y
p(y)
1
λe-λ
2
λ e /2!
2 -λ
3
λ e /3!
3 -λ
…
...
Figura 3-34
Distribución de Poisson
Por lo tanto:
⎛
μ = λ e− λ ⎜1 +
⎝
⎞
2λ 3λ 2
+
+ ... ⎟ =
2! 3!
⎠
Utilizando el desarrollo en serie de e λ , se tiene:
μ = λ e − λ eλ
Simplificando:
μ =λ
Varianza
V (Y ) = E (Y 2 ) − μ 2
⎛ 4λ 9λ 2
y 2 λ y −1 ⎞
E (Y 2 ) = λ e− λ ⎜1 +
+
+.+
⎟=
2!
3!
y! ⎠
⎝
∞
y 2λ y −1
= λ e−λ ∑
y!
1
Pero:
y2
1
1
=
+
y ! ( y − 1)! ( y − 2)!
Por lo tanto:
∞
y 2λ y −1 ∞ λ y −1
λλ y − 2
=
+
∑1 y ! ∑1 ( y − 1)! ∑1 ( y − 2)! =
= eλ + λ eλ
∞
Recordar que el factorial de un número negativo (en el segundo sumando aparece −1! ) es infinito.
56
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Distribución de Poisson, p(y, )
En definitiva:
E (Y 2 ) = λe−λ eλ (1 + λ ) = λ + λ 2
Reemplazando en la expresión de V(y):
V (Y ) = λ + λ 2 − λ 2
Finalmente:
V (Y ) = λ
Ejemplos de procesos de Poisson
Modela distribuciones de número de casos. Verificar que los siguientes ejemplos cumplen las 4
propiedades.
• Número de llamadas telefónicas en un intervalo de t.
• Número de vehículos que pasan en una autopista en un intervalo de t.
• Número de nacimientos en una ciudad en un intervalo de t.
• Número de fallas al azar en un componente en un intervalo de t.
• Número de rayaduras de un vehículo en una superficie.
• etc.
Observar además que el número de casos en el intervalo no tiene un límite establecido (confrontar
con las otras distribuciones anteriores).
Problema resuelto 3.16 Preguntas a un consultor
En promedio, 12 personas por hora hacen preguntas a un consultor. a) Hallar la probabilidad de que 3 personas
lo hagan en un período de 10 minutos, b) dibujar el histograma de y = número de personas que preguntan cada
10 minutos, con el valor medio y la desviación estándar, c) hallar la probabilidad de que al menos 3 personas
lo hagan en un período de 10 minutos, d) ¿Es poco común que más de 5 personas lo hagan en un período de 10
minutos?
a) Verificar que el problema cumple las 4 propiedades de una distribución de Poisson.
Luego se debe convertir la media al intervalo de 10 minutos.
Una forma, es razonar transformando las unidades del intervalo de ω:
ω=
12 p 12 p 1h
2p
=
=
1h
1h 6*10m 10m
Luego
Alternativamente, se puede utilizar la expresión
λ=2
λ = ωt :
λ = ωt =
12 ⎛ 1 ⎞
⎜ h⎟ = 2
1h ⎝ 6 ⎠
En consecuencia:
p (3, 2) = e −2
23
= 0.1804
3!
b) El histograma se muestra en la figura 3-35 y la PDF en la figura 3-36.
57
Capítulo 3 Distribuciones de Probabilidades
Figura 3-35
Figura 3-36
Distribución de Poisson
μ =λ =2
V ( y) = λ = 2
σ = 1.41
c) Observando el histograma,
P (Y ≥ 3) = 1 − P ( y ≤ 2) = 1 − (0.1353 + 0.2707 + 0.2707)
En definitiva:
P (Y ≥ 3) = 0.323
d) La P(y > 5) = 0.016 <5%, ´por lo cual es un suceso poco común y si sucede al azar es lícito dudar del
promedio de 2 personas cada 10 minutos.
58
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Distribución de Poisson, p(y, )
SPSS
Por ejemplo el valor de cola superior para y ≥ 3, se obtiene de la siguiente manera:
1-CDF.POISSON(2,2)=0.323
Aproximación de una binomial
Sea una distribución binomial y hagamos tender el tamaño de la muestra n a infinito con μ= np=λ
constante.
n(n − 1)(n − y + 1) ⎛ λ ⎞
⎜ ⎟
n→∞
y!
⎝n⎠
lim Pn ( y, n − y) p y q n− y = lim
n→∞
y
⎛ λ⎞
⎜1 − ⎟
⎝ n⎠
n− y
Operando:
n n −1 n − y + 1 λ
n→∞ n n
n
y!
lim
y
⎛ λ⎞
⎜1 − ⎟
⎝ n⎠
n
⎛ λ⎞
⎜1 − ⎟
⎝ n⎠
−y
Recordando que, cuando n tiende a infinito:
−n/λ
n
⎞
1 ⎞
⎛ λ ⎞ ⎛⎛
⎟
⎟
⎜1 − ⎟ = ⎜ ⎜1 +
⎠
⎝ n ⎠ ⎝ ⎝ −n / λ ⎠
−λ
= e−λ
Finalmente se obtiene:
lim1
n →∞
λ
y!
y
e− λ 1
O sea:
e
−λ
λ
y
y!
expresión del término general de la distribución de Poisson.
Observar además que sien si en λ = np, n tiende a infinito, dado que λ es constante, p debe tender a
0, con lo cual queda establecida una indeterminación (en este caso la binomial tomará valores
significativos solo para pequeños valores de y).
En síntesis, una distribución binomial, tiende a una de Poisson, si n se hace suficientemente grande y
p es chica (eventos raros), tal que su valor medio se mantenga constante.
En la figura 3-37 se establece uno de los criterios para precisar los términos grande y chico. Otro
criterio que da resultados aceptables es: n > 20 y p<0.05 .
n>100 y p<0.1
Binomial
Poisson
Figura 3-37
Aproximación Binomial a Poisson
Uso de tablas
Si se cuenta con una computadora en la cual se ha instalado SPSS o EXCEL, se podrán obtener los
valores de la distribución de Poisson, con las instrucciones que se encuentran en el apéndice B, en
las secciones SPSS y EXCEL. Alternativamente, aunque restringido a los valores más usuales, se
puede hacer uso de tablas, tal como las que se encuentran también en el apéndice B. Estas tablas
59
Capíítulo 3 Distrib
buciones de Probabilidade
P
es
relacio
onan valores de
d eje con prrobabilidadess y el parámeetro λ. Las 3 magnitudes
m
see resumen en la
siguiennte notación:
yCDF (λ )
Prob
blema ressuelto 3.117 Errores en un libro
Los auttores y editoress trabajan arduaamente para minimizar
m
el núm
mero de errorees en un libro. Si
S el número
medio de
d errores de 0.08 por capítullo, hallar la proobabilidad de que
q haya menos de 2 errores en
e un capítulo
específi
fico.
Se repro
oduce en la fig
gura 3-38 parte de la tabla de Poisson, del Apéndice
A
B. Esta tabla contienne la CDF es decir
d
las probbabilidades acu
umuladas.
F
Figura 3-38
Tabla disttribución de Po
oisson
En la prrimer columnaa se encuentra el
e valor de λ. E
En la fila superiior se encuentrra el número dee casos, y. En
cualquier fila se encueentran las acum
mulaciones de probabilidades
p
s de izquierda a derecha, a meedida que
aumentta el número dee casos. Así poor ejemplo el vaalor recuadradoo 0.997 es la prrobabilidad de que se
encuenttren 1 o menoss casos, para unn valor de λ = 00.08. Por lo tan
nto la respuestaa es 99.7%.
Dis
seños
s con tabla
t
de co
onting
gencia
as
Una tabbla de conting
gencias condu
uce a distintoos modelos dee probabilidadd, según se maantengan o noo
fijos loos valores de los
l marginalees, X, Y:
1. Maarginales X e Y fijos: distrribución hiperrgeométrica.
2. Unn marginal X (o Y) fijo: X distribucionees binomiales independienttes.
3. Tootal n fijo: disstribución multinomial conn tantas catego
orías como ceeldas.
4. Ni marginales ni
n total fijo: diistribución dee Poisson.
Para ejemplificar veeamos el prim
mer caso.
60
Jorge
e Carlos Carrrá
Ic Modelos teóricos de una variable – Diseños con tabla de contingencias
Diseño hipergeométrico: prueba exacta de Fisher
Sea la tabla de contingencias 2×2 que se muestra en la figura 3-39a, en la cual los niveles
dicotómicos se han denominado genéricamente (E, F) y (0, 1).
Asimilemos dicha tabla a la figura 3-26 de la página 43. Consideramos a la fila de totales como una
"urna" con n esferas, de las cuales NE son E y NF son F. Observar que esta interpretación parte de
mantener los marginales constantes. Se extraen simultáneamente n1 esferas, de las cuales un número
a son E y un número b son F, se trata entonces de una distribución hipergeométrica definida por:
h(a, N , n1 , N E )
Una interpretación similar podría haber sido realizada para la otra fila o por columnas (figura 3-39
b).
E
1
0
F
1
a
b n1
c
d n0
NE NF N
E
F
0
a b
c d
n1 n0
a
NE
NF
N
b
Figura 3-39
Si se conocen los marginales, basta conocer el valor de una celda para conocer toda la tabla. La
distribución completa se genera con el conjunto de tablas que se construyen manteniendo constantes
los valores marginales y variando el valor de y = a, desde 0 hasta el máximo del marginal menor (el
cual se asigna por simplicidad a la celda a). Este límite se debe a que los totales marginales deben
permanecer constantes y por lo tanto si una celda superara el marginal, la otra celda tendría que ser
negativa, lo cual no es posible). La cantidad de tablas será el valor del marginal menor + 1 (pues se
empieza desde 0).
Propiedad 1
La media de esta distribución es:
μ = np0 =
n1 N E
N
Puede observarse que este valor no es otro que el valor que debe tener la celda pivote entre los
marginales NE y n1 para que esa tabla contenga la condición de independencia entre las variables. Es
decir que una de las tablas de la distribución contendrá la independencia, la cual será a su vez la
media de la distribución de tablas. Naturalmente cualquiera de los valores de los coeficientes que
miden el apartamiento de la independencia, crece a medida que las barras representativas de las
tablas se alejan de la media. Esta interpretación se utiliza para generar un test de independencia
alternativo al de χ2 para muestras chicas, llamado Fisher's exact test, o test de Fisher–Irwin, que se
estudiará en el capítulo 5, página FisherExact5.
Propiedad 2
Utilizando la simbología de la tabla de la figura 3-39, calculamos la h(a, N , n1, NE ) con la fórmula
de la combinatoria.
h(a, N , n1 , N E ) =
CN E a CN F b
CN
N1
=
N E ! N F !n1 !n0 !
N !a !b !c !d !
Este valor es, en esta interpretación, la probabilidad (hipergeométrica) de generar cada tabla para
cada valor de y = a.
61
Capítulo 3 Distribuciones de Probabilidades
Con la ayuda de esta notación, puede observarse la simetría de la expresión, de la cual resulta que es
indistinto el orden de los 2 últimos parámetros de la ecuación, es decir:
h(a, N , n1 , N E ) = h(a, N , N E , n1 )
La dama inglesa
Una de las aplicaciones más famosas de la interpretación anterior es la protagonizada por una dama
inglesa presente en una reunión en la que se encontraba el célebre matemático y estadístico Ronald
Fisher. La dama era la bióloga Muriel Bristol, quién aseguraba que era capaz de detectar si en una
taza de té con leche se había colocado primero la leche o primero el té. Fisher propuso que se
realizara una prueba con 8 tazas de té con leche. En 4 de ellas se había colocado primero la leche y
en las 4 restantes, primero el té. Esta información fue provista a la dama pero el orden en el que se le
presentaron las tazas fue aleatorio.
El resultado de la prueba fue el siguiente:
Dama dice
te leche Total
realidad
te
leche
Total
3
1
4
1
3
4
4
4
8
Figura 3-40
La pregunta es: ¿cómo puede detectarse si el resultado se debe a la habilidad de la dama o al
producto del azar? Para responderlo debemos llegar al capítulo 5 (página damaFisher5), pero por el
momento podemos al menos crear la distribución de todos los resultados posibles. El alumno no
tendrá dificultades de obtener los valores hipergeométricos de la h(y,8,4,4) que se muestran en
la figura 3-41.
Figura 3-41
62
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – 2. Modelos contínuos
2. Modelos contínuos
Excepto la distribución uniforme y exponencial, el resto de las distribuciones contínuas se resuelven
con expresiones que requieren el cálculo diferencial, por lo cual se utilizarán exclusivamente tablas o
programas informáticos, para el cálculo de sus valores.
Distribución Uniforme, r(x,a,b)
También se llama rectangular y es la distribución más simple.
PDF
Se define como:
r ( x, a , b ) =
1
b−a
a≤ x≤b
siendo:
a≤ x≤b
Figura 3-42
PDF Distribución rectangular
Verificación PDF
f ( x) > 0
∞
∫
f ( x)dx = 1
−∞
Esta última propiedad se visualiza fácilmente reemplazando la función uniforme en la integral.
CDF
La expresión de la CDF será:
R ( x, a , b ) = ∫
x
a
1
dx
b−a
es decir:
63
Capítulo 3 Distribuciones de Probabilidades
x−a
⎡ x ⎤
=
R ( x, a , b ) = ⎢
⎥
⎣ b − a ⎦a b − a
x
R ( x, a, b) =
x−a
b−a
Sin embargo resulta en la práctica más conveniente hallar, partir de los datos, la ecuación de la recta
correspondiente.
Figura 3-43
CDF Distribución rectangular
Caracterización
Media
Aplicando la definición de la media:
E( X ) = ∫
b
a
1
1 (b 2 − a 2 )
xdx =
b−a
b−a
2
Por lo tanto:
E( X ) =
a+b
2
La media es el promedio de los valores extremos, conclusión que pudo obtenerse rápidamente por
razones de simetría.
Varianza
Aplicando la definición de la varianza:
V (X ) = ∫
b
a
2
1 ⎛
a+b⎞
⎜x−
⎟ dx
b−a⎝
2 ⎠
Operando:
64
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Distribución Uniforme, r(x,a,b)
V (X ) =
3
3
1 ⎡⎛ b − a ⎞ ⎛ a − b ⎞ ⎤
−
⎢⎜
⎟ ⎜
⎟ ⎥
3(b − a ) ⎣⎢⎝ 2 ⎠ ⎝ 2 ⎠ ⎦⎥
Por lo tanto:
V (X ) =
2(b − a)3
(b − a) 2
=
3(23 )(b − a)
12
V (X ) =
(b − a) 2
12
Nota
Se deja al estudiante que obtenga la misma ecuación a partir de la expresión alternativa:
1
⎛ b
⎞
V ( X ) = ⎜ ∫ x2
dx ⎟ − μ 2
a
b−a ⎠
⎝
Ejemplos de distribuciones rectangulares
•
•
Equiprobabilidad
Aplicaciones del principio de la teoría de las probabilidades conocido como "de la razón
insuficiente" o "de la indiferencia", el cual establece que en condiciones de incertidumbre se
asume la equiprobabilidad.
Elección de un punto al azar. La distribución uniforme precisa la noción intuitiva de elección
de un punto al azar, pues con esto se quiere decir que las coordenadas X de dicho punto están
uniformemente distribuidas. Esta distribución origina los Números Aleatorios Uniformes, NAU
y los problemas de muestreo aleatorio.
Problema resuelto 3.18 Distribución uniforme
Dada la distribución r(x,0,1), hallar la CDF (0.8,0,1), la media y la desviación estándar.
0.8 − 0
= 0.8
1− 0
0 +1
μ=
= 0.5
2
12
V (X ) =
= 0.0833
12
σ = 0.289
R (0.8, 0,1) =
SPSS
CDF.UNIFORM(0.8,0,1)=0.8
Problema resuelto 3.19 Espera del ómnibus
Los ómnibus arriban cada 15 minutos después de la 07:00. Si un pasajero llega a la parada en un tiempo que
está uniformemente distribuido entre 07:00 y 07:30, hallar la probabilidad de que tenga que esperar, a) menos
de 5 minutos, b) más de 10 minutos.
65
Capítulo 3 Distribuciones de Probabilidades
a) Sea X el tiempo en minutos que el pasajero debe esperar después de las 07:00. Para esperar menos de 5
minutos debe arribar entre 07:10 y 07:15 o entre 07:25 y 07:30.
Por lo tanto:
15
30
10
25
P ( (10 < X < 15) + ( 25 < X < 30 ) ) = ∫ 1/ 30dx + ∫ 1/ 30dx = 1/ 3
b) Similarmente :
5
20
0
15
P ( ( 0 < X < 5) + (15 < X < 20 ) ) = ∫ 1/ 30dx + ∫ 1/ 30dx = 1/ 3
Distribución Exponencial, e(t,ω)
Como es habitual que la variable aleatoria sea el tiempo, utilizaré a la letra t como simbología, en
esta distribución (sea o no el intervalo un tiempo).
PDF
Se define como:
e(t , ω ) = ωe−ωt 0 < t < ∞
donde:
ω = parámetro. Si la variable aleatoria es el tiempo, ω es la frecuencia de casos.
Se define además: β =
1
ω
.
Si la variable aleatoria es el tiempo, β es el período o también llamado MTBF, Tiempo Medio entre
Fallas (Mean Time Between Failures).
Figura 3-44
PDF Distribución exponencial
66
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Distribución Exponencial, e(t,
)
Se observa que es una distribución asimétrica con sesgo positivo.
CDF
La expresión de la CDF será:
t
E (t , ω ) = ∫ ωe−ωt dt = 1 − e−ωt
0
Figura 3-45
CDF Distribución exponencial
Propiedad de las colas exponenciales
De la expresión de la CDF se desprende que:
La cola de una distribución exponencial tiene siempre el valor e − ω t .
Caracterización
El alumno podrá obtener rápidamente con una integración por partes los valores de la media y de la
varianza (esta última con la fórmula rápida).
Media
∞
E (T ) =∫ ω te −ωt dt =
0
1
ω
=β
Varianza
∞
E (T 2 ) = ∫ ω t 2 e −ωt =
0
2
ω2
Por lo tanto:
V (T ) =
1
ω
2
= β2
Ejemplo de distribución exponencial
Modela el tiempo T1 hasta la primera falla, es decir la duración de un determinado elemento.
67
Capítulo 3 Distribuciones de Probabilidades
Pérdida de la memoria
Las v.a. exponenciales son las únicas v.a. contínuas que no tienen memoria y son el equivalente
contínuo de las variables discretas geométricas (página 46). Un fusible o un cojinete de material con
gran dureza son buenos ejemplos de elementos para los cuales esta propiedad suele cumplirse, pues
no cambian mayormente con el uso y son tan buenos como nuevos.
Decimos que una v.a. X no tiene memoria si:
P (T > s + t | T > s ) = P (T > t )
Veamos si se cumple para una distribución exponencial.
P (T > s + t | T > s ) =
e −ω ( t + s )
= e −ωt = P (T > t )
−ω s
e
En particular para la variable exponencial T1, esta ecuación dice que si se sabe que no se produjo
ninguna falla hasta s, la probabilidad a partir de ese tiempo no depende de s.
Haciendo intervenir la CDF, resulta:
1 − F (s + t )
= P(T > t ) = 1 − F (t )
1 − F ( s)
Llamando G al complemento de F: G (t ) = 1 − F (t ) :
P (T > s + t | T > s ) =
G ( s + t ) = G ( s )G (t )
La única función que cumple esta propiedad es la exponencial, por lo cual la inversa de la propiedad
anterior también es cierta: si una variable no tiene memoria, es exponencial.
Distribución Gamma
Primero debemos introducir la función Gamma.
Función Gamma
Está definida por:
∞
Γ(r ) = ∫ x r −1e − x dx
r>0
0
Expresión recursiva
Si integramos por partes diferenciando x r −1 , se obtiene:
∞
∞
Γ(r ) = −e − x x r −1 − ∫ −e − x ( r − 1)x r − 2 dx
0
0
∞
0 + ( r − 1) ∫ e − x x r − 2 dx = ( r − 1)Γ(r − 1)
0
Por lo tanto:
Γ (r ) = ( r − 1)Γ (r − 1)
68
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Distribución Gamma
p es entero positivo
Γ( r ) = ( r − 1)Γ ( r − 1)
= ( r − 1)( r − 2)Γ( r − 2)
= ( r − 1)(r − 2)...Γ(1)
Como:
∞
Γ(1) = ∫ e − x dx = 1
0
resulta:
Γ(r ) = (r − 1)!
Por lo tanto la función Gamma es una generalización de la función factorial.
Problema resuelto 3.20 Γ(1/2)
Demostrar que:
Γ (1 / 2) = π
∞
Γ(1/ 2) = ∫ x −1/2 e − x dx
0
Realizando el cambio de variable: x = u / 2 , se obtiene:
2
∞
∞
Γ(1/ 2) = 2 ∫ u −1e − u /2udu = 2 ∫ e − u /2 du
0
2
2
0
Se verá en el punto siguiente que (ver distribución normal):
1
2π
∞
∫e
− z 2 /2
dz = 1
−∞
Por lo tanto:
∞
∫e
− z2 / 2
dz =
0
1
2π
2
finalmente:
Γ(1/ 2) ==
2 2π
= π
2
Distribución Gamma(x,r,α)
Una X variable aleatoria no negativa sigue una distribución Gamma si su PDF es:
⎧ α
(α x)r −1 e−α x
⎪
f ( x, r , α ) = ⎨ Γ ( r )
⎪0 en otro lado
⎩
x>0 α >0 r>0
Tiene 2 parámetros r y α Al primero se lo llama de forma y al segundo de escala. A veces se suelen
llamar α y β, respectivamente.
69
Capítulo 3 Distribuciones de Probabilidades
Verificación PDF
f ( x) > 0
∞
∫
f ( x)dx = 1
−∞
Esta última propiedad se visualiza fácilmente reemplazando la función Gamma en la expresión.
En la siguiente figura se representan las PDF de la distribución Gamma para:
α = 1, r = 1 y α = 1, r = 2.
Figura 3-48
Caracterización
Se demuestra analíticamente que:
E( X ) =
V (X ) =
r
α
r
α2
Exponencial
Si r = 1, la PDF de la distribución Gamma es:
f ( x) = α e−α x
Por lo tanto la distribución exponencial es un caso particular de la Gamma con r = 1. Además α de la
Gamma se convierte en ω de la exponencial.
70
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Distribución Gamma
Relaciones entre las CDF de Gamma y Poisson
Las siguientes relaciones se verifican si el parámetro r es un entero positivo.
Gamma y Poisson
Sabemos que la distribución Binomial y la distribución Binomial Negativa o de Pascal forman un
conjunto de inversas.
Binomial
Número de Éxitos r para una muestra n
Binomial negativa
Tamaño de la muestra n para un número de éxitos r.
Además la distribución Geométrica es un caso particular de la Binomial negativa con r = 1: Tamaño
de la muestra n hasta el primer éxito.
De forma similar, la distribución de Poisson forma un sistema de inversas con la distribución
Gamma y la Exponencial es un caso particular de la Gamma con r = 1.
Sea r un entero positivo.
Sea T el tiempo requerido para observar r ocurrencias.
Sea X el número de ocurrencias durante [0, t].
a) 1 − CDF .GAMMA(t , r , α ) = CDF .POISSON ( r − 1, t , α t )
b) CDF .GAMMA(t , r , α ) = 1 − CDF .POISSON ( r − 1, t , α t )
a) Esta relación significa que si se requiere más de un tiempo t para obtener r ocurrencias, deberá
haber a lo sumo ( r − 1 ) ocurrencias en [0, t].
b) Este caso resulta del anterior pasando a los eventos complementarios. Si se requiere a lo sumo un
tiempo t para obtener r ocurrencias, deberá haber más de r ocurrencias en [0, t].
Con otra notación, resultan:
P(T > t ) = P( X < r )
P(T ≤ t ) = P( X ≥ r )
Observar que α de Gamma es ω de Poisson.
Utilizando la notación CDF, se aprecia el intercambio de parámetros. Al igual que para la pareja
Pascal-Binomial, en la pareja Gamma-Poisson, el valor de t se mantiene y el de r baja en una unidad
en la de Poisson.
Demostración
Sean T una variable aleatoria Gamma y X una variable aleatoria Poisson. Utilizaremos la relación:
∫
∞
a
r
e− x x r
e− a a r
dx = ∑
r!
k!
k =0
la cual se demuestra integrando sucesivamente por partes la integral:
∫
∞
a
e− x x r dx
con:
u = xr
dv = e − x dx
71
Capítulo 3 Distribuciones de Probabilidades
Si X tiene una distribución de Poisson con parámetro λ = ωt , entonces:
e−λ λ k
k!
k =0
r −1
P( X < r ) = ∑
Reemplazando la sumatoria del segundo miembro por la integral anterior, se obtiene:
− y r −1
− y r −1
∞e y
∞e y
e−λ λ k
=∫
dy = ∫
dy
λ ( r − 1)!
ωt ( r − 1)!
k!
k =0
Cambiando la variable: y = ω s ,
r −1
P( X < r ) = ∑
∞
P( X < r ) = ∫ ω
t
e −ω sω s r −1
ds = P( s > t )
(r − 1)!
pues el integrando es una PDF, f(t) de tipo Gamma siempre y cuando r sea un entero positivo.
En definitiva P (T > t ) = P ( X < r ) para T Gamma y X Poisson.
Ejemplos
CDF .GAMMA(3, 2, 0.5) = 1 − CDF .POISSON (1,1.5) ,
en donde 1.5 = 3*0.5 .
1 − CDF .GAMMA(3, 2,1.3) = CDF .POISSON (1,3.9) ,
en donde 3.9 = 3*1.3 .
Exponencial y Poisson
La relación anterior entre Gamma y Poisson se convierte entre Exponencial y Poisson, reemplazando
r por 1. Por lo tanto resultan las expresiones, con α = ω :
1 − CDF .EXP(t , ω ) = CDF .POISSON (0, ωt )
CDF .EXP (t , ω ) = 1 − CDF .POISSON (0, ωt )
Ejemplo
CDF .GAMMA(3,1, 0.5) = CDF .EXP (3, 0.5) = 1 − CDF .POISSON (0,1.5)
en donde 1.5 = 3*0.5
Sin embargo explicitaremos una demostración que ampliaremos al tiempo entre ocurrencias.
En un proceso de Poisson p(X, λ), denotamos:
T1, el intervalo de tiempo hasta el primer evento, es decir para X = 1.
T2 el intervalo de tiempo total hasta el segundo evento, es decir para X = 2.
S12, el intervalo de tiempo entre el primer evento y el segundo evento.
Distribución de T1
Bastará obtener la P(T1 > t ) .
Para esto observamos que este evento ocurre si y solo si ninguno de los eventos del proceso de
Poisson ocurre en el intervalo [0, t].
CDF = P(T1 ≤ t ) es la probabilidad de falla (al menos una vez) en [0, t]
1 − CDF = P(T1 > t ) es la probabilidad de no falla en [0, t]
Por lo tanto:
P (T1 > t ) = P ( X < 1) = P ( X = 0) =
e−λ λ 0
= e − λ = e −ω t
0!
Por consiguiente, recordando la propiedad de las colas exponenciales, T1 tiene una distribución
exponencial con media β =
72
1
ω
.
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Distribución Gamma
Conclusión
Las variables Número de Casos y Tamaño del Intervalo hasta el primer caso
forman un sistema de inversas. La distribución que considera como variable al Número de
Casos es Poisson y la que considera como variable al Tamaño del Intervalo hasta el
primer caso es Exponencial.
Distribución de S12
Bastará obtener la P( S12 > t | T1 = s) .
Partimos de la siguiente identidad:
P(S12 > t | T1 = s) = P( X = 0 eventos en (s, s + t ) | T1 = s)
Por la propiedad de independencia:
P( X = 0 eventos en ( s, s + t ) | T1 = s) = P(0 eventos en ( s, s + t ))
Finalmente:
P(0 eventos en (s, s + t )) = e−λ = e−ωt
Por consiguiente S12 es también una variable aleatoria exponencial con media β =
1
ω
.
Observando las distribuciones de T1 y S12, podemos concluir en general que:
La v.a. igual a la distancia T entre 2 casos sucesivos de un proceso de Poisson es exponencial.
Problema resuelto 3.21 Distribución exponencial
La distribución del tiempo de vida de un elemento de una computadora es exponencial con un MTBF = 560 h.
Si llamamos T1 a la v.a. Tiempo antes de la primer falla (es decir la duración), hallar la PDF y la CDF, b)
obtener
P(T1 ≤ 280) , c) obtener P(T1 > 1120) , d) obtener P(280 < T1 < 1120) .
a)
PDF
e(T1 ,1/ 560) =
1 − t /560
e
560
73
Capítulo 3 Distribuciones de Probabilidades
Figura 3-46
CDF
E (T1 ,1/ 560) = 1 − e−t /560
Figura 3-47
SPSS
PDF.EXP(t,1/560)
CDF.EXP(t,1/560)
b)
1 Como exponencial
P(T1 ≤ 280) = exp(T1 ≤ 280, ω ) = 1 − e−280/560 = 1 − e−0.5 = 0.3935
74
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Distribución Gamma
Observar que el valor pedido es el complemento de la cola a partir de t = 280.
2 Como Poisson
280
= 0.5
560
P(T1 ≤ 280) = Poisson(Y > 0, λ ) = 1 − P(0,0.5) = 1 − e−0.5 = 0.3935
λ = ωt =
c)
1 Como exponencial
P(T1 > 1120) = exp(T1 > 1120, ω ) = e−1120/560 = e−2 = 0.1353
Observar que el valor pedido es la cola a partir de t = 1120.
2 Como Poisson
1120
=2
560
P(T1 > 1120) = Poisson(Y < 1, ωt ) = Poisson(0, 2) = e−2 = 0.1353
λ = ωt =
d)
P(280 < T1 < 1120) = Exp(1120,1/ 560) − Exp(280,1/ 560) =
= (1 − e−1120/560 ) − (1 − e−280/560 ) = 0.4712
Problema resuelto 3.22 Reparación de aviones
Llega un promedio de 4 aviones a un hangar para su reparación, por cada período de 8 horas. a) Hallar la
probabilidad de que la primera llegada no ocurra durante la primera hora, b) hallar la probabilidad de que la
primera llegada ocurra dentro de la primera hora.
a)
λ=
4
= 0.5
8
Exponencial (t, ω) = (>1, 0.5)
P(T > 1) = e−λ = e−0.5 = 0.606
Poisson (x, λ) = (<1, 0.5)
P ( X = 0) =
e−0.5 0.50
=0.606
0!
b)
Exponencial (t, ω) = (≤1, 0.5)
P(T ≤ 1) = 1 − e−λ = 1 − e−0.5 = 0.394
Poisson (x, λ) = (≥1, 0.5)
P ( X ≥ 1) = 1 − P ( X = 0) = 1 − 0.606=0.394
75
Capítulo 3 Distribuciones de Probabilidades
Distribución Normal, n(z,0,1)
Es una distribución tipo campana (ver figura 3-49) con la mayoría de los casos en el medio y los
menos en los extremos.
Con frecuencia se otorga el crédito de su descubrimiento al alemán Karl Friedrich Gauss o al francés
Pierre Laplace, pero aunque no la dibujó, el francés Abraham De Moivre, fue el primero que calculó
áreas debajo de esta curva. De Moivre era protestante y por esta razón tuvo que emigrar a Inglaterra
en donde entabló amistad con Isaac Newton, de quién se dice que muchas veces contestaba
preguntas diciendo: "pregúntele a Monsieur De Moivre, el sabe eso mejor que yo". Sin embargo
como era extranjero, nunca logró la fama de los matemáticos británicos, con quienes De Moivre
trabajaba y quienes tanto lo respetaban.
La distribución Normal es además la distribución estadística más importante pues:
• En varias técnicas estadísticas, es la distribución que se adopta como supuesto.
• Varias distribuciones derivan de la Normal.
• Varias distribuciones tienden a la Normal cuando n es suficientemente grande. En particular lo
hacen las distribuciones de los promedios o de las sumas (Teorema Central del Límite, el cual
será motivo de estudio en el capítulo 4).
En la naturaleza se presentan con frecuencia comportamientos que son promedios o sumas de
muchos factores pequeños e independientes entre sí, tal como los errores accidentales en las
mediciones, los pesos y alturas de las personas, la hora de llegada de los estudiantes a una
escuela, la cantidad de letras que una persona puede recordar al repetir la prueba, etc.
Este comportamiento es bastante lógico pues es probable que estos factores ocurran por azar,
con valores extremos que tienden a presentarse en forma equilibrada y por lo tanto con tendencia
a cancelarse entre sí. Por esto son menos comunes las cantidades muy altas o bajas.
Supuestos
La demostración de la obtención de la ecuación de la PDF normal realizada por Gauss se basa en 4
supuestos de su teoría de errores.
Llamamos:
• M a la medición aleatoria, v al valor verdadero (desconocido) y x al error
•
x = M −v
f ( x ) a la función densidad de probabilidades.
Supuesto 1 Simetría
Los errores de magnitud x y –x son iguales (son simétricos). Los errores no dependen de la
orientación θ del sistema de coordenadas.
f ( x) = f (− x)
Supuesto 2 Promedio
El valor más probable v de varias mediciones es el promedio. En otras palabras, Gauss elige
entonces al mejor estimador de mínimos cuadrados de los datos (capitulo 1, página LSEMedia1).
v=M =
∑M
n
Supuesto 3 Comportamiento
Errores pequeños son más probables que errores grandes.
Esto implica:
max f ( x ) ⇒ x = 0 y por el supuesto 2, esto debe ocurrir en: v = M
lim f ( x ) = 0
n →∞
76
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Distribución Normal, n(z,0,1)
Supuesto 4 Independencia
Los errores son independientes. Entonces es válida la Regla del Producto, RP, para la distribución
conjunta de los errores:
f ( x) = f ( x1 ) f ( x2 )... f ( xn )
f ( x) = f (M1 − v) f (M 2 − v)... f (M n − v)
PDF
Nota
Suelen denominarse ϕ a la PDF y Φ a la CDF.
La expresión matemática para una variable sin estandarizar, es:
1 ⎛ x−μ ⎞
⎟
σ ⎠
− ⎜
1
ϕ ( x, μ , σ ) = f ( x , μ , σ ) =
e 2⎝
σ 2π
2
σ >0
Observar que el exponente es un polinomio de segundo grado centrado en el vértice con el
coeficiente del término cuadrático negativo.
Se aprecia en esta ecuación que la distribución solo depende, además de la variable x, de la media μ
y la desviación estándar σ. Una vez fijados los mismos, podremos calcular y graficar la ecuación. En
este sentido se recomienda al estudiante que obtenga la gráfica de esta función, estudiando la misma
(dominio, imagen, asíntotas, puntos de inflexión, máximos y mínimos).
Se puede demostrar además que si x tiene una distribución normal y se realiza una transformación de
variable a la variable z, la distribución de z, también es normal con media 0 y desviación estándar 1,
por lo cual se usa la notación: n(z,0,1). De esta forma se obtiene una expresión que solo es función
de z, lo cual permite su cálculo para cualquier combinación de μ y σ.
f ( z) =
1 − z 2 /2
e
2π
Esta expresión puede escribirse alternativamente como:
f ( z) =
1
2π e z
2
La expresión de la función densidad transformada debe verificar la expresión vista en el capítulo 1
(página Escalamientoz1):
f ( z ) = σ f ( x)
Por lo tanto, reemplazando por ejemplo f(z) en esta relación, se puede despejar f(x), obteniendo la
expresión del comienzo de esta sección.
77
Capítulo 3 Distribuciones de Probabilidades
Figura 3-49
PDF Distribución Normal
Recordemos además que cuando se dice que una v.a. z tiene una distribución determinada, por
1 − z2 /2
ejemplo normal, se está diciendo que PDF ( z ) =
.
e
2π
Demostración
Gauss
La ingeniosa derivación de Gauss de la PDF de esta distribución utiliza los 4 supuestos anteriores y
procedimientos estándar de cálculo.
Definamos la función auxiliar:
g ( x) =
f '( x)
f ( x)
De acuerdo al supuesto 1, se obtiene:
g (− x) = − g ( x)
De acuerdo al supuesto 4, la distribución conjunta de los errores debe verificar:
f ( x) = f ( x1 ) f ( x2 )... f ( xn )
De acuerdo al supuesto 3, v maximiza f(x) y por el supuesto 2 v = M , es decir:
∂f ( x)
=
∂v
= − f '( M 1 − M ) f ( M 2 − M )... f ( M n − M ) −
0=
− f ( M 1 − M ) f '( M 2 − M )... f ( M n − M ) − ...
... − f ( M 1 − M ) f ( M 2 − M )... f '( M n − M )
Multiplicando y dividiendo por f(x):
⎛ f '( M 1 − M ) f '( M 2 − M )
f '( M n − M ) ⎞
= −⎜
+
+ ... +
⎟
f (M n − M ) ⎠
⎝ f (M1 − M ) f (M 2 − M )
Es decir:
g ( M 1 − M ) + g ( M 2 − M ) + ... + g ( M n − M ) = 0
78
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Distribución Normal, n(z,0,1)
Como las mediciones M son arbitrarias, siendo M y N números reales arbitrarios, podemos poner:
M1 = M
M 2 = M 3 = ... = M n = M − nN
Por lo tanto:
M = M − (n − 1) N
Reemplazando en la expresión de las funciones g:
g (( n − 1) N ) + ( n − 1) g ( − N ) = 0
o también:
g (( n − 1) N ) = ( n − 1) g ( N )
Esta propiedad define una función del tipo4:
g ( x ) = kx
Por lo tanto:
f '( x)
= kx
f ( x)
Integrando:
k 2
x +c
2
ln( f ( x )) =
Por lo tanto:
k
f ( x) = Ae 2
x2
Para cumplir el supuesto 3, la exponencial debe ser negativa, por lo cual podemos poner
k
= −h2 .
2
Laplace
Una demostración distinta se debe al matemático francés Pierre Laplace (1810), la cual constituye el
Teorema del Limite Central, TLC, que se estudiará en el capítulo 4.
Verificación PDF
f ( x) > 0
∞
∫
f ( x)dx = 1
−∞
Planteando el cuadrado de la integral I y pasando a coordenadas polares se observa que:
∞
I =
2
∫e
− h2 x2
−∞
∞
dx ∫ e
− h2 y 2
−∞
∞ ∞
dy =
∫ ∫e
− h2 ( x2 + y 2 )
2π ∞
dxdy =
−∞ −∞
∫ ∫e
0 0
− h2 ρ 2
ρ d ρ dθ =
2π
2h 2
de donde:
∞
I=
∫e
−∞
− h2 x2
dx =
π
h
Por lo tanto la PDF será:
4
2
ag ( x ) = akx = g ( ax ) . Eso no se verifica para otra función como por ejemplo g ( x) = kx , pues
ag ( x) = akx2 ≠ g (ax) = k (ax)2 .
79
Capítulo 3 Distribuciones de Probabilidades
f ( x) =
h
π
2 2
e− h x
Luego, al estudiar la caracterización de la función densidad normal, relacionaremos h con la
desviación estándar.
CDF
Para obtener las áreas debajo de la curva anterior se debe integrar. Sin embargo esta integración no
tiene una expresión explícita y se debe realizar el cálculo por integración numérica o en series. En el
problema resuelto de página 83, se recorrerá la integración numérica. De todas formas, la buena
noticia es que no será necesario utilizar estos procedimientos, pues los valores de esta distribución
(estandarizada o no), se obtienen en general con algún programa de computación o de tablas.
Figura 3-50
CDF Distribución Normal
Caracterización
Utilizaremos la siguiente relación.
∞
∫e
− h2t 2
π
dt =
h
−∞
Media
Para generalizar la función densidad, agregamos un término a dentro del exponente.
h
E ( x) =
π
∞
∫ xe
− h2 ( x − a )2
dx
−∞
Realizamos primero el cambio de variable x − a = t :
=
h
π
∞
∫ (a + t )e
− h 2t 2
dt
−∞
Utilizando la relación anterior:
=a+
80
h
π
∞
∫ te
− h 2t 2
dt
−∞
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Distribución Normal, n(z,0,1)
La segunda integral debe dar 0 pues el integrando es una función impar: g (t ) = − g ( −t ) .
Por lo tanto:
E ( x) = μ = a
Varianza
V ( x) =
h
π
∞
∫ (x − μ) e
2 − h2 ( x − μ )2
dx
−∞
Comenzamos nuevamente por realizar el cambio de variable x − μ = t :
V ( x) =
h
π
∞
∫t e
2 − h 2t 2
dx
−∞
Integramos por partes, llamando:
⎧⎪u = t
⎨
− h 2t 2
⎪⎩dv = te dx
De esta forma se obtiene:
h ⎡ t − h 2t 2
e
=
⎢−
π ⎢⎣ 2h2
∞
+
−∞
1
2h2
∞
∫e
−∞
− h 2t 2
⎤
dt ⎥
⎦⎥
Aplicando el teorema de L´Hopital a la indeterminación del primer término y utilizando la integral
inicial para el segundo término:
=
h ⎡
1 π⎤
1
⎢0 + 2
⎥= 2
π ⎣ 2h h ⎦ 2h
V ( x) = σ 2 =
1
2h 2
Observar que la varianza y h 2 se relacionan inversamente por lo cual se suele llamar precisión al
valor h y que además el 2 aparece como coeficiente de cualquiera de los dos.
Por lo tanto hemos encontrado la relación entre h y la varianza:
h2 =
1
⇒h=
2σ 2
1
2σ
Reemplazando en la ecuación de Gauss los 2 parámetros encontrados, queda demostrada la ecuación
de la función densidad normal.
f ( x) =
h
π
e
− h 2 ( x − μ )2
1 ⎛ x−μ ⎞
σ ⎟⎠
− ⎜
1
e 2⎝
=
σ 2π
2
Además la relación inicial toma la forma:
∞
∫e
− z 2 /2
dz = 2π
−∞
Nota
La media y la desviación estándar en la variable z deben ser 0 y 1, cualquiera sea la distribución,
como se demostró en el capítulo 1 (página Mediaz1).
81
Capíítulo 3 Distrib
buciones de Probabilidade
P
es
Pro
opiedad
des
Puntto de inflexión
Resolvviendo la ecuaación f ''( x ) = 0 , se obtienne que los punntos de inflexxión se encuen
ntran en
x = μ ±σ .
Combinación lineal
Si X1, ….,Xn son vaariables aleatoorias independdientes distribbuidas normaalmente, entonnces la
combin
nación lineal de ellas, tamb
bién es normaal.
Uso
o de tab
blas
Si se cu
uenta con unaa computadorra en la cual sse ha instaladoo SPSS o EXCEL, se podrrán obtener loos
valoress de las áreas debajo de unna distribuciónn Normal, con
n las instrucciiones que se encuentran
e
enn el
apéndice B, en las secciones
s
SPS
SS y EXCEL. Alternativam
mente, aunquee restringido a los valores
más ussuales, se puedde hacer uso de tablas, tal como las quee también se encuentran
e
enn el apéndice B.
s contínuas reelacionan valores de eje con valores de área, es deccir
Todas las tablas de distribucione
d
las 2 magnitudes
m
quue se resumen
n en la siguiennte notación, en
e donde α ess el área de laa cola superioor:
zα
En cadda problema se sugiere reallizar un diagrama de análissis , colocar eel valor que see obtiene de laa
tabla y tener en cuennta, si se neceesitan, los vallores 0.5 de caada una de las 2 mitades de
d la curva o 1 de
toda laa curva.
Prob
blema ressuelto 3.223 Distrib
bución normal
n
Se repro
oduce en la fig
gura 3-51 parte de la tabla Noormal, del Apénndice B. Esta ttabla contiene las
l probabilidaades
de cola superior para cada
c
valor de z.
z
F
Figura 3-51
Tabla distribución
d
Normal (valoress de cola superiior)
En la co
olumna del maargen izquierdoo se encuentra eel valor de z haasta el primer ddecimal. El seggundo decimal se
halla enn la primera fila. De esta form
ma el recuadraddo 0.3015 correesponde a la prrobabilidad de cola superior al
a
valor z = 0.52.
82
Jorge
e Carlos Carrrá
Ic Modelos teóricos de una variable – Distribución Normal, n(z,0,1)
Problema resuelto 3.24 Método de Sympson
Hemos indicado que en estadística no será necesario utilizar la ecuación matemática de la función densidad de
la distribución normal, pues los valores de la misma, se obtienen en general con algún programa de
computación o de tablas. Sin embargo es saludable recorrer, al menos una vez, la determinación de los valores
que se encuentran en la tabla. Dado que la integración de esta función densidad no tiene una expresión
explícita (no hay ninguna primitiva cuya derivada de la función densidad), debe realizarse una integración
numérica o la descomposición de la función en series. En este ejemplo he elegido el conocido método
numérico de Sympson de aproximación de la curva con segmentos de parábola.
Demostraremos que el valor que da la tabla para el área de la cola a partir de z = 0.4, es decir: 0.3446 (ver
figura 3-52).
Si llamamos S a este valor, se tiene:
S = 0.5 −
1
2π
0.4
∫e
− z2
dz
0
Para calcular la integral definida, elijamos 4 intervalos con un ancho de intervalo h = 0.1. A partir de estas
elecciones generamos la siguiente tabla:
i
0
1
2
3
4
0
0.1
0.2
0.3
0.4
zi
2
e-zi 1 0.995 0.980 0.9559 0.923
Figura 3-52
Aplicando ahora la expresión de Sympson:
0.4
∫e
− z2
dz =
0
h
( E + 4I + 2P)
3
donde:
E = suma de los valores extremos = 1.923
I = suma de los valores en posición impar = 1.9509
P = suma de los valores en posición par = 0.980
Por lo tanto:
0.4
∫e
− z2
dz =
0
0.1
(1.923 + 4(1.9509) + 2(0.980)) = 0.3896
3
Finalmente:
S = 0.5 −
1
(0.3896) = 0.3446
2π
Con lo cual hemos demostrado el valor de la tabla.
Problema resuelto 3.25 Coeficiente de inteligencia
Suponiendo que el coeficiente de inteligencia CI, se distribuye según una distribución normal con media 100 y
desviación estándar 15:
a) obtener el porcentaje de personas que tienen un CI entre 90 y 110,
b) obtener el porcentaje de personas que tienen un CI mayor que 75,
c) obtener el porcentaje de personas que tienen un CI entre 105 y 115.
d) hallar el coeficiente de curtosis definido por AIC/AEP (capítulo 1, página curtosis1).
e) ¿Es poco común que una persona tenga un CI mayor a 125?
a)
83
Capítulo 3 Distribuciones de Probabilidades
Transformación a valores z
Para entrar a la tabla se debe estandarizar la n(x,100,15) en n(z,0.1).
Esta conversión de la variable original x a la estandarizada z se puede realizar dentro o fuera de la ecuación
probabilística.
Método 1: dentro de la ecuación probabilística
⎛ 90 − 100 x − 100 110 − 100 ⎞
P (90 < x < 110) = P ⎜
<
<
⎟=
15
15
⎝ 15
⎠
110 − 100 ⎞
⎛ 90 − 100
= P⎜
<z<
⎟=
15
⎝ 15
⎠
= P ( −0.667 < z < 0.667 ) = 1 − 0.2514 − 0.2514 = 0.497
Diagrama de análisis
Figura 3-53
Diagrama de análisis
Método 2: fuera de la ecuación probabilística
90 − 100
= −0.667
15
110 − 100
zs =
= 0.667
15
zi =
Por lo tanto:
p = P ( −0.667 < z < 0.667 ) = 0.497
b)
Transformación a valores z
Proseguiremos con el formato fuera de la ecuación probabilística.
z=
75 − 100
= −1.667
15
Diagrama de análisis
Figura 3-54
Diagrama de análisis
Por lo tanto:
p = 1 − 0.0475 = 0.9525 = 95.25%
c)
Transformación a valores z
105 − 100
= 0.33
15
115 − 100
zs =
=1
15
zi =
84
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Distribución Normal, n(z,0,1)
Diagrama de análisis
Figura 3-55
Diagrama de análisis
Por lo tanto:
p = 0.3707 − 0.1587 = 0.212 = 21.2%
d)
En todos los casos bastará obtener el valor z correspondiente a los siguientes valores de p (o de frecuencia
relativa).
Figura 3-56
Diagrama de análisis
Para:
p = 0.90, z = 1.2816
p = 0.10, z = -1.2816
p = 0.75, z = 0.6745
p = 0.25, z = -0.6745
Por lo tanto:
AIC = 0.6745 − (−0.6745) = 1.35
AEP = 1.2816 − (−1.2816) = 2.56
AIC
Curtosis =
= 0.527
AEP
e) La P(CI > 125) = 0.047 < 5%, ´por lo cual es un suceso poco común y si sucede al azar, o ha sucedido un
evento muy infrecuente o es lícito dudar de los valores dados de la media y de la varianza.
SPSS
A modo de ejemplos:
El porcentaje de personas entre CI = 110 y CI = 90 se obtiene a partir de los valores CDF de la siguiente
manera:
CDF.NORMAL(110,100,15)-CDF.NORMAL(90,100,15)=0.495
La AIC se obtiene de:
IDF.NORMAL(0.75,0,1)-IDF.NORMAL(0.25,0,1)= 1.35
Nota
Observar que en las distribuciones contínuas, la expresión PDF devuelve la función densidad y no una
probabilidad, como en las distribuciones discretas.
Regla empírica
Utilizando la tabla o el SPSS, se obtienen los valores de probabilidad que se encuentran debajo de la
curva normal para los intervalos -1< z <1, -2< z <2 y -3< z <3.
85
Capíítulo 3 Distrib
buciones de Probabilidade
P
es
-1< z <1
-2< z <2
-3< z <3
68%
95%
99%
F
Figura 3-57
Compaarar estos valo
ores con los mínimos
m
posibbles, aplicanddo el teorema de Tchebysh
heff (capítulo 1,
página Tchevy1).
Aprroximación de
e una binomia
b
al y de
e una Poisson
Corre
ección por continuida
c
ad, cpc
La aprooximación dee una distribucción discreta por una contíínua, mejora ssi se amplía en
e media uniddad
cada vaalor, de tal foorma que el árrea de los recttángulos se coorresponda m
más cercanameente con los de
d
la curvva normal
En la figura
f
3-58, see muestra porr ejemplo (utilizando por esta vez la nottación con parréntesis en lugar
de subííndices), que::
b ( x = 2) → n (1.5 < x < 2.5)
b ( x ≥ 2) → n ( x > 1.5)
1
b ( x > 2) → n ( x > 2.5)
b ( x ≤ 2) → n ( x < 2.5)
2
b ( x < 2) → n ( x < 1.5)
1
En igual sentido, si en el eje se en
ncuentra la prroporción muuestral, la cuall surge de div
vidir cada valoor
de x poor n, la cpc reesultará de sum
mar o restar el
e valor:
0.5
n
Si por ejemplo, n = 60: la cpc esttablece que:
P ( x ≥ 23) → P ( x > 22.5)
P ( pˆ ≥
23
23 0.5
) → P ( pˆ >
−
)
60
60 60
Para vaalores grandes de n, la cpc no se justificca.
86
Jorge
e Carlos Carrrá
Ic Modelos teóricos de una variable – Distribución Normal, n(z,0,1)
Figura 3-58
CPC
1 Binomial a Normal
En el capítulo 4 se verá que cualquiera sea la distribución de una v.a x, la sumatoria de x, sigue una
distribución Normal si n, el número de términos de la sumatoria, tiende a infinito. Este teorema
puede aplicarse a una binomial, pues esta distribución es en definitiva una sumatoria de una
distribución de Bernoulli.
Un criterio para realizar que esta aproximación asintótica sea adecuada, es:
np ≥ 5 y nq ≥ 5
Algunos autores recomiendan adoptar el valor 15 en lugar del valor 5.
Naturalmente bastará que se cumpla para el menor valor de p o q.
Si lo desea puede interactuar con el applet: Aproximación de una binomial, que se
encuentra en la dirección electrónica de la bibliografía bajo el título Simulaciones.
Problema resuelto 3.26 Estudiantes promocionados
El 52% de los estudiantes ha promocionado la materia estadística (evento E). Si se seleccionan aleatoriamente
a 40 estudiantes, ¿cuál es la probabilidad de que la mayoría haya promocionado la materia estadística?
Propiedades binomiales
1. Propiedad 1 Dicotómica
Una v.a x tiene solo 2 resultados (dicotómica), E y E' (el apóstrofo significa no E)
2. Propiedad 2 Variable Aleatoria
Se busca la v.a: y = Número de alumnos E.
P(E) = p = 0.52,
P(E') = q = 0.48.
3. Propiedad 3 Tamaño
Las muestras tienen un tamaño n = 40 > 1
4. Propiedad 4 Independencia
Se supone una población suficientemente grande como para que la probabilidad en la extracción de un
joven no influye significativamente en la probabilidad de la extracción del siguiente. Es decir se considera
que n < 5%N.
Por lo tanto es una binomial b ( y , 40, 0.52)
El resultado exacto es:
P ( y > 20) = 1 − CDF .BINOM (20, 40, 0.52) = 0.538
Condición de aproximación
nq = 40 ∗ 0.48 = 19.2 ≥ 5
Por lo tanto la binomial se puede aproximar con la normal n ( y , 20.8, 3.16)
El resultado aproximado (con cpc), es:
P ( y > 20.5) = 1 − CDF .NORMAL(20.5, 20.8, 3.16) = 0.538
2 Poisson a Normal
Considerando la distribución de Poisson como un límite de la Binomial ( λ = np ) para n tendiendo a
infinito (página 59) y sabiendo que además bajo estas condiciones la Binomial tiene a una Normal,
concluimos que la distribución de Poisson se aproxima a una Normal, para valores grandes del
promedio λ.
El criterio práctico para realizar una aproximación adecuada, debe ser consistente con los criterios de
87
Capítulo 3 Distribuciones de Probabilidades
las aproximaciones Binomial-Poisson y Binomial-Normal (ver figura siguiente). Se adopta en
general:
λ > 10
Síntesis
Si reunimos estas dos nuevas aproximaciones, con las dos ya vistas, obtenemos el cuadro general
que se muestra en la figura 3-59, con los respectivos criterios de validez.
Normal
np y nq >5
n<5%N
Hipergeométrica
Binomial
λ>10
n>100 y p<0.1
Poisson
Figura 3-59
Aproximaciones entre distintas distribuciones
Distribución t de Student, f(t,ν)
Una distribución muy utilizada en estadística es la desarrollada por el matemático inglés William
Gosset, alias Student. Gosset fue contratado por los fabricantes de la cerveza Guinnes en Dublin,
para estudiar la forma en que la calidad de la cerveza fuera más estable. Para controlar la economía
de la producción, se le impuso la condición de no utilizar grandes muestras. Gosset publicaba con el
seudónimo de Student pues la cervecería impedía que sus empleados publicaran artículos que
pudieran vulnerar el secreto industrial.
Como veremos en el capítulo 4, su descubrimiento es la base del estudio inferencial para pequeñas
muestras.
PDF
⎛ t2 ⎞
f (t ,ν ) = f (0) ⎜1 + ⎟
⎝ ν ⎠
⎛ ν +1 ⎞
−⎜
⎟
⎝ 2 ⎠
ν ≥1
En el resto de las distribuciones utilizaremos el símbolo general de una función densidad (f) o de la
función distribución (F) para evitar confusiones, pues, excepto para la normal, las distribuciones
llevan el mismo nombre que el eje.
Verificación PDF
f ( x) > 0
∞
∫
f ( x)dx = 1
−∞
Esta última propiedad no se demuestra aquí.
88
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Distribución t de Student, f(t, )
Grados de libertad
Se aprecia en la ecuación que esta distribución, además de t, depende de otra variable simbolizada
con la letra griega nu (ν), llamada grado de libertad. Esta variable estará presente en las 3
distribuciones que restan. Los grados de libertad son la cantidad de valores que son libres de variar,
conocidos algunos parámetros de la distribución. Su cálculo se definirá en cada distribución, pero en
general es función del tamaño de la muestra.
En la figura 3-60 puede apreciarse que es una distribución simétrica y también de forma
acampanada. Respecto de la distribución normal es platicúrtica (capítulo 1), es decir presenta más
variabilidad. Sin embargo, a medida que aumentan los grados de libertad, la distribución t se
aproxima a la normal.
Figura 3-60
PDF Distribución t de Student
CDF
Figura 3-61
CDF Distribución t de Student
Caracterización
E (t ) = 0 ν ≥ 1
89
Capítulo 3 Distribuciones de Probabilidades
V (t ) =
ν
ν −2
ν >2
Observar que, a diferencia de la distribución normal, la desviación estándar es algo mayor que 1, por
lo cual es platicúrtica.
Propiedades
Suma o resta
Si X1, ….,Xn son variables aleatorias independientes distribuidas con t de Student, entonces la
combinación lineal de ellas, también se distribuye con t de Student.
Relación con la chi-cuadrado
En la distribución χ2 se verá que la siguiente variable, sigue una distribución t de Student con ν
grados de libertad, la cual será utilizada extensamente en los capítulos siguientes:
t (ν ) =
x −μ
s/ n
Se observa que si bien la variable t no depende del grado de libertad, se usa la simbología t(ν) para
expresar que la distribución de t si depende de ν (ver la anterior expresión de la PDF).
El cálculo del grado de libertad está dado por:
ν = n −1
Uso de tablas
Si se cuenta con una computadora en la cual se ha instalado SPSS o EXCEL, se podrán obtener los
valores de la distribución t de Student, con las instrucciones que se encuentran en el apéndice B, en
las secciones SPSS y EXCEL. Alternativamente, aunque restringido a los valores más usuales, se
puede hacer uso de tablas, tal como las que se encuentran también en el apéndice B. Se aprecia que,
a diferencia de la normal, esta tabla solo devuelve algunos percentiles de cola superior.
Estas tablas relacionan las 3 magnitudes: valores de eje, valores de área y grados de libertad, los
cuales se resumen en la siguiente notación en donde α es el área de la cola superior:
tα (ν )
Puede apreciarse que los valores de la t de Student se aproximan a una normal, aproximación que es
satisfactoria para ν mayor que 30 (por lo cual las tablas generalmente terminan en este valor). Se
puede verificar que la última fila de la tabla (infinitos grados de libertad) contiene los valores de la
normal.
Por otra parte, para un determinado valor de una cola, por ejemplo 0.05, los valores de t aumentan al
disminuir los grados de libertad. Este comportamiento explica el hecho de hacerse cada vez más
platicúrtica, pues al tener colas de igual área cada vez más alejadas, deberá hacerse menos alta en el
centro (el área total debe ser siempre 1).
Problema resuelto 3.27 Distribución t de Student
Se reproduce en la figura 3-62 parte de la tabla t de Student, del Apéndice B. Esta tabla contiene los valores t
para determinadas probabilidades de cola superior y de grados de libertad ν. En la columna del margen
izquierdo se encuentran los grados de libertad y en la primera fila el valor de probabilidad de cola superior,
llamado α. a) Hallar el valor t correspondiente a 6 grados de libertad y un α = 0.0125, b) hallar el coeficiente
de curtosis definido por AIC/AEP (capítulo 1, página curtosis1), para 6 grados de libertad, c) hallar la cola
superior para un valor t =2.015 y 5 grados de libertad. .
90
Jorge Carlos Carrá
Ic Mod
delos teóricos
s de una varia
able – Distrib
bución chi cua
adrado, f(


F
Figura 3-62
Taabla de valores t de Student (ccola superior)
a)
La resp
puesta es el valoor recuadrado: 2.9687.
b)
Dado quue la tabla no es
e suficientemeente completa, debe calcularsse con el SPSS
S.
c)
La resp
puesta es 0.05.
SPSS
S
a)
IDF.T(0.9875,6)
)=2.97
b)
AIC = IDF.t(0.7
75,6)- IDF.t(0.25,6)
)= 0.7176-(-0.7176) = 1.4352
AEP = IDF.t(0.9
90,6)- IDF.t(0.10,6)
)= 1.4398-(-1.4398) = 2.8796
Curtosiss =
AIC
= 0.498
0
AEP
Valor menor
m
que 0.52
27 (correspondiiente a una disttribución mesoocúrtica), comoo era de esperaar al tratarse de
una disttribución platiccúrtica.
c)
1-CDF
F.T(2.015,5
5)=0.0452
El valorr no es exactam
mente 0.05 puees el valor de t en la tabla (2.0
015) se encuenntra redondeado
o.
Dis
stribu
ución chi cu
uadrado, f((χ2, ν)
Esta diistribución fue desarrolladaa por Karl Pearson, un mattemático inglés, a veces acclamado comoo el
invento
or de la ciencia estadística. Inventó adem
más el cálculo
o del coeficieente de correllación y acuññó
los térm
minos histogrrama y asimeetría. Fue am
migo de Williaam Gosset, peero acérrimo enemigo
e
de
Ronaldd Fisher (ver distribución
d
F El pacíficoo Gosset, amiigo de ambos,, estaba siemppre intentandoo
F).
suavizaar los problem
mas entre elloos, sin éxito.
PDF
Es un caso
c
particulaar de la distrib
bución Gamm
ma con:
α = 1// 2
r =ν / 2
f ( χ 2 ,ν ) = C
donde:
( χ 2 )ν / 2−1
e
χ 2 /2
ν ≥1 χ2 > 0
Capítulo 3 Distribuciones de Probabilidades
C=
1
2 Γ(ν / 2)
ν /2
Se aprecia en la ecuación que esta distribución, además de χ2, depende de otra variable simbolizada
con la letra griega nu (ν), llamada grado de libertad.
Para ν < 2, la distribución tiene al eje y como asíntota vertical y al eje x como asíntota horizontal
(figura 3-63).
Para ν ≥ 2, la distribución comienza en el origen y es sesgada hacia la derecha (figura 3-63). En
cualquier caso el eje no toma valores negativos. A medida que aumentan, los grados de libertad la
distribución se hace cada vez más simétrica y si ν > 100, se puede considerar normal.
Figura 3-63
PDF Distribución chi cuadrado para ν
≥2
Verificación PDF
f ( x) > 0
∞
∫
f ( x)dx = 1
−∞
Esta última propiedad resulta como caso particular de la distribución Gamma.
92
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Distribución chi cuadrado, f(


CDF
Figura 3-64
CDF Distribución chi cuadrado
Caracterización
Reemplazando los valores particulares de los parámetros de la distribución chi cuadrado en la media
y varianza de la distribución Gamma, se obtienen:
E( χ 2 ) = ν ν > 1
V ( χ 2 ) = 2ν ν > 1
Propiedades
Suma
Si X1 y X2 son dos variables chi-cuadrado independientes con ν1 y ν2 grados de libertad, entonces la
suma de ambas es también una variable aleatoria chi-cuadrado con ν = ν1 + ν2 grados de libertad.
Cociente
Se verá en la siguiente distribución.
Relación con la distribución Normal
Si Z1, ….Zn son variables aleatorias normales independientes, entonces la variable:
n
χ 2 (ν ) = ∑ zi 2
i =1
tiene una distribución chi cuadrado con ν = n grados de libertad.
Observar que este tipo de expresiones son una forma contracta de expresar la ecuación
probabilística:
⎛ n
⎞
P( χ 2 (ν ) > χα 2 ) = P ⎜ ∑ zi 2 > a ⎟ = α
⎝ i =1
⎠
En lugar de la CDF superior podría haberse usado la CDF inferior.
Caso particular: transformación cuadrática
93
Capítulo 3 Distribuciones de Probabilidades
Si ν = 1, resulta un problema de cálculo de la PDF de la variable w = z 2 , si la PDF de la variable z
es normal.
Aplicando la relación de PDF para una transformación cuadrática (página 27), resulta:
( ) (
)
1 ⎡
1 − s /2
ϕ w + ϕ − w ⎤ = w−1/2
e
⎣
⎦
2 w
2π
Dado que Γ (1 / 2) = π (página 69), observamos que w = z 2 tiene una distribución chi cuadrado.
g ( w) =
Por lo tanto:
P( χ 2 (1) > χα 2 ) = P( z 2 > a) = α
Desarrollando la expresión del segundo miembro:
P( z 2 > a ) = P ( − a > z > a ) = α
o también:
P( z 2 > a) = P(− zα /2 > z > zα /2 ) = α
Por lo tanto:
P( χ 2 (1) > χ 2α ) = P(− zα /2 > z > zα /2 ) = α
Esta relación se resume con la expresión:
χα 2 (1) = zα / 2 2
En un lenguaje cercano al de la sintaxis del SPSS:
sig .chisq ( x ,1) = sig .norm ( sqrt ( x ), 0,1)
donde sqrt ( x) = x . Observar que la variable del eje de la función SIG de la normal es el cuadrado
de la correspondiente a la variable de la función SIG de la chi-cuadrado.
En la figura siguiente se presenta la gráfica de las PDF de estas funciones (coincidentes). La curva
de la normal converge a la de la chi-cuadrado debido al escalamiento de su eje x con
94
Jorge Carlos Carrá
x.
Ic Modelos teóricos de una variable – Distribución chi cuadrado, f(


Figura 3-65
Si en la ecuación de z se usa x , en lugar de μ:
n
χ 2 (ν ) = ∑
( x − x )2
σ2
1
=
s 2 (n − 1)
σ2
con ν = n − 1 grados de libertad.
Relación con la distribución t de Student
x −μ
t=
donde se ha usado la relación σ x =
σ
n
z
χ2
ν
=
σx
=
s2
σ2
x −μ
s
n
que se verá en la unidad 4. Esta expresión es en realidad la
definición de una distribución t de Student que será utilizada a partir del capítulo 4, para modelar la
distribución de medias en muestras pequeñas.
Aproximación a una normal
Si ν >100, la distribución χ2 se puede aproximar a una normal (con la media y desviación estándar
anteriores). Es por esta razón que las tablas de χ2 usualmente llegan solo a ν = 100.
Si χ2 se aproxima a una distribución normal, entonces s 2 =
χ 2σ 2
n −1
también, con.
⎛ s 2 (n − 1) ⎞
E(χ 2 ) = E ⎜
⎟ = n −1
2
⎝ σ
⎠
de donde:
E(s 2 ) = σ 2
Análogamente:
⎛ s 2 (n − 1) ⎞
V (χ 2 ) = V ⎜
⎟ = 2(n − 1)
2
⎝ σ
⎠
de donde:
V (s 2 ) = 2
σ4
n −1
Uso de tablas
Si se cuenta con una computadora en la cual se ha instalado SPSS o EXCEL, se podrán obtener los
valores de la distribución χ2, con las instrucciones que se encuentran en el apéndice B, en las
secciones SPSS y EXCEL. Alternativamente, aunque restringido a los valores más usuales, se puede
hacer uso de tablas, tal como las que se encuentran también en el apéndice B.
Estas tablas relacionan las 3 magnitudes: valores de eje, valores de área y grados de libertad, los
cuales se resumen en la siguiente notación, en donde α es el área de la cola superior:
χ 2α (ν )
95
Capíítulo 3 Distrib
buciones de Probabilidade
P
es
Se apreecia que, debiido a que la distribución
d
ess asimétrica y por limitacioones de espaccio, solo
devuelve algunos peercentiles. El valor máxim
mo de ν es 100
0, pues a partir de este valoor, la
N
distribuución χ2 se approxima a la Normal.
Prob
blema ressuelto 3.228 Distrib
bución χ2
Se repro
oduce en la fig
gura 3-66 parte de la tabla Chhi-cuadrado, deel Apéndice B. Esta tabla conntiene los valores
χ2 para determinadas probabilidadess de cola superrior y de gradoss de libertad ν.
En la co
olumna del maargen izquierdoo se encuentrann los grados de libertad y en la primera fila el
e valor de α de
d
cola supperior. Así porr ejemplo el vallor recuadradoo 1.64 es el valo
or χ2 corresponndiente a 6 grados de libertadd y
un α = 0.950.
F
Figura 3-66
Tabla de valores
v
chi cuaadrado
SPSS
S
IDF.C
CHISQ(0.05,
,6)=1.64
CDF.C
CHISQ(1.64,
,6)=0.0503
Nota
Para lass distribuciones χ2 y F, SPSS tiene también una sintaxis directa
d
para devvolver la cola superior:
s
sig.c
chisq(1.64,
,6)=0.946
Dis
stribu
ución F, f(F
F,ν1, ν2)
Esta diistribución se debe al estaddístico inglés sir Ronald Fiisher, por la cual lleva su innicial (propueesta
por el matemático
m
n
norteamerican
no George Sneedecor, con cuyo nombre ttambién se la asocia).
Fisher fue contempo
oráneo de Wiilliam Gosset (alias Studennt) y de Karl P
Pearson. Fue probablement
p
te
el más brillante de los miembros del cerrado ggrupo de estad
dísticos británnicos. Influyeeron
notableemente en su producción y en el desarroollo de poderrosas herramiientas metodoológicas, sus 14
1
años en
n contacto con problemas reales,
r
en unaa estación expperimental aggrícola en Herrtfordshire, a 50
5
km al norte
n
de Lond
dres.
PDF
Es un miembro
m
de la familia de distribuciones
d
s beta.
96
Jorge
e Carlos Carrrá
Ic Modelos teóricos de una variable – Distribución F, f(F, 
f ( F ,ν 1 ,ν 2 ) = CF
ν 1 /2 −1
⎛ ν1 ⎞
⎜1 + ν F ⎟
2
⎝
⎠
⎛ ν +ν ⎞
−⎜ 1 2 ⎟
⎝ 2 ⎠

ν 1 ≥ 1,ν 2 ≥ 1
donde:
ν1
Γ(ν 1 +ν 2 ) / 2) ⎛ ν 1 ⎞ 2
C=
Γ(ν 1 / 2)Γ(ν 2 / 2) ⎜⎝ ν 2 ⎟⎠
No debe confundirse el símbolo f usado para simbolizar la función densidad, del F usado para
simbolizar la variable de la distribución F.
Se aprecia en la ecuación que esta distribución, además de F, depende de otras 2 variables
simbolizadas con la letra griega nu (ν), llamadas grados de libertad. Además se observa que la
dependencia con ambos grados de libertad no es simétrica, por lo cualν1 y ν2 no pueden ser
intercambiados (ver propiedad recíproca más adelante)
Para ν1 ≤ 2, la distribución tiene al eje y como asíntota vertical y al eje x como asíntota horizontal.
Para ν1 ≥ 2, la distribución comienza en el origen y es sesgada hacia la derecha.
En cualquier caso el eje de la distribución F no toma valores negativos.
Figura 3-67
PDF Distribución F
Verificación PDF
f ( x) > 0
∞
∫
f ( x)dx = 1
−∞
Esta última propiedad no se demuestra aquí.
97
Capítulo 3 Distribuciones de Probabilidades
CDF
Figura 3-68
CDF Distribución F
Caracterización
E(F ) =
V (F ) =
ν2
ν2 − 2
, ν2 > 2
2ν 22 (ν 1 +ν 2 − 2)
, ν2 > 4
ν 1 (ν 2 − 2)2 (ν 2 − 4)
Propiedades
Relación con χ2
F (ν 1 ,ν 2 ) =
χ 2 (ν 1 ) / ν 1
χ 2 (ν 2 ) / ν 2
Recordar nuevamente que esta expresión resume una ecuación probabilística del tipo CDF.
⎛ χ 2 (ν ) / ν
⎞
P( F (ν 1 ,ν 2 ) > a) = P ⎜ 2 1 1 > b ⎟ = α
⎝ χ (ν 2 ) / ν 2
⎠
Esta relación es en realidad la definición de la distribución F que será utilizada en el capítulo 5 y es
equivalente a la siguiente, ver página 95:
F (ν 1,ν 2 ) =
s12 / s22
σ 22 / σ 22
con los grados de libertad de la PDF dados por:
ν1 = n1 − 1
ν 2 = n2 − 1
98
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Distribución F, f(F, 

Se observa que si bien la variable F puede no depender del grado de libertad, se usa la simbología
F(ν1, ν2) para expresar que la distribución de F si depende de (ν1, ν2) (ver la anterior expresión de la
PDF).
Relación con t de Student
F (1,ν ) = t (ν )2
Demostración
χ 2 (1)
z2
F (1,ν 2 ) = 2
=
=
χ (ν 2 ) / ν 2 1 n ( x − μ )2
∑
ν2 1 σ 2
2
(x − μ)
2
2
⎛ x−μ ⎞
2
=⎜
⎟ = t (ν 2 )
⎝ s ⎠
σ2
s2
σ2
También podría haberse utilizado la relación: t =
z
χ2
ν
.
En forma similar al tratamiento visto en χ2, se desarrolla la expresión del segundo miembro:
P(t 2 > a) = P(− a > t > a ) = α
o también:
P( F (1,ν ) > Fα ) = P(−tα /2 < t < tα /2 ) = α
Esta relación se resume con la expresión:
Fα (1,ν ) = tα /2 2 (ν )
Propiedad reciproca
Permite calcular los puntos porcentuales de cola izquierda a partir de una tabla de cola derecha.
FI (ν 1 ,ν 2 ) =
1
FS (ν 2 ,ν 1 )
En la figura 3-69, se puede observar el procedimiento. Para hallar el valor FI de cola inferior, se entra
con valores invertidos de los grados de libertad y se invierte el valor de F cola superior.
Por ejemplo:
a = F0.05 (ν 1 ,ν 2 ) =
1
F0.95 (ν 2 ,ν 1 )
Siendo 0.05 y 0.95, valores CDF de la distribución.
99
Capítulo 3 Distribuciones de Probabilidades
Figura 3-69
Propiedad reciproca
Uso de tablas
Si se cuenta con una computadora en la cual se ha instalado SPSS o EXCEL, se podrán obtener los
valores de la distribución F, con las instrucciones que se encuentran en el apéndice B, en las
secciones SPSS y EXCEL. Alternativamente, aunque restringido a los valores más usuales, se puede
hacer uso de tablas, tal como las que se encuentran también en el apéndice B, para determinados
valores de ν1 y ν2.
Estas tablas relacionan las 4 magnitudes: valores de eje, valores de área y los 2 grados de libertad,
los cuales se resumen en la siguiente notación, en donde α es el área de la cola superior:
Fα (ν1 ,ν 2 )
Se aprecia que, debido a que la distribución es asimétrica y por limitaciones de espacio, solo
devuelve algunos percentiles de cola superior. Afortunadamente, los de cola inferior se obtienen con
la propiedad recíproca.
Problema resuelto 3.29 Distribución F
Se reproduce en la figura 3-70 parte de la tabla F, del Apéndice B. Esta tabla contiene los valores F para
determinadas probabilidades de cola superior (α = 0.05 en este encabezamiento) y de grados de libertad ν1
(primera fila) y ν2 (primera columna). Así por ejemplo el valor recuadrado 4.12 es el valor F correspondiente a
una cola superior de 0.05, 4 grados de libertad ν1 y 7 grados de libertad ν2.
100
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Distribuciones truncadas
Figura 3-70
Tabla de valores F
SPSS
IDF.F(0.95,4,7)=4.12
CDF.F(4.12,4,7)=0.9499
Nota
Para las distribuciones χ2 y F, SPSS tiene también una sintaxis directa para devolver la cola superior:
sig.F(4.12,4,7)=0.05
Problema resuelto 3.30 Propiedad reciproca
Obtener el valor F del límite superior de una cola inferior CDF = 0.05 con grados de libertad ν1 = 10 y ν2 = 5.
Por la propiedad recíproca esto es equivalente al valor inverso del límite de cola superior 0.05 y grados de
libertad ν1 = 5 y ν2 = 10. De la tabla que se muestra en la figura 3-70, se extrae el valor
F = 3.33. Por lo tanto el valor buscado es:
F=
1
= 0.3
3.33
SPSS
IDF.F(0.05,10,5)=0.30
Estimador de Densidad Kernel, Kernel Density
Estimate, KDE.
En el capítulo 1, página kernel1, vimos los gráficos de Estimadores de Densidad Kernel, KDE,
construidos con rectángulos. Estos gráficos se corresponden con la elección de una distribución
uniforme la cual pesa todos los datos de igual forma, pero podría elegirse otra distribución. Entre
ellas podemos citar: triangular, normal o gausiana y la epanechnikov (de tipo parabólico que pesa
menos los extremos).
En el apéndice A se brinda la sintaxis para obtener varias de ellas con el SPSS.
Distribuciones truncadas
Se desea convertir una distribución PDF f ( x ) que no es cero a la derecha de un punto x = r en
otra que lo sea y se llamará distribución truncada hacia la derecha del punto r (sin considerarlo).
La expresión de su CDF se obtiene calculando la probabilidad condicional dada la probabilidad
P ( X ≤ r ) (ver figura 3-71), es decir:
F (x | x ≤ r) =
P ( X ≤ x)
x≤r
P( X ≤ r )
Por lo tanto su PDF en función de la PDF original, será:
101
Capítulo 3 Distribuciones de Probabilidades
⎧ f ( x)
⎪
f ( x | x ≤ r ) = ⎨ P( X ≤ r )
⎪0
⎩
x≤r
x>r
Figura 3-71
Análogamente, para una distribución truncada a la izquierda:
⎧ f ( x)
⎪
f ( x | x ≥ r ) = ⎨ P( X ≥ r )
⎪
⎩0
x≥r
x<r
Ejemplos
Contínua
Una PDF exponencial truncada a la izquierda de x = r , será:
f (x | x ≥ r) =
α e −α x
e −α r
Discreta
Una PDF de Poisson truncada a la derecha de x = r será:
P ( X = x) = C
e− λ λ x
x!
con:
C=
1
e− λ λ j
∑
j!
j =0
r
Por lo tanto:
P( X = i) =
λx
x!
1
r
∑
j =0
λj
x = 0,1,..., r
j!
Problema resuelto 3.31 Normal truncada a la izquierda
El tiempo de vida de un componente está normalmente distribuido Con media 4 y varianza 4. Dado que esta
variable no puede tomar valores negativos y la distribución normal asume valores positivos y negativos, no
sería válida para X < 0. Si el valor de la probabilidad para X < 0 es despreciable, el modelo puede ser válido,
pero si no lo es, se debe truncar a la PDF.
En este caso:
102
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Momentos de orden n
⎛0−4⎞
P ( X < 0) = Φ ⎜
⎟ = Φ ( −2) = 0.023
⎝ 2 ⎠
Con este valor, el modelo sin truncar no es muy preciso, por lo tanto debemos truncar a la izquierda de X = 0,
resultando:
1
1⎛ x−4⎞
exp − ⎜
⎟
2⎝ 2 ⎠
f ( x) = 2 2π
Φ (2)
2
Momentos de orden n
Los momentos de orden n vistos en el capítulo 1 (página momentosr), se generalizan tanto a
variables discretas como contínuas. En las siguientes ecuaciones, la expresión con sumatoria
corresponde a variables discretas y la expresión con integral a variables contínuas.
Naturales
∞
∞
−∞
−∞
a1 = E ( X ) = ∑ xp =
∞
∫ xf ( x)dx = μ
a2 = E ( X ) = ∑ x p =
2
2
−∞
∞
an = E ( X ) = ∑ x p =
n
n
−∞
Centrados
∞
∫x
2
∞
−∞
∞
−∞
−∞
c1 = E ( X − μ ) = ∑ ( x − μ ) p =
∞
∫ ( x − μ ) f ( x)dx = 0
f ( x)dx c2 = E ( X − μ ) = ∑ ( x − μ ) p =
2
2
−∞
−∞
∫x
∞
∞
n
f ( x)dx cn = E ( X − μ ) = ∑ ( x − μ ) p =
n
n
−∞
∞
∫ (x − μ)
2
f ( x)dx = σ 2
−∞
∞
∫ (x − μ)
n
f ( x)dx
−∞
Función generadora de momentos, MGF
m(t)
Muchas distribuciones de probabilidades distintas tienen la misma media y varianza, pero si dos
distribuciones tienen todos los momentos de orden n iguales (capítulo 1, página momentosr y
sección anterior), entonces se puede demostrar que ambas distribuciones son idénticas.
Se puede definir una función que contiene todos los momentos naturales de una distribución y por
esta razón se llama Función Generadora de Momentos o MGF (Moment Generator Function), MX(t).
Si la variable es discreta demostraremos que es:
∞
M X (t ) = E (etx ) = ∑ etx p ( x)
−∞
Si la variable es contínua demostraremos que es:
∞
M X (t ) = E (etx ) =
∫e
tx
f ( x)dx
−∞
Puede observarse que la MGF es simplemente el valor esperado de e tx .
103
Capítulo 3 Distribuciones de Probabilidades
La notación M X (t ) expresa la dependencia con X y prepara la expresión para cuando se consideren
2 o más variables (como regla nemotécnica, del exponente de e tx , el valor t pasa al paréntesis de M y
el valor x al subíndice).
Demostración
Desarrollaremos (Mc Laurin) tanto el primer miembro como el segundo y luego identificaremos
ambas resultados.
1 Desarrollo del segundo miembro
La expansión en series de e tx (desarrollo de Mc Laurin) es:
etx = 1 + tx +
(tx) 2 (tx)3
+
+ ...
2!
3!
Realizaremos la demostración para una variable discreta (la de variable contínua es idéntica).
∞
∞
⎡
⎤
(tx) 2 (tx)3
+
+ ...⎥ p( x)
M X (t ) = E (etx ) = ∑ etx p( x) = ∑ ⎢1 + tx +
2!
3!
−∞
−∞ ⎣
⎦
Si los momentos ai son finitos se pueden intercambiar las sumatorias:
∞
∞
−∞
−∞
= ∑ p( x) + t ∑ xp( x) +
t2 ∞ 2
t3 ∞ 3
x
p
(
x
)
+
∑
∑ x p( x) + ...
2! −∞
3! −∞
Finalmente:
M X (t ) = 1 + ta1 +
t2
t3
a2 + a3 + ...
2!
3!
2 Desarrollo del primer miembro
El desarrollo de Mc Laurin de la función MX(t) es:
M X (t ) = M X (0) + M X '(0)t + M X ''(0)
t2
t3
+ M X '''(0) + ...
2!
3!
Es decir:
M X (t ) = 1 + M X '(0)t + M X ''(0)
t2
t3
+ M X '''(0) + ...
2!
3!
3 Identificación
Comparando ambos desarrollos, resulta:
a1 = E ( X ) = M X '(0)
a2 = E ( X 2 ) = M X ''(0)
a3 = E ( X 3 ) = M X '''(0)
...
ak = E ( X k ) = M X k (0)
Nota
Los momentos centrados se pueden obtener de los naturales aplicando la propiedad de transformación
lineal que se verá luego.
104
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Función generadora de momentos, MGF m(t)
Problema resuelto 3.32 Obtención de MX(t)
Hallar la MGF de las siguientes distribuciones: binomial, geométrica, uniforme, gamma, exponencial y
normal.
a) Binomial
n
n
x
⎛n⎞
⎛n⎞
M X (t ) = ∑ etx ⎜ ⎟ p x q n − x = ∑ ⎜ ⎟ ( pet ) q n − x
x =0
x =0 ⎝ x ⎠
⎝ x⎠
M X (t ) = ( pet + q )
n
Verificar las ecuaciones de la media y de la varianza.
Media
M X '(t ) = n ( pet + q )
n −1
pet
μ = M X '(0) = np
Varianza
Y = X −μ
V ( X ) = E (Y ) 2
Si bien la propiedad de transformación lineal se verá en el punto siguiente, se puede operar constructivamente:
M Y (t ) = E (e yt ) = E (e xt − μt ) = e− μt E (e xt ) = e − μt M X (t ) = e− μt ( pet + q )
n
Hallando la primera derivada en t y luego la segunda, se obtiene (la expresión pe + q se reemplaza por (.) :
t
M Y ''(t ) = μ 2 e − μt − μ e − μ t n(.) n −1 et + pet (1− μ ) (1 − μ ) n(.) n −1 + pet (1− μ ) n(n − 1)(.) n − 2 pet
Reemplazando t = 0 , q = 1 − p y simplificando, resulta:
V (Y ) = M Y ''(0) = npq
b) Geométrica
n
M X (t ) = ∑ etx q x −1 p =
x =0
x
p n
qet )
(
∑
q x=0
La suma de la serie es una serie geométrica y si restringimos los valores de t tal que
por lo tanto:
M X (t ) =
o < qet < 1 , converge y
p qet
q 1 − qet
M X (t ) =
pet
1 − qet
c) Poisson
∞
λ et )
(
e− λ λ x
−λ
M X (t ) = ∑ e
=e ∑
x!
x!
x =0
x =0
y
De la expansión en series de e , resulta.
∞
x
tx
105
Capítulo 3 Distribuciones de Probabilidades
= e − λ eλ e
t
M X (t ) = e
(
)
λ et −1
d) Uniforme
b
etx
dx
b−a
a
M X (t ) = ∫
1
ebt − e at )
(
t (b − a )
M X (t ) =
t≠0
e) Gamma
∞
α
−α x
tx
∫ e (α x ) e dx =
r −1
αr
∞
Γ(r ) ∫0
Haciendo el cambio de variable u = x (α − 1)
M X (t ) =
Γ( r ) 0
x r −1e − x (α −t ) dx
∞
⎛ α ⎞ 1
r −1 − u
=⎜
⎟
∫ u e du
⎝ α − t ⎠ Γ(r ) 0
r
∞
αr
⎛ u ⎞
⎜
⎟
∫
(α − t )Γ(r ) 0 ⎝ α − t ⎠
como la integral es Γ ( r ) ,
M X (t ) =
r −1
e −u du
⎛ α ⎞
M X (t ) = ⎜
⎟
⎝α −t ⎠
r
f) Exponencial
Es un caso especial de la Gamma con r = 1 .
M X (t ) =
α
α −t
t <α
g) Chi cuadrado
Es un caso particular de la distribución Gamma con
α = 1/ 2 y r = ν / 2 . Por lo tanto.
M X (t ) = (1 − 2t ) −ν / 2
h) Normal
1 N (0,1)
∞
M Z (t ) =
tz
∫e
−∞
1 − z2 / 2
1
e
dz =
2π
2π
∞
∫e
tz − z 2 / 2
dz
−∞
completando cuadrados;
=
106
1
2π
∞
∫e
(
− z / 2 −t / 2
)
2
+t 2 / 2
dz
−∞
Jorge Carlos Carrá
Ic Modelos teóricos de una variable – Función generadora de momentos, MGF m(t)
2
et /2
=
2π
∞
∫
2
2e
−u 2
−∞
et / 2
du =
2π
2 π = et
2
/2
M Z (t ) = e t
2
/2
2 N (μ ,σ )
Si bien la propiedad de transformación lineal se verá en el punto siguiente, se puede operar constructivamente:
Y = μ +σ Z
Por lo tanto:
M Y (t ) = E (e yt ) = E (e μt +σ Zt ) = e μt E (eσ Zt ) = e μt M Z (σ t ) = e μt eσ
M Y (t ) = e μt eσ
2 2
t /2
2 2
t /2
M Y (t ) = e μt eσ
2 2
t /2
Propiedades de la MGF
Unicidad
Si una distribución de probabilidades f(x) tiene una MX(t), ésta es única.
Este teorema que adoptamos sin demostración, demuestra la afirmación realizada al principio en el
sentido de que si dos distribuciones tienen los todos sus momentos iguales, es decir sus MX(t)
iguales, entonces ambas distribuciones son idénticas.
Esta conclusión será utilizada en el capítulo 4 para demostrar el Teorema Central del Límite, TCL.
1 Variable: Transformación lineal
Y = aX + b
aX + b t
M Y (t ) = E (e( ) )) = ebt E (eatX )
M Y (t ) = ebt M X ( at )
La traslación b aparece como parte del exponente de coeficiente exponencial y el cambio de escala
a como parte de la variable dentro del paréntesis.
>1 Variables: Suma + independencia
Se demuestra para 2 variables pero se extiende a más de 2.
Z = X +Y
M Z (t ) = E (e Zt ) = E ( e( X +Y )t ) = E ( e Xt eYt )
si además X e Y son independientes,
= E (e Xt ) E (eYt ) = M X (t ) + M Y (t )
M Z (t ) = M X (t ) + M Y (t )
>1 Variables: Propiedad reproductiva (algunas distribuciones)
Algunas distribuciones poseen la siguiente propiedad: la distribución de la suma es del mismo tipo
que la de los sumandos.
107
Capítulo 3 Distribuciones de Probabilidades
Poisson independientes
(
)
(
)
λ et −1
M X (t ) = e 1
M Y (t ) = e
λ2 et −1
Por lo tanto:
M Z (t ) = M X (t ) M Y (t ) = e
(
)
( λ1 + λ2 ) et −1
Esta es la MGF de una distribución de Poisson con parámetro
Se demuestra para 2 variables pero se extiende a más de 2.
λ1 + λ2 .
Normal independientes
M z (t ) = M X (t ) M Y (t ) = exp( μ1t + σ 12t 2 / 2) exp( μ 2t + σ 2 2t 2 / 2)
= exp ( ( μ1 + μ 2 )t + (σ 12 + σ 2 2 )t 2 / 2 )
Esta es la MGF de una distribución normal con media μ1 + μ2 y varianza σ 12 + σ 2 2 .
Se demuestra para 2 variables pero se extiende a más de 2.
Chi cuadrado independientes
M Z (t ) = M X (t ) M Y (t ) = (1 − 2t ) − (ν1 +ν 2 )/ 2
Se demuestra para 2 variables pero se extiende a más de 2.
Exponencial independientes
Esta distribución no tiene la propiedad reproductiva pero tiene una similar:
Si r distribuciones exponenciales tienen el mismo parámetro α, la distribución suma tiene una
distribución Gamma con parámetros α y r.
Esto es así pues:
⎛ α ⎞
M Z (t ) = ⎜
⎟
⎝α −t ⎠
r
Corolario
Dada la distribución Z anterior, la variable aleatoria W = 2α Z tiene una distribución chi cuadrado
con ν = 2r.
−2 r /2
⎛ α ⎞
M W (t ) = M Z (2α t ) = ⎜
⎟ = (1 − 2α t )
⎝ α − 2α t ⎠
Esta es una distribución chi cuadrado con ν = 2r grados de libertad.
r
Este corolario brinda una forma de calcular una distribución Gamma con una distribución chi
cuadrado.
Así por ejemplo P ( Z ≤ 4) = P (2α Z ≤ 8α ) . Esta última se calcula como una distribución chi
cuadrado (dados α y r) de W = 2α z y ν = 2r .
Por ejemplo, si r = 3 y α = 4:
CDF.GAMMA(1,r,α)=CDF.GAMMA(1,3,4)=CDF.CHISQ(2(1)(4),2(3))=CDF.CHISQ(8,6)=0.762.
108
Jorge Carlos Carrá
IIa Dos variables – 1. Métodos tabulares y gráficos
IIa Dos variables
En esta sección y la siguiente, la variable en estudio es de tipo vectorial, llamado vector aleatorio:
G
Y = (Y1 , Y2 ,...Yk )
Se tratará esencialmente el caso de 2 variables, pero el tratamiento es extensivo al caso
multivariable.
1. Métodos tabulares y gráficos
Sean X e Y con funciones de distribución contínuas, F1(x) y F2(y) y funciones densidad, f1(x) y f2(y)
(resultará más práctico usar, para la variable independiente, la notación con paréntesis en lugar de
subíndices).
a Variables discretas
Son las expresiones vistas en el capítulo 1 (2 variables), cambiando la frecuencia relativa por la
probabilidad p.
PF
Se define la probabilidad conjunta (llamada también PF, Probability Function o PDF, Probability
Density Function) como:
p ( x, y ) = P ( X = x, Y = y )
CDF
Se define la probabilidad acumulativa conjunta como:
F ( x, y ) = P ( X ≤ x, Y ≤ y )
Siendo:
a
b
P ( X ≤ a, Y ≤ b) = ∑∑ p ( x, y )
−∞ −∞
109
Capítulo 3 Distribuciones de Probabilidades
PF marginales
p1 ( x) = ∑ p( x, y )
x2
p2 ( y ) = ∑ p( x, y )
x1
PF condicionales
p ( x, y )
p2 ( y )
p ( x, y )
p2 ( y | x ) =
p1 ( x)
p1 ( x | y ) =
Independencia
X e Y se dicen independientes si:
p1 ( x | y) = p1 ( x)
p2 ( y | x) = p2 ( y)
Combinando las ecuaciones anteriores, se obtiene la condición de independencia:
p( x, y) = p1 ( x) p2 ( y)
b Variables contínuas
Las funciones conjuntas se simbolizarán como F(x,y) y f(x,y), las cuales se definen a continuación, a
partir de sus correspondientes categóricas.
CDF
Como ya adelantamos en el capítulo 1, las expresiones para variables categóricas se generalizan
informalmente a variables de escala, cambiando:
la frecuencia relativa fx por fdx
la frecuencia relativa conjunta fxy por f(x,y)dxdy
y las sumatorias por integrales.
F ( x, y) = P( X ≤ x, Y ≤ y) = ∫
x
∫
y
−∞ −∞
f ( x, y)dxdy
PDF
La vinculación entre una función PDF y su correspondiente CDF, se obtendrá derivando la expresión
de F ( x, y ) , primero con respecto de x y luego respecto de y, recordando la regla de derivación de
una función integral (integral definida que depende de su límite superior).
f ( x, y ) =
110
∂∂F ( x, y )
∂x∂y
Jorge Carlos Carrá
IIa Dos variables – 2. Métodos numéricos
Probabilidad de masas
Al igual que para una variable, página 16, resulta útil la analogía que surge de considerar a la
función densidad como una densidad superficial de masa en el plano xy. Con esta interpretación la
función densidad sería el volumen entre la superficie y el plano xy. En particular si la PDF es
constante (distribución uniforme) de valor c y el área en el plano xy es A, la constante deberá ser
1/ A.
PDF marginales
f1 ( x) = ∫
∞
−∞
f ( x, y )dy
Si se representa la PDF bivariable en 3D (con la función densidad en el eje vertical), se puede
visualizar este resultado asimilándolo al caso discreto visto en el capítulo 1, discretizando la gráfica
en un diagrama de barras elementales y acumulando las probabilidades de f ( x, y ) (tabla de
contingencias con celdas elementales en el plano x-y) a lo largo de líneas paralelas al eje y.
Análogamente:
f2 ( y) = ∫
∞
−∞
f ( x, y )dx
PDF condicionales
f ( x, y )
f2 ( y)
f ( x, y )
f 2 ( y | x) =
f1 ( x )
f1 ( x | y ) =
La visualización de estas fórmulas con una tabla de contingencias se realiza en forma similar al de
las PDF marginales.
Independencia
X e Y se dicen independientes si:
f1 ( x | y) = f1 ( x)
f 2 ( y | x) = f 2 ( y )
Combinando las ecuaciones anteriores, se obtiene la condición de independencia:
f ( x, y) = f1 ( x) f 2 ( y)
Esta ecuación es equivalente a:
F ( x, y) = F1 ( x) F2 ( y)
2. Métodos numéricos
A menos que se exprese específicamente, las expresiones que se enumeran a continuación son
genéricas y deberán ser calculadas con la expresión discreta o contínua según corresponda.
Adicionalmente, se recuerda que las expresiones para variables cuantitativas discretas son las
mismas que para variables cuantitativas contínuas cambiando las sumatorias por integrales y la
probabilidad p ( xy ) por f ( xy ) dxdy .
111
Capítulo 3 Distribuciones de Probabilidades
Medidas de posición
Vector esperanza
Como la variable aleatoria es vectorial, la esperanza también. Es el vector esperanza de las
distribuciones marginales.
( E ( X ), E (Y ))
Este vector, tal como se indicó en el capítulo 1, se corresponde con las coordenadas del centro de
gravedad, en este caso, de la nube de puntos.
Esperanza conjunta
Como ya vimos en el capítulo 1, página E2var1, se puede calcular como:
Discretas
E ( XY ) = ∑∑ pxy XY
x
y
Contínuas
+∞ +∞
E ( XY ) =
∫ ∫ xyf ( x, y)dxdy
−∞ −∞
Esperanza condicional
Discretas
E ( X | y ) = ∑ xi p ( xi | yi )
i
La interpretación es directa. Es simplemente la media de la distribución condicional p( xi | yi ) .
Observar que E ( X | y ) depende de y, por lo tanto es una variable aleatoria. La notación indica
estrictamente hablando, el valor de la variable aleatoria E ( X | Y ) .
Contínuas
∞
E ( X | y ) = ∫ xf ( x | y ) dx
−∞
Medidas de dispersión
Vector varianza
Al igual que las de posición, como la variable aleatoria es vectorial, la varianza también los es. Es el
vector varianza de las distribuciones marginales.
(V ( X ), V (Y ))
.
Como ya vimos en el capítulo 1, página Steiner1, se puede calcular como:
V (X ) =
112
SS xx
=
N
∑X
2
− Nμ2
N
= E( X 2 ) − ( E( X ))
2
Jorge Carlos Carrá
IIa Dos variables – Medidas de asociación
Varianza conjunta
La varianza conjunta es la covarianza y se desarrollará en la próxima sección.
Varianza condicional
Var (Y | X ) = E ⎡⎣(Y − E (Y | X )) 2 | X ⎤⎦
En otras palabras es la misma definición general de varianza aplicada a la distribución condicional
con X conocido (observar que todas las esperanzas son condicionales).
Medidas de asociación
La extensión de las expresiones del capítulo 1 es análoga a la de las medidas de posición.
Covarianza
Discretas
Cov( XY ) = ∑∑ pxy Δ x Δ y
x
y
Contínuas
+∞ +∞
Cov( XY ) =
∫ ∫ΔΔ
x
y
f ( x, y )dxdy
−∞ −∞
Como ya vimos en el capítulo 1, página Steiner2var1, se puede calcular como:
Cov( X , Y ) =
SS xy
N
= E ( XY ) − E ( X ) E (Y )
Correlación lineal
Cov( X , Y )
Sx S y
Si se multiplica numerador y denominador por N , se obtiene una expresión en función de los SS:
ρ=
ρ=
SS xy
SS xx SS yy
Si se aplica a variables de escala, se obtiene el coeficiente de correlación de Pearson, en cambio si
las variables son ordinales (por ejemplo tomando los rangos o posiciones ordenadas de una variable
de escala, a los que llamaremos RX y RY), se obtiene el coeficiente de correlación de Spearman.
Matriz Covarianzas, P
Al igual que en la unidad 1, página SSCP1, se presentan todos los resultados de varianzas y
covarianzas en el formato de matriz, P, como en la siguiente figura.
Varxx
Covyx
Covxy
Varyy
113
Capítulo 3 Distribuciones de Probabilidades
Figura 3-72
Matriz de correlaciones, R
La matriz de correlación R, contiene las correlaciones:
rij =
Cov(Yi , Y j )
sii s jj
Por lo tanto los elementos de la diagonal principal serán 1 y los restantes se calculan tomando de la
matriz de covarianzas, el valor de la celda en cuestión, dividiéndolo por la raíz cuadrada del
producto de los 2 valores de la diagonal principal que intersectan la celda en cuestión.
Problema resuelto 3.33. Género de los hijos
En una comunidad, 15% de las familias no tienen hijos, 20% tienen 1, 35% tienen 2 y 30% tienen 3. Suponer
que el nacimiento de varón es independiente de mujer. Una familia es elegida al azar, V es el número de hijos
Varones, M es el número de hijos Mujeres. a) Construir la TC de las variables V y M, b) Hallar la probabilidad
de que esa familia tenga 1 V sabiendo que tiene 1 M, c) obtener la distribución condicional dada M = 2, d)
hallar la E(V|M=2).
a) TC
p(x,y)
V
0
1
2
3
Total
0
0.15
0.10
0.0875
0.0375
0.375
1
0.10
0.175
0.1125
0
0.3875
M
2
0.0875
0.1125
0
0
0.20
3
0.0375
0
0
0
0.0375
Total
0.375
0.3875
0.20
0.0375
1
Figura 3-73
Estos valores surgen de construir el árbol de probabilidades condicionales.
P(V = 0, M = 0) = P( No hijos) = 0.15
P(V = 0, M = 1) = P(1H ) P(1M |1H ) = 0.20(0.5) = 0.10
P(V = 0, M = 2) = P(2 H ) P(2M | 2 H ) = 0.35(0.5)(0.5) = 0.0875
P(V = 1, M = 2) = P(3H ) P((2M ,1H ) | 3H ) = 0.30(0.5)2 (0.5) P3(2,1) = 0.1125
El resto del árbol se deja al lector.
b)
P (1V |1M ) =
0.175
= 0.452
0.3875
c)
Es simplemente el perfil columna de M = 2.
V
E(V|M=2)
0
0.4375
1
0.5625
2
0
Figura 3-74
d)
E (V | M = 2) = 0(0.4375) + 1(0.5625) = 0.5625
114
Jorge Carlos Carrá
3
0
Total
1
IIa Dos variables – Medidas de asociación
Problema resuelto 3.34. Demanda diaria
La siguiente PF representa la demanda diaria de dos determinados productos. a) Construir la distribución para
todos los valores de las variables, b) expresar las funciones marginales, c) obtener las medias y varianzas de las
marginales y la media conjunta, d) hallara la media condicional de x1 = 3, e) hallar la covarianza, la correlación
y decidir si las variables son independientes.
f ( x1 , x2 ) =
1
( x12 − x2 ) x1 = 2,3 x2 = 1, 2
20
a)
f(x1,x2)
2
3/20
2/20
5/20
1
2
Total
x2
x1
3
8/20
7/20
15/20
Total
11/20
9/20
1
Figura 3-75
b)
f x1 = ( 5 / 20, 15 / 20 )
f x2 = (11/ 20, 9 / 20 )
c)
E ( x1 ) = 2(5 / 20) + 3(15 / 20) = 2.75
E ( x2 ) = 1(11/ 20) + 2(9 / 20) = 1.45
V ( x1 ) = E ( x12 ) − ( E ( x1 ) ) = 0.187
2
V ( x2 ) = E ( x2 2 ) − ( E ( x2 ) ) = 0.247
2
E ( x1 , x2 ) = 2(1)(3 / 20) + 3(1)(8 / 20) + 2(2)(2 / 20) + 2(3)(7 / 20) = 4
d)
⎛ 8 / 20 ⎞
⎛ 7 / 20 ⎞
E ( x2 | x1 = 3) = 1⎜
⎟ + 2⎜
⎟ = 1.467
⎝ 15 / 20 ⎠
⎝ 15 / 20 ⎠
e)
Cov( x1 , x2 ) = E ( x1 , x2 ) − E ( x1 ) E ( x2 ) = 4 − (2.75)(1.45) = 0.0125
También podría calcularse en forma análoga a la esperanza
E ( x1 , x2 ) , celda por celda reemplazando las
variables por sus desviaciones.
ρ=
Cov( x1 , x2 )
0.0125
=
= 0.058
σ ( x1 )σ ( x2 ) 0.432(0.497)
La covarianza no es cero (o equivalentemente,
E ( x1 , x2 ) ≠ E ( x1 ) E ( x2 ) ), por lo tanto las variables son
dependientes. Observar que se trata de una magnitud poblacional, por lo tanto es un modelo teórico exacto y
entonces cualquier valor distinto de 0 (aunque sea pequeño), indica dependencia.
115
Capítulo 3 Distribuciones de Probabilidades
Problema resuelto 3.35. Tiempo de vida de 2 dispositivos
electrónicos
La siguiente función densidad conjunta representa el tiempo de vida de dos dispositivos electrónicos.
a) Obtener P(X > 1, Y < 1), b) P(X < Y), c) P(X < a), d) f(x|y), e) E(X|y), f) Cov(x,y) y ρ, g) E(XY), E(X) y
E(Y).
⎧2e− x e −2 y 0 < x < ∞, 0 < y < ∞
f ( x, y ) = ⎨
en otro punto
⎩0
a)
1∞
P( X > 1, Y < 1) = ∫ ∫ 2e− x e−2 y dxdy
0 1
1
= ∫ 2e−2 y |-e− x |1∞ dy = e−1 (1 − e−2 )
0
b)
Construir un diagrama para observar la región de integración.
P( X < Y ) =
∫∫ 2e
− x −2 y
e
dxdy
x< y
∞ y
= ∫ ∫ 2e − x e−2 y dxdy
0 0
∞
= ∫ 2e−2 y (1 − e− y ) dy = 1 − 2 / 3 = 1/ 3
0
c)
Construir un diagrama para observar la región de integración.
a∞
P( X < a) = ∫ ∫ 2e− x e−2 y dydx
0 0
a
= ∫ e− x dx = 1 − e− a
0
d)
Para las restantes preguntas es conveniente calcular previamente las distribuciones marginales.
∞
∞
0
0
f1 ( x) = ∫ 2e − x e −2 y dy = e− x ∫ 2e −2 y dy =e − x
∞
∞
0
0
f 2 ( y ) = ∫ 2e− x e −2 y dx = 2e −2 y ∫ e− x dx =2e −2 y
Observar que:
f ( x, y ) = f1 ( x) f 2 ( y )
por lo cual las variables son independientes.
f1 ( x | y ) =
f ( x , y ) 2 e − x e −2 y
=
= e− x
−2 y
2e
f2 ( y)
lo cual no extraña pues al ser independientes, f ( x | y ) = f ( x ) .
e)
116
Jorge Carlos Carrá
IIa Dos variables – Medidas de asociación
∞
∞
∞
0
0
0
E ( X | y ) = ∫ xf1 ( x | y ) dx = ∫ xe − x dx = − xe − x
− e− x
∞
=1
0
f)
Por ser independientes la covarianza debe ser 0 y por lo tanto también la correlación.
g)
∞
∞
0
0
E ( X ) = ∫ xf1 ( x)dx = ∫ xe dx = − xe
−x
−x ∞
0
∞
x
+ ∫ e dx = − x
e
0
∞
−x
0
∞
+ ∫ e − x dx = 1
0
Análogamente:
∞
∞
0
0
E (Y ) = ∫ yf 2 ( y )dy = ∫ y 2e−2 y dy = 0.5
E(XY) se podrá calcular con su expresión, pero como por independencia la covarianza debe ser 0,
Cov ( X , Y ) = E ( X , Y ) − E ( X ) E (Y ) , EXY) deberá ser 0.5. Verificar entonces que:
∞∞
E ( XY ) = ∫ ∫ xy 2e− x e−2 y dxdy = 0.5
0 0
117
Capítulo 3 Distribuciones de Probabilidades
IIb Funciones de variables
aleatorias (dos variables)
El problema es similar al caso de una variable, página 25. Se conoce la distribución de probabilidad
conjunta de dos v.a. f ( x1 , x2 ) y se desea la distribución de probabilidad conjunta g ( y1 , y2 ) de otras
dos variables Y, relacionadas con X a través de:
⎧Y1 = H1 ( X 1 , X 2 )
⎨
⎩Y2 = H 2 ( X 1 , X 2 )
Este es el objetivo de esta sección.
Métodos
Se presentan los mismos tres métodos vistos en el caso de una variable. Se divide el desarrollo,
según sea una variable discreta o contínua.
1 Caso discreto
Se tiene un solo método.
Método de la PF
g ( y1 , y2 ) = P(Y1 = y1 , Y2 = y2 ) = P( X1 = x1 , X 2 = x2 ) = f ( x1 , x2 )
Dado que la distribución no cambia, solo habrá que agrupar las probabilidades para los valores de y
coincidentes.
Problema resuelto 3.36 Defectuosos en 2 líneas de producción
La siguiente es una distribución bidimensional discreta de dos variables independientes, x1 y x2, representando
el número de artículos defectuosos en 2 líneas de producción. Obtener la distribución de
x1
p(x1)
1
0.2
2
0.6
3
0.2
x2
p(x2)
1
0.5
2
0.2
3
0.3
Figura 3-76
118
Jorge Carlos Carrá
y1 = x1 + x2
IIb Funciones de variables aleatorias (dos variables) – Métodos
Método de la PF
La siguiente tabla muestra la distribución de y1. La obtención de los mismos puede facilitarse dibujando en un
sistema de ejes los puntos (x1, x2) y en cada intersección el valor de y1.
Así por ejemplo:
P( y1 = 3) = P( x1 = 2) P( x2 = 1) + P( x1 = 1) P( x2 = 2) = 0.34
y1
p(y1)
2
0.1
3
0.34
4
0.28
5
0.22
6
0.06
Figura 3-77
2 Caso contínuo
Métodos generales:
1. Método de la CDF
2. Método de la PDF
3. Método de la MGF
Solo veremos los 2 primeros, válidos para funciones H uno a uno.
Método de la CDF
Las funciones de transformación son uno a uno y por lo tanto admiten inversa. Además este método
se aplicará solo al caso de una sola función de transformación H y por lo tanto al caso en que se
desea obtener la FDP de una sola variable.
Se obtiene esa CDF, integrando la PDF original en una región de integración RX, pues:
G( y1 ) = P(Y1 ≤ y1 ) = P( X 1 , X 2 ∈ RX1 , RX 2 ) = ∫∫ f ( x1 , x2 )dx1dx2
RX
Paso 1 Dominio de las x en función de las y
Encontrar la región de integración de las X en función de la Y1.
Analítico
La función de transformación se expresa en general:
Y1 = H1 ( X 1 , X 2 )
En el plano ( X 1 , X 2 ) se debe establecer la región Y1 ≤ y1 .
Numérico
Lo anterior solo se cumplirá en el dominio de las X (con la PDF).
Para expresar la PDF de la Y1, es necesario hallar su dominio numérico (con la H).
Paso 2 integrar la PDF en ese dominio
Para obtener la CDF, G( y1 , y2 ) , se debe resolver la integral de f ( x1 , x2 ) en la región obtenida del
paso 1.
Luego se podrá obtener la PDF, g ( y1 , y2 ) , derivando G( y1 , y2 ) .
119
Capítulo 3 Distribuciones de Probabilidades
Problema resuelto 3.37 Transformación suma
Dada la siguiente PDF en
X1 , X 2 y la transformación Y1 = H ( X1 , X 2 ) , hallar la PDF en Y1.
0 ≤ x1 ≤ 1 0 ≤ x2 ≤ 1
⎧1
f ( x1 , x2 ) = ⎨
⎩0
y1 = x1 + x2
en otro punto
Método de la CDF
Se debe calcular la integral correspondiente a:
G1 ( y1 ) = P(Y1 ≤ y1 ) ,
G1 ( y1 ) = P (Y1 ≤ y1 ) = P ( X 1 + X 2 ≤ y1 ) = ∫∫ f ( x1 , x2 ) dx1dx2
RX
Paso 1 Dominio de las x en función de las y
Analítico
El dominio de la PDF es el cuadrado unitario que se muestra en la siguiente figura. Los puntos que implican la
región RX =
x1 + x2 ≤ y1 , se muestran sombreados en la misma figura. La línea de la igualdad tiene pendiente
–1.
Numérico
Vinculando el dominio de
f ( x1 , x2 ) con la región x1 + x2 ≤ y1 , se obtiene que y1 puede tomar cualquier
valor en el intervalo : 0 ≤ y1 ≤ 2 . Observando ahora la figura siguiente se concluye que la integración cambia
según sea 0 ≤ y1 ≤ 1 o 1 ≤ y1 ≤ 2 .
Figura 3-78
Paso 2 Integrar la PDF en ese dominio
G1 ( y1 ) =
∫∫
f ( x1 , x2 ) dx1dx2
x1 + x2 ≤ y1
Región
0 ≤ y1 ≤ 1
Este caso se presenta en la figura siguiente.
Los límites de integración, en el orden x1 y luego de x2, se obtienen (para y1 = constante), de la siguiente
forma:
• Para x1: límites del segmento horizontal con trazo grueso dibujado sobre el área en cuestión.
120
Jorge Carlos Carrá
IIb Funciones de variables aleatorias (dos variables) – Métodos
•
Para x2: límites de la proyección, (segmento con trazo grueso), del área sobre el eje x2.
Figura 3-79
y1
G1 ( y1 ) = ∫ ∫
0
0
Región
y1 − x2
1dx1dx2 =
2
1
y
2
1 ≤ y1 ≤ 2
Este caso corresponde a la figura inicial. Se observa que es preferible integrar el complemento en lugar de la
región sombreada. Los límites de integración en el orden x1 y luego x2, se muestran con segmentos de trazo
grueso.
G ( y1 ) = −
1
⎡
x2 2 ⎤
=
−
−
+
1
1
(1
)
dx
dx
y
x
1
2
⎢
∫ ∫y1 − x2 1 2
2 ⎥⎦ y −1
⎣
y1 −1
1
1
G ( y1 ) = 1 −
1
y12
+ 2 y1 − 1
2
En definitiva:
y1 < 0
⎧0
⎪ 2
⎪ y1
0 ≤ y1 ≤ 1
⎪ 2
G1 ( y1 ) = ⎨
2
⎪− y1 + 2 y − 1 1 ≤ y ≤ 2
1
1
⎪ 2
⎪
y1 > 2
⎩1
Se observa que ambos volúmenes podrían haberse obtenido de la geometría elemental (las bases son el área de
un triángulo y el área de un cuadrado menos el área de un triángulo, respectivamente).
Finalmente:
0 ≤ y1 ≤ 1
⎧ y1
g1 ( y1 ) = ⎨
⎩2 − y1 1 ≤ y1 ≤ 2
Método de la PDF
Continuando con el desarrollo anterior, pero para dos funciones de transformación H, la cual se
expresa en general:
121
Capítulo 3 Distribuciones de Probabilidades
⎧Y1 = H1 ( X 1 , X 2 )
⎨
⎩Y2 = H 2 ( X 1 , X 2 )
Resolviendo el sistema (debe ser una relación biunívoca), surgen las funciones M1 y M2.
⎧ X 1 = M 1 (Y1 , Y2 )
⎨
⎩ X 2 = M 2 (Y1 , Y2 )
Se obtiene la CDF de la Y, integrando la PDF original en una región de integración RX:
G ( y1 , y2 ) = P (Y1 ≤ y1 , Y2 ≤ y2 ) = P ( X 1 , X 2 ∈ RX1 , RX 2 ) = ∫∫ f ( x1 , x2 )dx1dx2
RX
Si la relaciones H son biunívocas (uno a uno), se puede utilizar la conocida relación de contenidos
que se estudia en análisis matemático (involucra al valor absoluto del jacobiano de la transformación
(el cual es un determinante):
⎛ x ,x ⎞
dx1dx2 = J ⎜ 1 2 ⎟ dy1dy2
⎝ y1 , y2 ⎠
se obtiene:
⎛ x ,x ⎞
G ( y1 , y2 ) = ∫∫ f ( x1 , x2 )dx1dx2 = ∫∫ f ( x1 , x2 ) J ⎜ 1 2 ⎟ y1dy2
⎝ y1 , y2 ⎠
RX
RX
Finalmente:
⎛ x ,x ⎞
g ( y1 , y2 ) = f ( x1 , x2 ) J ⎜ 1 2 ⎟
⎝ y1 , y2 ⎠
Esta ecuación es la equivalente del caso univariable: g ( y ) = f ( x ) x '
Dada la relación uno a uno, se verifica además que:
−1
⎛ x , x ⎞ ⎛ ⎛ y , y ⎞⎞
J ⎜ 1 2 ⎟ = ⎜⎜ J ⎜ 1 2 ⎟ ⎟⎟ = J H −1
⎝ y1 , y2 ⎠ ⎝ ⎝ x1 , x2 ⎠ ⎠
De esta forma se puede expresar alternativamente:
g ( y1 , y2 ) = f ( x1 , x2 ) J H −1
siendo J H el jacobiano de la transformación H.
Si solo se plantea una sola relación H1 (como en el método anterior de la CDF), se completa el
esquema anterior con una segunda relación ficticia del tipo: Y2 = X1 o Y2 = X 2 resultando, por
,
ejemplo:
⎧Y1 = H1 ( X 1 , X 2 )
⎨
⎩Y2 = X 1
Funciones
Y = H ( X1 , X 2 ) importantes
Resultan de interés las siguientes transformaciones:
122
Jorge Carlos Carrá
IIb Funciones de variables aleatorias (dos variables) – Métodos
y1 = x1 ± x2
y1 = x1 x2
y1 =
x1
x2
Si se completa la transformación con la ecuación y2 = x2 , verificar que los valores absolutos de los
jacobianos resultan: 1, x2 y 1/ x2 , respectivamente.
Transformación suma
Como la transformación suma tendrá especial importancia en el capítulo 4, Distribuciones
Muestrales, veamos los detalles.
⎧ y1 = x1 ± x2
⎨
⎩ y2 = x2
JH =
1 1
0 1
=1
g ( y1 , y2 ) = J H
−1
f ( x1 , x2 ) = f ( y1 − x2 , x2 )
g1 ( y1 ) = f ( x1 + x2 ) = ∫
∞
−∞
∞
f ( y1 , y2 )dy2 = ∫
−∞
f ( y1 − x2 , x2 )dx2
Caso particular: X1, X2 independientes
g ( y1 , y2 ) = J g
g1 ( y1 ) = ∫
∞
−∞
−1
f1 ( x1 ) f 2 ( x2 ) = f1 ( y1 − x2 ) f 2 ( x2 )
f ( y1 , y2 )dy2 = ∫
∞
−∞
f1 ( y1 − x2 ) f 2 ( x2 )dx2
Esta integral se llama en matemáticas, integral de convolución y se representa f1 * f 2 .
f1 * f 2 = ∫
∞
−∞
f1 ( y1 − x2 ) f 2 ( x2 )dx2
Propiedad
f1 * f 2 = f 2 * f1
Es decir no interesa donde se coloca la resta.
Demostración
Basta hacer el cambio de variables: y1 − x2 = z ⇒ x2 = y1 − z, dx2 = −dz , e invertir el intervalo de
integración.
Problema resuelto 3.38 Transformación suma
Resolver el problema resuelto anterior, pero ahora con el método de la PDF.
Dada la siguiente PDF en
⎧1
f ( x1 , x2 ) = ⎨
⎩0
X1 , X 2 y la transformación Y1 = H ( X1 , X 2 ) , hallar la PDF en Y1.
0 ≤ x1 ≤ 1 0 ≤ x2 ≤ 1
en otro punto
y1 = x1 + x2
123
Capítulo 3 Distribuciones de Probabilidades
Método de la PDF
Para aplicar este método completamos la ecuación de transformación con
y2 = x1 o y2 = x2 .
⎧y = x + x
H ( x1 , x2 ) = ⎨ 1 1 2
⎩ y2 = x2
La función inversa es:
⎧ x = y1 − y2
H −1 ( y1 , y2 ) = ⎨ 1
⎩ x2 = y2
Para determinar la región del plano ( y1 , y2 ) en el que se transforma la región del plano ( x1 , x2 ) , la cual es el
cuadrado x1 = 0, x2 = 0, x1 = 1, x2 = 1 , observamos que reemplazando en las ecuaciones anteriores, resulta:
y2 = 0, y2 = y1 ,
y2 = y1 − 1, y2 = 1,
la cual se ha dibujado en la figura siguiente.
Figura 3-80
El jacobiano de la transformación es:
JH =
1 1
0 1
=1
su valor absoluto es 1. Por lo tanto:
g ( y1 , y2 ) = 1*1 = 1
Para hallar g ( y1 ) , debemos integrar respecto de y2 . Los límites de integración son (observar las rayas de
trazo grueso de la figura anterior):
⎧ y1 g ( y , y )dy = y
1
2
2
1
⎪ ∫0
g1 ( y1 ) = ⎨ 1
⎪ ∫ g ( y1 , y2 )dy2 = 2 − y1
⎩ y1 −1
0 ≤ y1 ≤ 1
1 ≤ y1 ≤ 2
Valores que coinciden con el cálculo por el método de la CDF.
Métodos numéricos
G
G
Sea el vector aleatorio X = ( X 1 , X 2 ,... X k ) e Y = H ( X ) una función escalar de variable vectorial.
124
Jorge Carlos Carrá
IIb Funciones de variables aleatorias (dos variables) – Métodos numéricos
Valor esperado de Y
G
G
Si la variable X es discreta con función de probabilidad conjunta p ( x ) :
G
G
E (Y ) = ∑∑ ...∑ H ( x ) p ( x )
x1
x2
xk
G
G
Si la variable X es contínua con función densidad conjunta f ( x ) :
G
G G
E (Y ) = ∫ ∫ ... ∫ H ( x ) f ( x )d ( x )
x1 x2
xk
La demostración de la ecuación anterior es difícil y no la haremos aquí.
H lineal
En particular, sea la función lineal Y =
n
∑a X
i =1
i
donde las ai son constantes.
i
Valor esperado de Y
n
E (Y ) = ∑ ai E ( X i )
i =1
Demostración
Esta expresión surge de aplicar cualquiera de las expresiones anteriores a Y .
Varianza de Y
n
V (Y ) = ∑ ai2V ( X i ) + 2∑∑ ai a j Cov( X i , X j )
i =1
i< j
donde la suma doble se forma para todos los pares (i, j) que resultan de la combinación de n
elementos tomados de a 2 (si el alumno conoce el análisis combinatorio reconocerá que esto equivale
a i < j).
Demostración
La demostración surge de aplicar la definición de varianza a la Y definida anteriormente.
Para ejemplificar el proceso veamos el caso más simple con Y = aX + bZ .
(( aX + bZ − (aμ + bμ ) ) )
= E ( ( ( aX − a μ ) + ( bZ − bμ ) ) ) = E ( ( aΔ + bΔ ) )
V (Y ) = E ( (Y − E (Y )) 2 ) = E
2
x
z
2
x
z
2
x
z
= E ( a 2 Δ x 2 + b 2 Δ z 2 + 2abΔ x Δ z ) = a 2 E (Δ x 2 ) + b 2 E (Δ z 2 ) + 2abE ( Δ x Δ z )
= a 2V ( X ) + b2V (Y ) + 2abCov( X , Z )
Esta demostración se extiende al caso de más de 2 variables.
125
Capítulo 3 Distribuciones de Probabilidades
Problema resuelto 3.39 Distribución hipergeométrica
En este problema deduciremos las expresiones de la media y varianza de una distribución hipergeométrica en
forma parecida al camino seguido con la distribución Binomial, vinculándola con la distribución de Bernoulli.
Una urna con N esferas tiene r esferas Rojas y N–r esferas Negras. Se muestrean n esferas sin reemplazo
(MSR) y se observa Y = número de esferas Rojas. Hallar E(Y) y V(Y).
Solución
Al igual que en la binomial, si X = número de esferas cada extracción:
Y =∑X
Características de un MSR
Analicemos el siguiente árbol de las 2 primeras extracciones sin reemplazo.
(r-1)/(N-1)
1.
1
r/N
(N-r)/(N-1)
0.
.
r/(N-1)
1-r/N
1..
0
(1-(r-1)/N)/(N-1)
0..
Figura 3-80
De este árbol se extrae.
Probabilidad incondicional
En forma directa:
P ( X 1 = 1) =
r
N
Esto también es cierto para la segunda extracción, pues:
P( X 2 = 1) = P( X 1 = 1, X 2 = 1) + P( X 1 = 0, X 2 = 1)
=
r r −1 N − r r
r N −1 r
+
=
=
N N −1
N N −1 N N −1 N
P ( X 2 = 1) =
r
N
El lector puede verificar que los resultados anteriores son válidos para cualquier extracción, no solo para las 2
primeras.
126
Jorge Carlos Carrá
IIb Funciones de variables aleatorias (dos variables) – Métodos numéricos
Por lo tanto, si se conforma la tabla de la distribución, en forma similar a la construida para la distribución de
Bernoulli, se verifica:
r
= p0
N
r ⎛
r ⎞
V ( X i ) = ⎜1 − ⎟ = p0 q0
N⎝ N⎠
E( X i ) =
Probabilidad conjunta
P ( X 1 = 1, X 2 = 1) =
r r −1
N N −1
El lector puede verificar que los resultados anteriores son válidos para cualquier extracción.
Dado que en el cálculo de E ( X i X j ) , solo queda el término con X i = 1, X j = 1 , se verifica:
E( X i X j ) =
r r −1
N N −1
E(Y)
A partir de la definición de la esperanza y del resultado anterior:
E (Y ) = E ∑ X = ∑ E ( X ) =np0 q0
V(Y)
En la sección anterior se demostró que.
V (Y ) = V ∑ X = ∑ V ( X )∑ +2∑∑ Cov( X i X j )
i< j
i
Esta relación corresponde a variables multivariables y es por esta razón que esta demostración se realiza en
esta sección.
Se puede observar que en las distribuciones Binomiales, el segundo término es 0 por la independencia entre
eventos. Esto no es así en la hipergeométrica, como veremos ahora.
Se tiene:
V (Y ) = V ∑ X = ∑V ( X ) = np0 q0
Cov ( X i X j ) = E ( X i X j ) − E ( X i ) E ( X j )
Reemplazando:
=
r ⎛
r ⎞ ⎛ r ⎞
⎜1 − ⎟ − ⎜ ⎟
N⎝ N⎠ ⎝N⎠
2
Operando:
⎛ 1 ⎞
Cov( X i X j ) = − p0 q0 ⎜
⎟
⎝ N −1 ⎠
Reemplazando ambos resultados en la expresión de V (Y ) , finalmente resulta:
⎛ 1 ⎞
V (Y ) = np0 (1 − q0 ) + 2∑∑ − p0 q0 ⎜
⎟
⎝ N −1 ⎠
i< j
En la sumatoria doble se deben formar todos los pares (i, j) que resultan de la combinación de n elementos
tomados de a 2, es decir ( se requiere análisis combinatorio)
n ( n − 1)
. Por lo tanto, reemplazando esta
2
relación y expresando todos los valores en función de r, n y N, resulta:
V (Y ) = n
r ⎛
r ⎞
n(n − 1 r ⎛
r ⎞⎛ 1 ⎞
⎜1 − ⎟ − 2
⎜1 − ⎟⎜
⎟
2 N ⎝ N ⎠⎝ N − 1 ⎠
N⎝ N⎠
127
Capítulo 3 Distribuciones de Probabilidades
Realizando algunas operaciones algebraicas que se dejan al lector, se obtiene finalmente:
V (Y ) = np0 q0
128
N −n
N −1
Jorge Carlos Carrá
IIc Modelos teóricos de dos variables – 1 Modelos discretos
IIc Modelos teóricos de dos
variables
1 Modelos discretos
Los modelos discretos de mayor interés son los siguientes:
Distribución Multinomial y Distribución Multihipergeométrica
Multinomial, m(yA,yB,yC,n,pA,pB,pC)
Supuestos
Es una modificación de la Binomial, en el supuesto 1.
Supuesto 1 Multicotómica
Una v.a Y tiene k resultados A1, A2, A3, …, Ak.
Supuesto 2 Variable Aleatoria
Dada una muestra de tamaño n, la variable aleatoria se define como el número de elementos
G
de cada categoría Ai. En otras palabras se busca el vector aleatorio: Y tal que
Y1 + Y2 + ... + Yk = n
.
Dada esta relación, las variables realmente independientes son k–1.
Supuesto 3 Tamaño
Como ya se estableció, las muestras tienen un tamaño n > 1.
Supuesto 4 Dependencia
Los n elementos del espacio muestral son independientes.
Expresiones generales
Observemos la siguiente tabla de una distribución de n = 5, con una variable tricotómica.
Se presentan solo algunos valores y se utilizaron A, B y C en lugar de A1, A2 y A3.
S
G G
Y=y
G
p( y)
ABBBC
AAAAB
AABBC
1,3,1
4,1,0
2,2,1
…
…
P5(1,3,1) pA pB3 pC
P5(4,1,0) p A4 pB
P5(2,2,1) p A2 pB2 pC
…
Figura 3-81
129
Capítulo 3 Distribuciones de Probabilidades
De la misma se desprende la siguiente expresión, la cual es una generalización de la binomial:
PDF conjunta
Observando la figura 3-81 se obtiene la siguiente expresión general de la función de probabilidad.
G
m( y A , n, pA , pB , pC ) = Pn ( yA , yB , yC ) pA yA pB yB pC yC
siendo:
∑y=n
Relación con la binomial
Si se toma cualquier agrupación de las variables, por ejemplo Y1 e Y2, puede considerarse una
variable dicotómica X con la categoría Y1 e Y2 por un lado y las restantes variables por el otro. Esta
variable es entonces Binomial.
Caracterización
Esperanza
Por la relación anterior con la Binomial, cada uno de los componentes del vector Esperanza tiene la
forma:
E (Yi ) = npi
Varianzas
Por la relación anterior con la Binomial, cada uno de los componentes del vector Varianza tiene la
forma:
V (Yi ) = npi qi
Covarianzas
Consideremos solo a dos variables Yi e Yj:
V (Yi + Y j ) = V (Yi ) + V (Y j ) + 2Cov(Yi , Y j )
Por la relación anterior con la Binomial, se tiene:
(
)
n( pi + p j ) 1 − ( pi + p j ) = npi qi + np j q j + 2Cov(Yi , Y j )
Despejando la covarianza, resulta:
Cov (Yi , Y j ) = − npi p j
La covarianza es negativa pues para un fijo n, dado que Y1 + Y2 + ... + Yk = n , un incremento en una
variable requiere un decrecimiento en otra.
Matriz Covarianzas, P
Al igual que en la unidad 1, página SSCP1, se presentan todos los resultados de varianzas y
covarianzas en el formato de matriz, P, como en la siguiente figura.
np1q1
-n p1p2 …
…
…
…
…
-n p1pk …
-n p1pk
…
npkqk
Figura 3-82
130
Jorge Carlos Carrá
IIc Modelos teóricos de dos variables – Distribución Multihipergeométrica
Matriz de correlaciones, R
Se construye a partir de la matriz de covarianzas como se detalló en la página 114.
Problema resuelto 3.40 Examen de selección múltiple
En un examen de selección múltiple usted debe elegir entre 3 posibles respuestas, A, B y C. Si la elección se
realiza al azar, calcular: a) la probabilidad de que 6 alumnos hayan elegido: yA= 1, yB= 2, yC= 3, b) expresar el
vector esperanzas, la matriz de covarianzas P y la de correlaciones R.
a)
n=6
m(1, 2,3, 6,1/ 3,1/ 3,1/ 3) = P6(1,2,3) (1/ 3)1 (1/ 3)2 (1 / 3)3 = 0.0823
b)
2
2
2
Vector Esperanzas
1.33 –1.33 –1.33
–1.33 1.33 –1.33
–1.33 –1.33 1.33
Matriz Covarianzas
1 –1 –1
–1 1 –1
–1 –1 1
Matriz Correlaciones
Figura 3-83
Distribución Multihipergeométrica
Es una modificación de la Binomial en los supuestos 1 y 4.
Supuesto 1 Multicotómica
Una v.a Y tiene k resultados A1, A2, A3, …, Ak.
Supuesto 2 Variable Aleatoria
Dada una muestra de tamaño n, se busca el número de elementos de cada categoría Ai.
G
En otras palabras se busca el vector aleatorio: Y tal que Y1 + Y2 + ... + Yk = n
.
Dada esta relación, las variables realmente independientes son k–1.
Supuesto 3 Tamaño
Como ya se estableció, las muestras tienen un tamaño n > 1.
Supuesto 4 Dependencia
Los n elementos del espacio muestral son dependientes (muestreo sin reemplazo o población finita).
PDF conjunta
Es una combinación de la multinomial y de la hipergeométrica.
131
Capítulo 3 Distribuciones de Probabilidades
⎛ A1 ⎞⎛ A2 ⎞ ⎛ Ak ⎞
⎜ ⎟⎜ ⎟ ... ⎜ ⎟
y
y
y
G
m( y A , N , n, A1 , A2 ... Ak ) = ⎝ 1 ⎠⎝ 2 ⎠ ⎝ k ⎠
⎛N⎞
⎜ ⎟
⎝n⎠
Al igual que para el caso univariable, si N tiende a infinito, la Multihipergeométrica tiende a la
Multinomial.
Relación con la hipergeométrica
Si se toma cualquier agrupación de las variables, por ejemplo Y1 e Y2, puede considerarse una
variable dicotómica X con la categoría Y1 e Y2 por un lado y las restantes por el otro. Esta variable
es entonces Hipergeométrica.
Caracterización
Esperanza
Por la relación anterior con la Hipergeométrica, cada uno de los componentes del vector Esperanza
tiene la forma:
E (Yi ) = np0i
Varianzas
Por la relación anterior con la Hipergeométrica, cada uno de los componentes del vector Varianza
tiene la forma:
V (Yi ) = np0i q0i
Covarianzas
Consideremos solo a dos variables Yi e Yj:
V (Yi + Y j ) = V (Yi ) + V (Y j ) + 2Cov(Yi , Y j )
Por la relación anterior con la Hipergeométrica, se tiene:
(
= n( p0i + p0 j ) 1 − ( p0i + p0 j )
) NN −− 1n = np
q
0i 0i
N −n
N −n
+ np0 j q0 j
+ 2Cov(Yi , Y j )
N −1
N −1
Despejando la covarianza, resulta:
Cov(Yi , Y j ) = − np0i p0 j
N −n
N −1
Matriz Covarianzas, P
Al igual que en el caso general, se presentan todos los resultados de varianzas y covarianzas en el
formato de matriz, P, como en la siguiente figura.
Var11 Cov12 … Cov1k
…
…
… …
…
… Varkk
Cov1k
Figura 3-84
132
Jorge Carlos Carrá
IIc Modelos teóricos de dos variables – 2 Modelos contínuos
Matriz de correlaciones, R
La matriz de correlación R se construye a partir de la matriz de covarianzas en forma análoga al
caso general, página 114.
2 Modelos contínuos
Distribución uniforme
PDF conjunta
Su PDF conjunta es simplemente:
f ( x, y ) = k
Problema resuelto 3.41 Encuentro
Una pareja decide encontrarse en un cierto lugar. Si cada persona arriba independientemente con una
distribución del tiempo uniforme entre 17:00 y 18:00, encontrar la probabilidad de que el primero en llegar
tenga que esperar más de 10 minutos.
Llamemos X e Y al tiempo pasadas las 17:00 que cada persona tarda en llegar, cada una uniformemente
distribuido sobre (0, 60).
Las probabilidades son P ( X + 10 < Y ) y P (Y + 10 < X ) .
Por la simetría son iguales, por lo tanto:
2 P( X + 10 < Y ) = 2∫
∫
x +10 < y
f ( xy )dxdy = 2∫
∫
f ( x) f ( y )dxdy
x +10 < y
Haciendo un gráfico de análisis para definir los intervalos de integración, resulta.
60 y −10
= 2∫
10
∫
0
2
60
2
25
⎛ 1 ⎞
⎜ ⎟ dxdy = 2 ∫ ( y − 10 )dy =
60 10
36
⎝ 60 ⎠
Distribución binormal
El modelo contínuo de mayor interés es el de la distribución binormal.
G
Dado el vector aleatorio Y = ( X , Y ) , se dice que tiene una distribución binormal si su distribución
de probabilidades es la que se define a continuación.
Es de particular interés presentar la distribución normal conjunta, pues es una condición requerida en
algunos procedimientos estadísticos.
133
Capítulo 3 Distribuciones de Probabilidades
nXY(μx, μy, σx, σy, ρ)
PDF conjunta
f xy ( μ x , μ y , σ x , σ y , ρ ) =
e −Q /2
2πσ xσ y 1 − ρ 2
donde:
Q=
=
1
1− ρ 2
⎡ ( x − μ x )2
( x − μ x )( y − μ y ) ( y − μ y )2 ⎤
ρ
−
+
2
⎢
⎥
2
σ xσ y
σ y2 ⎥⎦
⎢⎣ σ x
1
⎡ z 2 − 2 ρ z x z y + z y 2 ⎤⎦
2 ⎣ x
1− ρ
Esta PDF es función de 5 parámetros, los cuales llevan esos símbolos pues se corresponden con los
parámetros que se verán a continuación.
PDF marginales
Son:
N (μ x ,σ x 2 ) y N (μ y ,σ y 2 ) .
Caracterización
Esperanza
El vector aleatorio de las esperanzas es:
G
E (Y ) = ( E ( X ), E (Y )) = ( μ x , μ y )
Varianzas
El vector aleatorio de las varianzas es:
G
V (Y ) = (V ( X ), V (Y )) = (σ x2 , σ y2 )
Covarianza
Cov ( X , Y ) = ρσ xσ y
Matriz de covarianzas, P
σ x2
ρσ xσ y
ρσ xσ y
σ y2
Figura 3-85
Observar que el denominador del coeficiente de la PDF es 2π por la raíz cuadrada del determinante
de la matriz P.
Observar además que si la covarianza es cero, es decir ρ = 0, entonces fxy se puede expresar como:
f xy = N ( μ x , σ x 2 ) N ( μ y , σ y 2 )
134
Jorge Carlos Carrá
IIc Modelos teóricos de dos variables – Distribución binormal
por lo tanto X e Y son independientes.
Recordemos que una covarianza cero, no significa necesariamente independencia. Sin embargo, si la
distribución es normal conjunta, entonces la independencia es equivalente a la incorrelación lineal.
Matriz de correlaciones, R
La matriz de correlación R se construye a partir de la matriz de covarianzas en forma análoga al
caso general.
135
Capítulo 3 Distribuciones de Probabilidades
III Confiabilidad, R(t)
En el capítulo 2 definimos la confiabilidad como la probabilidad de que un sistema funcione. En esta
sección ampliaremos el concepto introduciendo la forma de calcular una confiabilidad dependiente
de la variable tiempo.
Definición
Confiabilidad, R(t) (Reliability): mide la probabilidad de que un componente no falle en [0, t] o
equivalentemente que dure hasta t. En otras palabras t es lo que antes llamamos T1 = tiempo
hasta el primer evento o falla.
En notación matemática:
R (t )= P (T > t )
donde T es la v.a. duración del componente.
Llamaremos f(t) a la PDF de T y F(t) a la CDF.
La cola de la distribución f(t) a partir de t = T1, es la confiabilidad. Por lo tanto:
R(t ) = P(T > t ) = 1 − F (t )= F (t )
Destaquemos que la F(t) (área de f(t) entre 0 y t) mide la probabilidad de que la primer falla se
presente en [0, t]. En cambio su complemento F (t ) , mide la probabilidad de que la primer falla no
se presente en [0, t] o equivalentemente que se presente luego de t.
En este contexto también suele definirse la falta de confiabilidad (unreliability) o probabilidad de
falla en [0,t] como:
Q (t ) = 1 − R (t ) = F (t )
Es decir es la CDF F(t).
En la siguiente figura se representan gráficamente los sectores de:
R(t1 ) : probabilidad de no falla en [0, t1] (pues la primera falla sucede luego de t1).
Q(t1 ) : probabilidad de falla en [0, t1] (pues la primera falla sucede antes de t1).
Figura 3-86
Conceptualmente, si por ejemplo un componente tiene una confiabilidad de 90% para t1 = 12 horas,
entonces si 100 componentes operan 12 horas, aproximadamente 90 no fallarán.
136
Jorge Carlos Carrá
III Confiabilidad, R(t) – Distribución binormal
Veamos cómo se obtienen 3 funciones de interés en función de la confiabilidad:
1 FDP f(t) en función de R(t)
La FDP se obtiene derivando R(t), pues:
R '(t ) = −
d ( F (t ))
− = − f (t )
dt
Por lo tanto:
f (t ) = − R '(t )
Observar que para obtener R(t) de la expresión anterior se debe integrar a f(t) entre t e infinito.
2 Media E(t) en función de R(t)
La media de f(t) será:
∞
E (t ) = ∫ t f (t ) dt
0
Teorema
∞
E (t ) = ∫ R (t ) dt
0
Expresando el límite superior con la letra a:
a
a
E (t ) = ∫ t f (t ) dt = tF (t ) 0 − ∫ F (t ) dt
a
0
0
pero:
a
tF (t ) 0 = aF (a ) = a = ∫ dt , pues F ( a ) = 1 .
a
0
por lo tanto:
a
a
a
0
0
0
E (t ) = ∫ dt − ∫ F (t )dt = ∫ 1 − F (t ) dt
Naturalmente esta forma de calcular la esperanza en función de la CDF, es válida siempre.
Otra demostración
∞ ∞
⎛
⎞
=
R
(
t
)
dt
∫0
∫0 ⎜⎝ ∫t f (s)ds ⎟⎠ dt
∞
Integrando por partes (considerando dv= dt):
∞
∞
∞
∞
∞
0
t
0
t
0
∫ R(t )dt = t ∫ f (s)ds − ∫ −tf (t )dt = t ∫ f (s)ds + ∫ tf (t )dt
El segundo sumando es E(t), por lo cual solo queda demostrar que el primero es 0. En t = 0, es
evidente que lo es. Para demostrar que lo es para el resto de valores se debe introducir el requisito
que E(t) sea finita. Se deja la demostración al lector.
3 Frecuencia de fallas instantánea h(t) en función de R(t)
Se llama también función de riesgo (hazard) y por esta razón se simboliza h(t).
h(t ) =
f (t )
1 − F (t )
137
Capítulo 3 Distribuciones de Probabilidades
Por la definición de confiabilidad, esta expresión se puede escribir:
h (t ) =
f (t )
R (t )
Si en la figura siguiente consideramos la probabilidad condicional P(t1 ≤ T ≤ t1 + Δt | T > t1 ) , para
un Δt pequeño, observamos que es:
P(t1 ≤ T ≤ t1 + Δt | T > t1 ) =
Δtf (t )
R(t )
Por lo tanto Δth(t ) representa la probabilidad de fallar en un intervalo pequeño después de t1 dado
que sobrevivió hasta t1 o en otras palabras, la frecuencia de fallas h(t) es proporcional a esta
probabilidad condicional.
Figura 3-87
Como veremos luego, para la distribución exponencial, h (t ) = ω , por lo cual podría utilizarse la
notación h (t ) = ω (t ) .
Teorema
t
R (t ) = e
∫
− h ( t ) dt
0
La demostración es directa a partir de:
h(t ) =
f (t ) − R '(t )
d (ln( R(t ))
=
=−
R(t )
R(t )
dt
Integrando entre 0 y t y bajo la suposición que R(0) = 1, es decir que la probabilidad de una falla
inicial es 0 (suposición que equivale a F(0) = 0 y que mantendremos de aquí en más), se obtiene la
expresión que se quiere demostrar. Si el elemento tiene una h(t) definida por tramos, la integral
deberá ser dividida con límites acordes con los tramos.
La PDF se obtiene a partir de:
t
f (t ) = − R '(t ) = h (t )e
∫
− h ( t ) dt
0
Síntesis
Las 3 importantes vinculaciones que hemos demostrado se resumen a continuación:
138
Jorge Carlos Carrá
III Confiabilidad, R(t) – Distribución binormal
f (t ) = −
d ( R(t ))
dt
∞
E (t ) = ∫ R (t )dt
0
h(t ) = −
d (ln( R (t ))
dt
Si bien se utilizan varias distribuciones como modelos matemáticos de fallas (Weibull, Rayleight,
etc), las distribuciones más comunes que siguen los componentes, son la exponencial, la Gamma, la
de Weibull y la normal.
Distribución exponencial
Se utiliza este modelo cuando la tasa de fallas ω se puede suponer constante y el objeto no cambia
con el uso (no tiene memoria, ver página 68). En este modelo se distingue, el tiempo de operación a
partir de un valor arbitrario t = a , de la edad de operación, partir de t = 0 .
R(t)
R (t ) = 1 − CDF (t )
En este caso, por la propiedad de las colas de una función exponencial, se tiene:
R(t ) = e−ωt
En particular si t = MTBF = β, la confiabilidad resulta:
R(β ) = e−ω /ω = e−1 = 0.37
valor que puede ser tomado como referencia.
Figura 3-88
La confiabilidad disminuye con el tiempo como es habitual.
f(t)
f (t ) = − R '(t ) =ωe−ωt
139
Capítulo 3 Distribuciones de Probabilidades
Figura 3-89
E(t)
∞
∞
0
0
E (t ) = ∫ R (t )dt = ∫ e −ωt dt =
1
ω
=β
Figura 3-90
h(t)
h(t ) =
f (t ) ωe −ωt
=
=ω
R(t ) e−ωt
Observar que para este modelo, la frecuencia de fallas h(t) es una constante, lo cual indica que
aunque el ítem se encuentre en uso, la probabilidad de falla no cambia. Dicho de otra forma no
interviene el "efecto de uso", lo cual ya adelantamos al estudiar la distribución exponencial en la
página 88.
Exponencial y Poisson
Recordemos, página 71, que si T es el tiempo requerido para observar r ocurrencias y X es el
número de ocurrencias durante [0, t], entonces:
140
Jorge Carlos Carrá
III Confiabilidad, R(t) – Distribución binormal
a) P (T > t ) = P ( X < r )
b) P (T ≤ t ) = P ( X ≥ r )
Además si T tiene una distribución Gamma, entonces X sigue una distribución de Poisson.
Utilizando el formato CDF, se verifica:
1 − CDF .GAMMA(t , r , α ) = CDF .POISSON ( r − 1, t , α t )
CDF .GAMMA(t , r , α ) = 1 − CDF .POISSON ( r − 1, t , α t )
En particular si r = 1, la distribución Gamma se convierte en exponencial (con α igual a ω):
1 − CDF .EXP (t , ω ) = CDF .POISSON (0, ωt )
CDF .EXP(t , ω ) = 1 − CDF .POISSON (0, ωt )
Distribución Gamma, (t,r,α)
El apartado anterior permite generalizar la distribución exponencial a una distribución Gamma para
tratar el tiempo en el que ocurren r fallas (no una), en tanto las mismas aparezcan de acuerdo a un
proceso de Poisson.
Distribución de Weibull, (x,ω,β)
Es otra generalización de la exponencial para la cual h(t) es polinómica de la forma:
h(t ) = ωβ t β −1
donde ω y β son constantes positivas.
Al variar β (con valores menores o mayores a 1), varía el exponente y se observa que se obtienen
curvas de h(t) con tramos decrecientes, DFR (Decreasing Failure Rate) o crecientes, IFR (Increasing
Failure Rate), por lo cual se lo llama parámetro de forma. Se puede observar que la exponencial es
un caso particular con β = 1. Con β = 3.6 se aproxima a una normal.
En esta distribución se llama a ω parámetro de escala, para el cual también suele usarse la letra α.
R(t)
t
R (t ) = e
∫
− h ( t ) dt
0
t
=e
∫
− ωβ t β −1dt
0
= e −ωt
β
R(t ) = e −ωt
β
En la figura siguiente se muestra la confiabilidad para ω = 1, β = 1 y ω = 1, β = 3.
141
Capítulo 3 Distribuciones de Probabilidades
Figura 3-91
f(t)
f (t ) = − R '(t ) =ωβ t β −1e−ωt
β
En la siguiente figura se muestra la PDF para ω = 1, β = 1 y ω = 1, β = 3.
Figura 3-92
F(t)
A partir de:
F (t ) = 1 − R (t ) ,
F (t ) = 1 − e−ωt
142
β
Jorge Carlos Carrá
III Confiabilidad, R(t) – Distribución binormal
En la siguiente figura se muestra la CDF para ω = 1, β = 1 y ω = 1, β = 3.
Figura 3-93
E(t)
Se puede demostrar que:
⎛1 ⎞
E (t ) = ω −1/ β Γ ⎜ + 1⎟
⎝β
⎠
h(t)
β
f (t ) ωβ t β −1e−ωt
=
= ωβ t β −1
h(t ) =
−ωt β
R(t )
e
Según el valor de β, se obtienen funciones de falla, constantes, lineales, parabólicas, etc.
Cuando β > 1 se obtiene un crecimiento de h(t) con el tiempo, lo cual indica un esperable efecto de
uso.
Cuando β = 1 , el valor de h(t) es constante (modelo exponencial) lo cual indica que se trata de un
modelo aplicable en los casos en que no existe el efecto de uso.
Finalmente cuando 0 < β < 1 , h(t) es decreciente, aplicable a casos no comunes en donde h(t)
decrece con el tiempo.
En la siguiente figura se muestra la h(t) para ω = 1, β = 1 y ω = 1, β = 3.
143
Capítulo 3 Distribuciones de Probabilidades
Figura 3-94
Distribución normal
La ley normal de fallas es un modelo apropiado cuando la mayor parte de las fallas se producen
alrededor de la media μ y cuando la falla tiene memoria (intervienen efectos del uso). Sin embargo,
no es el modelo más encontrado.
Naturalmente, como T debe ser mayor o igual a 0, debe ser P(T <0) =0 lo cual implica que deben ser
truncados los valores de z menores a z =
−μ
σ
por lo cual la distribución es normal truncada a la
izquierda (página 101).
R(t)
R (t ) = 1 − CDF (t )
Valor que deberá ser calculado numéricamente como en cualquier distribución normal, con tablas o
programas informáticos.
144
Jorge Carlos Carrá
III Confiabilidad, R(t) – Distribución binormal
Figura 3-95
La confiabilidad disminuye con el tiempo como es habitual.
f(t)
f (t ) = n (t , μ , σ )
Figura 3-96
La mayor parte de los artículos fallan alrededor de μ.
E(t)
Si la distribución normal no fuera truncada sería:
∞
E (t ) = ∫ tf (t ) dt = μ
0
Si μ ≥ 2σ , los valores que se truncan corresponden a z ≤ − 2 , por lo cual la media es muy similar a
μ.
145
Capítulo 3 Distribuciones de Probabilidades
h(t)
h(t ) =
f (t )
n(t , μ , σ )
=
R (t ) 1 − N (t , μ , σ )
Figura 3-97
La frecuencia de fallas aumenta con el tiempo lo cual indica el habitual efecto de uso.
Sistemas
1 Sistemas con componentes en serie o paralelo
Los teoremas de confiabilidad equivalente para circuitos serie o paralelo con valores constantes R
vistos en el capítulo 2, pueden ahora aplicarse a componentes con confiabilidades dependientes de
una variable t, R(t).
Elementos en serie
Figura 3-98
La confiabilidad equivalente de componentes en serie es el producto de las confiabilidades.
R(t ) = RA RB RC
En particular si la ley de falla es exponencial:
R(t ) = e−(ωA +ωB +ωC )t
En este caso, el T del sistema también está distribuido exponencialmente, con una frecuencia de
fallas que es la suma de las de los componentes.
146
Jorge Carlos Carrá
III Confiabilidad, R(t) – Distribución binormal
Elementos en paralelo
Figura 3-99
Expresión directa
R(t ) = R A + R B + R C − R AR B − R AR C − R B R C + R AR B R C
En particular si la ley de falla es exponencial y expresando, por simplicidad un sistema de 2
componentes:
R(t ) = e−ωAt + e−ωBt − e−(ωA +ωB )t
Se observa que en este caso T no está distribuido exponencialmente.
Expresión por complementos
El complemento de la confiabilidad equivalente de componentes en paralelo es el producto de
los complementos de las confiabilidades.
R = 1 − (1 − RA )(1 − RB )(1 − RC )
Cualquier otra combinación con componentes en serie y en paralelo se resuelve reemplazando las
partes serie y paralelo por su confiabilidad equivalente.
2 Sistemas con componentes en Stand By
Son sistemas en los cuales un componente está inactivo y solo funciona cuando otro falla (stand by).
Una llave sensa la falla y cambia al componente en espera que funcionará en lugar del primero.
Si llamamos S a la llave que funciona con probabilidad P(S), aplicando la RP de las probabilidades,
se tiene (Billinton R. 1992, página 96):
Q = Q(sistema | S ) P(S ) + Q(sistema | S ) P(S )
El componente redundante está normalmente inactivo con lo cual se reduce el tiempo de uso.
Problema resuelto 3.42. Ley exponencial de fallas
Ver el problema resuelto de página ConfiabilidadPR2.
El sistema de controles de un modelo de aviones A es de tipo eléctrico y consiste en 3 circuitos en paralelo, A,
B y C, para aumentar la redundancia, en serie con un sistema D.
Por su lado, otro modelo de aviones B, tiene un sistema similar pero con 2 circuitos eléctricos en paralelo.
Además tiene un sistema manual, mecánico de emergencia, C.
Considerar que todos los sistemas tienen una ley de falla dad por una distribución exponencial con igual
parámetro ω. Hallar la confiabilidad R(t) de cada sistema de control: a) avión A, b) avión B y luego la
confiabilidad si ω = 0.0001 y el tiempo de operación es de 1000 horas.
Ambos circuitos se muestran en la figura 3-100.
147
Capítulo 3 Distribuciones de Probabilidades
Avión B
Avión A
Figura 3-100
Modelo A
RABC (t ) = 1 − (1 − e−ωt )3
R(t ) = e−ωt (1 − (1 − e−ωt )3 )
Modelo B
RAB (t ) = 1 − (1 − e−ωt )2
RABD (t ) = e−ωt (1 − (1 − e−ωt )2 )
′
RABD
(t ) = 1 − e−ωt (1 − (1 − e−ωt )2 )
R(t ) = 1 − (1 − e−ωt )(1 − e−ωt (1 − (1 − e−ωt )2 ))
La confiabilidad para los valores numéricos establecidos resulta:
RA = 0.904
RB = 0.997
Problema resuelto 3.43. Frecuencia de fallas variable
La tasa de fallas h(t) de un componente está dada por:
0 ≤ t ≤ t0
⎧C0
h(t ) ⎨
⎩C0 +C1 (t - t0 ) t > t0
Obtener la PDF f(t) y la R(t).
R(t)
0 ≤ t ≤ t0
t
t
t
0
0
0
∫ h(t )dt = ∫ h(t )dt = ∫ C0 dt = C0t
t > t0
t0
t
t
∫ h(t )dt = ∫ C dt + ∫ C +C (t - t )dt = C t
0
0
0
0
t0
t
∫ h(t )dt = C t +
0
0
1
0
0 0
+ C0t − C0t0 +
C1
(t - t0 )2
2
C1
(t - t0 ) 2
2
Por lo tanto:
t
R (t ) = e
148
∫
− h ( t ) dt
0
Jorge Carlos Carrá
III Confiabilidad, R(t) – Distribución binormal
⎧e−C0t
⎪
R(t ) ⎨ −C t − C1 (t -t )2
0
0
2
⎪⎩e
0 ≤ t ≤ t0
t > t0
f(t)
t
f (t ) = − R '(t ) = h (t )e
∫
− h ( t ) dt
0
⎧C e−C0t
⎪ 0
f (t ) ⎨
C
− C t − 1 ( t -t ) 2
⎪⎩C0 +C1 (t - t0 )e 0 2 0
0 ≤ t ≤ t0
t > t0
149
Capítulo 3 Distribuciones de Probabilidades
IV Teoría de los juegos
La teoría de los juegos provee un modelo para tratar la complejidad relacionada con aprender a
pensar e interactuar estratégicamente con otras personas, habilidad imprescindible para poder
tomar decisiones inteligentes. La teoría de los juegos interactúa con más de una persona (acciones),
con o sin la presencia de estados de la naturaleza (eventos). Por su parte, la teoría de las decisiones
económicas que veremos luego involucra a una sola persona interactuando con estados de la
naturaleza. Por esta razón, la teoría de los juegos también podría llamarse Teoría de la Decisión
Multipersonal.
Entre los beneficios de este modelo se encuentra el de proveer un sistema lógico con el cual poder
analizar los razonamientos, además de un lenguaje común para poder dialogar y comunicar los
resultados. Poder modelar todas las estrategias propias y del competidor, proporciona un mejor
entendimiento de los escenarios posibles, con los cuales se puede saber, por adelantado, que
conviene hacer y que no. Sin embargo debe decirse que, más que un modelo predictivo, es un
modelo de cómo deberían comportarse las personas en las experiencias reales. De cualquier forma
debe quedar claro que aquel que conoce la teoría de los juegos, estará en mejores condiciones de
competir que el que no la conoce.
Los economistas ganadores del Premio Nobel de Economía 2005, Robert J. Aumann y Thomas C.
Schelling ganaron este premio por utilizar la teoría de juegos para explicar y facilitar la resolución de
conflictos.
En los siguientes apartados aplicaremos esta utilización entretenida de las matemáticas y de la
estadística, a simples juegos de mesa o deportes, acciones de guerra, comportamiento de mercados
competitivos, relaciones empresariales, disputas comerciales, crimen organizado, decisiones
políticas, negociaciones salariales o discriminación racial y sexual.
El término jugador podrá entonces identificar a personas, empresas, máquinas e incluso animales.
Objetivo
El objetivo del juego es encontrar una solución que implique la mayor ganancia estable, es decir la
mejor posible dada la competencia, que buscará lo mismo que uno.
La obtención de la matriz de ganancias para todas las acciones de una situación real determinada,
puede ser la parte más difícil para el diseñador del juego y queda fuera del objeto de esta
introducción, puesto que solo nos concentraremos en el análisis y resolución de juegos ya
diseñados. De todas formas es oportuno aclarar que no se necesita conocer los valores de la matriz
de pagos exactamente. Para analizar un juego basta con saber sus magnitudes relativas.
Llamaremos:
Acciones: alternativas controladas por el usuario.
Eventos: alternativas no controladas por el usuario y asociadas con una distribución de
probabilidades. Se suelen llamar también Estados de la Naturaleza.
Estrategia
Es una regla de decisión acerca de que acción elegir en cada instante del juego.
150
Jorge Carlos Carrá
IV Teoría de los juegos – Distribución binormal
Supuestos
•
•
•
Racionalidad
Todos los jugadores actúan racionalmente buscando maximizar sus ganancias.
Conocimiento
Todos los jugadores conocen todas las reglas del juego.
Conocimiento común
Consiste en una iteración de lo que cada jugador sabe.
Un jugador A sabe que otro jugador B es racional: S(R), donde S significa Sabe, R Racional y se
sobrentiende que el ordenamiento alterna a los distintos jugadores.
Además B sabe que A sabe que B es racional: S(S(R))
Además A sabe que B sabe que A sabe que B es racional: S(S(S(R)))
y así sucesivamente hasta el infinito.
Clasificación
Los juegos pueden clasificarse de acuerdo a distintas consideraciones.
1. Cooperativos y no cooperativos
En los juegos cooperativos los jugadores pueden hacer compromisos de cooperación al margen
de los equilibrios del juego que veremos luego. En los no cooperativos, no pueden acordar entre
ellos. Aquí solo trataremos a los no cooperativos.
2. Información completa o incompleta
Se refiere a la información privada que un jugador tiene antes de comenzar el juego. Es
incompleta cuando la naturaleza mueve primero y al menos un jugador no la observa. Solo
trataremos juegos con información completa.
3. Información perfecta IP o imperfecta II
La diferencia esencial se encuentra en la cantidad de información que tiene cada jugador a la
hora de decidir (derivada de causas de orden legal, físico o técnico). Un juego es de información
perfecta cuando el jugador conoce todo lo que desea antes de realizar su movida. El juego del
ajedrez o el tatetí son juegos con información perfecta, en cambio el póker o el truco son con
información imperfecta.
4. Simultáneo o secuencial
Estos términos se relacionan con el tiempo y se refieren a si las jugadas se realizan en forma
simultánea o luego de conocer la jugada del adversario. Naturalmente existen juegos que
combinan ambas situaciones.
En relación con la clasificación anterior, un juego simultáneo, tiene siempre información
imperfecta. En cambio un juego secuencial puede tener cualquier tipo de información, lo cual se
aprecia con los ejemplos secuenciales del ajedrez y el póker.
Simultáneo ⇒ II
IP ⇒ Secuencial
La clasificación entre decisiones simultáneas o secuenciales se presenta rutinariamente en la
competencia entre empresas.
5. Puro o mixto
Se llama juego de estrategias puras, EP cuando éstas son deterministas (el resultado es alguna
de las ganancias dadas). Se llama de estrategias mixtas, EM cuando en la elección de las
mismas interviene además el azar y por lo tanto la teoría de probabilidades (el resultado es una
distribución de probabilidades de las ganancias dadas).
Un jugador buscará primero analizar si existen estrategias puras que le permitan establecer por
adelantado todo lo que debe hacer. Cuando esto no es posible, lo mejor que puede hacer es ser
impredecible, actuando aleatoriamente o en otras palabras, utilizando una estrategia mixta. Esto
se observa claramente en juegos como el tenis en el que un jugador que no tiene un juego
dominante, combina jugadas para aumentar su imprevisibilidad.
6. Suma cero o suma variable
Un juego se llama de suma cero o también estrictamente competitivo, cuando la ganancia de
151
Capítulo 3 Distribuciones de Probabilidades
uno es igual a la pérdida del otro, para todas las estrategias. En realidad la suma de ambas no
requiere ser 0, sino un valor siempre constante k (por ejemplo 100 en porcentajes), por lo cual
sería más correcto llamarlos de suma constante. De todas formas siempre es posible convertir
las ganancias de un juego de suma constante en uno de suma cero, o viceversa, utilizando una
simple transformación lineal de variables.
Si las sumas de ganancias no es constante, se llaman de suma variable o de suma no cero y son
los juegos más habituales.
Los juegos de suma no cero de n jugadores se pueden convertir siempre en juegos de suma cero
de n +1 jugadores, al adicionar un jugador no influyente llamado en inglés “dummy player”, el
cual recibe la ganancia neta del juego, pero no puede interferir con el desarrollo del mismo.
7. Número de jugadores
Los juegos pueden ser de 2 jugadores (2-personal) y de más de 2 jugadores (n-personal). Solo
trataremos juegos de 2 jugadores.
8. Número de acciones
El mínimo número de acciones para cada jugador es naturalmente 2. Si un juego es de 2
jugadores y cada uno solo tiene 3 acciones posibles se llama juego de 2 jugadores 3 × 3.
9. Número de repeticiones
Juego de una sola ronda o estático: cada jugador juega una sola vez.
Juego repetido: Cada jugador se encuentra varias veces con el otro, en el mismo juego. En este
caso se presentan muchas formas en que esto puede hacerse: con repetición finita o infinita, con
ganancias sumadas, promediadas, solo la última, etc. Dado que se tienen en cuenta los resultados
de las jugadas anteriores, los jugadores pueden evaluar las acciones pasadas y determinar si
deberían repetirla o cambiarlas.
Utilidad
La ganancia no tiene por qué ser solo monetaria, podrían ser tiempos, distancias, probabilidades, etc.
Por otra parte, es conveniente resaltar que no todas las personas reaccionan de igual forma ante el
riesgo. Así por ejemplo, una E(G) > 0, incluirá necesariamente eventos con pérdida y ganancia de
dinero. Aunque la probabilidad de una pérdida sea baja, especialmente si el valor monetario de ésta
pérdida es muy importante, una persona puede decidir no participar (y por lo tanto quedarse sin
ganancias o pérdidas), debido a sus importantes consecuencias económicas. En cambio otra persona
puede ser más proclive al riesgo y aceptar el juego sabiendo que puede hacerse más rica con rapidez,
aceptando el riesgo de corto plazo.
El análisis de estas posturas se puede resumir en 3 grandes grupos. Los evitadores de riesgos, los
buscadores de riesgos y los indiferentes al riesgo. Esto se llama Teoría de la Utilidad. Se desarrolla
una curva de utilidad para la persona, para luego convertir las sumas de dinero en utilidades,
realizando el cálculo de la esperanza con estas últimas. Esta conversión no será tratada aquí.
Dividiré esta sección en 4 partes:
1. Simultáneos con estrategias puras
2. Simultáneos con estrategias mixtas
3. Secuenciales
4. Teoría de las decisiones económicas
1 Simultáneos con estrategias puras
a Formas del juego
Se puede representar a un juego con 2 formatos: tabla y árbol.
Forma normal o estratégica
Todo juego debe incluir las ganancias (en general utilidades) para determinar cuánto gana o pierde
cada jugador. Estas ganancias se pueden resumir en una tabla llamada tabla del juego o bimatriz de
152
Jorge Carlos Carrá
IV Teoría de los juegos – 1 Simultáneos con estrategias puras
ganancias.
En cada fila o columna se encuentran las acciones posibles de cada uno de ellos.
En cada celda se cruzan 2 acciones Acción A × Acción B. En ellas se ubican los resultados o
ganancias de ambos jugadores. Convencionalmente se utiliza una bimatriz colocando primero la
ganancia del jugador colocado en filas (A en la figura siguiente). Si el juego es de suma cero, el otro
tendrá los mismos valores cambiados de signo (suma 0) o los valores complementarios (suma
constante), por lo cual se sobreentienden y no se colocan.
Acciones B
b1
a1 GA11,GB11
b2
GA12,GB12
a2 GA21,GB21
GA22,GB22
Acciones A
Figura 3-101
Tabla del juego puro
Simetría
Un juego es simétrico si la matriz de ganancias tiene simetría respecto de la diagonal principal (de
izquierda a derecha y de arriba hacia abajo) atendiendo a los índices de posición de cada celda. La
siguiente matriz de juego es simétrica.
a1
Acciones B
b1
b2
4,4
–3,5
Acciones A
a2 5,–3
–6,–6
Figura 3-102
Tabla del juego puro
Una celda es simétrica si ambos valores de ganancia son iguales. Por lo tanto los resultados a1b1 y
a2b2 del juego de la figura anterior son simétricos.
Forma extensiva
Un árbol del juego es la expresión de la tabla en forma de árbol y se lo llama forma extensiva del
juego.
Recodemos que un árbol es un grafo, conjunto de nodos (puntos) unidos por ramas (rectas), tal que
en cada nodo solo entra una rama.
Repasar los conceptos de nodo inicial, nodos finales, rama, camino y estrella, vistos en el capítulo 2.
En esta aplicación, a los nodos de decisión de cada jugador se los llama nodos de acciones y a los
nodos de acción de la naturaleza, nodos de eventos.
Se debería agregar además una columna adicional que contiene los valores de la variable G
(equivalente a la matriz de ganancias). Sin embargo, el formato usual en teoría de juegos, es colocar
en los nodos a los jugadores, en las ramas a las acciones y en los nodos finales a las ganancias de
cada camino, en el orden en el que están los jugadores reales en el árbol, como indica la siguiente
figura. La naturaleza no tiene ganancias, solo los jugadores reales las tienen.
En el caso de estrategias mixtas y en los nodos de eventos de la naturaleza, se incluirán en las ramas
también a las probabilidades.
153
Capítulo 3 Distribuciones de Probabilidades
|
|
b1
|
|B
|
|
b2
|
|
|
|
b1.
|
|
|B.
|
b2.
|
|
a1
A
a2
GA11,GB11
GA12,GB12
GA21,GB21
GA22,GB22
Figura 3-103
Árbol del juego puro
Conjunto de información
Una forma de diferenciar un juego simultáneo de uno secuencial es colocando una línea vertical (si
el árbol se dibuja horizontal) al final de las acciones de cada jugador (ver figura). De esta forma se
recuerda que el siguiente jugador no conoce lo que hizo el anterior (está impedido de "verlo" por este
límite). Una forma alternativa es agrupando con un óvalo a los nodos que tienen información
imperfecta, lo cual indica que no se sabe cuál de ellos se presentará en el juego (en la figura anterior
los nodos B).
Este conjunto de nodos se llama conjunto de información. Observar que:
• El número de acciones de cada nodo en un conjunto de información debe ser idéntico para todos,
de otra forma el jugador podría distinguir entre estos nodos.
• Los conjuntos de información de los juegos con información perfecta, solo contienen un nodo,
en tanto que los juegos con información imperfecta, contienen más de uno.
b Equilibrio de Nash
El concepto de equilibrio de Nash se aplica a la forma normal no a la forma extensiva.
Estrategias dominantes
En los juegos de 2 acciones es conveniente utilizar flechas para indicar el sentido de las ganancias
dominantes, tal como se indica en la figura 3-104a. Las flechas verticales se refieren a las ganancias
de A dentro de cada acción de B (recordar que es el primer valor dentro del paréntesis).
Así por ejemplo la flecha vertical de la izquierda indica que dentro de b1 la ganancia de A con la
acción a2 (2) es mayor que la de la acción a1 (1).
Análogamente, la flecha horizontal superior hacia la izquierda indica que dentro de a1 la ganancia
de B con la acción b1 (4) es mayor que la de la acción b2 (3).
B
B
b1
a1 1,4
b2
3,3
a2 2,2
4,4
A
b1
a1 1,4
b2
3,3
a2 1,2
4,4
A
a
154
b
Jorge Carlos Carrá
IV Teoría de los juegos – 1 Simultáneos con estrategias puras
Figura 3-104
En los juegos con estrategias puras, las acciones dominantes fuertes son las acciones que tienen
ganancias dominantes para todas las elecciones. En la figura anterior la acción a2 es dominante fuerte
pues todas las flechas verticales se dirigen a ella. Eso no sucede con las acciones de B, quien no tiene
ninguna acción dominante (las flechas horizontales no tienen igual sentido).
En particular, si un valor de salida es igual al de llegada, se representa por una flecha doble y si en
este caso existe dominancia, se llama débil. En la figura siguiente la acción a2 es dominante débil.
En los juegos con más de 2 acciones, más cómodo que las flechas, es el marcado de las ganancias
dominantes en cada fila o columna, con un recuadro o asterisco. Lo mismo sucede con la
representación en forma de árbol.
Equilibrio de Nash
La estrategia dominante se refiere a las filas o columnas, en cambio el equilibrio se refiere a los
resultados o celdas (cruce de 2 estrategias llamada también, estrategia conjunta).
La siguiente definición del equilibrio es debida al matemático norteamericano John Nash, quién
recibió el premio Nobel de economía de 1994 por sus aportaciones a la teoría de los juegos, en
especial la que se deriva de su tesis doctoral de 1951: Juegos no cooperativos. Observar que fue
elaborada 43 años antes del premio5.
Dos estrategias cruzadas conforman un equilibrio de Nash si ningún jugador tiene incentivos
para cambiar la suya unilateralmente y por lo tanto lo mejor que puede hacer es quedarse en
la estrategia elegida.
Un equilibrio de Nash para estrategias puras se detecta cuando 2 flechas (o 2 marcas) se encuentran
en una celda, pues en este caso cada jugador está utilizando la mejor estrategia dadas las estrategias
de los demás.
Cadena de conjeturas
El análisis de juegos siempre se comienza pensando nuestra acción, la reacción racional del otro
jugador, nuestra nueva reacción racional, …. De este análisis surge nuestra mejor estrategia en
consecuencia. La palabra "pensando" es conducente en este párrafo pues al ser un juego simultáneo,
todo este proceso solo tiene lugar en la mente de cada jugador. Apreciar que la reacción del otro se
asociará con un perfil fila o columna.
Observar el juego de la figura 3-104b.
• Acción: el jugador B elige por ejemplo b1.
• Reacción: el jugador A elegiría la acción dominante en ganancias a2, dado b1 (dentro del perfil
b1).
• Reacción: el jugador B elegiría la acción dominante en ganancias b2, dado a2.
• Reacción: el jugador A seguiría eligiendo a2, con lo cual las acciones a2, b2, conforman un
equilibrio estable.
Formalmente se tienen las siguientes correspondencias6:
RA (b1 ) = a2
RB (a2 ) = b2
RA (b2 ) = a2
5
Su vida fue llevada al cine en la película: "Una mente brillante", protagonizada por Russell Crowe. Este film
narra sus dificultades para relacionarse con las personas, su esquizofrenia paranoide y sus delirios de
persecución, todos los cuales finalmente pudo controlar.
6
Estas relaciones no son funciones pues podrían existir valores iguales y por lo tanto expresiones del tipo:
RA (b1 ) = a2 , a3 , sin un valor único. Los economistas las llaman correspondencias.
155
Capítulo 3 Distribuciones de Probabilidades
En síntesis, si el jugador B elige b2, entonces el jugador A elegirá a2, pues no tiene incentivos para
cambiarla y tener mayores ganancias (y viceversa). El equilibrio se detecta comenzando desde
cualquier acción de cualquier jugador.
En la figura siguiente se aprecia este equilibrio con un diagrama de relaciones como el que se utiliza
en matemáticas. Si B elige b2, A elige a2, y B se queda en b2, lo cual indica un punto de equilibrio
estable.
RB
RA
b1
a2
b2
RA.
Figura 3-106
El valor de la ganancia en el equilibrio, se llama Valor del juego, en este ejemplo (4, 4).
Los equilibrios pueden naturalmente también obtenerse tildando en la forma extensiva, como se
muestra en la figura siguiente (con un * dentro de A y con un ' dentro de B). El equilibrio se detecta
ahora cuando las 2 marcas se encuentran en el mismo nodo final.
|
|
b1
|
|B
|
|
b2
|
|
|
|
b1.
|
|
|B.
|
b2.
|
|
a1
A
a2
1,4*
3,3
2',2
4',4*
Figura 3-107
Equilibrio de Nash
Se deja al lector concluir que el juego de la figura 3-107 tiene 2 equilibrios de Nash. En general un
juego puede tener 0, 1 o más equilibrios de Nash.
Un equilibrio no produce necesariamente el mejor resultado posible para cada jugador individual,
pero es una situación que conforma a todos ante la amenaza de resultados peores.
Más adelante veremos cómo obtener (si existen) los equilibrios de Nash para estrategias mixtas.
Teorema de Nash (Nash, 1951)
Cualquier juego de n jugadores (de suma variable o constante), tiene al menos un equilibrio de Nash
(puro o mixto).
156
Jorge Carlos Carrá
IV Teoría de los juegos – 1 Simultáneos con estrategias puras
Condiciones necesarias y suficientes para una solución
Condición necesaria
Un equilibrio de Nash es una condición necesaria (pero no suficiente) para ser solución del juego,
esto es:
Solución ⇒ Equilibrio
Esto implica que una situación que no es un equilibrio, no puede ser solución. Pero un equilibrio
podría presentarse con ambas estrategias no dominantes, dominantes o dominadas.
Condición suficiente
Una condición suficiente para una solución del juego en estrategias puras, es que el equilibrio de
Nash sea con ambas estrategias dominantes.
Equilibrio con estrategias dominantes ⇒ Solución
Esto se comprende pues sería ilógico que una estrategia dominada sea solución.
Conocimiento común
Cuando las estrategias son dominantes, podemos visualizar una aplicación directa de la cadena de
razonamientos llamada conocimiento común.
Sea el juego de la siguiente figura.
B
b1
a1 1,4
b2
3,3
a2 3,3
4,2
A
Figura 3-108
La racionalidad de A lo conduce a jugar la estrategia dominante a2 y la racionalidad de B, a jugar la
estrategia dominante b1, por lo cual ambos pueden predecir el equilibrio.
Utilizando el concepto de conocimiento común (página 151):
•
•
•
R: B es racional y elige b1.
S(R): A sabe que B es racional y elige b1 => A elige a2
S(S(R)): B sabe que A elige a2 (B sabe que A sabe que B es racional y elige b1) = > B elige b1.
En general son pocos los juegos que tienen este tipo de equilibrios (un ejemplo es el dilema del
prisionero, en la sección problemas del final del capítulo). A diferencia de los equilibrios con
estrategias no dominantes, estos equilibrios no dependen de las estrategias del otro.
Como consecuencia, si un juego tiene estrategias dominantes no importa quién es el primero. Por lo
tanto nos encontramos con un juego en el que con igual información, se presentan 2 formas
extensivas equivalentes, cada una de ellas con los órdenes invertidos.
Juego de suma cero
Si en particular un juego es de suma cero, el máximo (mínimo) de una fila o columna de un jugador
será el mínimo (máximo) del otro. En la siguiente figura se presenta un juego de suma 10. Se han
colocado por esta vez también las ganancias de B, aunque sabemos que en estos juegos solo se
colocan las de A (jugador de filas), pues las del otro se sobrentienden.
En la figura se ha incluido una columna y una fila adicionales con los valores de ganancias máximas
(expresadas en valores de A), las cuales facilitan la comprensión del siguiente análisis, que cada
jugador pensaría antes de hacer su juego.
157
Capítulo 3 Distribuciones de Probabilidades
•
•
•
•
Acción: A por ejemplo elige a1.
Reacción: B elegiría la acción dominante en ganancias, b1, (coincidirá con el mínimo de A).
Reacción: A elegiría la acción dominante en ganancias (máximo valor de esa columna), a2.
Reacción: B elegiría la acción dominante en ganancias (máximo valor de esa fila), b1, (coincidirá
con el mínimo de A).
Observar que en este caso existe un equilibrio de Nash, la celda (a2, b1), pues B elige b1 y A se
queda en a2, lo cual indica un punto de equilibrio estable.
B
b1
a1 1,9
b2
3,7
a2 2,8
4,6
A
Figura 3-109
Como en los juegos de suma cero no se incluyen las ganancias de B, se debe tener en cuenta que las
flechas de B resultan invertidas respecto de las ganancias de A.
B
a1
b1
1
b2
3
a2
2
4
A
Figura 3-110
c Eficiencia y justicia
Eficiencia
Este concepto (como el equilibrio) se refiere a los resultados (celdas) y no a las estrategias (filas o
columnas).
Comparación local (uno a uno)
Un resultado es Pareto Dominante o Dominante en Ganancias sobre otro, si las ganancias son al
menos iguales a la del otro y una es estrictamente mayor. Si todas son estrictamente mayores, el
resultado es estrictamente Pareto Dominante.
Comparación global (todas las celdas)
Un resultado es Pareto Eficiente si no es Pareto dominado por ningún otro. Si esto no ocurre, se
dice que es Pareto Ineficiente.
Un equilibrio no necesariamente coincidirá con un resultado Pareto Dominante o Pareto Eficiente,
pudiendo existir un resultado Pareto Dominante o Eficiente que no es un punto de equilibrio. Como
es un desequilibrio no puede subsistir y sus ganancias, aunque altas, son efímeras, por lo cual no
debe ser considerado.
Justicia
Un resultado es justo si cada jugador gana lo mismo, es decir si es simétrico.
Este concepto normalmente se encuentra en conflicto con el concepto de eficiencia, en el sentido de
que eficiencia y justicia no puedan satisfacerse a la vez. Este conflicto aparece frecuentemente en
economía, por lo cual no debe sorprender que lo haga en juegos de economía.
158
Jorge Carlos Carrá
IV Teoría de los juegos – 1 Simultáneos con estrategias puras
Juegos de coordinación
Es habitual que 2 equilibrios (puros o mixtos) contrapongan características deseables, como por
ejemplo:
• Dos equilibrios eficientes (tienen iguales ganancias totales). Esto sucede siempre en los juegos
de suma cero con 2 jugadores que presentan varios equilibrios puros.
• Un equilibrio es eficiente y el otro es dominante.
• Un equilibrio es eficiente y el otro es justo.
En estos casos, con varias soluciones posibles, el juego se llama juego de coordinación. Si los
jugadores desearan una estrategia común, deberán coordinar entre ellos dado que el que mueve
primero tendrá una ventaja, pues induciría al otro a adoptar el mismo equilibrio.
d Estrategias Minimax y MaxiMin
MiniMax y Maximin
Son definiciones aplicables a cualquier matriz (pertenezca o no a un juego).
MiniMax
Se halla el máximo de cada fila o columna y luego el mínimo de ese vector.
MaxiMin
Se halla el mínimo de cada fila o columna y luego el máximo de ese vector.
A modo de ejemplo, en la figura siguiente se colocaron en los márgenes de la tabla, los máximos o
mínimos de cada fila o columna con los subíndices R por Row (fila) y C por Column (columna).
Luego se colocó un * o un ' para marcar los MiniMax y MaxiMin.
MinC
MaxR
1' 6 0
6
2 0 3*
3*
3 2 4
4
1' 0 0
MaxC
1 6
2 0
3 2*
3 6
MinR
0
0
3
0
4'
2*
4'
Figura 3-111
Aplicación a la forma normal de un juego
A modo de ejemplo aplicaremos los conceptos de MiniMax o MaxiMin a la bimatriz de un juego.
a1
Acciones B
b1
b2
–3',5
4,4
MaxR
5
Acciones A
MaxC
a2 5,–3*
5
–6,–6
–3'
–3*
Figura 3-112
Minimax
Estrategia MiniMax (con la matriz del adversario)
Supongamos que nos enfocamos en las estrategias de A.
• Acción: A elige una acción cualquiera (fila).
• Reacción: la estrategia usual de B es elegir la dominancia de sus ganancias en esa fila, Max(B)
(máximo dentro de ese perfil fila).
159
Capítulo 3 Distribuciones de Probabilidades
Consecuencia
Si A prevé que B tenga la estrategia de dominancia en sus ganancias, elegiría de entrada la fila que
contenga el mínimo de esos máximos (la solución menos mala), esto es el Mini(Max(B))7, al que
llamaremos simplemente MiniMax de B.
B luego elegiría la celda de ese MiniMax. ¿Podrá B terminar eligiendo el Mini(Max(A))? Esto
ocurre algunas veces y será desarrollado en la siguiente sección.
En la figura anterior se colocaron en la columna marginal los máximos que puede elegir B a cada
acción de A (máximos de fila = MaxRow) y en la fila marginal los máximos que puede elegir A para
cada acción de B (máximos de columna = MaxColumn).
Se colocó una marca * al lado de cada ganancia para resaltar el MiniMax de fila y un tilde ' para el
MiniMax de columna.
Columna : MiniMaxR = −3
Fila : MiniMaxC = −3
Observar que la intersección de ambas acciones no se encuentra en la misma celda.
Estrategia MaxiMin (con la matriz propia)
•
•
Acción: A elige una acción cualquiera (fila).
Reacción: en lugar de maximizar sus ganancias, B podría optar por elegir como estrategia
mínimizar las ganancias de A, Min(A) (la cual es una acción algo paranoica). En este caso le
convendrá a A calcular previamente el máximo de esos mínimos, lo cual lo conduce a la
estrategia llamada Maxi(Min(A))8, es decir el MaxiMin de A.
Ambas estrategias se llaman estrategias conservadoras o de seguridad y por lo tanto son contrarias
a la expresión de mercado: mayor riesgo, mayor beneficio: No es aplicable, por ejemplo, en la
apertura de un mercado si una empresa busca captar mayor participación, en donde se debería
pretender bastante más que una estrategia mínima de seguridad para explotar las debilidades del
adversario.
El valor numérico del MiniMax (o del MaxiMin) se llama nivel de seguridad.
Equilibrio MiniMax o MaxiMin
Sucede cuando el par de estrategias (acciones elegidas) de ambos jugadores se interceptan en la
misma celda.
Equilibrio MiniMax -MiniMax
Se presenta cuando ambos usan la estrategia MiniMax (por lo tanto utilizan la bimatriz) y se cumple
que:
MiniMaxR ≡ MiniMaxC
En los juegos de suma no cero, no tiene porque existir o coincidir con el equilibrio de Nash (que
siempre existe).
Equilibrio MaxiMin -MaxiMin
En forma totalmente análoga se puede analizar si existe equilibrio cuando los jugadores deciden
minimizar las ganancias del otro en lugar de maximizar las suyas (por lo tanto usan la bimatriz).
7
El anidamiento indica las estrategias de cada jugador, en este caso: A(B).
El anidamiento indica las estrategias de cada jugador, en este caso nuevamente: A(B).
Jorge Carlos Carrá
160
8
IV Teoría de los juegos – 1 Simultáneos con estrategias puras
Equilibrio MaxiMin -MiniMax
Si un jugador, por ejemplo B, utiliza la estrategia MaxiMin y el otro A, la estrategia MiniMax,
ambos jugadores utilizarán una sola matriz para el análisis, en este ejemplo solo la matriz de B.
Punto de silla
Es una propiedad que tienen algunas matrices, por la cual el mínimo de fila coincide con el máximo
de columna. Por esta razón, a este punto se lo llama punto de silla, dada la semejanza con la silla de
montar en la cual existe un punto que cruza el mínimo en una dirección (curva cóncava hacia arriba)
con el máximo en la dirección perpendicular (curva cóncava hacia abajo).
Este punto, si existe, no tiene que ser necesariamente único.
En la figura siguiente la celda sombreada contiene el máximo de su columna y el mínimo de su fila.
MaxC
0
4
9
9
1
2*'
0
2'
7
3
0
7
MinR
0
2*
0
Figura 3-113
Punto de silla
Se puede demostrar el siguiente teorema:
La condición necesaria y suficiente para un equilibrio MaxiMin–MiniMax, es que esa celda sea
un punto de silla.
Observar que el punto de silla requiere que sea la misma matriz para ambos jugadores, por lo cual el
equilibrio debe ser MaxiMin–MiniMax.
En la figura siguiente, la celda inferior izquierda es un punto de silla, pues el 2 es el máximo de su
columna y el mínimo de su fila. Si suponemos ahora que esta matriz representa la ganancia de A de
un juego, el punto de silla sería el punto de equilibrio de las estrategias MaxiMin–MiniMax, pues A
elegiría la acción a2 del MaxiMinR y B la acción b1 del MiniMaxC9.
La estabilidad del punto de equilibrio se percibe razonando así:
• Acción: si por ejemplo A eligiera a1.
• Reacción: B elegiría b1.
• Reacción: A elegiría a2.
• Reacción: B elegiría b1.
Observando las 3 últimas reacciones, se aprecia la estabilidad del la estrategia a2-b1.
G(A)
a1
Acciones B
MinR
b1
b2
3
1
1
Acciones A
MaxC
a2 2*'
2'
4
4
2*
Figura 3-114
Punto de silla
9
Esto también ocurrirá si esta matriz fuera de un juego de suma constante (por ejemplo igual a 10).
161
Capítulo 3 Distribuciones de Probabilidades
e Juegos de suma cero
MiniMax = MaxiMin
En estos juegos se verifica que el MaxiMin de una matriz es siempre igual al MiniMax de la otra.
Equilibrio
Como es un juego de suma cero se podrían utilizar siempre los valores de las ganancias de un solo
jugador en el análisis y por lo tanto una sola matriz.
Si por ejemplo se utilizan solo las de A, se tiene:
•
•
•
Acción: A elige una acción.
Reacción: B elegiría el mínimo de esa fila Min(A) (coincidirá con el máximo de la fila de su
matriz).
Reacción: A concluirá que su solución menos mala será el máximo posible de estos valores, es
decir el MaxiMin de A.
Se llega a la misma estrategia utilizando la matriz de ganancias de B.
Sin embargo, estas estrategias no necesariamente coincidirán en la misma celda.
Teorema MiniMax (Von Neumann, 1928)
Cualquier juego de 2 jugadores de suma constante, tiene exactamente un equilibrio MiniMaxMaxiMin (puro o mixto).
Obviamente que si el equilibrio fuera puro sería un punto de silla.
Se aprecia que este teorema un caso particular del teorema de Nash, aplicable a cualquier juego. En
un juego de suma constante, el equilibrio de Nash coincide con el equilibrio MiniMax. Esta analogía
solo es válida para juegos de 2 jugadores.
Ejemplo
En la figura 3-115 se presenta un juego de suma constante 10, con las matrices de A y de B.
B
G(A)
b1
a1 1
b2
3'
MinR
a2
MaxC
b1
a1 9
1
A
B
G(B)
b2
7'
MaxR
9
A
4
4
2*
3'
2*
a2
MinC
6
6
a
8*
7'
8*
b
Figura 3-115
Observando la columna marginal de ambas figuras a y b, se obtienen los siguientes valores, el
primero calculado con las ganancias de A y el segundo con las ganancias de B. Corresponden a la
acción a2.
MaxiMinR = 2 ≡ MiniMaxR = 8
En forma análoga, observando la fila marginal, se obtienen los siguientes valores, el primero
calculado con las ganancias de B y el segundo con las ganancias de A. Corresponden a la acción b2.
MaxiMinC = 7 ≡ MiniMaxC = 3
162
Jorge Carlos Carrá
IV Teoría de los juegos – 1 Simultáneos con estrategias puras
Observar que esta matriz no posee un equilibrio MiniMax en estrategias puras. En la sección
siguiente se estudiará como calcular el equilibrio en estrategias mixtas.
Problema resuelto 3.45 Sistemas de video
Una empresa debe decidir entre adoptar la tecnología de un sistema de video VHS o la de Beta. Ambos son
igualmente buenos, pero una vez adoptada una tecnología, no podrá trabajar con la que utilice la otra. La
matriz de pagos se muestra en la siguiente figura.
Obtener las estrategias MiniMax, los equilibrios puros de Nash, la eficiencia; los valores del juego e interpretar
la situación.
B
Beta
Beta
1,1
VHS
0,0
VHS
0,0
1,1
A
Figura 3-116
Solución
Colocando los máximos de columna y de fila y las flechas, resulta la siguiente tabla:
B
Beta
Beta 1',1*
MaxR
VHS
0,0
1*
A
VHS
MaxC
0,0
1'
1',1*
1'
1*
Figura 3-117
Equilibrio MiniMax-MiniMax
Columna : MiniMax ( para A) = 1
Fila : MiniMax( para B ) = 1
Se encuentran 2 celdas en las que coinciden los MiniMax.
Equilibrio de Nash
Con las flechas se aprecia que ninguna acción es dominante.
Los equilibrios MiniMax coinciden aquí con los 2 equilibrios de Nash, en los cuales las empresas elegirían el
mismo sistema.
Valores del juego
Los valores del juego son 1, 1 para ambos jugadores en ambos equilibrios.
Eficiencia
Como los equilibrios no son dominantes y la eficiencia es igual para ambos, nos encontramos en un juego de
coordinación, en el que ambas empresas deberían coordinar una única estrategia.
163
Capítulo 3 Distribuciones de Probabilidades
Problema resuelto 3.46 El juego de la contaminación
Una empresa preferiría contaminar a instalar un caro sistema para controlar la contaminación. La siguiente
tabla muestra los beneficios para todos los cruces.
Obtener las estrategias MiniMax, los equilibrios puros de Nash, la eficiencia, los valores del juego e interpretar
la situación.
B
Poca
contaminación
Mucha
contaminación
Poca
contaminación
100,100
–30,120
Mucha
contaminación
120,–30
100,100
A
Figura 3-118
Solución
Colocando los máximos de columna, de fila y las flechas, resulta la siguiente tabla:
B
Poca
contaminación
Poca
contaminación
Mucha
contaminación
MaxR
100,100*
–30,120
100*
120,–30
100',100*
100*
120
100'
A
Mucha
contaminación
MaxC
Figura 3-119
Equilibrio MiniMax-MiniMax
Estrategias MiniMax
Columna : MiniMaxR = 100
Fila : MiniMaxC = 100
La estrategia conjunta Mucha Contaminación – Mucha Contaminación es un equilibrio MiniMax-MiniMax.
Equilibrio de Nash
Es la celda en que ambas empresas eligen Mucha contaminación.
La acción Mucha contaminación es dominante para la empresa A. Cuando un jugador A tiene una
estrategia dominante y el otro B no, B debe suponer que A la va a elegir y por lo tanto elegirá la mejor jugada
dado este supuesto. En este caso, B elegiría Mucha contaminación.
Valor del juego
El valor del juego del equilibrio de Nash es 100 para ambos jugadores.
164
Jorge Carlos Carrá
IV Teoría de los juegos – 1 Simultáneos con estrategias puras
Eficiencia
El equilibrio de Nash no es eficiente pues no domina al resto de las ganancias.
Observar que el equilibrio de Nash es en este caso antisocial. El mercado no siempre conduce al resultado
deseable. El estado puede resolver este problema con exenciones impositivas para imponer un equilibrio en la
celda superior izquierda.
Problema resuelto 3.47 Competición Cournot10
Un juego simultáneo en el que dos firmas compiten en cantidades, se llama modelo de competencia de
Cournot, debido al economista francés Agustín Cournot, quien lo estudió por primera vez en 1838,
apareciendo en el último capítulo de su libro, Recherches sur les príncipes mathématiques de la Theorie des
richesses. Cuando la competencia simultánea es en precios, se llama competencia de Bertrand, cuando la
competencia es secuencial en cantidades se llama de Stackelberg y cuando es secuencial en precios se llama
Liderazgo en precios.
Sea un duopolio11 conformado por 2 chocolaterías A y B que desean maximizar sus beneficios y cuyas
cantidades de unidades enviadas al mercado llamaremos qA y qB. La ley de la oferta y la demanda establece
que los precios y las cantidades se relacionan en forma inversa. Asumiremos que el precio de mercado P se
determina por la demanda, en función de la siguiente ecuación lineal:
P = a − b( q A + qB ) si a > b( q A + qB )
P=0
en caso contrario
Observar que P es función de la cantidad que producen ambas empresas, debido a lo cual aparece entre ellas
una relación estratégica.
Supongamos que a = 130, b = 1 y el costo C = 10$ para ambas firmas. Además consideremos por simplicidad
que solo existen 3 posibles cantidades qi, 30, 40 y 60.
a) Construir la matriz de pagos. b) Obtener los equilibrios puros de Nash, los valores del juego y la eficiencia.
Interpretar.
Solución
a)
Resolviendo P para cada valor de los cruces, se obtiene la siguiente tabla de ganancias. Recordemos que en los
paréntesis, convencionalmente se colocan primero las ganancias del jugador colocado en filas, es decir A.
Por ejemplo, si A elige q1=30 y B elige q2=60, se tiene:
P = 130 − (30 + 60) = 40$
Por lo tanto,
•
La ganancia para A es:
( P − c)q1 = (40 − 10)30 = 900$ .
•
La ganancia para B es:
( P − c)q2 = (40 − 10)60 = 1800$ .
10
Ejemplo tomado de Gardner, 1995, Games for Business and economics, pag 136.
Un oligopolio es una industria formada por n empresas con capacidad para modificar los precios en función
de su producción. En particular si n = 2 se llama duopolio. Lo contrario se llama competencia perfecta.
11
165
Capítulo 3 Distribuciones de Probabilidades
qB1=30
qA1=30 1800,1800
B
qB2=40
1500,2000
qB3=60
900,1800
A qA2=40 2000,1500
1600,1600
800,1200
1200,800
0,0
qA3=60
1800,900
Figura 3-120
b)
Eliminación de estrategias fuertemente dominadas
Se observa que en este problema, las acciones 3 para ambas fábricas son estrategias fuertemente dominadas.
Estas acciones pueden eliminarse del análisis pues nunca serán elegidas. Se obtiene así la tabla reducida
siguiente.
B
qB1=30
qA1=30 1800,1800
qB2=40
1500,2000
qA2=40 2000,1500
1600,1600
A
Figura 3-121
Repitiendo la reducción de estrategias fuertemente dominadas, se eliminarían las acciones 1 de cada fábrica,
resultando como equilibrio de Nash, la estrategia de elegir la acción 2 para ambas empresas. Cada empresa
producirá 40 unidades y por lo tanto el precio de mercado será:
P = 130$ − 2(40)$ = 50$
40$ por arriba de los costos (10$), lo cual produce unos beneficios totales de 1600$.
Nota
Por la condición de suficiencia antes vista (página 157), al eliminar estrategias débilmente dominadas, se
pierden los equilibrios de Nash que pudieran existir en estas estrategias.
Un método alternativo es el siguiente.
Celda por celda
Colocar las flechas verticales y horizontales indicando el sentido de las ganancias. La tabla resulta:
B
qB1=30
qA1=30 1800,1800
qB2=40
1500,2000
qA2=40 2000,1500
1600,1600
A
Figura 3-122
Si existe una celda en la que concurren todas las flechas, será la estrategia común para ambos jugadores, en
este caso la celda (1600,1600). Este es entonces el equilibrio de Nash de esta competición y 1600 es el valor
del juego. Ambas fábricas elegirían las producciones de 40 unidades pues es la mejor estrategia dada la
estrategia del otro.
Eficiencia
Observar que la solución es ineficiente pues existe una situación (1800,1800) con ganancia s mayores para los
jugadores, pero que no es un equilibrio.
166
Jorge Carlos Carrá
IV Teoría de los juegos – 2 Simultáneos con estrategias mixtas
2 Simultáneos con estrategias mixtas
El equilibrio de estrategias mixtas implica volverse impredecible. Esto es deseable en el caso de que
no exista un equilibrio de estrategias dominantes, pues evitará conductas sistemáticas que puedan ser
aprovechadas por el otro jugador. Esta conducta es la que se observa por ejemplo en los jugadores de
póker que desean tener algún tipo de éxito.
Una estrategia mixta es una distribución de probabilidades sobre el conjunto de estrategias.
Por lo tanto:
p1a1 + p2 a2 + ... pn an = 1
La selección de cualquiera de las acciones es un evento aleatorio para el jugador. Como resultado,
cada jugador aleatoriza su decisión, algunas veces elige la acción a1, otras veces la a2, etc. En este
sentido, su estrategia resulta una mezcla aleatoria de las estrategias puras.
a Formas del juego
Forma normal
Además de la tabla de ganancias, se debe incluir la tabla de contingencias con las probabilidades de
cada acción.
Llamamos:
pA = probabilidad de que A juegue la acción a1.
pB = probabilidad de que B juegue la ación b1.
Dado que las acciones son independientes entre sí, resulta entonces el esquema que se muestra en la
siguiente figura, con la tabla de contingencias y la de ganancias en una sola tabla.
Acciones B
b1
b2
T
a1 GA11, GB11
GA12, GB12
pApB
pA
pA(1–pB)
Acciones A a2 GA21, GA21
GA22, GB22
(1- pA)pB (1–pA)(1–pB) 1- pA
T
pB
1–pB
1
Figura 3-123
Tabla del juego mixto
Forma extensiva
Un árbol del juego sería simplemente el árbol de probabilidades condicionales correspondiente a la
tabla anterior (recordando que los eventos son independientes), adaptado al formato habitual en la
teoría de juegos.
167
Capítulo 3 Distribuciones de Probabilidades
pA a1
A
(1-pA) a2
|
| pB b1
|
|
|B
|
| (1-pB) b2
|
|
|
pB b1.
|
|
|B.
|
| (1-pB) b2.
|
GA11, GB11
pApB.
GA12, GB12
pA(1-pB)
GA21, GB21
(1-pA)pB
GA22, GB22
(1-pA)(1-pB)
Figura 3-124
b Equilibrio de Nash
El equilibrio de Nash de estrategias mixtas se materializa con la obtención adecuada de los valores
de pA y pB necesarios para que cada jugador maximice sus respectivas ganancias. Esta estrategia
también es llamada estrategia óptima.
Si un juego verifica la condición suficiente de solución de un equilibrio puro con estrategias
dominantes (página 157), no existirá un equilibrio en estrategias mixtas y por lo tanto finaliza el
análisis. Esto se comprende pues sería ilógico que se le asignara una probabilidad a la estrategia
dominada. De todas formas, si se resolviera por el enfoque de estrategias mixtas, se obtendría un
valor de probabilidad mayor que 1 o menor que 0, lo cual indica esta situación al modelador. Esto se
podrá apreciar desde el punto de vista gráfico en el siguiente problema resuelto.
La esperanza obtenida es el valor del juego y será favorable a alguno de ellos o 0. En este último
caso se dice que el juego de 2 jugadores 2 × 2 de suma cero, es neutro.
Sin embargo, el valor del juego es en este caso un valor al cual tenderá la ganancia del promedio de
muchos juegos. Si el número de repeticiones no es muy alto, la suerte podrá aumentar o disminuir la
ganancia.
Existen 3 métodos de resolución. A continuación los describiré conceptualmente y dejaré los detalles
para el próximo problema resuelto.
1 Método de maximización
Consiste aplicar el análisis infinitesimal a la expresión general de la ganancia conjunta del juego,
para obtener el valor máximo de la misma.
Por lo tanto primero deberá derivarse la misma respecto de sus variables pA y pB y luego igualar esta
expresión a 0. La resolución proveerá los valores de pA y pB. Notar que al derivar respecto de una
probabilidad se considera a la otra como si fuera constante. Esto solo es verdad en el equilibrio.
2 Método de igualación de ganancias
Este método se basa en la igualación de ganancias esperadas.
En un juego de n×m se llega a un sistema superdeterminado (más ecuaciones que incógnitas).Los
dos métodos principales de resolución de estos sistemas son el de mínimos cuadrados ya visto en la
168
Jorge Carlos Carrá
IV Teoría de los juegos – 2 Simultáneos con estrategias mixtas
regresión (capítulo 1) y la programación lineal12. Sin embargo, podremos resolver los siguientes
dos casos particulares sin usar ninguna de estas técnicas:
• Juegos n×n
En estos casos se llega a un sistema determinado, el cual se resuelve como es habitual.
• Juegos 2×n
El sistema es superdeterminado pero al ser 2 el número de filas o columna), se puede resolver en
forma gráfica en el plano.
Ambas situaciones se presentan en el siguiente problema resuelto.
3 Método de Williams
Es el resultado de la aplicación de la geometría a 2 triángulos semejantes que se encuentran en la
solución gráfica del método de igualación de ganancias de un juego 2×2.
c Funciones de mejor respuesta
(BRF, Best Response Function)
Son las gráficas de una probabilidad pA en función de la otra pB. Se construirán luego en un
problema resuelto.
Problema resuelto 3.48 Estrategia de juego en el saque
Un jugador de tenis sabe que cuando espera el saque, no debe decidirse a cubrir un determinado lado de la
cancha hasta el último momento pues de lo contrario el sacador puede aprovecharse y tirar la pelota en sentido
contrario. Si bien las decisiones son simultáneas, predecir la jugada del contrario tiene muchas ventajas.
Supongamos que los jugadores Del Potro, S (Sacador) y Federer, R (Receptor) tienen una matriz de ganancias
como la de la figura siguiente. Estas probabilidades pueden ser calculadas de las estadísticas correspondientes
a los partidos previos entre ambos. Indican por ejemplo que si R prevé correctamente el saque derecho, tiene
éxito el 90% de las veces. Apreciar que este es un problema de suma cero pero el procedimiento es totalmente
general. Luego en los problemas finales se pedirá resolver por ejemplo el juego del gallina, de suma no cero.
Del Potro Sacador
Derecho Revés
Derecho
90%
20%
Federer
Receptor Revés
30%
60%
Figura 3-125
Obtener los equilibrios de Nash (puros y mixtos) e interpretarlos. Compararlos con los equilibrios MiniMax.
¿Son los equilibrios eficientes?
Solución
Primero se debe analizar la existencia o no de estrategias puras dominantes (fila o columna con valores
sistemáticamente superiores a la otra). De la siguiente tabla se concluye que en este caso no existen estrategias
puras dominantes para las ganancias de ninguno de los jugadores.
Además, por ser un juego de suma cero, los equilibrios de Nash coinciden con los equilibrios MiniMax.
12
El objetivo de esta técnica es optimizar (en general maximizar), una ecuación W = f(X,Y,Z,…, con
inecuaciones de vínculo (desigualdades en lugar de igualdades). Se llama lineal pues todas las ecuaciones e
inecuaciones son lineales. Scheid, F. 1972, pag 368.
169
Capítulo 3 Distribuciones de Probabilidades
Federer
Receptor
Del Potro Sacador
Derecho
Revés
Derecho
90%
20%
Revés
30%
60%
Figura 3-126
1 Método de maximización
El paso siguiente es analizar las estrategias mixtas, debido a lo cual, en la siguiente tabla se muestran las
probabilidades pR y pS de que el receptor prevea un saque derecho o que el sacador realice un saque derecho.
El método de maximización consiste en obtener los valores de pR y pS de la distribución conjunta. Si se expresa
en forma tabular, se obtiene la tabla de la siguiente figura.
Del Potro Sacador
1 Derecho
2 Revés
T
20%
1 Derecho
90%
pR (1- pS)
pR
pR pS
Federer
60%
2 Revés
30%
Receptor
(1- pR) pS (1- pR)(1- pS) 1- pR
T
pS
1- pS
1
Figura 3-127
La expresión de la ganancia conjunta del receptor es:
GR = pR ((90 pS + 20(1 − pS )) + (1 − pR )(30 pS + 60(1 − pS )) =
= pR (70 pS + 20) + (1 − pR )(−30 pS + 60) =
= pR (100 pS − 40) + 60 − 30 pS
Diferenciando con respecto de pR, se obtiene:
100 pS − 40 = 0 ⇒
pS = 0.40
GR = 48%
Observar que si el sacador utiliza este valor de pS, no interesa cual sea el valor de pR que elija el receptor, pues
en la ecuación de GR se anula el término que contiene a pR. Una breve reflexión indicará que esto siempre
ocurrirá (en un juego de 2 jugadores 2×2), dado el formato con el que resulta la ecuación.
Análogamente para la ganancia del sacador (utilizando en la matriz de ganancias, las complementarias de las
anteriores), resulta:
GS = pS ((10 pR + 70(1 − pR )) + (1 − pS )(80 pR + 40(1 − pR )) =
= pS (−60 pR + 70) + (1 − pS )(40 pR + 40) =
= pS (−100 pR + 30) + 40 + 40 pR
Diferenciando con respecto de pS, se obtiene:
−100 pR + 30 = 0 ⇒
pR = 0.30
GS = 52%
Nuevamente observar que si el receptor utiliza este valor de maximización de ganancias, no interesa cual sea el
valor de pS que elija el sacador, pues en la ecuación de GS se anula el término que contiene a pS. Es decir que la
170
Jorge Carlos Carrá
IV Teoría de los juegos – 2 Simultáneos con estrategias mixtas
maximización de la ganancia conjunta en un juego de 2 jugadores 2×2, equivale a la obtención de un pR tal que
esa ganancia sea independiente de pS. De esta forma se minimiza la habilidad del oponente de reconocer
comportamientos sistemáticos en nuestras propias elecciones y nada de lo que haga afectará el resultado.
Para que estos resultados tengan validez, deben ser aplicados en forma totalmente aleatoria (por ejemplo
mirando la posición del minutero de un reloj, asignando sectores o cuadrantes al tiro derecho y al revés). De
todas formas recordar que las ganancias tenderán a los valores esperados del juego, solo si el número de
repeticiones es suficientemente grande.
Las ganancias del equilibrio mixto son (48, 52), por lo tanto la estrategia es Pareto Ineficiente pues sus
ganancias no son iguales o mayores que las de cualquier otro resultado. Además, esta solución no domina a
ninguna de las estrategias de la matriz del juego (la bimatriz se muestra en la figura siguiente). Claramente, si
existieran estrategias puras y mixtas, debería elegirse aquella que domine en ganancias.
La matriz de ganancias con las probabilidades encontradas se muestra en la figura siguiente. Así por ejemplo
se extrae que si ambos jugadores utilizan sus estrategias mixtas, la probabilidad de que el Sacador lo haga con
el revés y el Receptor reciba también con el revés es del 42%, con las cuales el Receptor tendrá una
probabilidad de éxito del 60% (ganancia de 60).
Del Potro Sacador
1 Derecho 2 Revés T
1 Derecho
(90,10)
(20,80)
0.12
0.18
0.3
Federer
2 Revés
(30,70)
(60,40)
Receptor
0.28
0.42
0.7
T
0.4
0.6
1
Figura 3-128
2 Método de la igualación de ganancias
Utilizando el concepto deducido en el método anterior, la maximización de ganancias conduce a que cada
jugador obtenga siempre la misma ganancia esperada con independencia de la acción del otro jugador13 .Esto
implica igualar las esperanzas dentro de cada perfil (luego se ampliará el concepto para cualquier juego de 2
jugadores, no solo de 2×2).
Para igualar los pagos se ha agregado a la tabla una columna y fila marginal, que contienen las expresiones de
las esperanzas dentro de cada perfil. Observar que para obtener estas ecuaciones, se deben utilizar las
ganancias de la distribución que corresponda.
Del Potro Sacador
1 Derecho
2 Revés
T
(20,80)
1 Derecho
(90,10)
70pS+20
pR
pR (1-pS)
pR pS
2 Revés
(30,70)
(60,40)
Federer
-30pS+60
(1-pR) pS (1-pR)(1-pS) 1-pR
Receptor
T
pS
1-pS
1
-60pR+70
40pR+40
Figura 3-129
13
Además de ser los perfiles fila (columna) iguales entre sí por tratarse de eventos independientes.
171
Capítulo 3 Distribuciones de Probabilidades
Analíticamente
ER1 = 70 pS + 20
ER 2 = −30 pS + 60
Observar que si el sacador S eligiera pS =1, es decir siempre juega Derecho, la esperanza de S, si solo juega
Derecho, daría ER1 = 90, el cual naturalmente coincide con el valor de la celda superior izquierda.
Análogamente se puede analizar el valor pS = 0 y la otra ecuación.
Igualando las esperanzas, se llega a un sistema de 2 ecuaciones con 2 incógnitas, al que procedemos a resolver.
70 pS + 20 = −30 pS + 60
⇒ pS = 0.40
Del Potro debe sacar el 40% de los tiros de derecha y el 60% de revés.
Análogamente:
ES1 = −60 pR + 70
ES 2 = 40 pR + 40
−60 pR + 70 = 40 pR + 40
⇒ pR = 0.30
Federer debe posicionarse para recibir el 30% de los tiros de derecha y el 70% de revés.
El valor del juego para cada jugador se obtiene reemplazando el valor obtenido en cualquiera de los miembros
de la igualdad.
GR = 48%
GS = 52%
Se obtienen así los mismos valores que con el método anterior.
Diagrama de árbol
Contiene los valores condicionales, los conjuntos y las ganancias. Notar que las ganancias se colocan en el
orden en el que se construye el árbol.
0.40 Derecho
.
Del Potro
0.60 Revés
|
0.30 Recibe
|
Derecho (10,90)
|
|
|Federer
|
0.70 Recibe (70,30)
|
Revés
|
|
0.30 Recibe
|
Derecho. (80,20)
|
| Federer.
|
|
|
|
0.70. Recibe (40,60)
Revés.
Figura 3-130
172
Jorge Carlos Carrá
0.12
0.28
0.18
0.42
IV Teoría de los juegos – 2 Simultáneos con estrategias mixtas
Comprobar que los valores del juego para cada jugador, dada cualquier acción del otro, se pueden obtener
también del diagrama de árbol. Así por ejemplo:
GFederer|Derecho = 0.3(90) + 0.7(30) = 48% .
Gráficamente
Estas ecuaciones pueden resolverse en forma gráfica, dibujando las esperanzas ER1 y ER2 en un solo diagrama.
Figura 3-131
En la figura anterior puede verse que la combinación 40:60 del sacador es la mejor que tiene el servicio pues es
la única que no puede ser aprovechada por el receptor. Si el sacador S eligiera cualquier otra estrategia, por
ejemplo 30%, el receptor R contestará con la estrategia ER2 anticipando al revés, lo cual le proporcionaría un
porcentaje de éxito de 51%, superior al 48%. En el límite, si S eligiera pS = 0%, es decir sacando siempre de
revés, R tendría una ganancia de 60%, tal como indica la matriz de pagos.
Lo mismo sucede si por ejemplo S eligiera el 50%, pues R contestaría eligiendo la estrategia ER1, anticipando a
la derecha, con un porcentaje de éxito de 55%, superior al 48%. Es por esto que el punto 40:60 es ciertamente
un punto de equilibrio, en el sentido de que cualquier alejamiento de él, nos retorna al mismo.
Matemáticamente:
pS < 0.4 ⇒ pR = 0
pS = 0.4 ⇒ ∀pR
pS > 0.4 ⇒ pR = 1
Observar además que este razonamiento se corresponde con una estrategia MiniMax del Sacador, pues:
• Acción: S elige una estrategia.
• Reacción: R elige la dominancia de sus ganancias. Dado que las rectas corresponden a las ganancias del
receptor, los valores máximos que elegiría racionalmente el Receptor, se encuentran en la poligonal
superior. Debido a esto, el Sacador reaccionaría con el mínimo de esos valores, es decir el vértice inferior
de esa poligonal.
Razonando en forma análoga, en la figura siguiente puede verse que la combinación 30:70 del receptor es la
mejor que tiene, pues es la única que no puede ser aprovechada por el sacador. Cualquier otra, si se aprovecha
por el sacador, le proporciona un porcentaje superior al 52%.
173
Capítulo 3 Distribuciones de Probabilidades
Figura 3-132
Matemáticamente:
pR < 0.3 ⇒ pS = 1
pR = 0.3 ⇒ ∀pS
pR > 0.3 ⇒ pS = 0
Notas
1. Pueden dibujarse ambas rectas a partir de los 2 valores extremos (ver figuras anteriores), valores que
pueden leerse directamente en la bimatriz, en una posición cuyo patrón podrá el lector fácilmente
encontrar y recordar.
2. La grafica de estas rectas puede anticipar la existencia o no de solución real, es decir con la intersección de
las mismas dentro del intervalo [0, 1]. Si la intersección se presenta fuera de este intervalo, o no existe,
entonces podrá decirse que no se presenta un equilibrio en estrategias mixtas.
Juegos 2×n
El MiniMax para un juego de 2×2, consiste en la igualdad de esperanzas, pero esto ya no es cierto para un
juego de 2×n.
Si por ejemplo fuera un juego de 2×3, se tendrían 3 rectas E1, E2 y E3, como se muestra en la figura siguiente.
174
Jorge Carlos Carrá
IV Teoría de los juegos – 2 Simultáneos con estrategias mixtas
Figura 3-133
En este caso, el equilibrio no consiste en igualar las 3 esperanzas entre sí, sino en encontrar el vértice inferior
del polígono delimitado por los ejes y la parte superior de las rectas, pues para cualquier otro valor, el oponente
contestará con una estrategia que le produce mayor ganancia. En la figura, este vértice inferior corresponde a la
igualación de E1 con E2. Observar que si se calculara el valor p correspondiente a la igualación entre E2 y E3, el
oponente B contestará con la estrategia E1, pues le produce una mayor ganancia y por lo tanto no sería la
estrategia óptima.
Este es un problema típico de programación lineal pero, como puede apreciarse, se resuelve perfectamente
graficando las rectas y hallando la intersección que corresponda al vértice más bajo de la poligonal superior.
Juegos n×n
En este caso simplemente deberá resolverse el sistema determinado de n ecuaciones con n incógnitas, en
forma similar al del sistema de 2 ecuaciones con 2 incógnitas correspondiente a este ejemplo.
3 Método de Williams
Método solo válido para un juego 2×2. Comparando los 2 triángulos semejantes que se observan a cada lado de
la recta vertical que pasa por la intersección de las rectas inclinadas, se deducen las siguientes relaciones, de
donde se extraen los valores de pR y pS.
Para la probabilidad del Receptor (primer gráfico):
pS
60 − 20
=
1 − pS 90 − 30
⇒ pS = 0.40
Para la probabilidad del Sacador (segundo gráfico):
pR
70 − 40
=
1 − pR 80 − 10
⇒ pR = 0.30
La forma más directa para obtener estas relaciones es hacer una figura de análisis, graficando a mano alzada
las rectas del diagrama respectivo.
175
Capítulo 3 Distribuciones de Probabilidades
Problema resuelto 3.49 Estrategia de juego en el saque
Para el problema anterior, obtener las funciones de mejor respuesta.
Función de mejor respuesta (BRF, Best Response Function)
La siguiente figura de pR en función de pS, muestra en forma gráfica las relaciones encontradas:
pS < 0.4 ⇒ pR = 0
pS = 0.4 ⇒ ∀pR
pS > 0.4 ⇒ pR = 1
Figura 3-134
Función de mejor respuesta (BRF, Best Response Function)
La siguiente figura de pS en función de pR, muestra gráficamente las relaciones:
pR < 0.3 ⇒ pS = 1
pR = 0.3 ⇒ ∀pS
pR > 0.3 ⇒ pS = 0
176
Jorge Carlos Carrá
IV Teoría de los juegos – 2 Simultáneos con estrategias mixtas
Figura 3-135
En la figura siguiente se muestra la combinación de las funciones de mejor respuesta, BRF. Los equilibrios de
Nash son las intersecciones de ambos, en este caso solo el equilibrio mixto.
Figura 3-136
Notas
1. Un juego que tiene un equilibro de estrategias puras, puede ser interpretado como un caso particular del de
estrategias mixtas con p = 0 o p = 1 . Si por ejemplo las funciones de mejor respuesta, BRF, fueran
como las de la siguiente figura, se tendrían 3 equilibrios, el mixto en (0.30, 0.40) y los 2 puros en las
intersecciones (0, 0) y (1, 1).
2. Si se construyen las BRF para un juego 2×2 que contenga una sola estrategia pura, es decir con algunas de
las soluciones:
(pA, pB) = (0, 0), (0, 1), (1, 0) o (1, 1),
177
Capítulo 3 Distribuciones de Probabilidades
se observará que las rectas solo se pueden cortar en los vértices del cuadrado delineado en la figura
anterior, por lo cual no existirá la posibilidad de un equilibrio en estrategias mixtas.
Figura 3-137
Del análisis gráfico precedente puede apreciarse que los juegos presentan en general un número impar de
equilibrios.
d Conjunto convexo de ganancias
Conjunto convexo
Un conjunto es convexo si al contener 2 puntos, también contiene la recta que los une.
Es decir, A es convexo:
Si x, y ∈ A ⇒ ax + by ∈ A
Conjunto convexo de ganancias
Dado un juego de 2 oponentes A y B, graficamos en un sistema de ejes G(A), G(B), los puntos de
cada celda de la bimatriz. El conjunto convexo de ganancias es el menor conjunto convexo que
contiene a dichos puntos. Por lo tanto será el contorno de esos puntos.
Sea por ejemplo la bimatriz de un juego, de la siguiente figura. Se marcaron con un * los resultados
dominantes de columna y con un ' los dominantes de fila. Se aprecia por lo tanto que la estrategia
a2, b3 es un equilibrio puro de Nash y que además es Pareto eficiente.
b1
A
B
b2
b3
a1 2*,-1 -1,2' 1,0
a2 1,1' 3*,0 2*,1'
Figura 3-138
El conjunto convexo de ganancias se muestra en la figura 3-139.
178
Jorge Carlos Carrá
IV Teoría de los juegos – 3 Secuenciales
Figura 3-139
Cualquier punto del interior de este conjunto podría ser una estrategia conjunta entre ambos
jugadores, sea pura (un punto ya existente en la bimatriz) o mixta (un punto cualquiera no
perteneciente a la bimatriz). Esta estrategia podría incluso provenir de un acuerdo cooperativo entre
los jugadores, aunque no coincida con un resultado de la teoría.
3 Secuenciales
Los juegos secuenciales se presentan a menudo. Ejemplos habituales son por ejemplo:
• un comprador hace una oferta y el vendedor debe decidir si acepta o no,
• un político debe decidir si realiza una costosa campaña, observando la decisión de su oponente.
Al igual que los juegos simultáneos, los secuenciales pueden representarse en forma normal o en
forma extensiva.
a Formas del juego
Forma extensiva
En la forma extensiva, es decir con un diagrama de árbol, se encuentra implícito el orden del juego,
por lo cual es más adecuada para los juegos secuenciales.
179
Capítulo 3 Distribuciones de Probabilidades
b1
a1
G(b1|a1)
B
b2
G(b2|a1)
A
b3
a2
G(b3|a2)
B.
b4
G(b4|a2)
Figura 3-140
Observar en la figura que se colocaron distintas acciones de B en cada estrella. Esto se hizo así pues
en un juego secuencial no es imprescindible que las acciones de un jugador en las distintas estrellas
sean las mismas.
Forma normal
La representación normal de un juego secuencial requiere modificar las acciones del jugador B que
sigue al primero A, pues dado que modelan un juego sucesivo, cada acción de B debe contemplar la
reacción para cada una de las acciones que A previamente ha decidido.
Juego simultáneo
Tomando como ejemplo el juego 2×2 de la figura anterior, las acciones de B son solo 2, (b1 y b2) y la
tabla de ganancias es de 2×2.
Juego secuencial
Tomando el mismo ejemplo, las acciones del segundo jugador B, deben ser 4:
(b1|a1 o b3|a2),
(b1|a1 o b4|a2,
(b2|a1 o b3|a2),
(b2|a1 o b4|a2).
La tabla de ganancias será de 2×4, como se muestra en la figura 3-141. De esta forma, cualquier
acción que elija B, contiene la respuesta a la acción que elija A, exactamente como si se actuara en
forma sucesiva.
B
A
a1
a2
b1|a1 o b3|a2
G(b1|a1)
G(b3|a2)
b1|a1 o b4|a2
G(b1|a1)
G(b4|a2)
b2|a1 o b3|a2
G(b2|a1)
G(b3|a2)
b2|a1 o b4|a2
G(b2|a1)
G(b4|a1)
Figura 3-141
Por razones de simplicidad podría sobreentenderse la condicionalidad y entonces la tabla quedaría
como en la figura siguiente (la primera acción de B es |a1 y la segunda es |a2).
180
Jorge Carlos Carrá
IV Teoría de los juegos – 3 Secuenciales
B
A
a1
a2
b1b3
G(b1|a1)
G(b3|a2)
b1b4
G(b1|a1)
G(b4|a2)
b2b3
G(b2|a1)
G(b3|a2)
b2b4
G(b2|a1)
G(b4|a1)
Figura 3-142
Se aprecia así que las columnas están formadas por las combinaciones de cada una de las acciones de
B de una estrella con cada una de las otras estrellas.
Por ejemplo:
• en un juego de 2×3, B tendrá 3*3 = 9 acciones.
• en un juego de 3×2, B tendrá 2*2*2 = 8 acciones.
• en un juego de m×n, B tendrá n m acciones.
b Subjuego
Es una parte de un juego, que al ser separado, constituye por sí mismo un juego independiente. Debe
cumplir las siguientes propiedades:
1. Comenzar en un solo nodo.
2. Contener todos los sucesores de ese nodo en el árbol.
3. Contener todos los nodos de los conjuntos de información que incluya el subjuego.
Todo juego con información perfecta, IP, tiene subjuegos.
Un juego con información imperfecta, II, no puede tener más subjuegos que el mismo pues debe
comprender en forma completa al conjunto de información.
Sin embargo, los juegos pueden contener ambas modalidades, con subjuegos con IP y subjuegos con
II. Se resuelven cada uno de los subjuegos y luego se colocan los resultados en el juego general.
c Equilibrios
Forma extensiva
Condición suficiente
La condición suficiente para resolver un juego en forma extensiva es la siguiente:
Un equilibrio es perfecto en subjuegos si cada jugador lo hace en forma óptima (ganancia
dominante) en cada subjuego.
Todas las estrategias que no satisfacen esta condición, se llaman imperfectas.
Inducción hacia atrás
El procedimiento para construir un equilibrio perfecto en subjuegos es el principio de inducción
hacia atrás, basado en el conocimiento común (página 151).
Se busca la mejor estrategia mirando hacia adelante y razonando hacia atrás.
•
•
R
El último jugador actuará racionalmente =>
se comienza hallando la ganancia dominante de cada uno los subjuegos finales (se elige esa rama
de cada una de las estrellas finales, marcándola por ejemplo con una flecha).
S(R)
El penúltimo jugador sabe que el último jugador actuará racionalmente =>
se retrocede en el árbol hallando la ganancia dominante de cada subjuego mayor que anida a los
181
Capítulo 3 Distribuciones de Probabilidades
últimos (nuevamente se elige y se marca con una flecha a una rama de cada estrella penúltima, lo
cual descartará a las estrellas finales existentes no elegidas).
Se sigue con el conocimiento común hasta llegar al principio del juego. El camino continuo de ramas
con flechas que resulta, se llama Trayectoria o Sendero del equilibrio. Esta solución es un
equilibrio perfecto en subjuegos pues es dominante en todos los subjuegos
La inducción hacia atrás no puede ser usada en juegos simultáneos pues existen nodos desde los
cuales no se puede observar todo lo que ha pasado (conjuntos de información con más de un nodo),
los cuales impiden aplicar este principio. En estos juegos debe utilizarse la solución del equilibrio de
Nash, antes estudiado para estos juegos.
Teorema de Nash
En realidad se trata de un caso particular del teorema ya visto (página 156), para juegos secuenciales.
Los juegos finitos de información perfecta, tienen al menos un equilibrio perfecto en subjuegos.
Esto es simplemente la consecuencia de que la inducción hacia atrás necesariamente termina después
de una serie de pasos. Si existiera algún empate entre 2 acciones, se deberían realizar 2 diagramas,
uno por cada una de las elecciones.
Observar entonces que, a diferencia de los juegos simultáneos, en los juegos secuenciales siempre
existe un equilibrio en estrategias puras.
Ejemplo
En el ejemplo del siguiente árbol, se han marcado con una flecha las ramas que en cada estrella
tienen las mayores ganancias, comenzado desde el final. Recordemos que las ganancias se colocan al
final del árbol, en el orden de los jugadores.
Así por ejemplo, en la estrella (subjuego), ubicada en la parte superior derecha del árbol, las
ganancias del jugador C son 3 para la rama superior y 1 para la inferior, por lo cual se resaltó la
superior c1. Análogamente para la estrella que se encuentra por debajo se resaltó la rama superior,
pues 5 es mayor que 1. El siguiente paso es analizar las estrellas penúltimas. Siguiendo con el
ejemplo, se resaltó la rama superior b1 pues 3 es mayor que 2.
Se continúa con este proceso hasta llegar al inicio del árbol. El sendero del equilibrio será, por lo
tanto, el conformado por las ramas superiores y el equilibrio se conforma con las ganancias (4, 3, 3).
Notar que el jugador A obtiene una ganancia de 4 aunque existe una ganancia mayor de 5, la cual no
es alcanzada por la racionalidad de los otros jugadores.
El estudiante puede averiguar si en este juego el orden importa, colocando a los jugadores en por
ejemplo, el orden BAC y resolviendo nuevamente el equilibrio (las ganancias no cambian de valor,
solo de ubicación).
182
Jorge Carlos Carrá
IV Teoría de los juegos – 3 Secuenciales
c1
C
b1
B
a1
4,3,3
b2
4,4,1
c2
c1.
4,2,5
c2.
5,5,1
c1..
1,4,4
c2..
1,5,2
c1...
3,3,4
C.
A
b1.
C..
a2
B.
b2.
C...
c2...
1,2,5
Figura 3-143
Forma normal
En la forma normal equivalente aparecen tanto los equilibrios perfectos como los imperfectos.
Esta particularidad se analizará con un ejemplo en el siguiente problema resuelto.
Estrategias dominadas y la inducción hacia atrás
La eliminación de ramas de la inducción hacia atrás de la forma normal es equivalente a la
eliminación de estrategias dominadas de la forma normal. Esto se cumple siempre, pero debe tenerse
una precaución por la existencia de estrategias débilmente dominadas, debiendo seguirse, por las
dudas, el mismo orden de eliminación de ramas de la inducción hacia atrás, para obtener igual
resultado.
A modo de ejemplo, en la siguiente figura se presenta un ejemplo en el cual el equilibrio de Nash
(100, 100) se pierde si se eliminan las estrategias débilmente dominadas correspondientes a su fila o
columna.
(1, 1)
(100; 0)
(0, 100)
(100, 100)
Figura 3-144
En la figura que sigue, si se eliminan las estrategias dominadas en un orden distinto, se obtienen
diferentes resultados. Si la columna dominada se elimina primero, queda la columna derecha. Si la
fila dominada se elimina primero, queda la fila inferior.
(0, 0)
(0; 1)
(1, 0)
(0, 0)
Figura 3-145
183
Capítulo 3 Distribuciones de Probabilidades
d Juegos simultáneos
Simultáneo en forma extensiva
Sabemos resolver los juegos simultáneos buscando los equilibrios con su forma normal. Pero ¿es
esto equivalente a la resolución con la inducción hacia atrás con la forma extensiva? La respuesta es
no. Veamos porque.
Recordemos que el equilibrio en la forma normal se basa en colocar flechas según las dominancias
de ganancias dentro de cada acción (fila o columna) independientemente de la elección del otro
(son simultáneos). Por su parte, la inducción hacia atrás, excepto para el último jugador, las flechas
se colocan dentro de las estrategias ya elegidas por los anteriores.
b1
B
b2
|
|
|C
|
|
|
| C.
|
|
c1
3,3
4,1
c2
c1.
2,5
c2.
5,1
Figura 3-146
A modo de ejemplo, en el juego de la figura anterior las flechas de C corresponden a dentro de b1 o
dentro de b2.
Luego de C se coloca la flecha de B. Dado que en este caso la acción c1 fue dominante en ambas
estrellas, la flecha de B es el resultado de las ganancias dominantes dentro de c1. En este caso existe
coincidencia con el procedimiento de la forma normal, lo cual puede corroborarse con el diseño del
juego en forma normal que se muestra en la siguiente figura, del cual resulta un equilibrio de Nash
para el par b1c1.
C
c1
b1 3, 3
c2
4, 1
b2 2, 5
5, 1
B
Figura 3-147
Pero veamos ahora la siguiente figura en la cual se intercambiaron las ganancias de la mitad inferior.
La flecha de B debe ser ahora dentro de la estrategia c1c2, la cual deja de ser una acción pura de C
(en la tabla 2×2 de la forma normal se correspondería con dentro de diagonal en lugar de dentro de
fila o columna).
184
Jorge Carlos Carrá
IV Teoría de los juegos – 3 Secuenciales
|
|
|C
|
|
|
| C.
|
|
b1
B
b2
3,3
c1
4,1
c2
c1.
5,1
c2.
2,5
Figura 3-148
Este ejemplo muestra que, salvo para el caso particular de estrategias dominantes en ambos
jugadores, en un juego simultáneo la inducción hacia atrás no puede aplicarse.
Secuencial con partes simultáneas
A modo de ejemplo, observar la forma normal del siguiente juego dado en la forma extensiva.
Forma extensiva
a1
a2
A
|
|
|B
|
|
|
|
|
| B.
|
a3
b1
G11
b2
G12
b1.
G21
b2.
G22
b1..
B..
b2..
G31
G32
Figura 3-149
Forma normal
La parte simultánea puede reemplazarse por su solución de equilibrio.
Ejemplo
Consideremos las siguientes ganancias.
185
Capítulo 3 Distribuciones de Probabilidades
|
|
|B
|
|
|
|
|
| B.
|
a1
a2
A
a3
b1
3,2
b2
0,1
b1.
1,5
b2.
-1,3
b1..
B..
b2..
4,6
3,5
Figura 3-150
Si se resuelve el equilibro de Nash del subjuego simultáneo se obtiene (verificarlo) el equilibrio a1,
b1, resultando, por lo tanto el siguiente juego.
3,2
a1
A
b1
a3
B..
b2..
4,6
3,5
Figura 3-151a
La forma normal equivalente es la siguiente.
B
b1b1 b1b2
a1 3, 2
3, 2
A
a3 4, 6
3, 5
Figura 3-151b
Volviendo a la forma extensiva y resolviendo ahora por inducción hacia atrás, resulta finalmente el
camino de equilibrio a3 b1.
186
Jorge Carlos Carrá
IV Teoría de los juegos – 3 Secuenciales
a1
a2
A
|
|
|B
|
|
|
|
|
| B.
|
a3
b1
b2
3,2
0,1
b1.
1,5
b2.
-1,3
b1..
B..
b2..
4,6
3,5
Figura 3-152
e Racionalidad secuencial y credibilidad
Los equilibrios imperfectos conformados por caminos del árbol que contienen flechas no elegidas en
una etapa posterior, presentan dos características.
Racionalidad secuencial
Los caminos de equilibrios imperfectos no serían elegidos por un jugador racional pues no obedecen
a una dominancia en ganancias. Esta propiedad de la inducción hacia atrás se llama Racionalidad
Secuencial, pues implica que cada jugador actuará en forma racional en todo punto del juego.
Credibilidad
Se llaman movidas estratégicas a las acciones realizadas afuera del juego, que lo transforman. Dos
de estas acciones son las promesas y amenazas (según el carácter de la acción), cuyo cumplimiento
generalmente tiene un coste para el jugador que la efectúa.
En el caso de que un jugador prometa elegir un equilibrio imperfecto, es decir una estrategia que
contradiga su dominancia en ganancias, realiza lo que se llama una amenaza (o promesa) no
creíble y es por esto que un problema de credibilidad siempre acompaña a estas acciones. Por el
contrario, una amenaza (o promesa) resulta creíble si para el jugador que la realiza es dominante en
ganancias.
La promesa es un ritual en los políticos en campaña, quienes realizan promesas que luego no pueden
cumplir por los costos que les acarrea, perdiendo credibilidad.
Las estrategias imperfectas no son dominantes en ganancias en algún momento del juego, por lo cual
presentan un problema de credibilidad.
Problema resuelto 3.50 Educación parental
Considerar un juego entre un padre y su hijo. El hijo puede elegir entre ser Bueno (B) o Malo (M). El padre
puede Castigar (C) o No castigar (N).
Consideremos como referencia a la ganancia del hijo BN como 0. Además el hijo tiene una ganancia de 1
siendo M y se le resta –2 si es castigado C.
Por lo tanto la ganancia del hijo si MN es 1, si MC es 1–2 = –1 y si BC es 0 – 2 = –2.
Por su parte las ganancias del padre que no castiga suben –2 si el hijo se comporta M y 0 si se comporta B.
187
Capítulo 3 Distribuciones de Probabilidades
Además el padre que castiga obtiene –1.
Por lo tanto, la ganancia del padre si BN es 0, si BC es 0–1=–1, si MN es –2 y si MC es –3.
Si el hijo juega primero y el padre reacciona observando su comportamiento, a) dibujar la forma extensiva (el
árbol del juego) y encontrar el camino del equilibrio, b) dibujar la forma normal y encontrar los equilibrios de
Nash.
Solución
a) Representación extensiva de un juego secuencial
1 Hijo
B
2
M
3 Padre.
Padre
C
C.
N
0,0
-2,-1
N.
-1,-3
1,-2
Figura 3-153
Aplicando la inducción hacia atrás, se encuentra que el equilibrio del juego es M, NN, el óptimo para el Hijo es
Malo, por lo que el Padre elige No castigar. Se podría argumentar que no es necesario agregar que en el nodo
2, el Padre elegiría N (primera N de la estrategia M, NN) pues ese nodo no es alcanzado nunca si el Hijo elige
el nodo 3. Sin embargo, este razonamiento es incorrecto pues el equilibrio resulta de pensar todas las
alternativas. Si el Hijo llegara al nodo 2, el Padre elegiría N y si llegara al nodo 3, el Padre elegiría N. Como
entre estas 2 estrategias del Padre, la dominancia en ganancias para el Hijo es el nodo 3 (1 es mayor que 0), el
Hijo elegiría este nodo.
b) Representación normal de un juego secuencial
El Padre tiene 4 estrategias, pues debe contemplar lo que hará el Hijo.
Hijo
Bueno
Malo
CC
–2, –1
*–1, –3
Padre
CN
NC
–2, –1 *0, 0'
*1, –2' –1, –3
NN
0, 0'
*1, –2'
Figura 3-154
Las 4 estrategias del Padre, son:
• CC. Castigar si es Bueno o Castigar si es Malo (Castigar siempre).
• CN. Castigar si es Bueno o No castigar si es Malo.
• NC. No castigar si es Bueno o Castigar si es Malo.
• NN. No castigar si es Bueno o No castigar si es Malo (No castigar siempre).
Se marcaron con * las ganancias dominantes del Hijo dentro de las estrategias del Padre y con ' las de Padre
dentro de las estrategias del hijo. Los equilibrios de Nash son los sombreados (pues contienen 2 marcas en una
misma celda), a saber:
188
Jorge Carlos Carrá
IV Teoría de los juegos – 4 Teoría de las decisiones económicas
1.
(M, NN) El Padre decide jugar: No castigar si es Bueno o No castigar si es Malo y el óptimo para el Hijo
es Malo. Por lo tanto el Padre elige No castigar.
2. (M, CN) El Padre decide jugar: Castigar si es Bueno o No castigar si es Malo y el óptimo para el Hijo es
Malo. Por lo tanto el Padre elige No castigar.
3. (B, NC) El Padre decide jugar: No castigar si es Bueno o Castigar si es Malo y el óptimo para el Hijo es
Bueno. Por lo tanto el Padre elige No castigar.
El equilibrio de Nash 1 es coincidente con el equilibrio perfecto obtenido con la forma extensiva.
Los dos equilibrios de Nash restantes son equilibrios imperfectos, más fáciles de detectar en la forma normal y
que presentan las siguientes características derivadas de la dominancia en ganancias. Por último los equilibrios
(M, NN) y (M, CN) son equivalentes pues producen las mismas ganancias.
Observar que si se eliminan las estrategias débilmente dominadas de la forma normal (columnas CC, CN y NC
y luego la fila Bueno), se obtiene la celda del equilibrio de Nash (M, NN), igual a las del equilibrio perfecto de
la inducción hacia atrás de la forma extensiva.
Racionalidad secuencial
Estos equilibrios imperfectos contradicen la propiedad de la Inducción hacia atrás, llamada Racionalidad
Secuencial, por la cual cada jugador actúa en forma racional en todo punto del juego.
Así por ejemplo, en el equilibrio (B, NC) el Hijo es Bueno y el Padre elige No castigar (el cual, por otra parte,
aparece como el más consistente), se elimina en la forma extensiva pues si el Hijo es racional nunca elegiría el
nodo 2, dada la racionalidad del Padre.
Credibilidad
Estos equilibrios imperfectos contienen una promesa no creíble, pues contradicen la dominancia en ganancias
de algún jugador.
f Aplicación: juego de ajedrez
Veamos someramente el procedimiento para analizar por computadora el juego secuencial de
ajedrez. Los computadores no pueden pensar pero el programa contiene un diagrama de árbol con las
jugadas más comunes (digamos 20) que pueden hacerse en cada situación. Las ganancias se
establecen de acuerdo a la importancia de cada pieza.
La computadora decide su movimiento aplicando el principio de inducción hacia atrás. Si por
ejemplo fueran 20 alternativas por cada jugada y el programa analizara un árbol de 5 jugadas
sucesivas, se tendrían 205 = 32000000 posibilidades para analizar en los 3 minutos asignados a cada
jugada.
Si bien no es posible para el computador tener almacenado el árbol completo pues se estiman en
alrededor de 101050 jugadas de ajedrez, estos programas pueden ganarle actualmente a cualquier
oponente (incluidos los campeones de ajedrez).
En esta introducción he presentado los conceptos básicos de la teoría de los juegos. A partir de aquí
el lector que lo desee puede profundizar en la abundante bibliografía existente, agregando nuevos
conceptos como, subastas, negociaciones, arbitrajes, votaciones, etc.
4 Teoría de las decisiones económicas
Es un caso particular de la Teoría de los Juegos en la cual solo interviene un jugador contra la
naturaleza. Trata de establecer algún criterio que permita a una persona elegir una de varias
alternativas económicas que se presenten en condiciones de incertidumbre.
189
Capítulo 3 Distribuciones de Probabilidades
a Formas de la decisión
a Forma extensiva
Es el formato habitual dado que intervienen eventos aleatorios de estados de la naturaleza.
Con el objeto de favorecer el cómputo de las ganancias dominantes, en la teoría de decisiones
económicas suele complementarse el árbol expresando los nodos de los eventos con un círculo y el
nodo del jugador con un rectángulo. Dentro del círculo se coloca el valor esperado de las ganancias
correspondientes a ese nodo y dentro del cuadrado la ganancia dominante, es decir el valor máximo
de las esperanzas de las acciones que se derivan de ese cuadrado. Se deja la decisión de utilizar o no
esta notación a juicio del lector.
En la figura siguiente, G1 y G2 expresan los valores esperados de las respectivas estrellas, es decir:
G1 = G11* p11 + G12 * p12
G 2 = G 21* p 21 + G 22 * p 22
G11
p11
a1
G1
A
p12
G
dominante
a2
G12
G21
p21
G2
p22
G22
Figura 3-155
Árbol de decisiones
b Forma normal
La tabla de decisiones es una tabla de doble entrada con las acciones controlables por el usuario en
la primera columna y los eventos de la naturaleza incontrolables o aleatorios en la primera fila. En
realidad son 2 tablas en una. La que contiene las ganancias y la que contiene las probabilidades. Esta
última es en realidad una tabla de contingencias (con frecuencias relativas) que cruza las variables
Acciones y Eventos.
Naturaleza
Acciones
a1
a2
a3
e1
G11, p11
G21, p21
G31, p31
Figura 3-156
Tabla de decisiones
190
Jorge Carlos Carrá
e2
G12, p12
G22, p22
G32, p32
IV Teoría de los juegos – 4 Teoría de las decisiones económicas
Problema resuelto 3.51 Mejor inversión
Un operador desea invertir 100$ ¿Cuál de las 3 siguientes es la mejor inversión?
a1: acciones A cuya probabilidad de aumentar en un año a 110$ es 0.85 y la de decrecer a 95$ es 0.15,
a2: acciones B cuya probabilidad de aumentar en un año a 140$ es 0.67 y la de decrecer a 40$ es 0.33,
a3: plazo fijo al 5% anual.
Árbol de decisiones
Invertir
10
0.15
-5
7.75..
a1
7.75
0.85
a2
0.67
7
40
0.33 -60
a3
7.75.
1
No Invertir
5
5.
0
Figura 3-157
Árbol de decisiones
Como ya sabemos, la construcción del árbol se realiza de izquierda a derecha pero el llenado de los valores
numéricos de las ganancias se hace aplicando el principio de inducción hacia atrás (página 181), de derecha a
izquierda. Observar que se ha remarcado con flechas el camino del equilibrio y que se han colocado además las
ganancias esperadas o dominantes en cada nodo, según corrsponda.
Tabla de decisiones
Se muestra en la figura 3-158. El primer valor de cada celda es la ganancia para cada evento y el segundo la
probabilidad de cada evento.
Acciones
a1
a2
a3
E1
10, 0.85
40, 0.67
5, 1
E2
-5, 0.15
-60, 0.33
0, 0
E(G)
7.75
7
5
Figura 3-158
Distribución de x=G
Las ganancias de cada alternativa son:
a1
a2
a3
E (G ) = 7.75$
E (G ) = 7$
E (G ) = 5$
Por lo tanto, si se adopta el criterio de maximizar este valor, deberá elegirse la alternativa a1.
191
Capítulo 3 Distribuciones de Probabilidades
Aplicación del teorema de Bayes
Las probabilidades incluidas en el árbol de decisiones pueden actualizarse mediante la aplicación del
teorema de Bayes, estudiado en el capítulo 2, originando un árbol de probabilidades anexo al árbol
de decisiones.
Problema resuelto 3.52 Acciones y la economía
Antes de tomar una decisión, el operador del problema resuelto anterior desea evaluar el comportamiento de
las acciones según las condiciones de la economía. Tomando como base a la experiencia, sabe que:
• cuando las acciones A suben, el 90% del tiempo ha habido prosperidad económica
• cuando las acciones A bajan, el 60% del tiempo ha habido recesión económica
• cuando las acciones B suben ,el 95% del tiempo ha habido prosperidad económica
• cuando las acciones B bajan, el 50% del tiempo ha habido recesión económica
En el momento de la inversión, la situación era de prosperidad. Revisar las probabilidades a priori del ejemplo
3.5, a la luz de la nueva información.
Acciones B
Acciones A
0.90
P
0.95
0.765
Sube
0.85
.
0.6365
0.05 R
0.0335
Sube
0.10 R
0.40
0.15
P
P.
0.67
0.085
0.06
.
0.50
0.33
Baja
0.60
R.
0.09
P.
0.165
R.
0.165.
Baja
0.50.
Figura 3-159
Árboles de probabilidades condicionales
Por consiguiente, utilizando el teorema de Bayes para calcular las probabilidades a posteriori de la nueva
evidencia, llamando S al evento Sube y B al evento Baja, resultan:
Para la acción A:
0.765
= 0.928
0.765 + 0.06
P ( B | P ) = 0.206
P(S | P) =
Para la acción B:
0.6365
= 0.794
0.6365 + 0.165
P ( B | P ) = 0.072
P(S | P) =
Las probabilidades de la inversión a plazo fijo, no cambian.
Las ganancias actualizadas de cada alternativa, resultan ahora:
192
Jorge Carlos Carrá
IV Teoría de los juegos – 4 Teoría de las decisiones económicas
a1
a2
a3
E (G ) = 8.25$
E (G ) = 27.4$
E (G ) = 5$
Por lo tanto, decisión óptima es ahora invertir en la acción B.
b Caso particular: una sola acción
Un caso particular del anterior se presenta cuando existe una sola acción voluntaria elegida y
controlada por el usuario: la de participar, la cual contiene varios eventos aleatorios. En realidad, en
forma implícita, esta acción siempre se contrasta con la acción de no participar, pero esta acción no
tiene eventos y su E(G) = 0.
En este contexto, el árbol de decisiones es un caso particular del caso anterior y se muestra en la
figura 3-160.
p1
a1:
participar
E(G)
p2
A
E(G)
a2: no
participar
G1
G2
0
Figura 3-160
Árbol de decisiones
La decisión se corresponde con el siguiente criterio.
Criterio del signo del valor esperado
•
•
•
Si E(G) > 0 => decisión favorable (a la larga conduce a la fortuna)
Si E(G) < 0 => decisión desfavorable (a la larga conduce a la ruina)
Si E(G) = 0 => decisión neutra.
Problema resuelto 3.53 Rifa para juntar fondos
a) Determinar el valor C, que debe tener una rifa para juntar fondos de 1000 números y con un premio de 200$,
si se desea que sea equilibrada. b) ¿Cuál es el valor esperado si C = 1$? c) ¿Cual deberá ser el premio si
C = 1$ y la rifa es neutra?
a)
Tabla de decisiones
Como alternativa de presentación se han colocado las probabilidades en una fila separada de las ganancias.
193
Capítulo 3 Distribuciones de Probabilidades
Eventos
Pierde
Gana
S
G=g
p(g)
-C
999/1000
200-C
1/1000
Figura 3-161
Distribución de x=G
Árbol de decisiones
G
999/1000
-C
E(G)
1/1000
200-C
Figura 3-162
Árbol de x=G
Operando para un juego neutro:
E (G ) =
Por lo tanto:
−999C + 200 − C
=0
1000
C = 0.20$
b) Reemplazando el valor de C en la ecuación de E(G), resulta E(G) = -0.80$
c) Reemplazando en E(G) = 0, el valor de C y el número 200 por una variable P (premio), resulta P = 1000$.
Problema resuelto 3.54 Costo de la prima de seguros
a) Determinar la prima anual C para un seguro de daños de un auto de 10000$. La póliza cubre siniestros que
por experiencias previas ocurren 1 de cada 200. Basar el cálculo en E(G)=0, es decir sin ganar ni perder. Luego
se agregarán las utilidades y los gastos administrativos.
b) Comparar las siguientes acciones:
a1: situación anteriormente descripta.
a2: persona que no compra el seguro.
a)
Tabla de decisiones
S
G=g
p(g)
Eventos
No Siniestro Siniestro
-C
199/200
10000-C
1/200
Figura 3-163
Distribución de x=G
194
Jorge Carlos Carrá
IV Teoría de los juegos – 4 Teoría de las decisiones económicas
Árbol de decisiones
G
10000-C
1/200
E(G)
199/200
-C
Figura 3-164
Árbol de x=G
Operando para un juego neutro:
E (G ) = − C +
Por lo tanto:
10000
=0
200
C = 50$
b)
Tabla de decisiones
S
a1
a2
p(g)
Eventos
No Siniestro Siniestro
-50
0
199/200
9950
-10000
1/200
Figura 3-165
Distribución de x=G
Árbol de decisiones
G
199/200
-50.
1/200
9950
199/200.
0..
0.
0
-50
1/200.
-10000
Figura 3-166
El E(G) de a1 es 0 y el de a2 es -50$. Por lo tanto si se adopta el criterio de maximizar este valor, se deberá
elegir la acción a1, es decir contratar el seguro.
195
Capíítulo 3 Distrib
buciones de Probabilidade
P
es
Prob
blema ressuelto 3.555 Ruletaa europea
Una rulleta europea (siin doble 0), tieene números deel 1 al 36 (18 ro
ojos, 18 negross y el 0 de coloor verde). El
casino paga
p
36$ por cada
c
pleno y paara el resto de llas jugadas en forma proporcional (por ejem
mplo en cada
columnna hay 12 plenoos y por lo tanto se pagará 36/12, es decir 3$$). Hallar la E((G) si se apuessta 1$ a: a) al
número
o 17 (pleno), b)) calle, c) negro
o (color). Ver figura
f
3-167. d)
d ¿Cuánto debería pagar la banca para que el
juego seea neutro?
F
Figura 3-167
Ruleta
a)
S
G=g
p(g)
Eventos
no saale el 17 saale el 17
-1
36/37
35
1/37
F
Figura 3-168
Distribución de probabilidaades de G
E (G ) = − 1
36
1
1
+ 35
=−
= −0.027$$
37
37
37
b)
S
G=g
p(g)
Evento
os
no saale la calle sale la calle
-1
334/37
11
3/37
F
Figura 3-169
Distribución de probabilidaades de G
E (G ) = − 1
34
3
1
+ 11 = −
= −0.027$
37
37
7
37
c)
196
Jorge
e Carlos Carrrá
IV Teoría de los juegos – 4 Teoría de las decisiones económicas
S
G=g
p(g)
Eventos
colorado o cero
-1
19/37
negro
1
18/37
Figura 3-170
Distribución de probabilidades de G
E (G ) = − 1
19
18
1
+1 = −
= −0.027$
37
37
37
d)
Sale
C
No sale
-1
1/37
.
36/37
Figura 3-171
Distribución de probabilidades de G
Por lo tanto:
E (G ) =
Despejando resulta:
1
36
C+
( −1) = 0
37
37
C = 36$
A partir de este valor, puede concluirse que la Posibilidad de Pago, PP, definida en el capítulo 2 (página PP2),
resulta:
PP =
G 36
=
= 36
A 1
En síntesis y generalizando, si el juego es neutro, las posibilidades de pago resultan ser iguales a las
posibilidades en contra de ganar, en este caso, 36:1. Naturalmente, los casinos fijan las posibilidades de pago
en un valor inferior, en este caso 35:1 (una ganancia del jugador de 35$ por cada 1$ colocado en un pleno,
equivale a un monto total de 36$).
Problema resuelto 3.56 Estrategias de ventas
Un comercio A vende una mercadería a 280$. Otro comercio B la vende a 300$ pero regala una rifa de 1000
números con un premio único de 10000$. ¿Dónde conviene comprar?
Calculemos la distribución de la ganancia de comprar en B, respecto de comprar en A.
S
G=g
p(g)
Eventos
no gana
-20
999/1000
gana
10000-20
1/1000
Figura 3-172
Distribución de probabilidades de G
De aquí que la ganancia de comprar en B respecto de A, resulta:
E (G ) = − 10$
Por lo tanto conviene comprar en A.
197
Capítulo 3 Distribuciones de Probabilidades
198
Jorge Carlos Carrá
V Simulaciones – 4 Teoría de las decisiones económicas
V Simulaciones
1 Simulación de distribuciones
En el capítulo 2, sección simulaciones, hemos utilizado la serie de frecuencias acumuladas de una
distribución particular en estudio para recodificar números aleatorios uniformes a esa distribución.
En esta última sección del capítulo 3, justificaremos esa construcción. También hemos adelantado
que bajo el nombre de Método Monte Carlo o Simulación Monte Carlo, SMC, (ver figura 3-173), se
agrupan una serie de procedimientos que reproducen por muestreo aleatorio, distribuciones
poblacionales arbitrarias F(x)14 de variables aleatorias x, normalmente con la intervención de la
computadora. Estas características que son parte esencial de un algoritmo por SMC.
Llamaremos NAF a los Números Aleatorios de cualquier distribución F(x). Si por ejemplo la F(x) en
estudio es normal, se generarán NAN, si es exponencial, NAE, etc.
Figura 3-173
Simulación Montecarlo SMC
Los paquetes de software que contienen técnicas estadísticas disponen en general de números
aleatorios que generan varios de los modelos vistos en este capítulo (ver resumen para SPSS y
EXCEL en el apéndice B). El procedimiento que veremos a continuación es válido para la
generación aleatoria de cualquier distribución, sea o no uno de los modelos vistos y se inicia con un
generador de Números Aleatorios Uniformes, NAU15. En este caso, al esquema anterior se le agrega
este generador, como se muestra en la figura 3-174.
14
15
Simbolizamos con F(x) a la probabilidad acumulativa P(X < x).
Una utilización de los mismos fue realizada en el capítulo 2, página NAU2.
199
Capítulo 3 Distribuciones de Probabilidades
Figura 3-174
SMC con NAU
Recordemos del capítulo 2, que existen 3 pasos en la obtención de una simulación:
1 Población
Definida con su distribución de probabilidades y por lo tanto es conocida su F(x).
2 Muestra: Método de la CDF inversa
Uno de los métodos de generación de NAF de cualquier distribución, se llama de la CDF inversa, ya
utilizado intuitivamente en el capítulo 2, aún sin conocer su nombre.
Propiedad de las CDF
Sea una función cualquiera F(x). Se cumple siempre que:
G( y) = P ( F ( X ) ≤ y ) = P ( X ≤ F −1 ( y) ) = P( X ≤ x) .
En el ejemplo de la figura 3-175, izquierda es:
G(0.52) = P( F ( X ) ≤ 0.52) = P( X ≤ F −1 (0.52) = P( X ≤ 6.02)
Pero hasta ahora no conocemos su valor. Si además la F(x) es la CDF de x, podemos conocer la
función G ( y ) pues el penúltimo miembro es:
G ( y ) = P ( X ≤ F −1 ( y ) ) = F ( F −1 ( y ) ) = y
Por lo tanto se trata de una CDF G ( y ) igual a una recta a 45° (ver figura 3-175, centro). Su PDF,
g ( y ) es entonces una distribución uniforme comprendida entre 0 y 1, y por lo tanto igual a 1 (ver
figura 3-175, derecha).
La CDF de una CDF es una distribución uniforme comprendida entre 0 y 1.
Figura 3-175
Método CDF inversa
Esta propiedad se utiliza para generar un muestreo aleatorio de una x, conocida su CDF, F ( x ) ,
procediendo de forma inversa al desarrollo anterior (ver nuevamente la figura):
1. y
Se genera un NAU y. Supongamos que éste valor es y = 0.52.
−1
2. y = F ( x) ⇒ x = F ( y)
Analíticamente
Igualamos la ecuación de F(x) a este número y despejamos la x.
Gráficamente
Lo buscamos en el eje de ordenadas de la CDF a simular (si admitimos que la distribución es
200
Jorge Carlos Carrá
V Simulaciones – 4 Teoría de las decisiones económicas
discreta, podríamos tomar el siguiente mayor es decir: 0,80).
Bajamos al eje x, de donde extraemos el valor final de la simulación de x = 6.02.
Nota
Si los elementos a muestrear son objetos, los NAU deben ser enteros, por lo cual se deberá
multiplicar a los anteriores NAU entre 0 y 1 por el tamaño de la muestra, n y obtener así NAU entre
0 y n.
3 Repetición
Se repite el procedimiento para obtener varias muestras que luego se podrán aplicar al proceso en
estudio.
En los programas informáticos, tal como el SPSS, existen en forma directa números aleatorios de la
mayoría de las distribuciones teóricas vistas en este capítulo (ver resumen en el apéndice B), pero el
método anterior de SMC permite resolver cualquier tipo de distribución y por lo tanto encarar,
aunque sea en forma aproximada, problemas que por su complejidad no podrían ser estudiados por
los alumnos. Por otra parte, y dada la fructífera relación modelo-experiencia inherente al método, se
recomienda su utilización, aún en los casos en los que la resolución matemática del problema sea
sencilla.
Problema resuelto 3.57 Simulación Montecarlo
Dada la siguiente distribución arbitraria de x, a) simular un muestreo aleatorio para hallar la P(x = 2) en 40
extracciones. b) Confrontar luego con el valor teórico: b(2,40,0.34).
0
1
2
3
x
P(x) 0.20 0.25 0.34 0.21
Figura 3-176
P(x)
a)
1 Población
Se conforma la siguiente tabla, en la que se definen los intervalos, para ubicar los NAU, por ejemplo entre 0 y
100.
0
1
2
3
x
u= F(x) 0-19 20-44 45-78 79-99
Figura 3-177
CDF inversa
El lector observará que este proceso de codificación de valores ya fue utilizado en el capítulo 2.
2 Muestra
Se generan NAU entre 0 y 100
3 Repetición
Repitiendo el paso 2 se conforma una tabla como la siguiente, en donde se tildan las veces que este valor se
encuentra entre 45 y 78. Se deja al lector el llenado de esta tabla, usando el generador que prefiera (tabla,
calculadora, SPSS, urna con 100 papeles, etc).
nE
sale 2
no sale 2
201
Capítulo 3 Distribuciones de Probabilidades
Figura 3-178
P(x = 2)
b) Confrontar el valor anterior con:
b2 (40,0.34) = 0.118 = 11.8%
2 Simulación de juegos
ComLabGames
No hay mejor manera para entender las estrategias de un juego que jugar con otros. Para esta función
se han creado algunos programas informáticos.
ComLabGames (Computational Laboratory Games) es un software libre implementado en Java,
creado por Robert Miller, Marko Gorbelnik y Vesna Prasnikar de la universidad Carnegie Mellon,
Graduate School of Industrial Administration.
Permite correr y analizar los resultados de juegos entre computadoras conectadas por Internet o
dentro de una red. Una PC (server) actúa como moderadora, en donde el moderador diseña el juego y
en las restantes PC (clientes) están los jugadores, quienes pueden actuar simultáneamente o
secuencialmente.
Pero además de poder simular escenarios y testear hipótesis acerca del comportamiento humano, esta
simulación, al igual que la simulación Monte Carlo, podrá crear datos experimentales para luego
analizarlos estadísticamente.
Para dar al juego un incentivo que semeje a la realidad y motivar a los participantes a probar la
eficacia (o no) de aprender la teoría de estrategia de juegos, se suele ofrecer como incentivo una
ganancia proporcional a la obtenida por cada estudiante al final del juego, la cual puede extraerse de
un pago inicial requerido a cada participante.
Se dividirá esta sección en 2 partes:
a. Moderador
b. Cliente
a Moderador
El creador del juego se llama moderador y es el que define el juego.
Desde la página con el nombre de este software descargar y ejecutar el archivo ComLabGame,
versión 0.4: clg_standalone.jar.
Se abre la siguiente ventana, con la pestaña Design (Diseño) pre-seleccionada. Observar que figura
el nombre Server en la parte superior para indicar que se trata de la computadora del moderador.
202
Jorge Carlos Carrá
V Simulaciones – a Moderador
Figura 3-179
Se aprecia que las pestañas siguen la secuencia normal de un proceso de investigación:
1. Design: diseño del juego.
2. Assignment: asignación de parámetros específicos del juego, tales como número de
repeticiones, duración, etc.
3. Execution: análisis del juego.
4. Data: resultados de la simulación.
La última ventana Client Play es utilizada por el jugador y no por el moderador.
a Design
Los elementos de diseño se muestran en los botones de la columna izquierda. Para incorporarlos al
modelo se los debe arrastrar hacia el espacio de trabajo y soltar.
Los 3 primeros se refieren a subastas, tipo de juego que no será analizado en esta introducción.
Los 2 siguientes se usan para elegir el tipo de diseño: tabla (Matrix) o árbol (Tree entry).
Los 3 últimos se utilizan para crear los jugadores (Players) y los estados de la naturaleza
(Nature) que modela un jugador especial con decisiones aleatorias. Las Ganancias (Payoff) se
aplican específicamente al caso de un diseño por árbol, con las ganancias en los nodos terminales.
Con un doble clic en los elementos arrastrados se les cambia el nombre.
Con un doble clic derecho se abre una ventana de edición.
203
Capítulo 3 Distribuciones de Probabilidades
HTML
El programa acepta algunos comandos de código HTML para editar los nombres. En particular si se
desea que el nombre aparezca en varias líneas, colocar una barra invertida \ al comienzo de la nueva
línea.
Borrar
Para borrar un elemento, seleccionarlo (a varios con el botón Ctrl) y presionar el botón Remove
de la barra de herramientas.
Duplicar
Con el botón Duplicate se puede duplicar cualquier parte del diseño, previamente seleccionada.
Player
Arrastrando un elemento Player (Jugador) al espacio de trabajo, lo incorpora al juego.
Cambiarle el nombre con un doble clic sobre el icono. Automáticamente cambiará el color. Si se
desea otro color, editar con un clic derecho, seleccionándolo de la ventana de edición.
Matrix (forma normal)
Diseño de un juego simultáneo.
Arrastrar tantos elementos Player, como jugadores existan en el juego y Nature, en el caso de
que existan estados aleatorios de la naturaleza.
Arrastrar Matrix (matriz) para crear la tabla del juego.
Hacer un doble clic derecho sobre Matrix. Se abre la ventana de la siguiente figura para editar la
tabla del juego. Se observará que los nombres de los jugadores aparecen en la parte inferior dentro
del panel Others y todos los elementos Nature en el panel Nature.
Figura 3-180
204
Jorge Carlos Carrá
V Simulaciones – a Moderador
•
•
Show player's values only
Esta opción se usa para determinar si los jugadores solo pueden mirar sus ganancias o también
las de los restantes jugadores.
Simultaneous move
Esta opción determina si el juego es simultáneo o sucesivo.
Número de filas y columnas
Si se desean agregar filas o columnas arrastrar el icono superior Insert Column a las filas o
columnas y soltar. Si se desea borrar alguna fila o columna, arrastrar el icono Remove column y
soltar en la que se desea borrar.
Asignar el nombre a las acciones con un doble clic en los encabezamientos.
El orden entre las acciones puede modificarse arrastrando el encabezamiento a la posición deseada.
Seleccionar jugadores fila y jugadores columna
Hacer clic derecho sobre las filas o columnas y seleccionar el jugador de la lista. Alternativamente
arrastrar el icono del jugador del panel inferior y soltarlo en filas o columnas. Si se arrastra un tercer
jugador, se anida en la tabla.
Luego de asignar los jugadores, sus iconos pasan del panel inferior Others al panel Payoffs
(Ganancias). Se puede arrastrar un jugador no seleccionado directamente de Others al Payoffs.
Este jugador no interviene en las decisiones pero tendrá asignadas ganancias. Si un jugador
permanece en Others será solo observador del juego.
Introducir las ganancias
Clic en cada celda y escribir la ganancia de cada jugador. En lugar de un valor numérico se puede
escribir una función, eligiéndola de un editor de funciones que se abre al hace un clic derecho sobre
la celda. Si por ejemplo se desea que la ganancia sea un valor aleatorio entre 10 y 20, se colocaría
Uniform(10,20).
Guardar el modelo con File > Save. Los archivos tendrán la extensión .mgd. Para volver a
abrirlos, ejecutar el programa y luego File > Open.
Tree Entry (forma extensiva)
Diseño de un juego secuencial.
Arrastrar el nodo inicial Tree Entry (Entrada del árbol) al espacio de trabajo para iniciar el árbol
del juego. Editar el nombre con un doble clic sobre él.
Para conectar sucesivos elementos al árbol (entrada del árbol, jugadores, estados de la naturaleza y
ganancias al nodo final), se tienen 2 formas:
• Cuando ambos elementos ya se encuentran en el espacio de trabajo, se selecciona el que va a
recibir la conexión y se arrastra el símbolo + inferior al elemento a conectar.
• Con el botón Standard layout de la parte inferior de la ventana seleccionado, se
selecciona previamente el icono al cual va a ser conectado y se arrastra el nuevo elemento del
panel izquierdo. En particular y dado que un elemento arrastrado al espacio de trabajo queda
seleccionado, se conectará automáticamente con el próximo elemento que se arrastre.
205
Capítulo 3 Distribuciones de Probabilidades
Figura 3-181
El cuadro intermedio que aparece en cada rama se utiliza para colocar el nombre de la acción, con un
doble clic.
En el caso particular de Nature, es imprescindible colocar la probabilidad correspondiente (en
forma absoluta o relativa, pues el programa siempre divide por la suma de los valores colocados). Si
se desea poner un nombre a la acción, debe estar separado de la probabilidad por un espacio. En base
a estas probabilidades el software utiliza un mecanismo aleatorio para seleccionar las ramas
conectadas a Nature.
Simulación de decisiones económicas
Observar que un juego con Nature y con un solo jugador, equivale a la situación ya vista en la
sección Teoría de las decisiones económicas (página 189).
Simultaneidad
Si parte del árbol implica simultaneidad (página 153), hacer clic en el icono de uno de los nodos y
arrastrar el símbolo + superior al otro nodo. Se observará que quedarán conectados con una línea
punteada para indicar el conjunto de información. Repetir para todos los nodos involucrados.
En este caso cualquiera de los 2 jugadores puede elegir su acción pero el movimiento de uno no es
observado por el otro hasta después de completar ambos sus movimientos. Comparar con un diseño
secuencial, en el cual cada jugador solo podrá mover cuando le llegue el turno.
Introducir las ganancias
La tabla de ganancias que se coloca en el nodo final, contendrá todos los jugadores que intervienen
en el diseño. Con un doble clic, colocar el valor numérico o función (ver párrafo anterior) en el panel
Number del jugador deseado. Con Label > Append, se puede colocar una etiqueta particular para
la ganancia de ese nodo.
b Assignment
•
•
•
206
Number of subjects
Se puede configurar para un mayor número de participantes que el requerido por el juego, para
poder repetir el juego para otras personas.
Number of rounds
No olvidar elegir aquí el número de corridas de la sesión.
Probability to continue
Se puede indicar una probabilidad de que el juego continue luego de la última corrida, con el
objeto de que el número de corridas sea aleatorio.
Jorge Carlos Carrá
V Simulaciones – a Moderador
c Execution
Posibilita probar y ejecutar el juego.
La dirección y puerto de la computadora del moderador se muestra en la parte superior. Estos datos
deben ser informados a los jugadores para que puedan conectarse al juego (ver Client play, más
adelante). Si el moderador desea correr varios juegos desde la misma PC (abriendo distintas sesiones
del software), debe cambiar la puerta de cada uno de ellos.
El nombre del juego aparece al pie de la pantalla.
Definir el ítem de comienzo
En el espacio de trabajo, hacer clic en el elemento de comienzo, Matrix o Tree Entry y luego
en el botón Toggle start de la barra de herramientas. El icono del elemento toma un color rojo
claro para indicar que el juego comenzará por él.
Pruebas
Test session(s)
El moderador puede probar el juego antes de conducir el experimento, lo cual le permite visualizar la
ventana que verá cada uno de los jugadores (clientes), probar el juego y corregir posibles errores.
Forma normal
En la figura siguiente se observa una de estas ventanas (tiene el nombre Client). En este ejemplo
se simuló con un clic del mouse que B eligió b2 y A eligió a1. Ninguno de los jugadores ve la
elección del otro hasta que ambos confirmen sus elecciones con Continue. Luego se muestra en la
celda elegida, un 1 en rojo (en general se verá la frecuencia acumulada absoluta de elecciones para
esa celda).
Figura 3-182
Forma extensiva
En la figura siguiente se observa la ventana que vería el jugador. Las ramas que cada jugador puede
seleccionar se destacan al pasar el mouse por ellas y se eligen con un clic del mouse en el nombre de
la acción. En este ejemplo se muestra un juego secuencial, por lo cual luego de que el primer jugador
207
Capítulo 3 Distribuciones de Probabilidades
en el árbol elige su acción, se muestra la misma en la ventana de los restantes jugadores. En el
ejemplo de la figura siguiente se simuló que A eligió Entra y luego de verla, B eligió Sale, por lo
cual se muestra en la celda inferior de las ganancias de este camino, un 1 en rojo y los totales en la
raíz del árbol.
Figura 3-183
Two session(s)
Prueba dos sesiones corriendo a la vez, duplicando el número de jugadores.
Trace Windows
Muestra informaciones relativas a la prueba.
Start sessións
Para correr el juego, el moderador presiona Start sessions y en la barra de estado se observa
Started.
Stop sessions
Detiene el experimento. En la barra de estado se observa Waiting.
e Data
Los datos son almacenados en un archivo en la computadora del moderador, dentro de una carpeta
llamada log que se crea dentro de la carpeta en donde se encuentra el archivo del juego.
Después de ejecutado el juego ir a Data > Open log. Abrir la carpeta log. Dentro de los iconos
que aparecen en la ventana, arrastrar los deseados al panel Viewer.
208
Jorge Carlos Carrá
V Simulaciones – b Jugador (cliente)
Con el icono Matrix de color rojo, se muestran entre otros, el número de sesión, el tiempo que
demandó la decisión, el nombre del jugador, el número de celda y las ganancias que recibió cada
jugador.
Con el icono Matrix de color turquesa se muestra información que el sujeto eligió.
Para ordenar los valores en forma ascendente, hacer clic en el encabezamiento de la columna
deseada. Con un nuevo clic se ordena en forma descendente.
Con la selección adecuada de elementos a la izquierda, se puede parcializar la vista de los datos.
b Jugador (cliente)
Los clientes pueden entrar al juego luego de haber sido iniciado por el moderador (ver pestaña
Execution, página 208).
Cada jugador en su PC debe ejecutar el archivo clg_standalone.jar e ir a la pestaña Client
Play (podría ser ejecutado en la misma PC del moderador abriendo otra sesión del programa).
Client Play
Tal como se indica en la siguiente figura, se deben ingresar:
• Server
datos que provee el moderador, por ejemplo: 192.168.1.47:6789. Notar que luego del IP se
colocan dos puntos y el puerto del servidor (9789).
Si el jugador usa un navegador en lugar del programa, debe colocar http:// antes de la
dirección.
• Username
puede ser cualquier nombre.
• Password
no es necesario.
209
Capítulo 3 Distribuciones de Probabilidades
Figura 3-184
Presionar el botón Login para conectarse al juego. Se muestra una ventana similar a la de la prueba
realizada en la sección anterior, tanto en la PC del jugador como en la del moderador.
Asignación de roles
Cada cliente es asignado a un jugador en forma aleatoria, luego de lo cual cada jugador deberá
comenzar a jugar eligiendo con el mouse una de las acciones (las de los otros jugadores están
desactivadas), en función del rol que se le haya asignado.
Presionar el botón Continue, luego de cada selección para confirmarla. En la ventana
Execution del moderador, los nombres de los jugadores pasan de color rojo a verde.
Datos
Al finalizar el juego se muestra un resumen en la PC del moderador. Pasar los 2 iconos Matrix al
panel Viewer, con lo cual se muestran todos los datos de las corridas, tal como se indica en la
siguiente figura. Se puede parcializar la información según la selección que se realice con los
botones de la izquierda.
Si se presiona el botón Statistics, se muestran las medidas de posición (media, mediana y
modo) y de dispersión (varianza, mínimo y máximo) de la distribución de ganancias correspondiente
a las selecciones realizadas en el panel de la izquierda.
Presionando Export table, se puede exportar la tabla como un archivo de texto delimitado por
tabulación (tsv, tab separated value), el cual se puede abrir con Excel.
Figura 3-185
La simulación de un juego con jugadores reales provee datos experimentales. En el capítulo 5 nos
servirán para probar hipótesis acerca de la cercanía o no de las experiencias con las predicciones
teóricas.
210
Jorge Carlos Carrá
V Simulaciones – b Jugador (cliente)
Problema resuelto 3.58 El empresario y el capitalista
Un empresario decide si buscar o no un inversor para un proyecto. En la siguiente figura se muestran las
posibles 4 posibles acciones.
1 El empresario ignora la idea y continúa su trabajo,
2 El empresario decide buscar un inversor y el inversor acepta con una probabilidad de falla q.
3 El empresario decide buscar un inversor y el inversor acepta con una probabilidad de éxito p.
4 El empresario decide buscar un inversor y el inversor no acepta.
a) Asignar libremente p y q y obtener teóricamente el camino del equilibrio
Diseñar el juego con ComLabGame y realizar experimentos (juegos) con jugadores sin conocimientos teóricos
acerca de la teoría de juegos. Estos datos experimentales luego podrán ser utilizados para analizar inferencias
en el capítulo 5. En particular extraer datos para probar luego las siguientes hipótesis.
b) La muestra está de acuerdo con las predicciones teóricas respecto de por ejemplo una selección al azar de
los nodos (o cualquier .otra opción).
c) Los resultados dependen del tipo de diseño, secuencial o simultáneo (el juego simultáneo no se refiere a la
forma normal equivalente del juego secuencial, sino a un diseño distinto de tipo simultáneo).
Figura 3-186
Solución
a) Supongamos que p = 0.50. En este caso y tal como hemos visto en la sección, Teoría de las decisiones
económicas en condiciones de incertidumbre, la contribución de los estados de la naturaleza se reemplaza por
la esperanza matemática:
E (empresario) = 0.5(10) + 0.5(100) = 55
E (Capitalista ) = 0.5( −15) + 0.5(20) = 2.5
El camino del equilibrio, resulta entonces como se muestra en la siguiente figura, en la cual se incluye la
codificación de nodos realizada por ComLabGame en la figura 3-187.
211
Capítulo 3 Distribuciones de Probabilidades
Empresario
Ignorar la idea
Busca Inversor
Capitalista
10,0
Nodo1
Invierte
No invierte
55,2.5
-5,0
Nodos 2 y 3
Nodo 4
Figura 3-187
El equilibrio perfecto de dominancia en ganancias conduce, con estas ganancias, al equilibrio:
Empresario: Busca Inversor –Capitalista. Invierte.
b)
Para la toma de datos de esta prueba se requiere realizar varias experiencias (al menos 20 repeticiones) para
obtener la frecuencia de resultados que conducen a los nodos que predice la teoría, es decir a los nodos 2 y 3.
Luego se realizará el análisis comparando este valor con una elección al azar de los nodos (considerando los
nodos 2 y 3 como uno solo), utilizando por ejemplo una prueba de la bondad del ajuste (capítulo 1). Se
calculará entonces el valor χ2.
Sean por ejemplo 20 juegos, con los resultados observados que se muestran en siguiente figura.
Frec observada
Frec esperada
Nodos 1
3
Nodo 1
6.67
Nodo2
5
Nodo2
6.67
Nodos 3y 4
12
Nodos 3 y 4
6.67
Total
20
Total
20
Figura 3-188
(3 − 6.67) 2 (5 − 6.67) 2 (12 − 6.67)2
χ2 =
+
+
= 6.69
6.67
6.67
6.67
C=
6.69
= 0.50
6.69 + 20
No puede anticiparse ninguna conclusión hasta completar la prueba estadística en el capítulo 5.
c)
Para esta prueba se requiere crear otro modelo en el cual otro juego se realice en forma Estratégica o Normal
(tabla). En este caso se tienen 2 jugadores; Empresario y Capitalista con las ganancias mostradas en la
figura 3-189. Observar que ambas celdas inferiores de la forma Normal tendrán igual valor pues si el
Empresario Ignora la idea, no interesa la acción del inversor.
Se puede apreciar que en este diseño el resultado Empresario Busca Inversor – Capitalista
Invierte, es un equilibrio de Nash y que el resultado Empresario Ignora la idea –
Capitalista No Invierte, es otro equilibrio de Nash.
212
Jorge Carlos Carrá
V Simulaciones – b Jugador (cliente)
Para la toma de datos se debe realizar ahora la experiencia con esta tabla, con igual cantidad de repeticiones
que la forma extensiva. Se obtendrán así las frecuencias en cada celda.
Figura 3-189
El análisis se realizará con una prueba chi-cuadrado de la bondad del ajuste, con los valores de frecuencias de
ambas experiencias y los valores esperados en caso de independencia entre la forma Extensiva y la forma
Normal. Por lo tanto, se deberá preparar una tabla con el formato que se muestra en la figura 3-190, en la cual
se muestra un ejemplo ficticio de 25 juegos.
Observados
Forma Extensiva
Forma Normal
Total
Nodo 1
Celda Inf Izq
15
2
17
Nodos 2 y 3
Celda Sup Der
6
20
26
Nodo 4
Celda Sup Izq
4
3
7
Total
25
25
50
Figura 3-190
Comparar esta tabla con la de valores esperados en el caso de que exista independencia y calcular el valor χ2.
Esperados
Forma Extensiva
Forma Normal
Total
Nodo 1
Celda Inf Izq
8.5
8.5
17
Nodos 2 y 3
Celda Sup Der
13
13
26
Nodo 4
Celda Sup Izq
3.5
3.5
7
Total
25
25
50
Figura 3-191
(15 − 8.5) 2 (6 − 13) 2
χ2 =
+
+ ... = 17.622
8.5
13
C=
17.622
= 0.510
17.622 + 50
213
Capítulo 3 Distribuciones de Probabilidades
Si este valor fuera cercano a 0, la forma de presentación sería independiente del resultado, lo cual indicaría
que estos no varían significativamente en las 2 presentaciones. En este caso no puede anticiparse la conclusión
hasta completar la prueba estadística en el capítulo 5.
Aplicaciones
Buscar en Internet o en la biblioteca documentación concerniente a teoría de juegos o economía, y
elegir algunos juegos de 2 jugadores. En la sección problemas del final del capítulo, se incluyen
algunos. Resolverlos teóricamente (incluso con varias matrices de ganancias) y luego crearlos con
ComLabGame, para experimentar las estrategias utilizadas por 2 oponentes. Es conveniente ofrecer
algún tipo de incentivo a los jugadores, aunque sea mínimo, para aumentar el interés.
Con los resultados obtenidos se podrán realizar interesantes pruebas estadísticas en el capítulo 5.
Acompañar los datos indicando cuáles fueron las estrategias utilizadas por los jugadores, si buscaron
o no los equilibrios del juego, si tenían o no una base teórica, si realizaron o no coordinaciones fuera
del juego o si se detectaron errores a corregir.
214
Jorge Carlos Carrá
Ensayo: ¿Creer en Dios mejora la existencia? – El peso de la decisión. Blas Pascal
Ensayo: ¿Creer en Dios
mejora la existencia?
En el capítulo 2 hemos presentado un ensayo acerca de la existencia de Dios. En este ensayo
veremos un enfoque histórico para responder a otra pregunta relacionada pero distinta16. ¿Quién
tiene el mejor modo de existencia, el que cree en Dios o el que no? El enfoque se basa en la
interrelación conjunta de utilidades y probabilidades.
El peso de la decisión. Blas Pascal
¿Es más conveniente creer en Dios?
El filósofo francés Blas Pascal (1623-1662), planteó en el siglo XVII, en su libro "Pensamientos"
(Pascal, B. 1996), un análisis basado en probabilidades y utilidades, que luego sería conocido como
la Apuesta de Pascal.
La historia cuenta que Pascal se convierte en un ferviente religioso, como consecuencia de haberse
salvado milagrosamente de morir ahogado, cuando los caballos del coche en el que viajaba, cruzaron
desbocados un puente.
Pascal plantea que en el caso de creer en la existencia de Dios, la decisión es más favorable hacia
los creyentes. Veamos su razonamiento a la luz de las 4 alternativas que se muestran en el árbol de
decisiones de la figura 3E-1.
Si se cree que Dios existe, dice Pascal, el creyente recibirá la felicidad eterna (ganancia infinita) y en
cambio para el resto de las alternativas, las ganancias serán finitas (sean positivas o negativas). De
esta forma, no importa cuán pequeña sea la probabilidad de la existencia de Dios pues la esperanza
matemática de este camino del árbol siempre será mayor que la de los demás.
Veamos el detalle. Un rectángulo simboliza un nodo de decisiones controladas por la persona. Un
círculo significa un nodo de eventos no controlables por la persona, pero de los cuales se conocen las
probabilidades p de cada uno. Al final de cada una de estas ramas se encuentran las ganancias o
utilidades que proporciona cada evento.
De acuerdo a la teoría de las probabilidades, el valor esperado para el creyente y el ateo son,
respectivamente:
G ( creyente ) = ∞ ∗ p1 + a ∗ p 2 = ∞
G ( ateo ) = b ∗ p 3 + c ∗ p 4 = finito
Estos valores se colocan en cada uno de los círculos, como ganancias de esas ramificaciones.
En los nodos de decisión se decide finalmente cual es la decisión más conveniente, eligiendo
naturalmente la acción que maximiza las ganancias. En este caso es la que le corresponde a ganancia
infinita, por cuya razón se ha colocado una doble raya en la rama eliminada.
En conclusión, según Pascal, sin importar el valor de las probabilidades acerca de la existencia de
Dios, la esperanza es mayor si optamos por creer en él.
16
A pesar de que en algunos textos también se la enuncia incorrectamente también como ¿Dios existe?
215
Capítulo 3 Distribuciones de Probabilidades
Ganancia
p1
Existe
Infinito..
creyente Infinito.
p2
Infinito
ateo
p3
No existe
a
Existe.
b
No Existe.
c
Finito
p4
Figura 3E-1
Árbol de decisiones
Para finalizar el razonamiento de Pascal, deben mencionarse algunas críticas matemáticas al mismo.
Entre ellas se encuentran las siguientes dos. La primera es que debe exceptuarse el valor de p1 igual a
cero, pues produce un resultado indeterminado (0 por ∞ ), el cual no es infinito. La segunda crítica es
planteada por quienes no ven en la noción de infinito, un valor legítimo. El argumento es que si se
reemplaza ∞ por un valor muy grande pero finito, siempre se podrá asignar a p1 el valor inverso, lo
cual producirá una ganancia finita, comprometiendo, de esta forma, el argumento de Pascal.
Al igual que para el ensayo sobre la existencia de Dios (página Dios1), el lector podrá sumar su
interpretación y opinión personal a la discusión que seguirá generando la respuesta de Pascal.
216
Jorge Carlos Carrá
Ensayo: Intimidades de un casino – Introducción
Ensayo: Intimidades de un
casino
Introducción
Sabemos que la teoría de las probabilidades tiene amplia aplicación tanto en Casinos como en
Compañías de Seguros. Utilizando la distribución binomial veremos aquí una consecuencia que
resultará sin duda sorprendente y que resulta aplicable en ambas actividades.
1. Casinos
Conocemos del capítulo 3 que en una ruleta la esperanza matemática de la ganancia a la larga, por
cada peso apostado es la misma independientemente del tipo de apuesta. Veremos en cambio ahora
una extensión de la teoría matemática en condiciones de incertidumbre, para establecer algún criterio
que nos permita elegir una de las dos siguientes alternativas:
¿Cuál es la mejor acción: realizar pocas apuestas grandes o muchas apuestas chicas?
Para responder a esta pregunta demostraré previamente que la probabilidad de salir ganando (por lo
menos 0 $) en un número dado de jugadas, presenta las siguientes tendencias:
• para un determinado tipo de apuestas, decrece a medida que el número de jugadas aumenta.
• para un determinado número de jugadas, aumenta al elegir los mayores pagos (y por lo tanto las
menores probabilidades).
Por lo tanto la respuesta a la pregunta será: lo mejor es realizar pocas jugadas de altos pagos.
Observaremos experimentalmente el comportamiento anterior simulando con el SPSS un gran
número de apuestas en distintos juegos, por ejemplo: docena, mayores, calle, etc.
217
Capíítulo 3 Distrib
buciones de Probabilidade
P
es
F
Figura 3E-2
Ruleta
En unaa ruleta, la disstribución de la
l variable X: número de aciertos
a
en n jugadas es una binomial
b ( x, n, p ) .
Vinculación entre
e
XyG
En un casino
c
europeeo B, un jugaddor A juega n veces 1$. Paara obtener laa relación entrre X y G,
comencemos por razzonar los valoores de G parra: 1) pleno, 2)
2 docena.
Pleno
o
Por cad
da 1$ que se juegue,
j
la ruleeta siempre paga
p
un montoo M (incluyenndo la apuestaa):
M =
36$
pleno
Por lo tanto para obtener la ganan
ncia G del jueego, se debe restar
r
1$ a la cuenta anterio
or.
Si se juuega a pleno, si no sale, se pierde 1$ (G
G = –1$) y si sale,
s
paga 36/1 = 36$, resu
ultando una G =
35$.
S
X
G
F
E
0
––1
1
35
F
Figura 3E-3
Ganancia dde pleno en unaa jugada
Para esstablecer la reelación para n jugadas, se pprocede en foorma similar. Si denotamoss a las pérdidaas
con unn asterisco, ressulta:
218
Jorge
e Carlos Carrrá
Ensayo: Intimidades de un casino – 1. Casinos
S
X
G
E
F
XA
35 XA
X'A
– X'A
Figura 3E-4
Ganancia de pleno en n jugadas
Es decir:
G = 35 X A − X A′
Como:
2 = X A + X A′
Se obtiene:
G = 36 X A − 2
Docena
Si se juega a docena, si no sale, se pierde 1$ (G = –1$) y si sale, paga 36/12 = 3$, resultando una G =
2$. Las tablas son las de las figuras 3E-5 y 3E-6.
S
X
G
F
E
0
–1
1
2
Figura 3E-5
Ganancia de Docena en una jugada
S
X
G
E
F
XA
2 XA
X'A
- X'A
Figura 3E-6
Ganancia de Docena en n jugadas
Hallar, a) E(GA) a la larga, b) la probabilidad de que A salga ganando o empatando al término de las
n veces, c) el número de éxitos necesario para salir ganando o empatando.
Es decir:
G = 2 X A′ − X A′
Como:
2 = X A + X A′
Se obtiene:
G = 36 X A − 2
Si se hace intervenir la ecuación de pagos M, enunciada al principio, puede observarse que estas
ecuaciones responde a la siguiente ecuación general, válida para todas las jugadas:
G = M ∗ XA −n
La cantidad de éxitos XA necesarios para salir por lo menos a la par, es decir ganando o empatando,
se obtendrá haciendo G = 0. Si llamamos a este valor de X, X0, se tiene entonces:
X0 =
n
M
Elección de la mejor acción
El número de éxitos que se deben obtener para estar a la par, es:
219
Capítulo 3 Distribuciones de Probabilidades
. X0 =
n
M
Analizando la gráfica 3E-7 se concluye que la probabilidad de ganar por lo menos 0 $ deberá ser
1 − CDF .BINOM ( x 0 , n, p ) .
CDF.BINOM(x0,n,p) P(ganar o empatar)
x0
x
0
G
Figura 3E-7
Histograma
Combinando las dos expresiones anteriores se obtiene una fórmula para calcular la probabilidad de
salir ganando del casino para cualquier juego y para cualquier valor de n. Por ejemplo para los
juegos Pleno, Cuadro y Color, resultará:
Pleno:
n
1 − CDF.BINOM ( − 0.01, n,1 / 37)
36
Cuadro:
n
1 − CDF.BINOM ( − 0.01, n,4 / 37)
9
Color:
n
1 − CDF .BINOM ( − 0.01, n,18 / 37)
2
Nota
Para que cuando x0 coincida con un valor entero, la ganancia 0 se compute correctamente a la probabilidad
de salir ganando, restemos un valor pequeño, por ejemplo 0.01 a dicho valor x0).
Para la simulación solo basta generar los valores de n. Esto se realiza fácilmente con EXCEL hasta
un límite de 65536 (es decir 216) y luego se pasa a una columna de SPSS con copiar y pegar.
Llamaremos n a dicha columna.
Si se generan las 3 variables anteriores, se observarán las 2 tendencias enunciadas al principio de
esta actividad y además ciclos bien definidos de 36, 9 y 2 elementos. ¿Cómo se explican estos
ciclos? (si no se le ocurre nada, seguir leyendo).
220
Jorge Carlos Carrá
Ensayo: Intimidades de un casino – 1. Casinos
Probabilidad de ganar 0 ó más
.6
.5
.4
.3
.2
PLENO
.1
CUADRO
COLOR
0.0
9
92
62 1 7
6
59 0 5
3
56 9 3
9
52 8 1
6
49 6 9
3
46 5 7
0
43 4 5
7
39 3 3
4
36 2 1
1
33 0 9
8
29 9 7
4
26 5
18
23 7 3
8
19 6 1
5
16 4 9
2
13 7
3
99 5
2
66 3
1
33
1
Número de apuestas
Figura 3E-8
Probabilidad de ganar en función del número de apuestas
Las tendencias se aprecian nítidamente generando gráficos como los que se muestran.
En la figura 3E-8, se muestra la tendencia general al aumentar n, en tanto que en la figura 3E-9 se
amplifica la escala para observar los ciclos. Observar como la probabilidad de salir ganando del
casino converge a cero con el número de jugadas y lo hace más rápidamente para los juegos con
menores pagos.
Probabilidad de ganar 0 ó más
.8
.6
.4
.2
PLENO
CUADRO
COLOR
0.0
1
301
151
601
451
901 1201 1501 1801 2101 2401 2701
751 1051 1351 1651 1951 2251 2551 2851
Número de apuestas
Figura 3E-9
Probabilidad de ganar en función del número de apuestas (amplificado)
Para obtenerlos se utilizará el ya conocido menú Graphs. Si se desea representar a todas las variables
en un mismo gráfico como se muestra en las figuras, utilizar Graphs > Sequence…> colocar todas
las variables en el cuadro Variables y la variable n en el cuadro Time Axis Labels. Los gráficos que
representan a una variable categórica tienen en SPSS un límite de 3000 niveles por lo cual, para ver
los ciclos del segundo gráfico, limitar los casos a n < 3001 (con Select Cases) y para ver la tendencia
del primer gráfico para los 65536 valores de n, seleccionar solo un valor de cada ciclo con Data >
Select Cases…> If condition is satisfied > If > buscar la función módulo o teclear mod(n,36)=1 (esto
elimina por ejemplo, los ciclos de 36 valores. ¿Por qué?).
Repetir la simulación anterior para otros juegos distintos a los ejemplificados, y también
computando la probabilidad de salir ganando (no empatando), es decir sin restar ningún valor a x0 .
221
Capítulo 3 Distribuciones de Probabilidades
Sugerencia para explicar los ciclos
Crear la variable x0 y analizar el siguiente comportamiento. La probabilidad de salir ganando, crece
Probabilidad de ganar 0 ó más
en los tramos comprendidos entre valores enteros de x0 y decrece en forma brusca exactamente en
dichos valores, pues al término de la CDF se le agrega el salto correspondiente a la barra de
probabilidades de x0 . Además de observarlo en la planilla de datos, esto se puede ver nítidamente
limitando los casos a por ejemplo 100, como se indica en el diagrama 3E-10, correspondiente a la
apuesta cuadro. En otras palabras estos ciclos se originan por las discontinuidades de una
distribución discreta, pero lo que interesa realmente es la tendencia general, la cual, como se observa
en la figura 3E-9, es decreciente con el número de jugadas.
.7
.6
.5
.4
.3
.2
.1
0.0
1.00
10.00 19.00 28.00 37.00 46.00 55.00 64.00 73.00 82.00 91.00
Número de apuestas
Figura 3E-10
Probabilidad de ganar en función del número de apuestas
Esta actividad ayudará a comprender los efectos de la ventaja que tiene un Casino en la esperanza
matemática (ciertamente muy moderada) y porque no es negocio para el Casino que se juegue poco.
Todos los Casinos buscan atraer a muchos jugadores (que equivale a jugar muchas veces para el
Casino). El negocio redondo sería tener una ciudad atractiva, con sorteos gratis, incluso con hoteles
y restaurantes baratos, para atraer siempre a una gran cantidad de jugadores.
2. Aseguradoras
Estas compañías también utilizan la teoría de las probabilidades en su gestión. Por razones similares
a los Casinos es conveniente para ellas asociarse en lugar de operar cada una por su cuenta, pues de
esta forma disminuyen el riesgo de perder. Por lo mismo, aparece la figura de las reaseguradotas, es
decir sociedades que aseguran a las aseguradoras. En la punta de la pirámide se encuentra el Lloyd
de Londres, quien al distribuir el riesgo lo minimiza.
222
Jorge Carlos Carrá
Ensayo: Intimidades de un casino – 2. Aseguradoras
223
Capítulo 3 Distribuciones de Probabilidades
Problemas
Ia Una variable
1. Inglés y francés
En un conjunto de 330 estudiantes argentinos, 200 hablan inglés, 90 hablan francés y 70 no
hablan ni inglés ni francés. Se elige un estudiante al azar, a) hallar la distribución de
probabilidades de x: número de idiomas extranjeros que habla, b) Si se elige 1 estudiante
¿cuál es la probabilidad de que hable un solo idioma extranjero, c) Si se eligen 2 estudiantes,
¿cuál es la probabilidad de que el primero hable un solo idioma extranjero y el segundo por
lo menos uno? Realizar primero el cálculo exacto y luego suponiendo que los eventos son
independientes.
R: a) μ = 0.88, σ = 0.53, b) 0.697, c) 0.549.
2. Tanques de agua con impurezas
Se examinan tanques de agua en la búsqueda de 2 impurezas A y B. Se encontró que el 20%
no revelaban impurezas, 40% tenían la A y el 50% la B. Hallar, a) la distribución de
probabilidades de X: el número de impurezas encontradas si se elige un tanque al azar, b) si
se eligen 2 tanques independientes, cual es la probabilidad de que el primero tenga 1
impureza y el segundo por lo menos 1, c) si se elige un tanque del que se sabe que tiene por
lo menos 1 impureza, hallar la probabilidad de que tenga una sola.
R: a) µ=0.9, σ=0.54, b) 0.56, c) 0.875.
3. Válvulas de agua
En el circuito de la figura, A B y C son válvulas de agua que se abren con una probabilidad
p=0.8. a) Hallar el histograma de probabilidad de X: el número de ramas abiertas luego de
haber enviado la señal. b) ¿Cuál es la probabilidad de que una rama este abierta sabiendo
que por lo menos una lo está? c) Calcular la confiabilidad del sistema.
R: a) µ=1.44, σ=0.62, b) 0.448. c) 0.928.
4. Lanzamiento de una moneda
Se lanza una moneda hasta que aparezcan 1 cara o 5 secas. Si X es el número de
lanzamientos, a) hallar µ y σ de la distribución, b) ¿cuál es la probabilidad de que salgan no
más de 2 secas?
R: a) µ=1.94, σ=1.19, b) 0.875.
224
Jorge Carlos Carrá
Problemas – Ic Modelos teóricos de una variable
Ic Modelos teóricos de una variable
Discretas
5. Equipos y la probabilidad de ganar
El equipo A tiene 2/3 de probabilidad de ganar cuando juega. Si A juega 4 partidos, hallar:
a) la distribución de probabilidades, µ y σ de X: resultados (número de partidos ganados) de
A, b) la probabilidad de que A gane 2 partidos, c) de que gane un partido por lo menos, d) de
que gane más de la mitad de los partidos, e) ¿Es poco común que A gane menos de 1
partido? f) Si Y = 2X+4, hallar la distribución de probabilidades de Y, su esperanza y su
varianza. Resolver manualmente y con el SPSS.
R: a) 8/3; 0.943, b) 8/27, c) 80/81, d) 16/27, f) SPSS.
6. Equipos de radar
Siete equipos de radar están disponibles para detectar cualquier avión. Cada equipo tiene una
probabilidad p = 3/4 de detección. Sea X el número de radares detectores. a) Dibujar el
histograma con µ y σ, b) si un avión entra en el área, cuál es la probabilidad de que no sea
detectado y cuál de que sea detectado por 2 radares por lo menos, c) cuantos radares debe
haber para que la probabilidad de detección de por lo menos 1 de ellos sea 15/16, d) cuál es
la probabilidad de que uno de los equipos detecte 3 aviones antes de fallar e) ¿Es poco
común que un avión sea detectado por menos de 2 aviones? f) Si Y = 2-X, hallar la
distribución de probabilidades de Y, su esperanza y su varianza. Resolver manualmente y
con el SPSS.
R: a) 5.25, 1.14, b) 0.006%, 99.8%, c) 2, d) 10.54%, f) SPSS.
7. Examen de selección múltiple
Hallar la probabilidad de que un estudiante en un examen de selección múltiple, conteste
correctamente y al azar, a) 12 o más de un total de 20, si tiene 2 respuestas posibles, b) al
menos 10 de un total de 15, si tiene 5 respuestas posibles, c) ¿Es poco común que conteste
más de 15 de un total de 20, si tiene 2 respuestas posibles? Resolver manualmente y con el
SPSS.
R: a) 0.2511, b) 0.
8. Vuelos sobre registrados
Una compañía aérea tiene aviones pequeños con capacidad para 18 personas y tiene la
política de registrar hasta 20 personas pues la experiencia anterior indica que el 80% de los
pasajeros registrados realmente toman el vuelo. a) Calcular la probabilidad de que, habiendo
registrado 20 pasajeros, no haya asientos disponibles. b) Si consideramos como un valor
inusualmente bajo cuando la probabilidad sea menor al 5%, ¿será esta sobreventa un
problema real para los pasajeros? Resolver manualmente y con el SPSS.
R: 0.069, b) si.
9. Cara reticente
Dado que se ha lanzado 5 veces una moneda normal sin obtener una cara, ¿cuál es la
probabilidad de que se tenga que lanzar al menos dos veces para obtener la primera cara?
R: 0.5.
10. Computadoras de un avión
Un avión tiene 3 computadoras pero solo una de ellas se encuentra en servicio. Las otras son
de reserva en caso de falla. Durante una hora de operación, la probabilidad de falla es 0.0005
(el número de ensayos y equivale en este problema al número de horas). a) ¿Cuál es el
tiempo promedio de falla de las 3 computadoras? b) ¿Cuál es la probabilidad de que las 3
fallen en un vuelo de 5 horas (es decir: P ( y ≤ 5) = P ( y = 3) + P ( y = 4) + P ( y = 5) )?
c) ¿Es poco común que las 3 fallen en un vuelo de 5 horas? Resolver manualmente y con el
SPSS.
R: a) 6000 horas, b) 1.25E-9.
225
Capítulo 3 Distribuciones de Probabilidades
11. Muestreo de aceptación
Un producto se embarca en lotes de 20. Se muestrean 5 artículos de cada lote y se rechaza el
lote si se encuentra más de 1 defectuoso. Si un lote contiene 4 defectuosos, a) ¿cuál es la
probabilidad de ser rechazado?, b) si X es el número de defectuosos encontrados en el lote,
hallar el µ y σ de la distribución. Resolver manualmente y con el SPSS.
R: a) 0.248, b) µ=1, σ=0.7947.
12. Acciones preferentes y ordinarias
Un inversionista desea comprar 3 acciones. Tiene 5 alternativas de las cuales 2 son
preferentes y 3 ordinarias. Si toma la decisión al azar, hallar: a) el histograma para X: el
número de acciones preferentes que comprará, b) µ y V(X), c) la probabilidad de que x caiga
a no más de dos σ de µ, d) ¿Es poco común que compre menos de 2 acciones ordinarias?
R: b) µ=1.2, V(X) = 0.36, c) 1. Resolver manualmente y con el SPSS.
13. Elección de trabajadores
Un capataz de una fábrica tiene 3 hombres y 3 mujeres trabajando para él. Desea elegir 2
trabajadores al azar. a) Hallar el histograma de probabilidad de X: el número de mujeres en
su selección. b) ¿Es poco común que elija menos de 1 mujer? Resolver manualmente y con
el SPSS.
R: µ=1, σ=0.63.
14. Soldadura defectuosa
La probabilidad de que se haga una soldadura defectuosa en una conexión dada es 10-4.
Hallar: a) el número de soldaduras en un sistema si la probabilidad de que no se presenten
defectos en dicho sistema es 6.7363.10-3, b) el número esperado de uniones defectuosas.
R: a)5 104., b) 5.
15. Test para detectar una enfermedad
Un médico aplica un test a una muestra de 10 personas para detectar una enfermedad que
afecta al 10% de los trabajadores de una fábrica. Se sabe que el test acierta un 80% a un
individuo enfermo y un 75% a un individuo sano. a) Hallar la probabilidad de que a 4
personas de las 10, el test les dé positivo (predice enfermedad), b) Si hay 4 personas que el
test les da positivo, cual es la probabilidad de que entre éstas exactamente 2 estén sanas, c)
hallar la probabilidad de que el test se equivoque en 2 personas de las 10, d) calcular la
probabilidad de que el test acierte a por lo menos 8 personas de las 10.
R: a) 0.2047, b) 0.2246, c) 0.285, d) 0.5407. Resolver manualmente y con el SPSS.
16. Suspensión de clases como medida de protesta
De los 800 alumnos de una facultad, 560 están en contra de la suspensión de clases como
medida de protesta resuelta por el gremio. Veinticinco estudiantes son elegidos al azar, sin
reposición. a) Hallar la probabilidad de que menos de 5 estén a favor de la medida de fuerza.
b) ¿Es poco común que menos de 4 estén a favor de la medida de fuerza? Resolver
manualmente y con el SPSS.
R: 9%.
17. Envío de artículos
Una empresa debe enviarle a un cliente 5 artículos y posee en existencia 12. De estos 12
artículos, 3 son del tipo A, 2 del tipo B y el resto del tipo C. ¿Cuál es la probabilidad de que
el cliente reciba exactamente 2 del tipo A, 1 del tipo B y 2 del tipo C?
R: 0.159.
18. Técnica de captura- marcación- recaptura
Muchas veces se estima el tamaño de la población de animales utilizando la técnica de
captura- marcación- recaptura. Utilizando este procedimiento para estimar el tamaño de la
población de truchas de un lago se capturan 10 truchas, se las marca y luego se las devuelve
al lago. Posteriormente se toman muestras al azar de 2 truchas y se anota el número X de
animales marcados. Si se ha determinado por este proceso que la frecuencia relativa de X=1
es 0.05, ¿cuántas truchas se estima que haya en el lago?
R: 390.
226
Jorge Carlos Carrá
Problemas – Ic Modelos teóricos de una variable
19. Número de fallas
En un servidor web, el número de fallas que un requerimiento puede generar es de 1 por
cada 100 requerimientos y el servidor procesa 500 requerimientos por hora. Hallar
manualmente y con el SPSS, la probabilidad de que se presenten:
a) 7 fallas en 1.5 horas
b) al menos 3 fallas en media hora
c) ¿Es poco común que se presenten menos de 2 fallas en media hora?
R: a) 0.1465, b) 0.456.
20. Errores de inventario
En un supermercado el número promedio de errores de un cierto empleado es 2.3. a) Si se
consideran 3 períodos consecutivos, ¿cuál es la probabilidad de que el número de errores se
aleje de la media en, a lo sumo, una desviación estándar?
Un programa de incentivos para disminuir la cantidad de errores consiste en:
1) si comete menos de 5 errores, su sueldo no se verá afectado por descuentos,
2) si comete por lo menos 5 pero menos de 10 errores, su sueldo tendrá un descuento del
5%,
3) si comete por lo menos 10 errores, su sueldo tendrá un descuento del 10%.
b) Calcular el descuento esperado por período de inventario.
R: a) 0.778, b) 0.42%.
21. Seguros por enfermedad
La probabilidad de que una persona de entre 20 y 30 años muera de cierta enfermedad
durante un período de un año es de 0.00001. a) Si una compañía de seguros tiene 100000
personas de este grupo, ¿cuál es la probabilidad de que deba pagar más de 4 seguros por esta
enfermedad? b) Si la póliza de seguros es de $ 200000, ¿cuál debe ser la prima anual si la
compañía desea tener un beneficio de $ 10?
R: a) 0.00366, b) $ 12.
22. Páginas con avisos comerciales
Forme un grupo de estudiantes que cuenten las páginas con avisos comerciales en una
revista. Luego deben crear la distribución de frecuencias en una columna del SPSS,
comparar esta distribución real con una binomial b ( y , n , p ) (forma de la CDF y
parámetros).
Calcular en forma manual y con la computadora, para ambas distribuciones: a) la
probabilidad de que la proporción muestral de páginas con avisos comerciales se encuentre a
menos de 0.09 de la media, b) el percentil 59 de la distribución binomial de la proporción de
páginas con avisos comerciales, c) la proporción de páginas con avisos comerciales a partir
de la cual sería un suceso poco común.
23. Lanzamiento de una moneda
Cada estudiante debe lanzar 10 monedas, anotar el número de caras y repetir el experimento
30 veces. Luego debe crear una distribución de frecuencias en una columna del SPSS y
comparar esta distribución real con una binomial b ( y , n , p ) (forma de la CDF y
parámetros).
Con ambas distribuciones: a) calcular la probabilidad de que la proporción de veces que sale
cara, sea mayor a 0.60, b) hallar la AIC, c) ¿es poco común que el número de caras sea
mayor a 28?
24. Búsquedas en Google
Realizar 20 búsquedas de un tópico cualquiera y registrar el número de errores que se
presentan debido a páginas que no se conectan. Repetir para otras 30 búsquedas. Colocar los
resultados en una columna de 30 filas del SPSS y comparar esta distribución real con una
binomial b ( y , n , p ) o con una p ( y , λ ) (forma de la CDF y parámetros).
Con ambas distribuciones: a) hallar la probabilidad de recibir menos de 1 error, b) hallar el
percentil 50. ¿Que hubiera sucedido con las diferencias si la muestra hubiera sido de 500?
¿Puede ser usada la distribución de Poisson para aproximar esta distribución observada?
227
Capítulo 3 Distribuciones de Probabilidades
Contínuas
25. Distribución definida con una PDF constante
Si X es una variable aleatoria distribuida con la siguiente función densidad:
⎧k , si − 2 < x < 2
f ( x) = ⎨
⎩0 en otros puntos
a) Obtener la media y la varianza, b) hallar la CDF, c) hallar la AIC, d) ¿cuál es la
probabilidad de que X sea mayor que 1 sabiendo que es positiva? e) dibujar la CDF y el
diagrama de caja, encolumnados con la PDF.
R: a) 0, 0.333, b) (x+2)/4, c) 2, d) 0.5.
26. Distribución definida con una PDF Triangular
Un error X se distribuye de acuerdo a la PDF que se muestra en la figura. a) Hallar la
probabilidad de que el error respecto de 10 sea superior a ± 0.5% (es decir de que X se
encuentre a mas de 0.05 de µ), b) la PDF analítica con la media y la varianza, c) la CDF, d)
la AIC, e) dibujar la CDF y el diagrama de caja, encolumnados con la PDF.
R: a) 0.25,
9.9 < x < 10
⎧100 x − 990
⎩−100 x + 1010 10 < x < 10.1
b) f ( x) = ⎨
μ = 10, σ2 = 0.001667.
2
⎪⎧50x -990x+4900.5
2
⎪⎩-50x +1010x-5099.5
c) F ( x) = ⎨
9.9 < x < 10
10 < x < 10.1
d) 10.0293-9.9707= 0.0586
27. Distribución definida con una PDF cuadrática
Dada la siguiente función:
f ( x) = ax 2 (1 − x)
0 < x <1
a) Hallar a para que sea una PDF, b) obtener la CDF, la media y la varianza. Dibujar
encolumnadas la PDF y la CDF, c) hallar la moda, d) hallar la mediana.
R: a) 12, b) 4 x 3 − 3 x 4 , μ = 0.60, σ2 = 0.04, c) 0.667, d) 0.615.
28. Distribución definida con una PDF por tramos
La densidad de probabilidades del tiempo de duración (en horas) de un determinado
producto se puede suponer representada por la f(x) que toma los valores siguientes:
⎧a, si 1 < x < 2
⎪3a si 2 ≤ x < 4
⎪
f ( x) = ⎨
⎪1, si x = 5 ó x = 6
⎪⎩0, para los demás valores de x
Hallar:
a) p( X ≤ 1.5)
b) la CDF, la media, la desviación estándar y graficarla encolumnada con la PDF.
c) la amplitud intercuartílica y el diagrama de caja,
228
Jorge Carlos Carrá
Problemas – Ic Modelos teóricos de una variable
d) Si un producto ha tenido una duración comprendida entre 1.3 y 2.4 horas, hallar la
probabilidad de que haya superado 2 horas,
e) Se seleccionan 10 productos en forma independiente. Calcular la probabilidad de que por
lo menos 9 tengan una duración superior a 3 horas.
R: a) 0.0714,
b)
1
⎧1
⎪⎪ 7 x − 7 ,
F ( x) = ⎨
⎪3 x − 5
⎪⎩ 7
7
si 1 < x < 2
si 2 ≤ x < 4
μ = 2.785, σ = 0.757
c) AIC = 1.167, Q2 = 2.833, d) 0.631,e) 2.99 10-3.
29. Distribución definida con una CDF cuadrática
Dada la siguiente función:
F ( x) =
30.
31.
32.
33.
34.
35.
x2
4
0< x<2
a) Determinar si cumple las propiedades de una función de distribución, b) Hallar los
cuartiles y dibujar el diagrama de caja, c) hallar el percentil 80., d) hallar la PDF, la media y
la varianza. e) graficar la PDF y la CDF en forma encolumnada.
R: a) si, b) 1.414, 1, 1.732, c) 1.789, d) x/2, μ = 4/3, σ2 = 2/3.
Cantidad de chocolate
La cantidad de chocolate utilizada por una fábrica en un día se puede modelar con una
distribución exponencial con media β = 300 kg. a) Hallar la probabilidad de que la fábrica
utilice más de 300 kg en un día determinado. b) El gerente le pide que calcule qué cantidad
de chocolate tendría que almacenar para que la probabilidad de agotar la existencia sea poco
común. Resolver manualmente y con el SPSS.
R: a) 0.368, b) 898 kg.
Dado el valor del eje de una normal, hallar la probabilidad
Si X es una variable aleatoria distribuida normalmente con µX=0 y σx=1, hallar manualmente
y con el SPSS: a) P(0<x<1.42), b) P(-0.73<x<0), c) P(-1.37<x<2.01), d) P(0.65<x<1.26), e)
P(-1.79<x<-0.54), f) P(x>1.13), g) P(-0.5<x<0.5).
R: a) 0.422, b) 0.2673, c) 0.892, d) 0.154, e) 0.258, f) 0.13, g) 0.383.
Dada la probabilidad de una normal, hallar el valor del eje
Sabiendo que Z está distribuida normalmente con µZ=0 y σZ=1, determinar su valor,
manualmente y con el SPSS, si: a)
A0 z = 0.377, b) CDF=0.377, c) A−1.5 z = 0.0217, d) A−∞ z = 0.8621.
R: a) ±1.16, b) –0.31, c) –1.35, -1.69, d) 1.09.
Admisión de un colegio
Los resultados de admisión de un colegio tienen una distribución normal con µ=7.5 y σ=1.
a) ¿Qué fracción de resultados se encuentra entre 8 y 9? b) Hallar la puntuación máxima del
10% inferior de la clase. Resolver manualmente y con el SPSS.
R: a) 24.17%, b) 6.22.
Error con distribución normal
En una medición se comete un error e que se distribuye normalmente con µ=0 y σ=2.
Determinar la probabilidad de que en 5 mediciones independientes todas resulten con error
superior a 0.5 (en ambos sentidos).
R: 0.333
Dígitos al azar
Hallar la probabilidad de que entre 10000 dígitos al azar con reposición, el dígito 3 aparezca
950 veces a lo sumo. Resolver manualmente y con el SPSS.
R: 4.75%.
229
Capítulo 3 Distribuciones de Probabilidades
36. Un persona, su padre y su abuelo
¿Cuál es la probabilidad de que una persona, su padre y su abuelo paterno tengan el mismo
cumpleaños? b) En una ciudad de 2000000 de habitantes, cuantos habrá término medio con
esta característica. c) ¿Cuál es la probabilidad de que haya menos de 10 habitantes con dicha
característica? d) ¿Cuál de que haya más de 5 con dicha característica?
R: a) 7.5 10-6, b) 15, c) 7.78%, d) 99.5%.
37. Dos máquinas independientes
E n un proceso de fabricación de una pieza mecánica intervienen 2 máquinas: la A taladra y
la B corta en trozos. Ambas son independientes. El diámetro del taladro de A en mm sigue
una n(23; 0.5), y el grosor producido por B, una n(11.5; 0.4). a) ¿Qué
porcentaje de las piezas tienen un diámetro entre 22.5 mm y 24 mm? b) ¿Qué porcentaje
tiene un grosor entre 10.5 mm y 11.7 mm? c) Si solo son aceptadas las piezas que cumplen
a) y b), ¿qué porcentaje de piezas será aceptado?
R: a) 81,8%, b) 68,53%, c) 56%.
38. Lanzamiento numeroso de una moneda
Una moneda se lanza 400 veces. Calcular la probabilidad de que a) el número de caras
difiera de 200 en más de 10, b) el número de caras se encuentre en el intervalo 200 ±20. c) Si
el número de caras resultó menor que 212, cual es la probabilidad de que hayan salido más
de 203. d) En que intervalo se encuentra el 77% de los resultados (número de caras)
alrededor del valor medio. e) Se realizan 2 pruebas. Cuál es la probabilidad de que en la
primera salgan menos de 194 caras y en la segunda menos de 190 secas. Resolver
manualmente y con el SPSS.
R: a) 31.7%, b) 95.4%, c) 30%, d) 200±12, e) 4.3%.
39. Suma de los dígitos de un dado
Se tira un dado 60 veces. Hallar la probabilidad de que la suma de todos los dígitos sea
menor que 200.
R: 0.2358
40. Probabilidad de salir ganando del casino
Con una ruleta americana (con 0 y 00), se realizan 64 apuestas de 1$ a colorado. a)¿Cuál es
la probabilidad de salir ganando del casino?, (pensar en el número mínimo de éxitos que
aseguran esto), b) ¿cuál es la probabilidad de ganar exactamente 20$?, c) ¿cuál es la
probabilidad de perder al menos 10$?, d) si se realizan 10000 jugadas, ¿cuál es la
probabilidad de salir al menos a la par?, e) si se juega a pleno 1$ en 500 jugadas, ¿cuál es la
probabilidad de ganar al menos 40$?.
R: a) 0.295, b) 0.0014, c) 0.242, d) ~0, e) 0.337.
41. Lavado automático
Los automóviles llegan un lavado automático en promedio 20 cada hora. Hallar
manualmente y con el SPSS:
a) la probabilidad exacta de que en cualquier período dado de media hora lleguen menos de
4 automóviles.
b) la probabilidad aproximada de que en cualquier período dado de 30 minutos lleguen
menos de 4 automóviles (usar la cpc).
R: a) 0.010, b) 0.019.
42. Persona que entra a un shopping y compra.
Los dueños de un shopping saben que una de cada cuatro personas que entra, compra algo.
Si se selecciona una muestra de 5 personas, hallar la probabilidad de que
a) 2 o más realicen alguna compra
b) a lo sumo 4 realicen alguna compra
Si se selecciona una muestra de 90 personas, hallar la probabilidad aproximada de que,
c) menos de 15 realicen alguna compra
d) al menos 20 realicen alguna compra
R: a) 0.367, b) 0.999, c) 0.025, d) 0.767
230
Jorge Carlos Carrá
Problemas – IV Teoría de los juegos
43. Entrega de la Tesis
De acuerdo a estudios anteriores, el 5% de los alumnos de estadística no presentan la tesis.
Se toma una muestra aleatoria de 20 alumnos, hallar las siguientes probabilidades en forma
exacta y con todas las formas de aproximación válidas:
a) no más de 2 no presenten la tesis,
b) cuanto menos 18, presenten la tesis,
c) 3 no presenten la tesis.
d) dibujar el histograma de probabilidades
R: a) 0.925, 0.919, b) 0.925, 0.919, c) 0.059, 0.0613.
IV Teoría de los juegos
44. Problemas Resueltos
Obtener los equilibrios en estrategias mixtas de todos los problemas resueltos de la sección:
"Simultáneos con estrategias puras", los cuales comienzan en la página 163.
R: Sistemas de video: 0.5, 0.5, El juego de la contaminación: no tiene equilibrios en
estrategias mixtas, Competencia Cournot: no tiene equilibrios en estrategias mixtas.
45. El dilema del prisionero
Dos prisioneros, A y B, que efectivamente cometieron un delito, son interrogados por
separado. Cada uno tiene 2 acciones posibles: Delatar, C o No Delatar, N.
Si los 2 niegan, la sentencia es solo 1 año por evidencias menores. Si solo uno delata, se le
libera, pero al otro se le sentencia con la condena máxima establecida por el código que es
de 15 años. Si ambos delatan se les rebaja la condena y son sentenciados a 10 años de
prisión.
a) Confeccionar la matriz de ganancias (años de prisión) y verificar que en este juego
simétrico, cada uno tiene una estrategia dominante y que existe un solo equilibrio de Nash
dominante. ¿Cuál es el valor del juego? ¿Cuál es el dilema? ¿Subsiste si el juego se repite?
¿El equilibrio es Pareto eficiente? b) Convertir el problema simultáneo en secuencial y
verificar que, al tener estrategias dominantes, no importa quién es el primero.
c) Para un posterior análisis, genere datos experimentales creando una simulación con el
programa ComLabGame y confronte a 2 jugadores. Repita el juego y exporte los principales
datos de la experiencia a un archivo EXCEL.
46. Aplicación del dilema del prisionero
Documentarse en el dilema del prisionero para involucrar los conceptos de cooperación y
confianza (es una situación muy común en el combate del crimen). Luego adaptar el juego a
por lo menos 2 situaciones en las que se presente una dicotomía entre el incentivo individual
para no cooperar y el incentivo social para cooperar.
Ejemplos: guerra de precios de 2 empresas duopólicas (Coca y Pepsi), hacer o no publicidad
(existe un ejemplo testigo con las empresas tabacaleras y la publicidad en TV), conducir
siempre por la izquierda o respetar la norma, pagar impuestos o no, divorcio amigable o con
juicio, licitaciones, negociaciones políticas, quiebra de bancos por retiros en masa, consumo
de agua de red, tragedia de los comunes, carrera armamentista, etc.
47. El juego del gallina
Dos adolescentes conducen cada uno un auto en sentidos contrarios, siendo inminente un
choque. Cada uno puede decidir Continuar o Virar hacia un lado. Si ambos continúan,
ambos mueren lo cual se representará con una ganancia de –3. Si ambos viran, se salvan
(ganancia 1) pero pierden prestigio. Si solo uno de los dos continúa se cubre de gloria
(ganancia 2), pero el que vira tiene una ganancia de 0. a) Obtener los equilibrios de Nash
(puros y mixtos), el valor del juego y la probabilidad de que ambos adolescentes se salven.
¿Son los equilibrios Pareto eficientes? ¿Existen estrategias dominantes débiles o fuertes? b)
Convertir el problema simultáneo en secuencial y analizar si importa quién es el primero. c)
Para un posterior análisis, genere datos experimentales creando una simulación con el
programa ComLabGame y confronte a 2 jugadores sin base teórica. Repita el juego y
231
Capítulo 3 Distribuciones de Probabilidades
exporte los principales datos de la experiencia a un archivo EXCEL.
R: a) dos equilibrios de Nash de estrategias puras no dominantes y un equilibrio de Nash de
estrategias mixtas con p(continuar) = 0.25. La probabilidad de que se salven es: 0.9375.
48. Juego de entrada al mercado
Dos empresas A y B deben decidir si abrir un restaurant en un shopping. Las estrategias son
Entrar, E y No entrar, N. Si las 2 empresas deciden N, la ganancia será 0 para ambas.
Si un decide E y la otra N, la firma que entra gana 30000$. Si ambas deciden E, ambas
pierden 10000$ pues no ha suficiente demanda para ambas. a) Obtener los equilibrios de
Nash (puros y mixtos) y el valor del juego. ¿Son los equilibrios Pareto eficientes? Construir
las formas normal y extensiva del juego. b) Repetir el análisis si la matriz de pagos cambia
de tal forma que B gane 400000$ si entra sola. c) Para un posterior análisis, genere datos
experimentales creando una simulación con el programa ComLabGame y confronte a 2
jugadores sin base teórica. Repita el juego y exporte los principales datos de la experiencia a
un archivo EXCEL. Este problema será continuado en el capítulo 5.
R. a) ambas deben utilizar una estrategia mixta de 0.75 para Entrar. Valor del juego = 0.
b) La probabilidad para Entrar de A cambia de 0.75 a 0.80. El valor del juego no cambia.
49. Los generales juegan a la guerra
Dos generales Smith y Gonzalez deciden jugar un juego de guerra. El general Smith puede
atacar por Tierra o por Mar. El general Gonzalez puede defender por Tierra o por Mar.
Ambos acuerdan la siguiente matriz de pagos (los valores representan las ganancias del
general Smith).
a) Obtener los equilibrios de Nash (puros y mixtos) y el valor del juego. ¿Son los equilibrios
Pareto eficientes? Construir las formas normal y extensiva del juego. b) Para un posterior
análisis, genere datos experimentales creando una simulación con el programa
ComLabGame y confronte a 2 jugadores sin base teórica. Repita el juego y exporte los
principales datos de la experiencia a un archivo EXCEL.
General Gonzalez
Tierra
Mar
Tierra
–25$
75$
General Smith
Mar
90$
–50$
R: a) Estrategia mixta con pSmith = 0.583, pGonzalez = 0.521. Valor del juego = 22.92$.
50. Roca, papel, tijera
Dos amigos Juana y Juan realizan este conocido juego en forma simultánea mostrando los
dedos. Roca rompe Tijera, Tijera corta Papel y Papel envuelve Roca. Si Juana
gana, obtiene 1$ de Juan y viceversa. Construir la tabla de pagos y el árbol del juego. a)
Obtener los equilibrios de Nash (puros y mixtos) y el valor del juego (deberá resolver un
sistema de ecuaciones de 4×4). ¿Son los equilibrios Pareto eficientes? b) Para un posterior
análisis, genere datos experimentales creando una simulación con el programa
ComLabGame y confronte a 2 jugadores. Repita el juego y exporte los principales datos de
la experiencia a un archivo EXCEL.
R: a) probabilidades = 0.33, G = 0.
51. Monedas y ases
En un juego usted elige cara o seca y su compañero elige uno de 4 ases. Dependiendo de si
él elige: Oro, Copa, Espada o Bastos, si usted elige Cara, recibe un pago de 15$, 4$, –5$ y
1$, y si selecciona Seca, recibe un pago de –10$, –2$, 1$ y –5$.
a) ¿Está de acuerdo con jugar? Deberá obtener el valor del juego para las estrategias puras o
mixtas que posea (utilice el método gráfico para resolver la igualdad de ganancias). b) Si
aceptó el juego y luego de 4 repeticiones ganó 5$, ¿Qué concluiría?
R: a) estrategia mixta p = (0.5, 0.5). Valor del juego: –2$. b) o tuvo mucha suerte o su
compañero es un ignorante.
232
Jorge Carlos Carrá
Problemas – IV Teoría de los juegos
52. Campaña publicitaria
Dos senadores compiten por la reelección. El senador A mueve primero y debe decidir si
invierte en una costosa campaña publicitaria. El senador B mueve después y debe decidir si
entra o no en el juego. B sabe que le será más fácil ganar si A no realiza una campaña
publicitaria. Modelar las 4 ganancias de cada uno con los valores 1, 2, 3 y 4. Si en el orden
A (Campaña, No campaña) y B (Entra, No entra), se utilizan las siguientes ganancias en los
nodos finales: (1,1), (3,3), (2,4) y (4,2), a) ¿Cuál es el equilibrio del juego?, b) hallar el
equilibrio si se mantienen las ganancias pero B mueve primero. ¿Importa quién mueve
primero? ¿Por qué? c) rediseñar las ganancias de tal forma que el orden no importe y
calcular el equilibrio.
R: a) (3,3), b) (4,2).
53. Póliza de seguro
Hallar la prima anual (de equilibrio) de una póliza de seguro contra incendio de $ 20000 en
una zona que por experiencia anterior puede tener pérdida total con p=0.001 y pérdida del
cincuenta por ciento con p=0.01. Ignorar todas las otras pérdidas parciales.
R: $ 120.
54. Empresa petrolera
Una empresa petrolera va a realizar 10 exploraciones. La probabilidad de una exploración
exitosa es 0.1. El conjunto tiene un costo fijo de $ 20000. Además cada exploración exitosa
cuesta $ 30000 y las fallidas $ 15000. Hallar el costo esperado para las 10 exploraciones.
R: $ 185000.
55. Bonos de inversión
Usted debe aconsejar a un cliente que tiene $1000 para invertir, el cual está interesado en 2
bonos con riesgos. Los bonos A tienen un rendimiento anual del 6.5%, pero tienen una tasa
de incumplimiento del 1% (se pierden los $1000). Los bonos B tienen un rendimiento anual
del 8.6%, con una tasa de incumplimiento del 2%. ¿Cuál de los bonos aconsejaría?
R: B.
56. Envases defectuosos
Una empresa provee envases para distintas industrias. El control de calidad de la misma
realiza un muestreo mensual de 350 envases para detectar la cantidad de fallas, cuyo último
resultado se indica en la tabla siguiente. Por cada envase la empresa cobre 6$. El costo de
cada uno es de 3$, pero si debe ser corregido se incrementa en 1.20$, independientemente de
las fallas que tenga. Los envases que tienen hasta 2 fallas se corrigen y los que tienen 3 o
más se descartan. Calcular la ganancia esperada mensual por envase.
1
2
3
4
Número de fallas por envase 0
86 112 83 47 22
Cantidad de envases
R: 1.150$.
57. Instrumentos de laboratorio
Todas las mañanas debe ajustarse un sistema de instrumentos en 2 laboratorios A y B de la
misma empresa, en forma independiente. Cada puesta a punto requiere una serie de ensayos
que no superan a 3, cuyas probabilidades se dan en la siguiente tabla. Cada ensayo cuesta 3$.
a) ¿Cuál es el laboratorio con mayores gastos diarios y cuál es el de gastos más irregulares.
b) Si U es el número total de ensayos en le empresa, calcular la esperanza y varianza del
gasto total G.
Laboratorio A
1
2
3
X
0.2
0.6
0.2
P(X)
Laboratorio B
1
2
3
Y
P(Y) 0.5 0.2 0.3
R: a) A, B, b) 11.40$, 10.44$.
233
Capítulo 3 Distribuciones de Probabilidades
58. Apuestas simples y dobles
Un jugador a cara o seca tiene un capital de 3 $. Apuesta 1 $ siempre a cara (apuesta
simple). Hallar el valor esperado de la ganancia si a) juega 2 veces, b) juega 3 veces. Luego
decide usar la técnica de la apuesta doble, es decir duplica la apuesta (2 $) si pierde, en tanto
tenga capital suficiente, c) repetir a), d) repetir b). ¿Qué diferencia se observa en los
histogramas? Justificarlas.
R: a) 0 $, b) 0 $, c) 0 $, d) 0 $.
59. Casino de ruleta europea y el equilibrio
En un casino de ruleta europea, establecer cuál de los siguientes juegos, conduce a: la
fortuna, la ruina o es equilibrado. Suponer que en cada uno se apuesta 1 $. a) Apostar al
número tres, (pleno), b) apostar a una línea, c) apostar a la primer docena, d) jugar a pleno
dos veces con apuesta simple, e) jugar tres veces a pleno con apuesta doble.
R: a) E(G)=-0.027, b) E(G)=-0.027, c) E(G)=-0.027, d) E(G)= - 0.054, e) E(G)= - 0.108.
60. Dados y el equilibrio
Establecer cuál de los siguientes juegos, conduce a: la fortuna, la ruina o es equilibrado,
suponiendo que en cada uno se apuesta 1 $. a) Apostar a obtener por lo menos un 6 en 4 tiros
de un dado, b) apostar a obtener por lo menos un doble 6 en 24 tiros de dos dados, (ídem
anterior).
R: a) E(G)=0.035, b) E(G)=-0.01718.
Problemas con base de datos
Todos los archivos que se mencionan en los problemas, se encuentran en la dirección (acceso
restringido a alumnos):
http://www.aprehender.net/JCC/viewtopic.php?f=52&t=267
61. Telefonistas en la mira
Abrir el archivo Llamadas.sav.
La empresa en la que usted trabaja atiende pedidos por teléfono, para lo cual cuenta con un
grupo de telefonistas. El gerente desea bajar los costos y le pide que estudie optimizar el
número de telefonistas. Como primera medida necesita datos para analizar, por lo que
solicita que le confeccionen un registro del número de llamadas que se reciben de los
clientes, agrupados por hora desde las 8 de la mañana hasta las 4 de la tarde. Estos datos se
obtienen durante el transcurso de 22 días y le son entregados en el archivo Llamadas.sav
Supondremos en principio que el número de llamadas por hora sigue una distribución
normal lo cual será validado en el capítulo 7. Las inquietudes del gerente son las siguientes:
a) ¿Qué cantidad de telefonistas por hora recomendaría para estar 98 % seguro de que cada
uno de ellos solo tenga que atender 8 clientes por hora?
Sugerencia: calcular primero el número de llamadas por hora asociado al 98 % (percentil
98).
b) El gerente observa que los datos parecen indicar algunas horas pico, por lo cual le solicita
evaluar una solución menos costosa que utilice por ejemplo distinta cantidad de telefonistas
en cada hora. Repetir entonces la pregunta anterior pero ahora analizando la cantidad
requerida de telefonistas por cada una de las horas entre las 8 de la mañana y las 4 de la
tarde. ¿Cuántas horas de telefonistas se ahorraría el gerente?
Sugerencia: Usar Split File para dividir los datos por hora. Para calcular los percentiles
98 de las nueve distribuciones en un solo paso, colocar en dos columnas de la vista de datos
los valores de μ y σ para cada una de las 9 horas pedidas (tomándolos del visor con:
Frequencies > Pivoting Trays > pasar Statistics a Layer > seleccionar las
medias y luego las desviaciones estándar). Luego colocar el nombre de estas dos variables
generadas, en la fórmula de cálculo del percentil (IDF.Normal).
R: a) 6 telefonistas por hora, b) cantidad de telefonistas por hora entre las 8 de la mañana y
234
Jorge Carlos Carrá
Problemas – Problemas con base de datos
las 4 de la tarde. 4-6-5-6-5-6-7-7-4. Se ahorra 4 horas de telefonistas por día (por ejemplo
reasignándolos en otras funciones) y puede mejorar la deficiencia que se observa en la
solución a) a las 2 de la tarde y a las 3 de la tarde.
235