aplicación de la teoría de valores extremos en el análisis de eventos

XXIII C ON G R E S O N A C I O N A L
AMH
DE
H I D R Á U LI C A
AMH
PUERTO VALLARTA, JALISCO, MÉXICO, OCTUBRE 2014
APLICACIÓN DE LA TEORÍA DE VALORES EXTREMOS EN EL ANÁLISIS DE EVENTOS
HIDROMETEOROLÓGICOS
Avilés Ramírez Mayela Edna1, González García Isaac1, Meda Guardiola Ana2 y
Silva Casarín Rodolfo1
1
Instituto de Ingeniería, Universidad Nacional Autónoma de México. Circuito Escolar S/N, Edificio 5,
Ciudad Universitaria, Del. Coyoacán, México D.F., México. C.P. 04510
2
Facultad de Ciencias, Universidad Nacional Autónoma de México. Circuito Exterior S/N, Ciudad Universitaria,
Del. Coyoacán, México D.F., México. C.P. 04510
[email protected], [email protected], [email protected], [email protected]
Introducción
El constante interés por la preservación de los recursos
naturales y culturales, así como el desarrollo de los recursos
económicos de las zonas costeras, ha impulsado la realización
de diversos tipos de análisis de riesgos en dichas zonas, ya que
éstas se encuentran amenazadas por una amplia gama de
fenómenos
naturales
tales
como
los
eventos
hidrometeorológicos. En la actualidad, son sujeto de estudio y
análisis diversos tipos de riesgo costero, en particular el riesgo
de inundación y erosión, resultado directo de la ocurrencia de
fenómenos como la sobreelevación por marea y el impacto del
viento, especialmente aquellos considerados como extremos
debido al alto impacto que tienen en la sociedad y la
economía.
Este estudio se realiza mediante la aplicación de la Teoría de
Valores Extremos, la cual es una parte de la probabilidad que
se utiliza para la estimación de la distribución de los valores
máximos de una muestra. Esta teoría surge de la necesidad de
modelar aquellas observaciones que se separan mucho de la
media, y que tienen poca probabilidad de ocurrencia. Es decir,
se concentra en responder preguntas probabilísticas y
estadísticas sobre valores muy altos o muy bajos en los datos.
Esto se puede analizar de manera univariada, es decir,
estudiando cada variable por separado, o multivariada, ya que
existe una gran variedad de situaciones concernientes con
eventos extremos que tienen un inherente carácter
multivariado.
Como ya se mencionó, en el contexto oceanográfico, se tiene
un especial interés en la evaluación del riesgo asociado con
fenómenos hidrometeorológicos extremos, que son, con
frecuencia, consecuencia de un cúmulo de eventos extremos
actuando conjuntamente por diversos componentes físicos y/o
espaciales y como resultado se tiene asociada una estructura
de dependencia.
El análisis multivariado de eventos extremos constituye un
sobresaliente tema de estudio en distintos campos de
aplicación en los últimos años. Los estudios realizados han
sido comúnmente abordados bajo modelos bivariados. Entre
los primeros trabajos en el análisis bivariado de valores
extremos se encuentran los de Galambos (1987), Resnick
(1987), Kotz and Nadarajah (2000), Coles (2001), Reiss and
Thomas (2001), entre otros. En la literatura más reciente se
tiene a Beirlant et al. (2004), De Haan and Ferreira (2006) y
Resnick (2007). Por otro lado, existen diversas alternativas
equivalentes para caracterizar la estructura de dependencia;
por ejemplo, se puede trabajar con la densidad espectral,
Beirlant (2004); la función de dependencia de Pickands, Coles
(2001), Tawn (1988), Rakonczai (2009), Zhao (2012);
Cópulas, Rakonczai (2009), Dupuis y Jones (2006); series de
tiempo, Katz (2002), entre otras.
Teoría de valores extremos univariada
En la Teoría de Valores Extremos de una variable existen dos
formas diferentes de catalogar a una observación o variable
como extremo. Una de ellas es el modelo de Máximos por
bloque (o Block Maxima), y la otra es utilizando el modelo de
Picos o excedentes sobre un umbral POT, por sus siglas en
inglés (Peaks Over Thresholds). El modelo de máximos por
bloque consiste en registrar el mayor valor en un intervalo
dado de tiempo, por ejemplo un año o mes. Mientras que en el
Modelo POT se registran todos aquellos valores que se
encuentren por encima de un nivel o umbral dado. Un análisis
detallado de esta metodología se puede encontrar en
Embrechts et al. (1997) y en Coles (2001).
Primer método: Máximos por Bloque
En el método de máximos por bloque se considera al máximo
valor de una sucesión de variables aleatorias independientes e
idénticamente distribuidas
con función de
distribución común , denotado por
. El Teorema de
Fisher-Tippet y Gnedenko (Embrechts, 1997) nos dice que si
existen constantes
y
y alguna función de
distribución no degenerada tales que
(1)
cuando
entonces
para todos los puntos donde
es del siguiente tipo:
es continua,
,
para
(2)
y
,
(3)
para
. A
se le conoce como la Distribución
Generalizada de Valores Extremos (DGVE). Al parámetro
se le llama parámetro de forma, mientras que a
y
de
localización y escala, respectivamente. A la DGVE con
parámetros
y
se le conoce como DGVE estándar.
El parámetro
es llamado parámetro de forma ya que
determina la clase de distribución que representa la DGVE
como sigue: para
, se dice que la distribución es de tipo
Fréchet, si
se dice que es de tipo Weibull, y si
se
XXIII C ON G R E S O N A C I O N A L
AMH
dice que la distribución es de tipo Gumbel. A estas
distribuciones se les conoce como distribuciones de valores
extremos (DVE). Los tres tipos de límite tienen
comportamientos muy diferentes, correspondientes a las
diferentes formas de comportamiento de la cola de la
distribución
de . Esto puede precisarse considerando el
comportamiento de la distribución límite en su punto final
derecho
, es decir en
.
Para la distribución Weibull,
es finito, mientras que para
las distribuciones Fréchet y Gumbel
. Además, la
densidad de
decae exponencialmente para la distribución
Gumbel y de manera polinómica para la distribución Fréchet.
De ello se desprende que, en la aplicación, las tres familias
dan muy distintas representaciones de la conducta de los
valores extremos, por ejemplo las estimaciones de cuantiles en
los niveles de retorno son agresivamente diferentes
dependiendo de la elección de la familia o de la estimación del
parámetro de forma. (Coles 2001).
El Teorema de Fisher-Tippet y Gnedenko, aunque no
garantiza la existencia del límite, nos proporciona la única
forma de la distribución límite no degenerada para máximos
normalizados bajo el modelo de máximos por bloque en caso
de existir dicho límite. Si el límite en (1) se cumple con alguna
de las expresiones en (2) o (3) para una función de
distribución , se dice que esa distribución pertenece al
dominio de atracción de la DGVE y se denota por
.
Segundo Método: Picos sobre un umbral
Por otro lado, el método en el que se consideran como valores
extremos a aquellos que sobrepasen un cierto nivel o umbral
dado, es el de picos sobre un umbral o POT.
Se dice que es una excedencia sobre si
. En ese caso
al valor
se le conoce como el exceso de sobre .
Para este modelo se hace uso de la función de distribución de
los excesos (
. Definimos a la función de distribución de
los excesos sobre por la probabilidad condicional
. (4)
Esta función también es llamada la función de distribución de
excesos condicional, pues reduce el espacio muestral a
aquellas variables que sobrepasan el nivel .
La distribución relacionada con el modelo de picos sobre un
umbral es la Distribución Generalizada de Pareto (DGP) la
cual se define como
(5)
para
cuando
; y para
(6)
para
DE
H I D R Á U LI C A
AMH
PUERTO VALLARTA, JALISCO, MÉXICO, OCTUBRE 2014
.
Observemos que si queremos dar la expresión en términos de
las excedencias, basta con evaluar las expresiones (5) y (6)
considerando que
, es decir, evaluando en
.
Así como el Teorema de Fisher-Tippet y Gnedenko relaciona
al modelo de máximos por bloque con la DGVE, otro de los
principales teoremas dentro de la teoría de valores extremos es
el propuesto por Pickands, Balkema y de Haan (McNeil 2005)
el cual relaciona al modelo de picos sobre un umbral a la
DGP. El teorema dice que si la función de distribución
, entonces la DGP es la distribución límite de
los excesos cuando el umbral tiende a
. Es decir, si
la función de distribución de los excesos sobre entonces
es
(7)
si y sólo si
. Este resultado es la base para la
aproximación de la distribución de los excesos sobre umbrales
suficientemente altos mediante la DGP. El teorema nos da
bases teóricas para esperar que si elegimos un umbral
adecuado, las observaciones que se encuentren por encima
mostrarán un comportamiento tipo Pareto.
Se conocen varias propiedades de la DGP, una de ellas es
sobre su función media de excesos que se define como
.
(8)
Es decir, la esperanza o media de los excesos sobre
condicionada a las excedencias. Si una variable aleatoria
sigue una DGP, entonces su función media de excesos tiene la
siguiente expresión
.
(9)
El problema inicial es la elección de un umbral adecuado para
que la aproximación de
puede hacerse mediante la DGP, el
cual no debe ser elegido de manera arbitraria. Sin embargo, no
existe un método para estimarlo puntualmente, por lo que esta
tarea requiere de un análisis cuidadoso, ya que de elegirse un
umbral demasiado bajo, se violaría la suposición del Teorema,
y un umbral demasiado alto, dejará muy pocas observaciones
con las cuales pueda hacerse la inferencia sobre la DGP.
Existen diversas herramientas disponibles que ayudan a elegir
un umbral adecuado, una de ellas basada en la propiedad
mencionada en (9), la cual es la gráfica de medias de excesos
que consiste en los puntos de la forma
,
(10)
donde
son las
excedencias observadas
sobre , y
es el valor máximo de las
(Coles 2001).
Es decir, esta gráfica relaciona a cada umbral
con la
esperanza empírica de los excesos sobre dicho umbral. Por la
propiedad de la DGP antes mencionada, sabemos que sobre un
umbral
para el cual la DGP proporcione una aproximación
válida a la distribución de los excesos, la función media de
excesos debería comportarse de manera lineal en .
Teoría de valores extremos multivariada
El estudio de eventos extremos multivariados se componen de
dos partes: el estudio de las funciones de distribución
marginales y la estructura de dependencia. Esta distinción se
refleja tanto en la teoría como en la práctica. Comúnmente,
primero se realiza el correspondiente manejo de las funciones
marginales y como segundo paso, después de la
transformación estandarizada de las marginales a una escala
común.
La teoría multivariada de valores extremos también se estudia
mediante dos enfoques: el comportamiento límite de máximos
por bloques, método mediante el cual está basada la teoría
clásica para caracterizar el comportamiento de extremos
multivariados; y extremos sobre un umbral, Beirlant (2004),
Joe (1994), Katz (2002).
XXIII C ON G R E S O N A C I O N A L
AMH
DE
H I D R Á U LI C A
PUERTO VALLARTA, JALISCO, MÉXICO, OCTUBRE 2014
AMH
Máximos por bloque multivariados
Modelos de Cópulas de valores extremos
Sea
) elementos en
. Si
son vectores aleatorios independientes e
idénticamente distribuidos (i.i.d) de dimensión d. Se define el
vector de máximos,
La teoría clásica de Cópulas está dada por Sklar (1952) que
muestra que para una función de distribución d-variada , con
funciones marginales continuas , existe una única cópula
en el cubo unitario d-dimensional, con marginales uniformes
tal que la distribución conjunta es la composición de funciones
Debe observarse que estos vectores de máximos no
necesariamente corresponden a observaciones de los datos
originales.
La familia de cópulas de valores extremos (CBVE) es usada
para representar las DMVE por medio de distribuciones
marginales distribuidas uniformemente. Es posible representar
una CBVE mediante otros conceptos de dependencia, por
ejemplo, una cópula bivariada de valores extremos puede ser
escrita en términos de la función de dependencia de Pickands
como
=(
(16)
La función de distribución de
evaluada en
está dada por
(12)
Del mismo modo que en el caso univariado, para evitar
degeneración de la distribución límite de
, se buscan
secuencias de vectores normalizantes,
y
, con
componentes
y
, j
tales que
cuando
,
(13)
para una función de distribución d-dimensional
con
marginales no degeneradas y por (11), DVE. Aquí y en las
demás operaciones vectoriales se suponen componente a
componente.
Si se tiene (13), se dice que
pertenece al dominio de
atracción del máximo de ,
es llamada una
distribución multivariada de valores extremos (DMVE).
Cuando se estudia la estructura de dependencia, es
frecuentemente conveniente usar marginales estandarizadas,
esta elección es arbitraria, Tiago de Olivera (1963) y
Galambos (1978) asumen marginales Gumbel; Hann &
Resnick (1977) asumen marginales Fréchet; otros más como
Pickands (1981), Deheuvels (1983,1985) y Tawn (1988) las
asumen exponenciales, siendo estas dos últimas las más
utilizadas en la literatura.
De acuerdo a Pickands, para el caso bivariado, la distribución
de
puede ser aproximada mediante una distribución bivariada de
valores extremos, determinada por su función de dependencia
así como por sus marginales y
respectivamente
(14)
Donde
(15)
para
,
,
(t) es llamada la función de
dependencia o función de dependencia de Pickands, la cual es
necesariamente convexa y se aproxima al triángulo definido
por los puntos (0,1), (1,1) y (1/2,1/2).
Para el caso bivariado se han propuesto diversos modelos
paramétricos como el modelo logístico, Gumbel (1960);
asimétrico logístico, Tawn (1988); Husler & Reiss (1989);
negativo logístico, Galambos (1975); negativo logístico
asimétrico, Joe (1990); biologísitco, Smith (1990);
biologístico negativo, Coles y Tawn (1994); Coles-Tawn,
Coles y Tawn (1991); asimétrico mixto, Tawn (1988). Siendo
entre ellos, los modelos más generales, las cópulas.
(17)
Con
, Rakonczai (2009).
Extremos multivariados sobre un umbral
Sea
una muestra ddimensional de observaciones i.i.d. con una desconocida
distribución conjunta
para
alguna cópula desconocida con funciones marginales
y perteneciente al dominio de atracción de una DMVE
Tal como en el caso univariado, se busca aproximar la cola
derecha de
sobre algún vector de umbrales altos
. Por la teoría univariada, para
y lo
suficientemente grande, la cola derecha de la distribución
marginal es aproximada por una DGP. Reemplazando por
una cópula límite de valores extremos se puede ajustar un
modelo paramétrico mediante cópulas de valores extremos
flexible y tratable.
Descripción de los datos
Se realizó un análisis del comportamiento del viento y el
oleaje extremo al norte de la costa de Campeche,
caracterizando la altura de ola y la velocidad del viento. Los
datos horarios empleados corresponden a los resultados del
modelo numérico híbrido WAM-HURAC, presentado por
Ruiz-Martínez et al. (2009), para el periodo del 1 de enero de
1948 al 31 de diciembre de 2010, en la celda ubicada en las
coordenadas 19°25’ Latitud Norte, 91°45’ Longitud Oeste, los
cuales forman parte del Atlas de Clima Marítimo de la
Vertiente Atlántica Mexicana (Silva et al., 2008)
El análisis se realizó utilizando un entorno de programación
para análisis estadístico y gráfico llamado “R”. Es un proyecto
de software libre que puede descargarse en http://cran.rproject.org/.
Ilustración 1. Altura de ola de 1948 a 2010.
XXIII C ON G R E S O N A C I O N A L
AMH
DE
H I D R Á U LI C A
PUERTO VALLARTA, JALISCO, MÉXICO, OCTUBRE 2014
Ilustración 2. Velocidad de viento de 1948 a 2010.
Resultados para extremos univariados
A continuación, se presenta el análisis de las variables
mencionadas, altura de ola y velocidad del viento, bajo los dos
modelos univariados descritos, que consisten en el modelo de
máximos por bloque, relacionado con la DGVE por el
Teorema de Fisher-Tippet y Gnedenko, y el modelo de picos
sobre un umbral, relacionado con la DGP por el Teorema de
Pickands-Balkema-de Haan. (Coles 2001).
AMH
es la función de distribución estimada, la cual se obtiene
utilizando los parámetros estimados; y
es el -ésimo valor
de los datos ordenados
. Otra de las
herramientas de diagnóstico es la gráfica de cuantiles, la cual
consiste en los puntos de la forma
, donde
es la función inversa de la distribución
estimada y
y
están dadas como se mencionó
anteriormente. Si el modelo representa un buen ajuste, en
ambas gráficas debería observarse que los puntos se asemejan
a una línea diagonal (Coles 2001). Adicionalmente se
realizaron pruebas de bondad de ajuste de Kolmogorov y
Anderson Darling (NIST 2012) que avalaron el modelo como
una buena aproximación, a un 95% de confianza.
Inferencia para la DGVE
El Teorema de Fisher-Tippet y Gnedenko provee un modelo
límite para la distribución del máximo valor obtenido por el
modelo de máximos por bloque. En el análisis de fenómenos
hidrometeorológicos es conveniente analizar los máximos
anuales, pues de tomarse bloques de menor tamaño, éstos se
ven afectados por la variabilidad de las condiciones que
afectan la intensidad de dichos fenómenos a lo largo del año
con el cambio de diversos factores, como las estaciones (Coles
2001). Existen varios métodos que son utilizados para la
estimación de los parámetros de una distribución a partir de
una muestra, entre ellos el método de máxima verosimilitud
(Coles 2001), el cual fue utilizado para la obtención de los
estimadores de los parámetros de la DGVE, así como los
intervalos de confianza de cada uno, los cuales se muestran en
la Tabla 1.
Ilustración 3. Gráficas de probabilidades (izquierda) y de
cuantiles (derecha) del ajuste a DGVE de la variable altura de ola.
Tabla 1. Estimadores e intervalos de confianza al 95% de la
DGVE.
Altura
Velocidad
Estimadores
Intervalos
0.33256
(0.12465 , 0.54033)
2.78268
(2.57314 , 2.99243)
0.75476
(0.57444 , 0.93522)
0.60683
(0.35321 , 0.86024)
9.99688
(9.48751 , 10.5071)
1.82127
(1.29228 , 2.35093)
En un análisis previo, se supuso que el parámetro de forma era
igual a cero, para obtener una aproximación de los máximos
anuales de altura de ola por una distribución tipo Gumbel. Sin
embargo, podemos observar que el estimador para
en la
altura de ola es positivo, y además que el intervalo de
confianza correspondiente no contiene al cero, por lo que el
ajuste a Gumbel no es un modelo adecuado en este caso.
Para verificar la bondad del ajuste se hizo uso de algunas
herramientas de diagnóstico. Las gráficas de probabilidad
comparan el modelo teórico con las estimaciones graficando
los puntos de la forma
, donde
es un estimador de posición de datos en una gráfica propuesto
por Hosking (1995) que se calcula como
;
Ilustración 4. Gráficas de probabilidades (izquierda) y de
cuantiles (derecha) del ajuste a DGVE de la variable velocidad de
viento.
En las Ilustraciones (3) y (4) podemos ver que el modelo
representa un buen ajuste para la distribución límite de los
máximos anuales. Tenemos entonces que las expresiones de
las distribuciones límite para los máximos niveles de altura
anuales
y máximas velocidades de viento anuales
están
dadas por
(18)
(19)
Para estimar los periodos de retorno asociados a los cuantiles
de la DGVE, se invirtieron las expresiones en (18) y (19) y se
evaluaron en
para hallar el valor
para el cual
, es decir, aquel valor para el cual la
probabilidad de que el máximo valor anual lo exceda sea . A
este valor se le conoce como el nivel de retorno asociado al
periodo de retorno
años, ya que el nivel
se
espera será excedido en promedio una vez cada
años.
AMH
XXIII C ON G R E S O N A C I O N A L
DE
H I D R Á U LI C A
AMH
PUERTO VALLARTA, JALISCO, MÉXICO, OCTUBRE 2014
La extrapolación de este tipo de modelos sirve para hacer
inferencia sobre los posibles niveles que se alcanzarán en
periodos de tiempo incluso de mayor longitud que el periodo
de tiempo que comprenda a los datos analizados. De las
ecuaciones (18) y (19) se obtuvieron las expresiones de los
niveles de retorno para altura de ola
y velocidad de viento
y en la Ilustraciones (5) y (6) se muestran las gráficas de
niveles de retorno de cada una de las dos variables, las cuales
relaciona los periodos de retorno con el nivel de retorno
correspondiente, en una gráfica con escala logarítmica en el
eje de las abscisas
(20)
(21)
Ilustración 7. Gráfica de medias de excesos de altura de ola
(izquierda) y velocidad de viento (derecha).
Tabla 2. Estimadores e intervalos de confianza al 95% de los
parámetros de la DGP.
Estimadores
Intervalos
0.74942
(0.6799 , 0.8242)
0.05732
(0.0034 , 0.1233)
0.8603
(0.6002 , 1.2200)
0.2547
(0.0172 , 0.5939)
1.6470
(1.2568 , 2.1353)
0.3989
(0.2088 , 0.6476)
724
Altura
80
Velocidad
Ilustración 5. Gráfica de niveles de retorno de altura de ola.
Ilustración 6. Gráfica de niveles de retorno de velocidad de viento.
Inferencia para la DGP
En la Ilustración (7) observamos que la gráfica sugiere que la
elección de un umbral de
metros para la altura de ola
y un umbral
metros sobre segundo para la velocidad de
viento, pues presenta un comportamiento aproximadamente
lineal a partir de dichos puntos. Habiendo elegido los
umbrales, se estimaron los parámetros de forma y de escala
de la DGP por máxima verosimilitud (Tabla 2). Se incluyen
los parámetros estimados con el umbral seleccionado para
análisis previo, el cual es
, el cual fue elegido como 1.5
veces la altura de ola cuadrática significante media (Hrms) que
es considerada como condiciones de tormenta de alta energía
y, por tanto, es tomada como el umbral que define una
tormenta (Silva R, comunicación personal).
147
Una vez hechas las estimaciones, se procedió a realizar el
diagnóstico de ajuste para cada modelo, utilizando las
herramientas gráficas descritas, las cuales son la gráfica de
probabilidades y la gráfica de cuantiles (Ilustraciones 8, 9 y
10). Adicionalmente, se hicieron pruebas de bondad de ajuste
de Kolmogorov y Anderson Darling, las cuales rechazaron el
modelo con un umbral
y avalaron los otros dos modelos
como buenas aproximaciones, a un 95% de confianza.
Ilustración 8. Gráficas de probabilidades (derecha) y de cuantiles
(izquierda) del ajuste a DGP para altura de ola con u=1m.
Ilustración 9. Gráficas de probabilidades (izquierda) y de
cuantiles (derecha) del ajuste a DGP para altura de ola con
u=2.5m.
AMH
XXIII C ON G R E S O N A C I O N A L
DE
H I D R Á U LI C A
AMH
PUERTO VALLARTA, JALISCO, MÉXICO, OCTUBRE 2014
datos dadas por la aproximación
(1995).
propuesta por Hosking
Ilustración 10. Gráficas de probabilidades (izquierda) y de
cuantiles (derecha) del ajuste a DGP para velocidad de viento con
u=9m/s.
Observamos en las gráficas de diagnóstico del ajuste con un
umbral
, en la Ilustración 8, que el modelo estimado
para la altura de ola con dicho umbral parece no dar una buena
aproximación, ya que presenta valores que se alejan
demasiado de la recta diagonal. Por otro lado, las gráficas de
ajuste para la altura de ola con umbral
(Ilustración 9),
presentan una mejor similitud con la recta diagonal tanto en
las gráficas de probabilidades como en la gráfica de cuantiles,
dando evidencia de que se trata de un mejor modelo. Por otro
lado, las gráficas de diagnóstico para la velocidad de viento
con
(Ilustración 10) presentan semejanza con la recta
diagonal, lo cual indica que se trata de un buen ajuste.
Tenemos entonces que las expresiones de las distribuciones
límite
para las distribuciones de excedencias de altura de
ola sobre
y
para la distribución de excedencias de
velocidades de viento sobre
están dadas por
(22)
(23)
Los niveles de retorno en el modelo de picos sobre un umbral
se tratan de manera ligeramente diferente a la forma usada en
el modelo de máximos por bloque. Si queremos dar los
periodos de retorno en una unidad de tiempo, en este caso en
años, supongamos que buscamos un nivel
que se espera
sea excedido una vez cada años. Si tenemos una cantidad
de excedencias observadas durante un año, entonces el nivel
buscado es aquel que se exceda en promedio una vez cada
excedencias observadas, o bien que la probabilidad de
que una excedencia sobrepase el nivel
sea
.
Como la base comprende de 1948 a 2010 se consideraron 63
años para la estimación de
, donde
es el
número de excedencias de cada variable. Invirtiendo la
expresión de la DGP y evaluando en dicha probabilidad
llegamos a las expresiones de los niveles de retorno asociados
a un periodo de retorno de años para altura de ola
y para
velocidad de viento .
Ilustración 11. Gráfica de niveles de retorno de altura de ola con
un umbral u=2.5m.
Ilustración 12. Gráfica de niveles de retorno de velocidad de
viento con un umbral u=9m/s.
Resultados para extremos bivariados
Para el ajuste de los modelos paramétricos bivariados, se
procedió a formar una muestra conjunta con los máximos
anuales de la altura de ola y la velocidad de viento.
Como consideración inicial se efectuó una prueba de hipótesis
con la finalidad de descartar la independencia de las variables.
El valor del estadístico de Cramer-von Mises que se obtuvo
fue 0.33073, con un p-value de 0.0004995, en base a ello se
tuvo evidencia suficiente para rechazar la hipótesis nula de
independencia. Posteriormente, se emplearon métodos de
estimación de máxima verosimilitud en la estimación los
correspondientes parámetros particulares de los modelos
bivariados. Mediante el criterio de información de Akaike
AIC y pruebas de bondad de ajuste se discriminó entre los
distintos modelos ajustados, y se propusieron como buenos
ajustes para los eventos extremos bivariados de altura de ola y
velocidad de viento los modelos Husler-Reiss y el negativo
logístico por los resultados obtenidos en dichas pruebas.
Tabla 3. Ajuste del modelo bivariado Husler-Reiss.
(24)
Parámetros
μ
ξ
r
localización forma escala dependencia
(25)
Para la gráfica de niveles de retorno se procede de manera
similar al modelo de máximos por bloque, graficando los
periodos de retorno (en años) contra los niveles de retorno
asociados con escala logarítmica en el eje de las abscisas.
Adicionalmente se incluyen las posiciones estimadas de los
H
2.8106
0.2163 0.7666
V
10.1848
0.3787 1.9701
AIC
445.819
Desviación
431.819
2.4063
XXIII C ON G R E S O N A C I O N A L
AMH
DE
H I D R Á U LI C A
AMH
PUERTO VALLARTA, JALISCO, MÉXICO, OCTUBRE 2014
.
Ilustración 13. Gráficos de bondad de ajuste para el modelo
Husler-Reiss.
Ilustración 14. Gráficos de bondad de ajuste para el modelo
negativo logístico.
La expresión paramétrica del modelo negativo logístico es
La expresión paramétrica del modelo Husler Reiss es
,
, (26)
(29)
con
con
(30)
(27)
(28)
Tabla 4. Ajuste del modelo bivariado negativo logístico
Parámetros
μ
ξ
r
localización forma escala dependencia
H
2.8018
0.2322 0.7567
V
10.176
0.3947 1.9468
AIC
446.8938
Desviación
432.8938
1.7212
(31)
Conclusiones
La Teoría de Valores Extremos puede ayudar a mejorar las
medidas preventivas ante sucesos que causan consecuencias
extremas gravosas, brindando información que permita
mejorar la cuantificación de los riesgos hidrometeorológicos
para la optimización de toma de decisiones, gestión de áreas
susceptibles a este tipo de riesgos y llevar una adecuada
modelación de los agentes externos y erradicar en lo posible
las incertidumbres inherentes a la modelación de los
fenómenos naturales; en ingeniería marítima, el éxito en el
diseño de estructuras depende esencialmente de la adecuada
selección de las condiciones ambientales a las que puede verse
sometida garantizando que dicho elemento no llegue a los
estados límites de falla a lo largo de su vida útil.
En el análisis de los datos específicos se obtuvieron
expresiones para las distribuciones límite que describen el
AMH
XXIII C ON G R E S O N A C I O N A L
DE
H I D R Á U LI C A
PUERTO VALLARTA, JALISCO, MÉXICO, OCTUBRE 2014
comportamiento aproximado de los valores máximos de la
muestra en cuestión. De ellos se pudieron obtener las
estimaciones de los cuantiles con los que se calcularon los
niveles de retorno, los cuales representan una herramienta de
suma utilidad en la planificación y diseño de estructuras que
requieren de un conocimiento del comportamiento a largo
plazo de fenómenos de tipo hidrometeorológico.
Adicionalmente, se obtuvieron las expresiones de
distribuciones límite que describen el comportamiento de los
valores máximos de ambas variables tomadas de forma
conjunta y que están ligadas intrínsecamente en la
caracterización del oleaje, esto en busca de tener estimaciones
que permitan estudiar de forma más completa el fenómeno
hidrometeorológico en cuestión.
Una de las instituciones que realiza más contribuciones en
evaluación de riesgos hidrometeorológicos en México es el
Centro Nacional de Desastres (CENAPRED) (Silva 2012),
que ha publicado guías y directrices para la construcción de
atlas de riesgos, para el cual un factor importante es el
conocimiento, o en este caso estimación de las probabilidades
de que se presenten eventos potencialmente dañinos. Una
mejor estimación de la probabilidad de ocurrencia de un
evento potencialmente dañino a largo plazo, o con largos
periodos de retorno, puede servir para una mejor evaluación
del riesgo.
Se espera que la metodología presentada en este trabajo
impulse el desarrollo y el uso de herramientas teóricas
recientes y sofisticadas para obtener mejores análisis y
evaluaciones de modelos basados en valores extremos para la
prevención y toma de decisiones en materia de riesgo
hidrometeorológico, ya que en análisis menos rigurosos se
corre el riesgo de llegar a estimaciones menos adecuadas o
suposiciones sobre parámetros muy sensibles como el
parámetro de forma que figura en ambos métodos (máximos
por bloque y picos sobre umbral), el cual determina
comportamientos muy distintos en la cola de las distribuciones
de los fenómenos analizados.
AMH
http://cran.rproject.org/web/packages/ismev/ismev.pdf. 200914-07.
GILLI M., KËLLEZI E. An Application of Extreme Value
Theory for Measuring Risk. Department of Econometrics,
University of Geneva and FAME, Geneva, Switzerland,
febrero 2003, 24 pp.
HOSKING J. R.., WALLIS J.R. Water resources research. A
comparison of unbiased and plotting-position estimators of L
moments. Vol. 31, No. 8. Agosto 1995, pp. 2019-2025.
JOE, H. Multivariate Extreme-Value Distributions with
applications to environmental data, The Canadian Journal of
Statistics, Vol. 22, No. 1, 1994, pp. 47-64.
JOE, H., SMITH, R., y WEISSMAN, I. Bivariate threshold
methods for extremes, Journal of the Royal Statistical Society,
Vol. 54, No. 1, 1992, pp. 171-183.
KATZ, R., PARLANGE, M., y NAVEAU, P., Statistics of
extremes in hydrology, Advances in Water Resources, Vol. 25,
2002, pp. 1287-1304.
McNEIL, A., FREY, R., y EMBRECHTS, P. Quantitative
Risk Management: concepts, techniques, and tools Princeton
University Press, 2005, 529 pp.
NIST/SEMATECH e-Handbook of Statistical Methods. [en
línea]. Abril 2012. [citado en agosto de 2014]. Disponible en
http://www.itl.nist.gov/div898/handbook/.
PFAFF B., MCNEIL A. J., STEPHENSON A. Package evir
(Version 1.7) [en línea]. Extreme Values in R. Febrero 2013
[citado en agosto de 2014] Disponible en: http://cran.rproject.org/web/packages/evir/evir.pdf.
RAKONCZAI, P., On modelling and prediction of
multivariate extremes with applications to environmental
data. Tesis de licenciatura en ciencias matemáticas, Suecia,
2009, 109 pp.
Referencias
REISS R., THOMAS M. Statistical Analysis of Extreme
Values: with Applications to Insurance, Finance Hydrology
and Other Fields. Tercera edición. Birkhäuser Verlag,
Germany 2007, 511 pp.
BEIRLANT, J., GOEGEBEUR, J., SEGERS and TEUGELS,
J., Statistics of extremes: Theory and Applications, West
Sussex, England, John Wiley & Sons. 2004, 485 pp.
RIBATET M. The POT Package (Version 1.1-3) [en línea].
Febrero de 2013 [citado en agosto de 2014] Disponible en:
http://benz.nchu.edu.tw/ _nmyc/POT.pdf.
BORTOT, P., GAETAN, C., Multivariate extremes,
dipartimento di Scienze Statistiche, Bologna, Italy
CEBRAIN, A., DENUIT, M., y LAMBERT, P., Analysis of
bivariate tail dependence using extreme value copulas: An
application to the SOA medical large claims database,
Extremes, Vol. 3, 2000, pp. 311-329.
COLES, STUART. An Introduction to statistical modeling of
extremes values Department of Mathematics. University of
Bristol: Springer Series in Statistics, 2001, 209 pp.
RUIZ-MARTÍNEZ G., SILVA R., PÉREZ D., POSADA G.,
BAUTISTA E. Modelo híbrido para la caracterización del
oleaje. Ingeniería hidráulica en México. Vol. XXIV, núm 3,
julio-septiembre de 2009, pp 5-22.
DUPUIS, DJ., y JONES, BL. Multivariate Extreme value
theory and its usefulness in understanding risk, North
American Actuarial Journal, Vol. 10, No. 4, 2006, pp. 1-27.
EMBRECHTS P., KÜPPELBERG C., MIKOSCH T.
Modelling Extremal Events for Insurance and Finance.
Springer-Verlag 1997, 644 pp.
GILLELAND E. Package ismev (Version 1.39) [en línea].
Febrero 2013 [citado en agosto de 2014]. Disponible en:
SILVA R., MENDOZA E., ESCUDERO M., POSADA G.,
ARGANIS M. Characterization Of Risks In Coastal Zones: A
Review. Instituto de Ingeniería, Universidad Nacional
Autónoma de México. Instituto EPOMEX, Universidad
Autónoma de Campeche, 2012. 24 pp.
SILVA, R., RUIZ, G., POSADA, G., PÉREZ, D., RIVILLAS,
G., ESPINAL, J., MENDOZA, E. Atlas de Clima Marítimo de
la Vertiente Atlántica Mexicana. Instituto de Ingeniería,
Universidad Nacional Autónoma de México, 2008.
TAWN, J., Bivariate extreme value theory: models and
estimation, Biometrika,Vol. 75, núm. 3, 1988, pp. 397-415.
ZHAO, Z., On parametric modelling of bivariate extreme
value dsitribution. Tesis de maestría, Suecia, 2012, 40 pp.