XXIII C ON G R E S O N A C I O N A L AMH DE H I D R Á U LI C A AMH PUERTO VALLARTA, JALISCO, MÉXICO, OCTUBRE 2014 APLICACIÓN DE LA TEORÍA DE VALORES EXTREMOS EN EL ANÁLISIS DE EVENTOS HIDROMETEOROLÓGICOS Avilés Ramírez Mayela Edna1, González García Isaac1, Meda Guardiola Ana2 y Silva Casarín Rodolfo1 1 Instituto de Ingeniería, Universidad Nacional Autónoma de México. Circuito Escolar S/N, Edificio 5, Ciudad Universitaria, Del. Coyoacán, México D.F., México. C.P. 04510 2 Facultad de Ciencias, Universidad Nacional Autónoma de México. Circuito Exterior S/N, Ciudad Universitaria, Del. Coyoacán, México D.F., México. C.P. 04510 [email protected], [email protected], [email protected], [email protected] Introducción El constante interés por la preservación de los recursos naturales y culturales, así como el desarrollo de los recursos económicos de las zonas costeras, ha impulsado la realización de diversos tipos de análisis de riesgos en dichas zonas, ya que éstas se encuentran amenazadas por una amplia gama de fenómenos naturales tales como los eventos hidrometeorológicos. En la actualidad, son sujeto de estudio y análisis diversos tipos de riesgo costero, en particular el riesgo de inundación y erosión, resultado directo de la ocurrencia de fenómenos como la sobreelevación por marea y el impacto del viento, especialmente aquellos considerados como extremos debido al alto impacto que tienen en la sociedad y la economía. Este estudio se realiza mediante la aplicación de la Teoría de Valores Extremos, la cual es una parte de la probabilidad que se utiliza para la estimación de la distribución de los valores máximos de una muestra. Esta teoría surge de la necesidad de modelar aquellas observaciones que se separan mucho de la media, y que tienen poca probabilidad de ocurrencia. Es decir, se concentra en responder preguntas probabilísticas y estadísticas sobre valores muy altos o muy bajos en los datos. Esto se puede analizar de manera univariada, es decir, estudiando cada variable por separado, o multivariada, ya que existe una gran variedad de situaciones concernientes con eventos extremos que tienen un inherente carácter multivariado. Como ya se mencionó, en el contexto oceanográfico, se tiene un especial interés en la evaluación del riesgo asociado con fenómenos hidrometeorológicos extremos, que son, con frecuencia, consecuencia de un cúmulo de eventos extremos actuando conjuntamente por diversos componentes físicos y/o espaciales y como resultado se tiene asociada una estructura de dependencia. El análisis multivariado de eventos extremos constituye un sobresaliente tema de estudio en distintos campos de aplicación en los últimos años. Los estudios realizados han sido comúnmente abordados bajo modelos bivariados. Entre los primeros trabajos en el análisis bivariado de valores extremos se encuentran los de Galambos (1987), Resnick (1987), Kotz and Nadarajah (2000), Coles (2001), Reiss and Thomas (2001), entre otros. En la literatura más reciente se tiene a Beirlant et al. (2004), De Haan and Ferreira (2006) y Resnick (2007). Por otro lado, existen diversas alternativas equivalentes para caracterizar la estructura de dependencia; por ejemplo, se puede trabajar con la densidad espectral, Beirlant (2004); la función de dependencia de Pickands, Coles (2001), Tawn (1988), Rakonczai (2009), Zhao (2012); Cópulas, Rakonczai (2009), Dupuis y Jones (2006); series de tiempo, Katz (2002), entre otras. Teoría de valores extremos univariada En la Teoría de Valores Extremos de una variable existen dos formas diferentes de catalogar a una observación o variable como extremo. Una de ellas es el modelo de Máximos por bloque (o Block Maxima), y la otra es utilizando el modelo de Picos o excedentes sobre un umbral POT, por sus siglas en inglés (Peaks Over Thresholds). El modelo de máximos por bloque consiste en registrar el mayor valor en un intervalo dado de tiempo, por ejemplo un año o mes. Mientras que en el Modelo POT se registran todos aquellos valores que se encuentren por encima de un nivel o umbral dado. Un análisis detallado de esta metodología se puede encontrar en Embrechts et al. (1997) y en Coles (2001). Primer método: Máximos por Bloque En el método de máximos por bloque se considera al máximo valor de una sucesión de variables aleatorias independientes e idénticamente distribuidas con función de distribución común , denotado por . El Teorema de Fisher-Tippet y Gnedenko (Embrechts, 1997) nos dice que si existen constantes y y alguna función de distribución no degenerada tales que (1) cuando entonces para todos los puntos donde es del siguiente tipo: es continua, , para (2) y , (3) para . A se le conoce como la Distribución Generalizada de Valores Extremos (DGVE). Al parámetro se le llama parámetro de forma, mientras que a y de localización y escala, respectivamente. A la DGVE con parámetros y se le conoce como DGVE estándar. El parámetro es llamado parámetro de forma ya que determina la clase de distribución que representa la DGVE como sigue: para , se dice que la distribución es de tipo Fréchet, si se dice que es de tipo Weibull, y si se XXIII C ON G R E S O N A C I O N A L AMH dice que la distribución es de tipo Gumbel. A estas distribuciones se les conoce como distribuciones de valores extremos (DVE). Los tres tipos de límite tienen comportamientos muy diferentes, correspondientes a las diferentes formas de comportamiento de la cola de la distribución de . Esto puede precisarse considerando el comportamiento de la distribución límite en su punto final derecho , es decir en . Para la distribución Weibull, es finito, mientras que para las distribuciones Fréchet y Gumbel . Además, la densidad de decae exponencialmente para la distribución Gumbel y de manera polinómica para la distribución Fréchet. De ello se desprende que, en la aplicación, las tres familias dan muy distintas representaciones de la conducta de los valores extremos, por ejemplo las estimaciones de cuantiles en los niveles de retorno son agresivamente diferentes dependiendo de la elección de la familia o de la estimación del parámetro de forma. (Coles 2001). El Teorema de Fisher-Tippet y Gnedenko, aunque no garantiza la existencia del límite, nos proporciona la única forma de la distribución límite no degenerada para máximos normalizados bajo el modelo de máximos por bloque en caso de existir dicho límite. Si el límite en (1) se cumple con alguna de las expresiones en (2) o (3) para una función de distribución , se dice que esa distribución pertenece al dominio de atracción de la DGVE y se denota por . Segundo Método: Picos sobre un umbral Por otro lado, el método en el que se consideran como valores extremos a aquellos que sobrepasen un cierto nivel o umbral dado, es el de picos sobre un umbral o POT. Se dice que es una excedencia sobre si . En ese caso al valor se le conoce como el exceso de sobre . Para este modelo se hace uso de la función de distribución de los excesos ( . Definimos a la función de distribución de los excesos sobre por la probabilidad condicional . (4) Esta función también es llamada la función de distribución de excesos condicional, pues reduce el espacio muestral a aquellas variables que sobrepasan el nivel . La distribución relacionada con el modelo de picos sobre un umbral es la Distribución Generalizada de Pareto (DGP) la cual se define como (5) para cuando ; y para (6) para DE H I D R Á U LI C A AMH PUERTO VALLARTA, JALISCO, MÉXICO, OCTUBRE 2014 . Observemos que si queremos dar la expresión en términos de las excedencias, basta con evaluar las expresiones (5) y (6) considerando que , es decir, evaluando en . Así como el Teorema de Fisher-Tippet y Gnedenko relaciona al modelo de máximos por bloque con la DGVE, otro de los principales teoremas dentro de la teoría de valores extremos es el propuesto por Pickands, Balkema y de Haan (McNeil 2005) el cual relaciona al modelo de picos sobre un umbral a la DGP. El teorema dice que si la función de distribución , entonces la DGP es la distribución límite de los excesos cuando el umbral tiende a . Es decir, si la función de distribución de los excesos sobre entonces es (7) si y sólo si . Este resultado es la base para la aproximación de la distribución de los excesos sobre umbrales suficientemente altos mediante la DGP. El teorema nos da bases teóricas para esperar que si elegimos un umbral adecuado, las observaciones que se encuentren por encima mostrarán un comportamiento tipo Pareto. Se conocen varias propiedades de la DGP, una de ellas es sobre su función media de excesos que se define como . (8) Es decir, la esperanza o media de los excesos sobre condicionada a las excedencias. Si una variable aleatoria sigue una DGP, entonces su función media de excesos tiene la siguiente expresión . (9) El problema inicial es la elección de un umbral adecuado para que la aproximación de puede hacerse mediante la DGP, el cual no debe ser elegido de manera arbitraria. Sin embargo, no existe un método para estimarlo puntualmente, por lo que esta tarea requiere de un análisis cuidadoso, ya que de elegirse un umbral demasiado bajo, se violaría la suposición del Teorema, y un umbral demasiado alto, dejará muy pocas observaciones con las cuales pueda hacerse la inferencia sobre la DGP. Existen diversas herramientas disponibles que ayudan a elegir un umbral adecuado, una de ellas basada en la propiedad mencionada en (9), la cual es la gráfica de medias de excesos que consiste en los puntos de la forma , (10) donde son las excedencias observadas sobre , y es el valor máximo de las (Coles 2001). Es decir, esta gráfica relaciona a cada umbral con la esperanza empírica de los excesos sobre dicho umbral. Por la propiedad de la DGP antes mencionada, sabemos que sobre un umbral para el cual la DGP proporcione una aproximación válida a la distribución de los excesos, la función media de excesos debería comportarse de manera lineal en . Teoría de valores extremos multivariada El estudio de eventos extremos multivariados se componen de dos partes: el estudio de las funciones de distribución marginales y la estructura de dependencia. Esta distinción se refleja tanto en la teoría como en la práctica. Comúnmente, primero se realiza el correspondiente manejo de las funciones marginales y como segundo paso, después de la transformación estandarizada de las marginales a una escala común. La teoría multivariada de valores extremos también se estudia mediante dos enfoques: el comportamiento límite de máximos por bloques, método mediante el cual está basada la teoría clásica para caracterizar el comportamiento de extremos multivariados; y extremos sobre un umbral, Beirlant (2004), Joe (1994), Katz (2002). XXIII C ON G R E S O N A C I O N A L AMH DE H I D R Á U LI C A PUERTO VALLARTA, JALISCO, MÉXICO, OCTUBRE 2014 AMH Máximos por bloque multivariados Modelos de Cópulas de valores extremos Sea ) elementos en . Si son vectores aleatorios independientes e idénticamente distribuidos (i.i.d) de dimensión d. Se define el vector de máximos, La teoría clásica de Cópulas está dada por Sklar (1952) que muestra que para una función de distribución d-variada , con funciones marginales continuas , existe una única cópula en el cubo unitario d-dimensional, con marginales uniformes tal que la distribución conjunta es la composición de funciones Debe observarse que estos vectores de máximos no necesariamente corresponden a observaciones de los datos originales. La familia de cópulas de valores extremos (CBVE) es usada para representar las DMVE por medio de distribuciones marginales distribuidas uniformemente. Es posible representar una CBVE mediante otros conceptos de dependencia, por ejemplo, una cópula bivariada de valores extremos puede ser escrita en términos de la función de dependencia de Pickands como =( (16) La función de distribución de evaluada en está dada por (12) Del mismo modo que en el caso univariado, para evitar degeneración de la distribución límite de , se buscan secuencias de vectores normalizantes, y , con componentes y , j tales que cuando , (13) para una función de distribución d-dimensional con marginales no degeneradas y por (11), DVE. Aquí y en las demás operaciones vectoriales se suponen componente a componente. Si se tiene (13), se dice que pertenece al dominio de atracción del máximo de , es llamada una distribución multivariada de valores extremos (DMVE). Cuando se estudia la estructura de dependencia, es frecuentemente conveniente usar marginales estandarizadas, esta elección es arbitraria, Tiago de Olivera (1963) y Galambos (1978) asumen marginales Gumbel; Hann & Resnick (1977) asumen marginales Fréchet; otros más como Pickands (1981), Deheuvels (1983,1985) y Tawn (1988) las asumen exponenciales, siendo estas dos últimas las más utilizadas en la literatura. De acuerdo a Pickands, para el caso bivariado, la distribución de puede ser aproximada mediante una distribución bivariada de valores extremos, determinada por su función de dependencia así como por sus marginales y respectivamente (14) Donde (15) para , , (t) es llamada la función de dependencia o función de dependencia de Pickands, la cual es necesariamente convexa y se aproxima al triángulo definido por los puntos (0,1), (1,1) y (1/2,1/2). Para el caso bivariado se han propuesto diversos modelos paramétricos como el modelo logístico, Gumbel (1960); asimétrico logístico, Tawn (1988); Husler & Reiss (1989); negativo logístico, Galambos (1975); negativo logístico asimétrico, Joe (1990); biologísitco, Smith (1990); biologístico negativo, Coles y Tawn (1994); Coles-Tawn, Coles y Tawn (1991); asimétrico mixto, Tawn (1988). Siendo entre ellos, los modelos más generales, las cópulas. (17) Con , Rakonczai (2009). Extremos multivariados sobre un umbral Sea una muestra ddimensional de observaciones i.i.d. con una desconocida distribución conjunta para alguna cópula desconocida con funciones marginales y perteneciente al dominio de atracción de una DMVE Tal como en el caso univariado, se busca aproximar la cola derecha de sobre algún vector de umbrales altos . Por la teoría univariada, para y lo suficientemente grande, la cola derecha de la distribución marginal es aproximada por una DGP. Reemplazando por una cópula límite de valores extremos se puede ajustar un modelo paramétrico mediante cópulas de valores extremos flexible y tratable. Descripción de los datos Se realizó un análisis del comportamiento del viento y el oleaje extremo al norte de la costa de Campeche, caracterizando la altura de ola y la velocidad del viento. Los datos horarios empleados corresponden a los resultados del modelo numérico híbrido WAM-HURAC, presentado por Ruiz-Martínez et al. (2009), para el periodo del 1 de enero de 1948 al 31 de diciembre de 2010, en la celda ubicada en las coordenadas 19°25’ Latitud Norte, 91°45’ Longitud Oeste, los cuales forman parte del Atlas de Clima Marítimo de la Vertiente Atlántica Mexicana (Silva et al., 2008) El análisis se realizó utilizando un entorno de programación para análisis estadístico y gráfico llamado “R”. Es un proyecto de software libre que puede descargarse en http://cran.rproject.org/. Ilustración 1. Altura de ola de 1948 a 2010. XXIII C ON G R E S O N A C I O N A L AMH DE H I D R Á U LI C A PUERTO VALLARTA, JALISCO, MÉXICO, OCTUBRE 2014 Ilustración 2. Velocidad de viento de 1948 a 2010. Resultados para extremos univariados A continuación, se presenta el análisis de las variables mencionadas, altura de ola y velocidad del viento, bajo los dos modelos univariados descritos, que consisten en el modelo de máximos por bloque, relacionado con la DGVE por el Teorema de Fisher-Tippet y Gnedenko, y el modelo de picos sobre un umbral, relacionado con la DGP por el Teorema de Pickands-Balkema-de Haan. (Coles 2001). AMH es la función de distribución estimada, la cual se obtiene utilizando los parámetros estimados; y es el -ésimo valor de los datos ordenados . Otra de las herramientas de diagnóstico es la gráfica de cuantiles, la cual consiste en los puntos de la forma , donde es la función inversa de la distribución estimada y y están dadas como se mencionó anteriormente. Si el modelo representa un buen ajuste, en ambas gráficas debería observarse que los puntos se asemejan a una línea diagonal (Coles 2001). Adicionalmente se realizaron pruebas de bondad de ajuste de Kolmogorov y Anderson Darling (NIST 2012) que avalaron el modelo como una buena aproximación, a un 95% de confianza. Inferencia para la DGVE El Teorema de Fisher-Tippet y Gnedenko provee un modelo límite para la distribución del máximo valor obtenido por el modelo de máximos por bloque. En el análisis de fenómenos hidrometeorológicos es conveniente analizar los máximos anuales, pues de tomarse bloques de menor tamaño, éstos se ven afectados por la variabilidad de las condiciones que afectan la intensidad de dichos fenómenos a lo largo del año con el cambio de diversos factores, como las estaciones (Coles 2001). Existen varios métodos que son utilizados para la estimación de los parámetros de una distribución a partir de una muestra, entre ellos el método de máxima verosimilitud (Coles 2001), el cual fue utilizado para la obtención de los estimadores de los parámetros de la DGVE, así como los intervalos de confianza de cada uno, los cuales se muestran en la Tabla 1. Ilustración 3. Gráficas de probabilidades (izquierda) y de cuantiles (derecha) del ajuste a DGVE de la variable altura de ola. Tabla 1. Estimadores e intervalos de confianza al 95% de la DGVE. Altura Velocidad Estimadores Intervalos 0.33256 (0.12465 , 0.54033) 2.78268 (2.57314 , 2.99243) 0.75476 (0.57444 , 0.93522) 0.60683 (0.35321 , 0.86024) 9.99688 (9.48751 , 10.5071) 1.82127 (1.29228 , 2.35093) En un análisis previo, se supuso que el parámetro de forma era igual a cero, para obtener una aproximación de los máximos anuales de altura de ola por una distribución tipo Gumbel. Sin embargo, podemos observar que el estimador para en la altura de ola es positivo, y además que el intervalo de confianza correspondiente no contiene al cero, por lo que el ajuste a Gumbel no es un modelo adecuado en este caso. Para verificar la bondad del ajuste se hizo uso de algunas herramientas de diagnóstico. Las gráficas de probabilidad comparan el modelo teórico con las estimaciones graficando los puntos de la forma , donde es un estimador de posición de datos en una gráfica propuesto por Hosking (1995) que se calcula como ; Ilustración 4. Gráficas de probabilidades (izquierda) y de cuantiles (derecha) del ajuste a DGVE de la variable velocidad de viento. En las Ilustraciones (3) y (4) podemos ver que el modelo representa un buen ajuste para la distribución límite de los máximos anuales. Tenemos entonces que las expresiones de las distribuciones límite para los máximos niveles de altura anuales y máximas velocidades de viento anuales están dadas por (18) (19) Para estimar los periodos de retorno asociados a los cuantiles de la DGVE, se invirtieron las expresiones en (18) y (19) y se evaluaron en para hallar el valor para el cual , es decir, aquel valor para el cual la probabilidad de que el máximo valor anual lo exceda sea . A este valor se le conoce como el nivel de retorno asociado al periodo de retorno años, ya que el nivel se espera será excedido en promedio una vez cada años. AMH XXIII C ON G R E S O N A C I O N A L DE H I D R Á U LI C A AMH PUERTO VALLARTA, JALISCO, MÉXICO, OCTUBRE 2014 La extrapolación de este tipo de modelos sirve para hacer inferencia sobre los posibles niveles que se alcanzarán en periodos de tiempo incluso de mayor longitud que el periodo de tiempo que comprenda a los datos analizados. De las ecuaciones (18) y (19) se obtuvieron las expresiones de los niveles de retorno para altura de ola y velocidad de viento y en la Ilustraciones (5) y (6) se muestran las gráficas de niveles de retorno de cada una de las dos variables, las cuales relaciona los periodos de retorno con el nivel de retorno correspondiente, en una gráfica con escala logarítmica en el eje de las abscisas (20) (21) Ilustración 7. Gráfica de medias de excesos de altura de ola (izquierda) y velocidad de viento (derecha). Tabla 2. Estimadores e intervalos de confianza al 95% de los parámetros de la DGP. Estimadores Intervalos 0.74942 (0.6799 , 0.8242) 0.05732 (0.0034 , 0.1233) 0.8603 (0.6002 , 1.2200) 0.2547 (0.0172 , 0.5939) 1.6470 (1.2568 , 2.1353) 0.3989 (0.2088 , 0.6476) 724 Altura 80 Velocidad Ilustración 5. Gráfica de niveles de retorno de altura de ola. Ilustración 6. Gráfica de niveles de retorno de velocidad de viento. Inferencia para la DGP En la Ilustración (7) observamos que la gráfica sugiere que la elección de un umbral de metros para la altura de ola y un umbral metros sobre segundo para la velocidad de viento, pues presenta un comportamiento aproximadamente lineal a partir de dichos puntos. Habiendo elegido los umbrales, se estimaron los parámetros de forma y de escala de la DGP por máxima verosimilitud (Tabla 2). Se incluyen los parámetros estimados con el umbral seleccionado para análisis previo, el cual es , el cual fue elegido como 1.5 veces la altura de ola cuadrática significante media (Hrms) que es considerada como condiciones de tormenta de alta energía y, por tanto, es tomada como el umbral que define una tormenta (Silva R, comunicación personal). 147 Una vez hechas las estimaciones, se procedió a realizar el diagnóstico de ajuste para cada modelo, utilizando las herramientas gráficas descritas, las cuales son la gráfica de probabilidades y la gráfica de cuantiles (Ilustraciones 8, 9 y 10). Adicionalmente, se hicieron pruebas de bondad de ajuste de Kolmogorov y Anderson Darling, las cuales rechazaron el modelo con un umbral y avalaron los otros dos modelos como buenas aproximaciones, a un 95% de confianza. Ilustración 8. Gráficas de probabilidades (derecha) y de cuantiles (izquierda) del ajuste a DGP para altura de ola con u=1m. Ilustración 9. Gráficas de probabilidades (izquierda) y de cuantiles (derecha) del ajuste a DGP para altura de ola con u=2.5m. AMH XXIII C ON G R E S O N A C I O N A L DE H I D R Á U LI C A AMH PUERTO VALLARTA, JALISCO, MÉXICO, OCTUBRE 2014 datos dadas por la aproximación (1995). propuesta por Hosking Ilustración 10. Gráficas de probabilidades (izquierda) y de cuantiles (derecha) del ajuste a DGP para velocidad de viento con u=9m/s. Observamos en las gráficas de diagnóstico del ajuste con un umbral , en la Ilustración 8, que el modelo estimado para la altura de ola con dicho umbral parece no dar una buena aproximación, ya que presenta valores que se alejan demasiado de la recta diagonal. Por otro lado, las gráficas de ajuste para la altura de ola con umbral (Ilustración 9), presentan una mejor similitud con la recta diagonal tanto en las gráficas de probabilidades como en la gráfica de cuantiles, dando evidencia de que se trata de un mejor modelo. Por otro lado, las gráficas de diagnóstico para la velocidad de viento con (Ilustración 10) presentan semejanza con la recta diagonal, lo cual indica que se trata de un buen ajuste. Tenemos entonces que las expresiones de las distribuciones límite para las distribuciones de excedencias de altura de ola sobre y para la distribución de excedencias de velocidades de viento sobre están dadas por (22) (23) Los niveles de retorno en el modelo de picos sobre un umbral se tratan de manera ligeramente diferente a la forma usada en el modelo de máximos por bloque. Si queremos dar los periodos de retorno en una unidad de tiempo, en este caso en años, supongamos que buscamos un nivel que se espera sea excedido una vez cada años. Si tenemos una cantidad de excedencias observadas durante un año, entonces el nivel buscado es aquel que se exceda en promedio una vez cada excedencias observadas, o bien que la probabilidad de que una excedencia sobrepase el nivel sea . Como la base comprende de 1948 a 2010 se consideraron 63 años para la estimación de , donde es el número de excedencias de cada variable. Invirtiendo la expresión de la DGP y evaluando en dicha probabilidad llegamos a las expresiones de los niveles de retorno asociados a un periodo de retorno de años para altura de ola y para velocidad de viento . Ilustración 11. Gráfica de niveles de retorno de altura de ola con un umbral u=2.5m. Ilustración 12. Gráfica de niveles de retorno de velocidad de viento con un umbral u=9m/s. Resultados para extremos bivariados Para el ajuste de los modelos paramétricos bivariados, se procedió a formar una muestra conjunta con los máximos anuales de la altura de ola y la velocidad de viento. Como consideración inicial se efectuó una prueba de hipótesis con la finalidad de descartar la independencia de las variables. El valor del estadístico de Cramer-von Mises que se obtuvo fue 0.33073, con un p-value de 0.0004995, en base a ello se tuvo evidencia suficiente para rechazar la hipótesis nula de independencia. Posteriormente, se emplearon métodos de estimación de máxima verosimilitud en la estimación los correspondientes parámetros particulares de los modelos bivariados. Mediante el criterio de información de Akaike AIC y pruebas de bondad de ajuste se discriminó entre los distintos modelos ajustados, y se propusieron como buenos ajustes para los eventos extremos bivariados de altura de ola y velocidad de viento los modelos Husler-Reiss y el negativo logístico por los resultados obtenidos en dichas pruebas. Tabla 3. Ajuste del modelo bivariado Husler-Reiss. (24) Parámetros μ ξ r localización forma escala dependencia (25) Para la gráfica de niveles de retorno se procede de manera similar al modelo de máximos por bloque, graficando los periodos de retorno (en años) contra los niveles de retorno asociados con escala logarítmica en el eje de las abscisas. Adicionalmente se incluyen las posiciones estimadas de los H 2.8106 0.2163 0.7666 V 10.1848 0.3787 1.9701 AIC 445.819 Desviación 431.819 2.4063 XXIII C ON G R E S O N A C I O N A L AMH DE H I D R Á U LI C A AMH PUERTO VALLARTA, JALISCO, MÉXICO, OCTUBRE 2014 . Ilustración 13. Gráficos de bondad de ajuste para el modelo Husler-Reiss. Ilustración 14. Gráficos de bondad de ajuste para el modelo negativo logístico. La expresión paramétrica del modelo negativo logístico es La expresión paramétrica del modelo Husler Reiss es , , (26) (29) con con (30) (27) (28) Tabla 4. Ajuste del modelo bivariado negativo logístico Parámetros μ ξ r localización forma escala dependencia H 2.8018 0.2322 0.7567 V 10.176 0.3947 1.9468 AIC 446.8938 Desviación 432.8938 1.7212 (31) Conclusiones La Teoría de Valores Extremos puede ayudar a mejorar las medidas preventivas ante sucesos que causan consecuencias extremas gravosas, brindando información que permita mejorar la cuantificación de los riesgos hidrometeorológicos para la optimización de toma de decisiones, gestión de áreas susceptibles a este tipo de riesgos y llevar una adecuada modelación de los agentes externos y erradicar en lo posible las incertidumbres inherentes a la modelación de los fenómenos naturales; en ingeniería marítima, el éxito en el diseño de estructuras depende esencialmente de la adecuada selección de las condiciones ambientales a las que puede verse sometida garantizando que dicho elemento no llegue a los estados límites de falla a lo largo de su vida útil. En el análisis de los datos específicos se obtuvieron expresiones para las distribuciones límite que describen el AMH XXIII C ON G R E S O N A C I O N A L DE H I D R Á U LI C A PUERTO VALLARTA, JALISCO, MÉXICO, OCTUBRE 2014 comportamiento aproximado de los valores máximos de la muestra en cuestión. De ellos se pudieron obtener las estimaciones de los cuantiles con los que se calcularon los niveles de retorno, los cuales representan una herramienta de suma utilidad en la planificación y diseño de estructuras que requieren de un conocimiento del comportamiento a largo plazo de fenómenos de tipo hidrometeorológico. Adicionalmente, se obtuvieron las expresiones de distribuciones límite que describen el comportamiento de los valores máximos de ambas variables tomadas de forma conjunta y que están ligadas intrínsecamente en la caracterización del oleaje, esto en busca de tener estimaciones que permitan estudiar de forma más completa el fenómeno hidrometeorológico en cuestión. Una de las instituciones que realiza más contribuciones en evaluación de riesgos hidrometeorológicos en México es el Centro Nacional de Desastres (CENAPRED) (Silva 2012), que ha publicado guías y directrices para la construcción de atlas de riesgos, para el cual un factor importante es el conocimiento, o en este caso estimación de las probabilidades de que se presenten eventos potencialmente dañinos. Una mejor estimación de la probabilidad de ocurrencia de un evento potencialmente dañino a largo plazo, o con largos periodos de retorno, puede servir para una mejor evaluación del riesgo. Se espera que la metodología presentada en este trabajo impulse el desarrollo y el uso de herramientas teóricas recientes y sofisticadas para obtener mejores análisis y evaluaciones de modelos basados en valores extremos para la prevención y toma de decisiones en materia de riesgo hidrometeorológico, ya que en análisis menos rigurosos se corre el riesgo de llegar a estimaciones menos adecuadas o suposiciones sobre parámetros muy sensibles como el parámetro de forma que figura en ambos métodos (máximos por bloque y picos sobre umbral), el cual determina comportamientos muy distintos en la cola de las distribuciones de los fenómenos analizados. AMH http://cran.rproject.org/web/packages/ismev/ismev.pdf. 200914-07. GILLI M., KËLLEZI E. An Application of Extreme Value Theory for Measuring Risk. Department of Econometrics, University of Geneva and FAME, Geneva, Switzerland, febrero 2003, 24 pp. HOSKING J. R.., WALLIS J.R. Water resources research. A comparison of unbiased and plotting-position estimators of L moments. Vol. 31, No. 8. Agosto 1995, pp. 2019-2025. JOE, H. Multivariate Extreme-Value Distributions with applications to environmental data, The Canadian Journal of Statistics, Vol. 22, No. 1, 1994, pp. 47-64. JOE, H., SMITH, R., y WEISSMAN, I. Bivariate threshold methods for extremes, Journal of the Royal Statistical Society, Vol. 54, No. 1, 1992, pp. 171-183. KATZ, R., PARLANGE, M., y NAVEAU, P., Statistics of extremes in hydrology, Advances in Water Resources, Vol. 25, 2002, pp. 1287-1304. McNEIL, A., FREY, R., y EMBRECHTS, P. Quantitative Risk Management: concepts, techniques, and tools Princeton University Press, 2005, 529 pp. NIST/SEMATECH e-Handbook of Statistical Methods. [en línea]. Abril 2012. [citado en agosto de 2014]. Disponible en http://www.itl.nist.gov/div898/handbook/. PFAFF B., MCNEIL A. J., STEPHENSON A. Package evir (Version 1.7) [en línea]. Extreme Values in R. Febrero 2013 [citado en agosto de 2014] Disponible en: http://cran.rproject.org/web/packages/evir/evir.pdf. RAKONCZAI, P., On modelling and prediction of multivariate extremes with applications to environmental data. Tesis de licenciatura en ciencias matemáticas, Suecia, 2009, 109 pp. Referencias REISS R., THOMAS M. Statistical Analysis of Extreme Values: with Applications to Insurance, Finance Hydrology and Other Fields. Tercera edición. Birkhäuser Verlag, Germany 2007, 511 pp. BEIRLANT, J., GOEGEBEUR, J., SEGERS and TEUGELS, J., Statistics of extremes: Theory and Applications, West Sussex, England, John Wiley & Sons. 2004, 485 pp. RIBATET M. The POT Package (Version 1.1-3) [en línea]. Febrero de 2013 [citado en agosto de 2014] Disponible en: http://benz.nchu.edu.tw/ _nmyc/POT.pdf. BORTOT, P., GAETAN, C., Multivariate extremes, dipartimento di Scienze Statistiche, Bologna, Italy CEBRAIN, A., DENUIT, M., y LAMBERT, P., Analysis of bivariate tail dependence using extreme value copulas: An application to the SOA medical large claims database, Extremes, Vol. 3, 2000, pp. 311-329. COLES, STUART. An Introduction to statistical modeling of extremes values Department of Mathematics. University of Bristol: Springer Series in Statistics, 2001, 209 pp. RUIZ-MARTÍNEZ G., SILVA R., PÉREZ D., POSADA G., BAUTISTA E. Modelo híbrido para la caracterización del oleaje. Ingeniería hidráulica en México. Vol. XXIV, núm 3, julio-septiembre de 2009, pp 5-22. DUPUIS, DJ., y JONES, BL. Multivariate Extreme value theory and its usefulness in understanding risk, North American Actuarial Journal, Vol. 10, No. 4, 2006, pp. 1-27. EMBRECHTS P., KÜPPELBERG C., MIKOSCH T. Modelling Extremal Events for Insurance and Finance. Springer-Verlag 1997, 644 pp. GILLELAND E. Package ismev (Version 1.39) [en línea]. Febrero 2013 [citado en agosto de 2014]. Disponible en: SILVA R., MENDOZA E., ESCUDERO M., POSADA G., ARGANIS M. Characterization Of Risks In Coastal Zones: A Review. Instituto de Ingeniería, Universidad Nacional Autónoma de México. Instituto EPOMEX, Universidad Autónoma de Campeche, 2012. 24 pp. SILVA, R., RUIZ, G., POSADA, G., PÉREZ, D., RIVILLAS, G., ESPINAL, J., MENDOZA, E. Atlas de Clima Marítimo de la Vertiente Atlántica Mexicana. Instituto de Ingeniería, Universidad Nacional Autónoma de México, 2008. TAWN, J., Bivariate extreme value theory: models and estimation, Biometrika,Vol. 75, núm. 3, 1988, pp. 397-415. ZHAO, Z., On parametric modelling of bivariate extreme value dsitribution. Tesis de maestría, Suecia, 2012, 40 pp.
© Copyright 2025