CÓMO SUSTENTAR UN PLAN DE RECUPERACIÓN DE DESASTRES Por Diego Fernández, Solution Strategist de CA Technologies. Fuente: Revista Gerencia La sustentación de un plan de recuperación de desastre (DRP - Disaster Recovery Plan) de una organización se obtiene mediante la aceptación de que los desastres ocurren. Esta afirmación nos permite comenzar a trabajar proactivamente en la mitigación del riesgo de que ocurra un desastre, pero siempre a la espera de que éste suceda. Es por esto que las empresas deben repensar su estrategia proteccionista por una dinámica con la mirada puesta en la recuperación de sus procesos. PARTE I.Los últimos años hemos transitado por una serie de eventos que permiten analizar con profundidad la ejecución de los planes de recuperación en Latinoamérica, pero más aún hemos observado con claridad el desempeño de los negocios y su evolución posterior a los desastres. Seguramente usted esté pensando que las organizaciones deben procurar que su tiempo de recuperación ante un desastre esté cercano a cero, y aquí vemos el primer problema: si usted no consideró el circuito de proveedores, y cómo sus clientes adquieren sus productos o servicios luego de un desastre, seguramente tendrá a su empresa funcionando y sin clientes a quien vender sus productos, o bien carezca de recursos donde abastecerse luego de esta contingencia. En el anecdótico párrafo anterior ilustramos cómo se debe realizar la correcta planificación de un plan de recuperación de desastres; esto es, una planificación integral pensada en la ejecución de sus procesos. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 1 PENSAR EN FUNCIÓN DE PROCESOS Y SERVICIOS La Biblioteca de Infraestructura de TI versión 2 (ITIL v2) nos proponía una serie de documentos que estaban orientados a la ejecución de procesos propios de TI como detallo a continuación: Gestión de Servicios de TI 1. Mejores prácticas para la provisión de servicio. 2. Mejores prácticas para el soporte de servicio. Otras Guías Operativas 1. Gestión de la infraestructura de TI. 2. Gestión de la seguridad. 3. Perspectiva de negocio. 4. Gestión de aplicaciones. 5. Gestión de activos de software. Sin embargo estas guías proponían, sin querer, la visión del área de TI un poco lejos de la gestión del negocio. Por este motivo, en la tercera revisión de ITIL se pretendía adquirir un mayor vínculo de la tecnología con el negocio de la organización y por esta razón se redactaron cinco guías pensando en los servicios que TI ofrece a ésta: 1. Estrategia del servicio. 2. Diseño del servicio. 3. Transición del servicio. 4. Operación del servicio. 5. Mejora continua del servicio. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 2 Con el estudio de estas guías obtendremos una mejor comprensión del área de TI y el negocio, y fundamentalmente comenzaremos a pensar en función de procesos y servicios. Estrategia del Servicio Si comenzamos a analizar la estrategia de servicio nos toparemos con la primera pregunta de la composición de un plan de recuperación de desastres, que es: ¿Conoce el tiempo máximo que puede estar sin que se ejecute un proceso determinado sin que su empresa sufra daños irreversibles? Esta pregunta declara cuál es el foco de negocio, y delimita los procesos vitales de la organización. Este proceso se conoce como el cálculo del MTD (Maximun Tolerable Downtime), el mismo se debe obtener por cada proceso detectado en el párrafo anterior. Si logramos avanzar en estas preguntas estaremos en condiciones de proponer la conformación de un BIA (Business Impact Analysis). El BIA es un documento que identificará los eventos que afectan la continuidad de los procesos de la organización e incluirá un análisis profundo. Las normas ISO 27001, ISO 27002, ISO 27005, ISO 20000, Cobit 4.1, COSO, ITIL V3 y BS 25999, entre otras, nos permitirán establecer una ruta estratégica que ofrezca a la organización la capacidad para estar mejor preparada ante un entorno cambiante y de alto riesgo. Comencé este artículo mencionando que uno debería empezar a trabajar en su plan de recuperación de desastres con la convicción de que éste puede ocurrir. De esta manera es fundamental que desde el minuto cero de la planificación del mismo, comencemos a trabajar en la reducción de la mitigación de los efectos que puedan generarse tras un desastre que ocurra durante esta planificación. Es por esto que se debe comenzar con un plan provisorio de emergencia. Al momento de destinar fondos para la conformación de éste, se debe justificar que los elementos que se adquieran durante el mismo serán flexibles y escalables a la solución final. Muchas veces los clientes adquieren soluciones para responder a necesidades inmediatas y emergentes durante estos planes provisorios de emergencia y luego descubren que estas Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 3 herramientas comienzan a recolectar información de los servicios que nos serán vitales al momento de la conformación del BIA. Desde ya algunas soluciones pretenderán responder de forma automática ante un desastre habilitando los servicios en el sitio de contingencia, ya sea que esté próximo al sitio del desastre, a miles de kilómetros o en la nube. Como analistas de TI tenemos el deber de poner nuestra mirada en la continuidad del negocio, por eso es vital que se ponga en marcha el plan provisorio de emergencia con una visión mucho más liviana de los puntos y el tiempo de recuperación de los sistemas que en un DRP. En paralelo es posible continuar con el BIA, el cual actualizará dinámicamente el plan provisorio de emergencia ajustándolo a recuperar los procesos que se van descubriendo como críticos. Este proceso puede estar conformado por las siguientes tareas: Obtener información por medio de entrevistas o encuestas. Obtener información financiera del impacto en caso de afectarse un proceso de negocio. Estudio detallado de la información obtenida. Determinar tiempos críticos de aplicaciones, procesos de negocio y recursos o servicios. Calcular los MTD. Priorizar las operaciones de recuperación con base en la anterior información recolectada. La anterior información recolectada debe ser documentada adecuadamente con el fin de ser parte del DRP. Sin duda nos encontramos en un momento histórico del “management” de TI, donde las organizaciones han redescubierto la importancia de estas áreas gracias a que se ha repensado a TI como un sector que provee servicios concretos al negocio. Hoy usted puede comenzar a preparar a su compañía para pensar en su DRP, tal vez hoy sólo pueda alcanzar la conformación de un plan provisorio de emergencia; pero seguramente debe incorporar soluciones de recuperación que sean flexibles, permitan actualizaciones dinámicas, y que no condenen a su organización a trabajar con un único proveedor de hardware, etc. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 4 Sustentar un plan de recuperación de desastres dentro de una organización depende del correcto planteamiento del problema: ocurrirá un desastre y la forma correcta de abordar este problema es pensar en los métodos de recuperación de los procesos. PARTE II.- En el artículo anterior mencionamos que las organizaciones deben enfrentar la generación de sus planes de recuperación de desastres con la certeza de que ocurrirá uno. Es por esto que las empresas deben repensar su estrategia proteccionista y cambiarla por una dinámica con la mirada puesta en la recuperación de sus procesos. Para esto comenzamos a estudiar el desarrollo de la gestión de los planes de recuperación de desastres a través de las perspectivas propuestas por ITIL versión 3. Mencionamos en el artículo anterior que es necesario mantener una visión del área de TI que esté a la par de la gestión del negocio, por este motivo observamos que en el segundo apartado de ITIL v3 se proponen guías para el diseño del servicio desde una perspectiva de negocio. Antes de comenzar enumeremos las cincos guías propuestas por ITIL v3: 1. Estrategia del Servicio. 2. Diseño del Servicio. 3. Transición del Servicio. 4. Operación del Servicio. 5. Mejora Continua del Servicio. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 5 DISEÑO DEL SERVICIO En la definición de la estrategia del servicio comenzamos a analizar cuáles son los procesos críticos de la organización y detectamos el correspondiente MTD (Maximun Tolerable Downtime) para cada proceso. Durante la etapa de “diseño del servicio” estaremos llevando a la práctica los distintos procedimientos para la implementación y gestión del plan de recuperación de desastres. En esta fase es necesario ya contar con el “plan provisorio de emergencia”, el cual comprenderá herramientas de respaldo y continuidad de datos que permiten proteger, provisoriamente, los sistemas que soportan los procesos críticos de la organización. Estas nos deben permitir obtener información relevante de la infraestructura, como así también deben tener la capacidad de escalar en la incorporación de nuevos servicios a proteger. Durante esta serie de artículos insistiré en la necesidad de tener una visión integral de la organización y daremos respuestas que sean integradoras. Por ese motivo una vez que se haya identificado un servicio a ofrecer debemos analizar la viabilidad tomando en cuenta factores como la infraestructura, el personal, la cultura de la organización, y las distintas sub-culturas. En el diseño estaremos optando por los distintos métodos de capacitación al personal en aspectos como la seguridad y la prevención ante desastres. Cuando se diseñen los servicios se debe tomar en cuenta el dinamismo actual que tienen las organizaciones y por este motivo se debe comprender la eventual rotación de roles, despidos, contrataciones, etc. Debemos entender el crecimiento y cambio de la infraestructura y del software con el que trabajaremos. Durante el diseño del servicio atravesaremos los siguientes procesos: 1. Gestión del Catálogo de Servicios: Este proporcionará una referencia estratégica y técnica clave dentro de la organización. Como vimos en el artículo anterior utilizaremos la información recolectada en el BIA (Business Impact Analisys) para construir un mapa que describa detalladamente los servicios que se prestan y los recursos asignados para éstos. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 6 Este catálogo de servicios incluirá la información sobre todos los servicios que se hayan prestado alguna vez o los que prestará la organización. Claramente servirá también para delimitar las funciones y compromisos de TI. 2.Gestión de Niveles de Servicio: Las actividades y objetivos de los procesos de la Gestión del Nivel de Servicios (SLM, Service Level Management) son esencialmente idénticos en ITIL V2 y V3. ITIL V3 clasifica la SLM dentro del área de diseño del servicio, mientras que las actividades de la revisión de servicios se encuentran en el perfeccionamiento continuo de éste. El proceso ITIL V3 Gestión del Nivel de Servicio (SLM) abarca los siguientes subprocesos: Mantenimiento de infraestructura de SLM. Inscripción de clientes en servicios estándar. Identificación de requisitos de servicio. Descomposición del servicio de negocio en servicios de soporte. Diseño técnico y organizativo del servicio. Compilación y presentación de la solicitud de cambio. Firma de acuerdos y activación del servicio. Monitoreo e informes del nivel de servicio. 3. Gestión de la Disponibilidad: Este proceso es el responsable del monitoreo y optimización de los servicios de TI para que funcionen ininterrumpidamente y de manera confiable según los SLA establecidos. Los planes de disponibilidad deben ajustarse a los planes reales del negocio; los niveles de disponibilidad que se establecerán aquí serán claramente superiores a los establecidos en el plan provisorio de emergencia, pero es altamente recomendable utilizar la misma herramienta de gestión en una u otra etapa. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 7 La gestión de la disponibilidad debe contar con indicadores que sustenten el trabajo, es por esto que las herramientas elegidas para realizar los procesos de continuidad de información deben contar con la capacidad de generar reportes y análisis de tiempo real que permitan ver: Disponibilidad: Porcentaje de tiempo sobre el total acordado en que los servicios TI han sido accesibles al usuario y han funcionado correctamente. Fiabilidad: Medida del tiempo durante el cual los servicios han funcionado correctamente de forma ininterrumpida. Mantenibilidad: Capacidad de mantener el servicio operativo y recuperarlo en caso de interrupción. Capacidad de servicio: Determina la disponibilidad de los servicios internos y externos contratados y su adecuación a los OLAs y UCs en vigor. Cuando un servicio TI es subcontratado en su totalidad la disponibilidad y la capacidad de servicio son términos equivalentes. Queda mucho camino por recorrer en el proceso de conformación de un plan de recuperación de desastres sustentable. Está claro que es fundamental seleccionar herramientas de gestión de TI que permitan escalar de manera flexible en la adopción de nuevos procesos y procedimientos según cambie el negocio. Adoptar sistemas continuidad de aplicaciones y respaldo de información es una tarea que debe estar comprometida con el negocio y no sujeta al hardware existente. La historia indica que quienes han adoptado soluciones de resguardo condicionadas por un hardware en particular debieron descartar su plan de recuperación de desastres o el producto de respaldo o continuidad elegido. La clave está en la elección de software crossplatform, independientemente de hardware, que permita gestionar los procesos y procedimientos mencionados en los párrafos anteriores. ¿Su organización está preparada para el siguiente desastre? PARTE III.Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 8 Hemos revisado los primeros 2 puntos de las 5 guías pensando en los servicios que TI ofrece a la organización: 1. Estrategia del servicio 2. Diseño del servicio 3. Transición del servicio 4. Operación del servicio. 5. Mejora continua del servicio Con el estudio de estas guías obtendremos una mejor comprensión del área de TI y el negocio, y fundamentalmente comenzaremos a pensar en función de procesos y servicios. Es momento ahora de abordar algunos elementos de la “transición del servicio”, “operación del servicio” y la “mejora continua del servicio”. Aquí es donde vemos la necesidad clara de contar con herramientas para automatizar la recuperación de diversos elementos, como aplicaciones, bases de datos o sistemas completos. Durante la planificación de la transición del servicio se establece cómo se desea que se recuperen las aplicaciones tras una caída, y también se deben preparar los planes de “rollback” (reversión) junto con sus respectivas pruebas. Es común contar con soluciones de backup que apoyen el resguardo de la información, pero en esta etapa es recomendable analizar herramientas de replicación y alta disponibilidad que puedan trabajar en distintas capas de los procesos a proteger. La transición del servicio no debe contemplar solamente las fallas completas de los sistemas, sino también la respuesta ante fallas particulares de distintos elementos de estos sistemas. Por ese motivo es correcto pensar que cuando una organización se encuentra ante un proceso crítico, con un MTD (Maximun Tolerable Downtime) igual a 0, se deben realizar tareas de replicación y alta disponibilidad del mismo. De ser posible es necesario contar con un sitio de contingencia que permita ejecutar este proceso frente a una caída del sitio principal. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 9 Analizando un ejemplo Veamos el siguiente ejemplo: La organización “A” en el año 2010 adquiere dos dispositivos de almacenamiento del fabricante “X” para que trabajen en redundancia replicando datos entre los sitios remotos. En el año 2012 el fabricante “X” descontinúa estos equipos y cambia su estrategia de negocio a otra línea por lo que deja de desarrollar estos equipos. En el año 2013 la organización “A” sufre un desastre en su sitio principal por lo que comienza a operar en el sitio de contingencia. Hasta aquí podemos pensar que el plan de recuperación ha sido un éxito, sin embargo, un plan de recuperación debe contemplar la transición al funcionamiento normal de las operaciones. Esto quiere decir, recuperar el sitio principal. En el ejemplo la organización “A” adquiere un hardware de un fabricante “X”, el cual ahora ya no cuenta con equipos del mismo modelo. Aquí vemos el olvido más grande que suele existir en este tipo de planes: manejo de proveedores, o sea flexibilidad. En el ejemplo, la organización “A” quedó comprometida al trabajo con un único proveedor, no tiene flexibilidad y éste es un error grave en la planificación de un plan de recuperación de desastres. Cuando esté pensando en incorporar una solución de replicación debe contemplar que pueda contar con la capacidad de trabajar con múltiples proveedores de hardware, software, etc. A considerar La implementación de una solución de replicación y alta disponibilidad deberá respetar los siguientes ítems: 1) Integración con la aplicación a replicar: Optar por soluciones que trabajen a nivel de aplicación permite manejar mejores estándares de seguridad y optimizar el tiempo y la velocidad de replicación. 2) Flexibilidad ante el cambio: Todas las soluciones deben permitir realizar modificaciones de manera de poder adaptarse a los cambios de la infraestructura y del negocio. Siempre se debe tomar en cuenta la gestión centralizada y de la solución. Por este motivo no es recomendable contar con múltiples herramientas de replicación y alta disponibilidad según la aplicación o Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 10 hardware. Tampoco podemos ajustarnos a soluciones de nicho. Tenga una mirada integral, piense en el futuro, analice su historia y las tendencias. Y, por sobre todo, contemple la mayor cantidad de situaciones inesperadas. 3) Gestión del conocimiento: Recuerde que un plan de recuperación de desastres debe tener una mirada integral de la organización. Planifique y estructure según la cultura de quienes componen la organización. Eduque y forme pensamiento nuevo. Seguramente usted está pensando en realizar un curso o entrenamiento para los empleados… éste es el camino difícil, primero, seleccione herramientas intuitivas, simples; luego de los conocimientos. 4) Planificación y apoyo a la transición: Recuerde que un DRP óptimo es aquél que le permita automatizar la recuperación de los procesos más importantes de manera automática. Es muy probable que hoy no esté evaluando una situación de replicación o alta disponibilidad porque piensa que puede restaurar un servidor en unas pocas horas ante un problema. En el momento en que ocurre un desastre es probable que múltiples equipos y aplicaciones sufran daños, ¿podrá usted realizar manualmente la recuperación de todos los equipos en el tiempo que ahora prevé? Cuanto más automática sea la recuperación más tiempo para análisis y control tendrá; con esto podrá realizar acciones mucho más eficaces. 5) Implementación: Recuerde que todo proceso automático debe ser factible de transformarse en manual de manera fácil. Revise y organice todos los pasos previos a la recuperación de sus sistemas. 6) Gestión de pruebas: Todos los procedimientos tienen que ser medibles. Establezca cómo deberá testear sus herramientas, quién debe hacer las pruebas, y cuáles son los resultados que se esperan. También debe establecer qué debe hacerse ante los distintos resultados. Recuerde que las herramientas que soportan los planes de recuperación ante desastres deben ser flexibles y poder adaptarse con comodidad a los cambios que las compañías sufren día a día. El último punto a tener en cuenta en la conformación de su DRP es la operación del servicio. Aquí usted deberá trabajar sobre el monitoreo activo y pasivo de los servicios, el registro de eventos, incidencias, problemas, y acceso al servicio. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 11 Para finalizar recuerde trabajar la planificación de un DRP con la certeza de que un desastre sucederá, no planifique pensando que un desastre puede suceder. Esta forma de pensar lo expondrá críticamente ante la problemática. Marín N° 0586 – Providencia/ Mesa Central: +56 (2) 496 69 00 - Fax: +56 (2) 496 69 10 Ventas: [email protected] /Casilla de Reclamos: [email protected] 12
© Copyright 2025