cortes no planificados ocurren por varias razones. A veces, el error humano es el culpable , como cuando alguien desenchufa accidentalmente el servidor y provocar un fallo . Otras veces hay un problema ambiental , como un incendio o un mal funcionamiento del aire acondicionado. Además , los fallos de hardware o software puede causar sistemas se bloquee , lo que requiere horas de tiempo para restablecer las operaciones . El impacto de estos cortes puede variar de leve a grave, dando lugar a cortes de tácticas o desastres en toda regla .
Evaluar la
Evaluación de daños Daños es una prioridad en la prioridad lista , ya que es necesario conocer el alcance de los daños a fin de saber qué hacer a continuación . Si el problema es una falla de aire acondicionado la interrupción sólo puede durar un par de horas . Por otro lado, si se ha producido un incendio en el centro de datos , usted podría estar en medio de un esfuerzo de recuperación fuera del sitio. Conocer la magnitud de los daños le ayuda a determinar el alcance de los esfuerzos de recuperación requerida, así como el tiempo de inactividad previsto.
Determinar el tiempo de inactividad potencial
Si su empresa ha sufrido un corte de táctica , como una unidad de fallo en el servidor , es posible que sólo sea por unas pocas horas , mientras que la sustitución se ha instalado y se restaura cualquier dato . Si su centro de datos ha experimentado un desastre que requiere la reubicación, lo que obviamente se traducirá en un período de tiempo de inactividad más largo. La determinación del tiempo de inactividad estimado es importante para la alta gerencia en la determinación de qué comunicar a quién y cómo programar los recursos humanos.
Comunicar la situación
El alcance de la interrupción y el tiempo de inactividad potencial debe ser comunicada a la alta dirección lo más pronto posible , para que puedan comenzar a tomar decisiones cruciales que pueden implicar la existencia de la empresa. La mayoría de las compañías que incurran en un desastre catastrófico y sin un plan de recuperación en su lugar se queden sin trabajo en dos años. Parte del plan de recuperación es un plan de comunicación que cubre a los empleados y el público , y determina quién está autorizado a comunicar qué a quién .
Recuperar el sistema
Una vez que han evaluado y comunicado la situación, y se han tomado decisiones sobre la estrategia de recuperación , es el momento de recuperar el sistema. En el caso de un fallo de hardware de menor importancia puede ser tan simple como encender el servidor de nuevo y la educación de las aplicaciones. En un verdadero desastre puede significar mudarse por un período de tiempo, recuperar el sistema en un lugar caliente de la recuperación, y la planificación de una vuelta al centro de operaciones originales. El alcance de los esfuerzos de recuperación depende de la magnitud de la interrupción , y un buen plan de recuperación es esencial para un retorno suave a las operaciones de cortes menores y mayores .