¡No se deje llevar por el pánico! 10 formas de gestionar incidentes de TI mayores
6 de enero · lectura de 4 minutos

Los incidentes deben evaluarse según su urgencia, impacto y gravedad
Para muchos departamentos de TI, la reacción predeterminada ante un incidente mayor es pasar al modo de extinción de incendios. Así que aquí tiene diez pasos de buenas prácticas para resolver incidentes mayores, sin tener que entrar en pánico.
Primer paso: Distinga entre incidentes de alta prioridad e incidentes mayores
Un incidente mayor es cualquier problema que tenga un gran impacto en el negocio en varios usuarios y obligue a una organización a desviarse de los procesos existentes de gestión de incidentes.
Sin unas directrices de ITSM claras, los incidentes de alta prioridad suelen identificarse erróneamente como incidentes mayores. Para evitar confusiones, distinga entre incidentes de alta prioridad e incidentes mayores basándose en factores como la urgencia, el impacto y la gravedad.
Segundo paso: disponga de flujos de trabajo claros y separados para los incidentes mayores
Para restablecer rápidamente un servicio interrumpido, implemente un proceso sólido con flujos de trabajo separados para los incidentes mayores.
Céntrese en automatizar y simplificar los procesos, incluyendo: Identificación del incidente mayor; comunicación con el personal afectado o las partes interesadas de la empresa; asignación del personal adecuado; control del incidente mayor a lo largo de su ciclo de vida; escalamiento en caso de incumplimiento de los SLA; resolución y cierre, así como generación y análisis de informes...
Para garantizar una resolución lo más rápida posible, adopte un proceso sin aprobación para resolver incidentes mayores.
Tercer paso: Consiga el mejor equipo para el trabajo
Garantice que sus mejores recursos trabajen en incidentes mayores con roles y responsabilidades claramente definidas. Algunas organizaciones cuentan con un equipo especializado en incidentes mayores dirigido por un gestor de incidentes mayores, mientras que otras tienen un equipo dinámico y ad hoc que cuenta con expertos de varios departamentos.
Su principal objetivo debe ser mantener sus recursos involucrados y evitar conflictos de tiempo y prioridades.
Cuarto paso: Capacite y equipe al personal con las herramientas adecuadas
Nadie puede predecir cuándo se producirá un incidente mayor de TI. Sin embargo, el primer paso para manejarlo es estar preparado. Divida su equipo de gestión de incidentes mayores en subequipos y capacítelos en la gestión de incidentes mayores. Asigne responsabilidades correlacionando las competencias con los requisitos.
Realice pruebas de simulación de forma periódica para identificar los puntos fuertes, evaluar el rendimiento y subsanar las deficiencias según sea necesario. Esto también ayudará a su equipo a hacer frente al estrés y a estar preparado cuando se enfrente a escenarios en tiempo real.
Proporcione a su equipo las herramientas adecuadas, como smartphones y tabletas con conectividad eficiente, para que puedan trabajar desde cualquier lugar durante una emergencia.
Quinto paso: Siga los SLA predefinidos con un recurso adicional en espera
Defina unos SLA estrictos para los incidentes mayores. Establezca SLA de respuesta y resolución independientes con puntos de escalamiento claros para cualquier incumplimiento del proceso. Siga un proceso de escalamiento manual si el técnico asignado carece de la experiencia necesaria para resolver el incidente y garantice que siempre haya disponible un técnico de reserva.
Sexto paso: Mantenga informadas a las personas pertinentes
A lo largo del ciclo de vida de los incidentes mayores, envíe anuncios, notificaciones y actualizaciones de estado a las partes interesadas pertinentes. Los anuncios en el portal de autoservicio evitarán que los usuarios finales generen tickets duplicados y sobrecarguen la mesa de ayuda.
Igualmente, envíe actualizaciones cada hora o cada dos horas durante un periodo de inactividad del servicio provocado por incidentes mayores. Disponga de una línea específica para responder inmediatamente a los incidentes mayores y ofrecer apoyo a las partes interesadas. Utilice los medios de comunicación más rápidos, como las llamadas telefónicas, las visitas directas, el chat en tiempo real y el desktop de control remoto, en lugar de depender del correo electrónico.
Séptimo paso: Revise los incidentes mayores para evitar que se repitan en el futuro
Una vez resuelto un incidente mayor, realice un análisis de la causa raíz utilizando métodos de gestión de problemas. Luego, implemente cambios en toda la organización para evitar que vuelvan a producirse incidentes similares en el futuro siguiendo el proceso de gestión de cambios.
Acelere todo el proceso de gestión de incidentes, problemas y cambios proporcionando información detallada sobre los activos implicados mediante la gestión de activos.
Octavo paso: Añada información sobre incidentes mayores a su base de conocimientos
Formule plantillas sencillas de artículos de la base de conocimientos que recopilen los detalles críticos. Estos pueden incluir el tipo de incidente mayor al que se refiere el artículo, el último problema resuelto utilizando el artículo, el propietario del artículo y los recursos necesarios para implementar la solución. Cree y controle las soluciones por separado para los incidentes mayores, de modo que pueda acceder a ellas rápidamente con poco esfuerzo.
Noveno paso: Revise e informe sobre los incidentes mayores
Documente y analice todos los incidentes mayores para poder identificar las áreas de mejora. Esto ayudará a su equipo a gestionar eficientemente problemas similares en el futuro. Además, genere informes específicos sobre incidentes mayores para su análisis, evaluación y toma de decisiones.
Estos pueden incluir: El número de incidentes mayores generados y cerrados cada mes; el tiempo medio de resolución de incidentes mayores; el porcentaje de tiempo de inactividad, la causa de los incidentes mayores y los problemas y cambios relacionados con incidentes mayores.
Décimo paso: Evalúe los procesos de incidentes mayores para la mejora continua del servicio
Es una buena práctica documentar los procesos y flujos de trabajo relativos a incidentes mayores para que puedan ser consultados por el departamento de TI y otras partes interesadas del negocio. Esto podría incluir detalles como el número de personal implicado, sus roles y responsabilidades, los canales de comunicación, las herramientas utilizadas para la corrección, los flujos de trabajo de aprobación y escalamiento y la estrategia general, junto con las métricas de referencia para la respuesta y la resolución.
La dirección debe evaluar periódicamente los procesos para comprobar si se alcanzan los niveles de rendimiento previstos en la gestión de incidentes mayores. Esto debería ayudar a rectificar los fallos y contribuir a la mejora continua del servicio.
Este artículo se publicó originalmente en Information Age.