Los términos incidente y problema suenan parecidos, pero juegan roles distintos en la ITSM. En la gestión de incidentes, un incidente se refiere a una interrupción no planificada de un servicio o de un componente de la infraestructura de TI. Por ejemplo, un problema de inicio de sesión en una aplicación debido a una actualización defectuosa del código es un incidente, y el proceso que se lleva a cabo para restablecer el funcionamiento normal de la aplicación es la gestión de incidentes.
La gestión de problemas consiste en determinar la causa de un incidente y eliminar el posible cuello de botella. Por ejemplo, si un equipo de TI observa una tendencia de incidentes recurrentes por la ralentización de la aplicación, esto se califica como un problema. El equipo de TI profundiza en los logs de la aplicación para encontrar los interbloqueos frecuentes de la base de datos y los errores de tiempo de espera de las consultas durante las horas pico de uso.
Tras el análisis inicial, el equipo descarta la latencia de la red como posible problema principal. Tras realizar un RCA exhaustivo utilizando métodos como los cinco porqués y los diagramas de espina de pescado, el equipo de TI descubre que las consultas de SQL en un módulo de elaboración de informes recién construido están escritas de forma ineficaz. A continuación, el equipo de TI implementa una corrección permanente optimizando el código y utilizando vistas materializadas para los datos a los que se accede con frecuencia, reduciendo así la carga del módulo de elaboración de informes durante las horas pico de uso.