Escalade d’alarmes

La gestion de l’infrastructure informatique est dynamique, des notifications et des alertes provenant de tous les points du réseau. Les défis auxquels fait face une équipe informatique peuvent évoluer rapidement, les administrateurs devant réagir sans délai à chaque problème ou congestion du réseau.

Outre l’alerte des administrateurs sur les problèmes à résoudre immédiatement, les alarmes en gestion de l'infrastructure informatique peuvent porter sur une baisse de performance, un prochain manque de ressources, des rappels de maintenance, etc. Il faut prêter attention à tous ces problèmes, mais leur importance varie. Il faut un mécanisme qui permet aux administrateurs de s’occuper des alarmes graves qui exigent une attention immédiate et une expertise, en écartant celles secondaires. Sans classification ni priorisation, les alarmes graves peuvent être ignorées, perdues parmi le nombre écrasant de notifications et d’alarmes émises tout au long de la journée. Évitez un chaos de l’infrastructure en identifiant et résolvant les alarmes graves à temps.

Analyse et alarmes dans OpManager Plus

OpManager Plus observe les erreurs ou les problèmes du réseau de l’infrastructure et en avise l’utilisateur ou l’administrateur par SMS ou courrier. L’onglet Alarmes d’OpManager Plus affiche un aperçu de toutes les alarmes, permettant de trier et filtrer selon des critères comme la gravité, le type d’appareil, le type d’alarme et l’heure d’arrivée. Un clic sur chaque alarme de la liste ouvre un écran de détails, avec l’élément concerné, l’état, l’événement à l’origine de l’alarme, les messages associés ou les entrées de journal. Des informations complètes sur l’alarme aide les administrateurs à mieux comprendre le problème pour une résolution efficace. OpManager Plus leur permet de confirmer chaque alarme et d’indiquer si le problème a été examiné et est en cours de traitement.

Rôle de l’escalade d’alarmes dans OpManager Plus

Si une alarme reste longtemps ignorée, il faut la remonter à l’administrateur, au manager ou l’affecter à l’équipe compétente. Par exemple, pour un site Web hébergé sur un serveur, une alarme grave signale que le serveur manque d’espace disque. L’alarme est envoyée à l’équipe d’ingénieurs informatiques. Toutefois, les ingénieurs ne parvenant pas à résoudre le problème dans un délai précis, l’alarme est remontée à un administrateur ou un manager. Après l’escalade, le manager peut rapidement répondre au problème en contactant l’hébergeur et achetant de l’espace disque supplémentaire sur le serveur.

L’escalade d’alarmes dans OpManager Plus commence par l’ajout de règles d’escalade. On peut préciser tous les détails dans les règles, ajouter les coordonnées de ceux à aviser et définir le délai dans lequel résoudre le problème.

Les administrateurs peuvent passer à l’identification de la cause en analysant les journaux et isolant l’entrée exacte susceptible d’avoir provoqué l’émission de l’alarme. OpManager Plus facilite l’analyse de la cause première et la corrélation avec ses outils d’observabilité.

L’onglet Alarmes d’OpManager Plus fournit un centre de contrôle pour analyser, gérer et répondre aux alarmes que génère l’infrastructure, permettant à la DSI de remédier de façon proactive aux problèmes et d’assurer la haute disponibilité, l’intégrité globale et la performance de l’environnement.

En savoir plus sur OpManager Plus.

Section vidéo
OpManager Customer Videos
Altaleb Alshenqiti - Ministère de la garde nationale - Affaires de santé
  
  •  Administrateur informatique de " Royal flying doctor service ", Australie
     Jonathan, client de ManageEngine
  •  Michael - Réseau et technologie, client de ManageEngine
     Altaleb Alshenqiti - Ministère de la garde nationale - Affaires de santé
  •  David Tremont, directeur associé d'Infrastructure, États-Unis
     Todd Haverstock Directeur administratif
  •  Donald Stewart, directeur informatique de Crest Industries
     John Rosser, responsable MIS - Yale Chase Equipment & Services