Trois métriques de service clés que chaque administrateur réseau doit surveiller

Les administrateurs ont pour mission première d’assurer la disponibilité du réseau, sans nuire à sa performance. Toutefois, les solutions à déployer modernes se répandant dans l’architecture réseau classique, la tâche s’avère ardue. Bien que les solutions modernes marquent un net progrès par rapport à celles anciennes en termes d’efficacité, elles présentent aussi leurs propres difficultés de gestion. Les administrateurs doivent surmonter ces difficultés tout en évitant les interruptions réseau, ce qui exige une vigilance constante.

Leur effort pour maintenir le bon fonctionnement implique de mesurer l’efficacité du réseau. C’est alors qu’interviennent trois métriques clés. Ces métriques aident les administrateurs à mieux comprendre la gestion des incidents. En les optimisant, les administrateurs assurent une haute disponibilité de leur matériel. Les trois métriques de service sont :

  1. Temps moyen entre défaillances (MTBF)
  2. Temps moyen de bon fonctionnement (MTTF)
  3. Temps moyen de réparation/résolution (MTTR)

Service Metrics

Temps moyen entre défaillances (MTBF)

Dans n’importe quel réseau, l’indisponibilité d’un appareil peut avoir de graves effets, notamment des interruptions. Toute interruption réseau risque de perturber les services métier, pénalisant les revenus de l’entreprise.

Outre les pertes financières, les interruptions nuisent à la réputation, ce qu’il faut éviter. Il s’avère donc important de s’assurer que les réseaux, ainsi que les appareils associés, restent disponibles et fonctionnent de façon optimale. Le MTBF est un métrique qui aide les administrateurs à connaître la fréquence à laquelle un appareil subit une défaillance, ainsi que le temps moyen pour rétablir son fonctionnement.

Mode de calcul du MTBF

Le MTBF est la durée moyenne entre deux défaillances consécutives. En général, on peut le calculer en prenant le jeu de données de la période à analyser, puis en divisant la disponibilité de l’appareil durant cette période par le nombre de défaillances.

Par exemple, considérons un routeur d’un réseau d’entreprise qui subit quatre défaillances dans une période de 24 heures, d’une heure chacune. Sa disponibilité atteint alors 20 heures, car la période de 24 heures affiche quatre heures d’arrêt. Le MTBF se calcule donc ainsi :

MTBF = disponibilité totale / nombre de défaillances = 20/4 = 5

Comment réduire le MTBF

  • Création et mise en place d’un plan d'urgence efficace, pour minimiser l’impact des interruptions.
  • Exécution d’une analyse de la cause première, pour mieux comprendre l’origine du problème actuel.
  • Analyse proactive, pour anticiper les défaillances d’appareil et les interruptions.

Temps moyen de bon fonctionnement (MTTF)

Des problèmes fréquents des appareils du réseau constituent assurément un souci à cause de l’effet sur sa performance globale. Cette situation n’est pas souhaitable, car elle affecte la performance du réseau tout en créant un risque d’interruption si on ne règle pas le problème. C’est alors qu’intervient le MTTF. Le MTTF est un métrique qui permet aux administrateurs de comprendre le temps moyen s’écoulant avant la défaillance d’un appareil. Ce métrique sert à déterminer s’il faut remplacer ou réparer un appareil. Un MTTF élevé peut indiquer que l’appareil demande un remplacement fréquent à intervalles réguliers, ce qu’il faut éviter. Cela entraîne une perte de temps et de ressources dont pourraient profiter d’autres aspects vitaux du réseau.

Mode de calcul du MTTF

Le MTTF est le temps moyen entre des cas de problème d’un appareil. On peut le calculer en divisant la somme des heures de service de chaque appareil par le nombre d’appareils.

Par exemple, considérons quatre routeurs. Les appareils A, B, C et D fonctionnent pendant 10, 12, 14 et 16 heures respectivement, avant de tomber en panne. Le MTTF se calcule donc ainsi :

MTTF = Nombre total d’heures de service / nombre total d’appareils = (10 + 12 + 14 + 16) / 4 = 52 / 4 = 13

Comment améliorer le MTBF

  • Analyse en temps réel des périphériques réseau pour signaler l’apparition d’éventuels goulots.
  • Achat de composants de haute qualité, durables et fiables.
  • Exécution de contrôles périodiques des appareils, notamment pour ceux sensibles.

Temps moyen de réparation (MTTR)

Il faut éviter les interruptions réseau, car elles affectent le fonctionnement quotidien de l’entreprise, mais nuisent aussi à la réputation et l’image de marque aux yeux des clients. Bien que les interruptions réseau puissent s’avérer désastreuses et que les équipes I/O doivent tout faire pour les prévenir, elles doivent aussi pouvoir les gérer et y remédier aussi vite que possible pour atténuer l’ampleur des dommages. Le MTTR est un métrique permettant aux administrateurs de savoir à quelle rapidité les équipes I/O tendent à répondre à des risques imminents et sert donc à évaluer leur degré de préparation.

Mode de calcul du MTTR

Le MTTR est le temps moyen pris pour corriger le problème d’un appareil, de la réception d’une alerte au moment où il fonctionne de nouveau.

Par exemple, considérons un routeur qui connaît quatre incidents en une semaine, entraînant une interruption réseau totale de deux heures. Le MTTR serait alors de 30 minutes par incident.

Comment réduire le MTTR

  • Utilisation d’une analyse réseau proactive qui informe les équipes I/O des interruptions de service à venir bien avant leur survenue.
  • Distinction des rôles, des responsabilités et du champ des techniciens pour minimiser la mauvaise communication.
  • Définition claire d’une procédure opératoire standard et mise en place pour son suivi en cas de problème.
  • Intégration de la solution d’analyse réseau aux outils ITSM concernés pour que chaque alerte atteigne la bonne personne, au moment utile, via le bon canal.

Rôle d’OpManager pour améliorer ces métriques afin d’obtenir un réseau pérenne

ManageEngine OpManager est une solution d’analyse réseau complète qui permet aux administrateurs de suivre leur réseau tout en évitant les interruptions et éliminant les angles morts. Ils disposent d’un suivi détaillé du réseau et maintiennent une intégrité et une efficacité optimales des appareils. OpManager, avec ses extensions et ses intégrations performantes, permet aux administrateurs de recevoir des alertes instantanées lorsqu’un problème apparaît.

Optimizing Service Metrics using ManageEngine OpManager

OpManager offre les fonctions suivantes pour améliorer le MTTF tout en réduisant le MTBF et le MTTR.

Recherche intelligente : OpManager, avec sa fonction de recherche intelligente, permet aux administrateurs de recenser automatiquement les appareils. De plus, OpManager permet aux administrateurs de planifier des contrôles d’inventaire à intervalles réguliers, selon le besoin. En savoir plus.

Seuils adaptatifs : la configuration manuelle de seuils après l’évaluation détaillée des données historiques d’un appareil et des modèles d’utilisation actuels s’avère plus difficile qu’il n’y paraît. OpManager, avec sa fonction de seuils adaptatifs, permet aux administrateurs d’automatiser la configuration, allégeant donc leur tâche. En savoir plus.

Prévision des tendances de performance : OpManager permet aussi de prévoir les tendances de performance d’un appareil ou moniteur, facilitant la planification de la capacité par les administrateurs. En savoir plus.

Intégrations transparentes : OpManager est aussi compatible avec les principaux outils ITSM du marché. Les intégrations avertissent instantanément les administrateurs en cas de problème par courrier, SMS, enregistrement de tickets, etc. En savoir plus.

Visualisation avancée : OpManager offre aussi des fonctions de visualisation efficaces qui offrent un aperçu détaillé du réseau. Sa fonction de diagramme réseau automatique permet d’obtenir une connaissance complète du réseau, facilitant la planification et l’expansion. En savoir plus. En savoir plus.

Découvrez OpManager en détail ou téléchargez une version d’évaluation gratuite pour démarrer l’analyse réseau de nouvelle génération.

Avis de clients

OpManager
OpManager, 10 longueurs d’avance sur la concurrence, à un pas de devenir inégalé.
- Directeur des services réseau, organisme public
Rôle de l’évaluateur : Infrastructure et exploitation Taille de l’entreprise : Administration/SP/ED 5 000 à 50 000 employés
« Ma relation avec ManageEngine remonte à loin. Il a toujours manqué une ou deux fonctions à OpManager pour devenir vraiment le meilleur outil sur le marché, mais il reste le produit le plus complet et pratique. »
OpManager
Simple à déployer, facile à utiliser. Produit très intuitif.
- Ingénieur principal, services informatiques
Rôle de l’évaluateur : Architecture d’entreprise et innovation technologique Taille de l’entreprise : 250 à 500 millions de dollars
« ManageEngine offre un support bien utile et répond à toutes nos questions. »
OpManager
Déploiement facile avec un catalogue riche en fonctionnalités, support restant perfectible.
- Directeur NOC, services informatiques
Rôle de l’évaluateur : Gestion des programmes et des portefeuilles Taille de l’entreprise : 500 millions à 1 milliard de dollars
« ManageEngine nous a assisté dans la mise en œuvre et les phases du POC en offrant des licences d’évaluation. Les demandes fonctionnelles et les retours sont traités rapidement. Le support fourni est suffisant pendant la phase de déploiement. Après le déploiement, le support s’avère convenable, mais peut encore s’améliorer. »
OpManager
Excellent outil d’analyse
- CIO du secteur financier
Rôle de l’évaluateur : CIOTaille de l’entreprise : 1 à 3 milliards de dollars
« ManageEngine offre une suite d’outils qui ont amélioré la disponibilité de nos applications internes. L’analyse, la gestion et les alertes optimisent la performance de notre centre de données. »
OpManager
Facile à déployer, abordable et excellent support
- Chef d’équipe, services informatiques
Rôle de l’évaluateur : Infrastructure et exploitation TailleTaille de l’entreprise : 500 millions à 1 milliard de dollars
« Nous utilisons OpManager depuis 2011 et notre expérience globale s’avère excellente. L’outil joue un rôle vital pour assurer la qualité de service pour notre organisation et nos clients. Le support est de qualité, ses techniciens s’engageant pleinement à résoudre les problèmes. L’innovation ne s’arrête jamais et se traduit clairement par les nouvelles versions. »
 
 

Études de cas - OpManager

OpManager

Hinduja Global Solutions économise 3 millions de dollars par an avec OpManager

Secteur : IT

Hinduja Global Solutions (HGS) est un acteur indien de la gestion des processus métier (BPM) basé à Bangalore et appartenant au groupe Hinduja. HGS allie des solutions d’automatisation, d’analyse et des services informatiques axés sur les processus principaux.

OpManager

Un organisme de santé américain supervise ses périphériques réseau avec OpManager et Network Configuration Manager

Secteur : Santé

L’un des plus grands groupes du pays, avec une équipe comptant plus de 200 radiologistes certifiés, offre des services de radiologie sur site et d’interprétation à plus de 50 hôpitaux et cliniques spécialisées partenaires.

OpManager

Un fournisseur néerlandais de données immobilières évite les interruptions système grâce à OpManager et Firewall Analyzer

Secteur : Immobilier

Vabi est une entreprise néerlandaise qui fournit des données immobilières de qualité à tous. Depuis 1972, elle se spécialise dans la création de logiciels qui calculent la performance des bâtiments. Elle a aussi élargi son champ d’activité au-delà de son métier de base

OpManager

Actualité mondiale et médias

Secteur : Télécommunication et médias

Bonita utilise OpManager pour analyser son infrastructure réseau et éliminer les engorgements

OpManager

Bonita

Secteur : Entreprises et services

Bonita utilise OpManager pour analyser son infrastructure réseau et éliminer les engorgements

OpManager

Thorp Reed & Armstrong

Secteur : Administration locale

Randy S. Hollaway de Thorp Reed & Armstrong se fie à OpManager pour des alertes rapides et des rapports complets