Τελευταία ενημέρωση στις: June 16, 2020

Αυτός ο οδηγός θα σας βοηθήσει να κατανοήσετε ποια είναι τα μείζονα περιστατικά και να προετοιμάσετε τον οργανισμό σας να αντιμετωπίσει μείζονα περιστατικά αξιοποιώντας μια σαφώς προσδιορισμένη και σχεδιασμένη διαδικασία διαχείρισης μειζόνων περιστατικών.

  1. Διαχείριση μειζόνων περιστατικών: Μια επισκόπηση
  2. Τι είναι ένα μείζον περιστατικό;
  3. Τα τέσσερα στάδια ενός μείζονος περιστατικού
  4. Η διαδικασία διαχείρισης μειζόνων περιστατικών
    1. Αναγνώριση
    2. Περιορισμός
    3. Επίλυση
    4. Συντήρηση
  5. Διάγραμμα ροής διαδικασίας διαχείρισης μείζονος περιστατικού ITIL
  6. Ρόλοι και αρμοδιότητες διαχείρισης μείζονος περιστατικού
    1. Πίνακας RACI
  7. 5 συνήθη λάθη στη διαχείριση μειζόνων περιστατικών
  8. 5 βέλτιστες πρακτικές διαχείρισης μειζόνων περιστατικών
  9. Μετρικά και KPI διαχείρισης μειζόνων περιστατικών
  10. Σενάριο μειζόνων περιστατικών
  11. Γλωσσάρι
  12. Αποκτήστε δωρεάν πόρους ITSM

Διαχείριση μειζόνων περιστατικών: Μια επισκόπηση

Διαχείριση μειζόνων περιστατικών: Μια επισκόπηση

Είναι Δευτέρα πρωί και τα πράγματα φαίνονται αρκετά φυσιολογικά στο Service Desk σας. Ξαφνικά, λαμβάνετε ένα δελτίο ειδοποίησης ότι μια κρίσιμη υπηρεσία είναι εκτός λειτουργίας, και μέσα στα επόμενα 15 λεπτά αρχίζετε να λαμβάνετε πλήθος δελτίων τα οποία αναφέρουν το ίδιο πρόβλημα. Η αιτία θα μπορούσε να είναι ότι ο ιστότοπός σας είναι εκτός λειτουργίας, το λογισμικό σημείου πώλησης έχει πάψει να λειτουργεί ή κάτι ακόμη πιο εκτεταμένο, όπως πτώση στο χρηματιστήριο ή καθήλωση των αεροσκαφών. Όταν η επιχείρησή σας επηρεάζεται σημαντικά από ένα ζήτημα IT που προκαλεί απώλεια εσόδων ή/και φήμης, έχετε ένα μείζον περιστατικό στα χέρια σας.

Το πώς αντιδράτε σε ένα μείζον περιστατικό κάνει όλη τη διαφορά στην ελαχιστοποίηση του αντίκτυπου που έχει το περιστατικό καθώς και στην επαναφορά των υπηρεσιών. Όπως λένε, ο χρόνος είναι χρήμα, και σε αυτήν την περίπτωση, δεν θα μπορούσε να είναι πιο ταιριαστό. Εάν ο οργανισμός διαθέτει διαδικασία διαχείρισης μειζόνων περιστατικών (ΜΙΜ), μπορείτε να αποκριθείτε γρήγορα και να επιλύσετε μείζονα περιστατικά. Εάν δεν διαθέτετε μια τέτοια διαδικασία, ήρθε η ώρα να καταρτίσετε σχέδιο αντιμετώπισης έκτακτων περιστατικών, επίσης γνωστή ως διαδικασία απόκρισης σε μείζον περιστατικό.

Ο κίνδυνος ενός μείζονος περιστατικού είναι μεγαλύτερος από ποτέ, ενώ σύμφωνα με μελέτη της Information Technology Intelligence Consulting, το 98% των οργανισμών χάνουν τουλάχιστον 100.000 $ από μια ώρα διακοπής λειτουργίας. Αυτό ενισχύει τη σπουδαιότητα της δημιουργίας μιας διαδικασίας MIM, η οποία μπορεί μα αντιμετωπίσει αποτελεσματικά και αποδοτικά μείζονα περιστατικά.

Κάθε οργανισμός στοχεύει στην εξάλειψη μειζόνων περιστατικών, ωστόσο, στην ουσία, τα μείζονα περιστατικά είναι αδύνατο να αποφευχθούν τελείως και το μόνο που μπορείτε να κάνετε είναι να είστε προετοιμασμένοι γι’ αυτά.

Σε αυτόν τον οδηγό, θα εξετάσουμε πώς να ρυθμίσετε μια αποτελεσματική διαδικασία MIM, κοινά λάθη που μπορούν να επηρεάσουν τη MIM του οργανισμού σας και βέλτιστες πρακτικές για βελτίωση της διαδικασίας MIM.

Αλλά πρώτα, τι καθιστά ένα περιστατικό μείζον;

Τι είναι ένα μείζον περιστατικό;

Τι είναι ένα μείζον περιστατικό

Μείζον περιστατικό είναι ένα επείγον πρόβλημα υψηλού αντίκτυπου, το οποίο επηρεάζει συνήθως το σύνολο του οργανισμού ή ένα σημαντικό μέρος αυτού. Ένα μείζον περιστατικό οδηγεί σχεδόν πάντα στο να μην είναι διαθέσιμες οι υπηρεσίες ενός οργανισμού, γεγονός που πλήττει τις επιχειρηματικές δραστηριότητες του οργανισμού και τελικά επηρεάζει την οικονομική κατάστασή του. Υπάρχουν δύο τρόποι με τους οποίους μπορεί ένα μείζον περιστατικό να επηρεάσει τις υπηρεσίες ενός οργανισμού:

  • Αποτρέποντας την πρόσβαση πελατών σε υπηρεσίες του οργανισμού. Η διακοπή λειτουργίας του Cloudflare τον Ιούλιο του 2019 αποτελεί παράδειγμα του πώς επηρεάζονται οι πελάτες από ένα μείζον περιστατικό. Αυτή η μείζονα διακοπή επηρέασε σχεδόν το ήμισυ του Διαδικτύου και άφησε εκατομμύρια χρήστες του Διαδικτύου χωρίς πρόσβαση σε διάφορες υπηρεσίες.
  • Διακόπτοντας τη δυνατότητα των εργαζομένων να ολοκληρώσουν την εργασία τους εγκαίρως, οδηγώντας σε διακοπή των επιχειρηματικών δραστηριοτήτων. Η διακοπή λειτουργίας της IndiGo τον Νοέμβριο του 2019 επηρέασε τη διαδικασία check-in της αεροπορικής εταιρείας, με αποτέλεσμα μεγάλες καθυστερήσεις επηρεάζοντας χιλιάδες επιβάτες.

Ένα καλά προετοιμασμένο Service Desk είναι εξοπλισμένο για την αξιολόγηση μειζόνων περιστατικών και την εξεύρεση λύσεων ή επιλύσεων για μείωση και έλεγχο του αντίκτυπου ενός μείζονος περιστατικού.

Τα τέσσερα στάδια ενός μείζονος περιστατικού

Τα μείζονα περιστατικά θεωρείται πως έχουν τέσσερα στάδια, συγκεκριμένα:

Τα τέσσερα στάδια ενός μείζονος περιστατικού

Η διαδικασία διαχείρισης μειζόνων περιστατικών

Η διαδικασία MIM είναι απαραίτητη για τους οργανισμούς, καθώς τους βοηθά να ελαχιστοποιήσουν τον αντίκτυπο ενός μείζονος περιστατικού στις επιχειρηματικές δραστηριότητες. Η διαδικασία MIM αποτελείται κυρίως από τα ακόλουθα βήματα:

1. Αναγνώριση

Αναγνώριση

1. Αναγνώριση

Δήλωση του μείζονος περιστατικού:

Το πρώτο βήμα είναι η αναγνώριση πιθανών μειζόνων περιστατικών. Είναι σημαντικό για τους οργανισμούς να καθιερώσουν πολλαπλές μεθόδους αναγνώρισης απειλών. Μείζονα περιστατικά μπορούν να επισημανθούν από τεχνικούς όταν συναντούν ασυνήθιστα δελτία ή μπορούν να εντοπιστούν με λύσεις όπως εργαλεία εποπτείας δικτύου, τα οποία μπορούν να επισημάνουν αυτόματα ένα πρόβλημα δικτύου και να δημιουργήσουν δελτίο προς ενημέρωση του Service Desk. Οι οργανισμοί μπορούν επίσης να δημιουργήσουν μια ειδική γραμμή υποστήριξης για το προσωπικό του Service Desk, ώστε να επισημαίνουν ύποπτα μείζονα περιστατικά.

Ενημέρωση των ενδιαφερομένων:

Μόλις αναγνωριστεί ένα μείζον περιστατικό, πρέπει να κοινοποιηθεί σε όλους τους βασικούς ενδιαφερόμενους. Υπάρχουν τέσσερις κύριες ομάδες που πρέπει να ενημερωθούν για μείζονα περιστατικά:

  • Τεχνική ομάδα: Είναι σημαντικό να ενημερώσετε άμεσα την τεχνική ομάδα, ώστε να μπορέσει να αποφασίσει την πορεία δράσης για επίλυση του προβλήματος.
  • Διαχείριση: Η ενημέρωση της ανώτερης διοίκησης, όπως ο CIO, για μείζονα περιστατικά βοηθά στο να υπάρχει υπευθυνότητα. Οι οργανισμοί θα πρέπει επίσης να ενημερώνουν τη διοίκηση για όλα τα βήματα που έχουν γίνει για τη διόρθωση μειζόνων περιστατικών.
  • Βασικοί ενδιαφερόμενοι: Οι επικεφαλής τμημάτων και το προσωπικό διοίκησης επιχειρήσεων σε επίπεδο υπηρεσιών πρέπει επίσης να ενημερώνονται για μείζονα περιστατικά και να λαμβάνουν τακτικές ενημερώσεις για την κατάσταση.
  • Χρήστες: Οι χρήστες πρέπει να γνωρίζουν ποιες υπηρεσίες ενδέχεται να μην είναι διαθέσιμες λόγω ενός μείζονος περιστατικού.

2. Περιορισμός

Περιορισμός

2. Περιορισμός

Δημιουργία ομάδας μειζόνων περιστατικών:

Μια ομάδα μειζόνων περιστατικών, ή MIT για συντομία, απαρτίζεται από τεχνικούς, επικεφαλής διοίκησης σε επίπεδο υπηρεσιών και άλλους βασικούς ενδιαφερόμενους. Ορισμένες φορές ζητείται η συμμετοχή εξαιρετικά εξειδικευμένου εξωτερικού προσωπικού για την αντιμετώπιση ενός μείζονος περιστατικού. Η MIT συνεργάζεται για να βρει μια λύση στο μείζον περιστατικό και να αποκαταστήσει τις λειτουργίες.

Δημιουργία γέφυρας διάσκεψης:

Μια γέφυρα διάσκεψης, πιο γνωστή ως κλήση διάσκεψης, βοηθά στην αποτελεσματική αντιμετώπιση προβλημάτων και την κεντρική επικοινωνία. Λειτουργεί ως καθαρό και γρήγορο κανάλι επικοινωνίας μεταξύ των μελών της MIT.

Προετοιμασία ειδικής αίθουσας «πολέμου»:

Η ύπαρξη ειδικής αίθουσας «πολέμου» επιτρέπει σε όλα τα μέλη της MIT να συγκεντρωθούν και να αντιμετωπίσουν το περιστατικό. Αυτό αυξάνει τις προσπάθειες συνεργασίας, βοηθώντας τη MIT να βρει ταχύτερα μια λύση.

Δημιουργία δελτίου προβλήματος για αναγνώριση υποκείμενων ζητημάτων:

Ένα δελτίο προβλήματος μπορεί να δημιουργηθεί για να ανακαλύψετε και να κατανοήσετε τη βασική αιτία του μείζονος περιστατικού. Αυτό μπορεί να βοηθήσει στην αποτροπή παρόμοιων μειζόνων περιστατικών στο μέλλον, αντιμετωπίζοντας τις αιτίες του μείζονος περιστατικού.

3. Επίλυση

Επίλυση

3. Επίλυση

Εφαρμογή του σχεδίου επίλυσης ως αλλαγή:

Αποτελεί καλή πρακτική η εφαρμογή επιδιόρθωσης για το μείζον περιστατικό ως αλλαγή, ώστε να διασφαλίσετε ότι η επίλυση έχει τεκμηριωθεί και εφαρμοστεί κατάλληλα. Η εφαρμογή της επίλυσης ως αλλαγή ελαχιστοποιεί τον κίνδυνο κακότεχνης επίλυσης η οποία διακόπτει τη λειτουργία άλλων υπηρεσιών.

4. Συντήρηση

Συντήρηση

4. Συντήρηση

Εκτέλεση αναθεώρησης μετά την εφαρμογή:

Είναι σημαντικό να αποτιμήσετε το περιστατικό σε μια εκτεταμένη χρονική περίοδο, ώστε να βεβαιωθείτε πως έχει επιλυθεί πραγματικά. Εάν τα υποκείμενα ζητήματα παραμείνουν ανεπίλυτα, ενδέχεται να οδηγήσουν σε άλλο μείζον περιστατικό.

Δημιουργία σαφούς τεκμηρίωσης:

Η τεκμηρίωση της συνολικής διαδικασίας επίλυσης του μείζονος περιστατικού βοηθά τον οργανισμό να προετοιμαστεί για παρόμοια περιστατικά στο μέλλον. Με κατάλληλη τεκμηρίωση προηγούμενων περιστατικών, ο οργανισμός μπορεί να εφαρμόσει τη δοκιμασμένη και ελεγμένη λύση αμέσως, κάθε φορά που αντιμετωπίζει κάποιο άλλο παρόμοιο μείζον περιστατικό, μειώνοντας τον αντίκτυπό του.

Μέτρηση μετρικών:

Η μέτρηση της απόδοσης του Service Desk βοηθά στη μέτρηση της αποτελεσματικότητας του Service Desk και της διαδικασίας MIM. Κάποια σημαντικά μετρικά προς μέτρησης είναι ο μέσος χρόνος επιβεβαίωσης (MTTA), ο μέσος χρόνος επίλυσης (MTTR), ο συνολικός αριθμός μειζόνων περιστατικών και ο μέσος χρόνος διακοπής λειτουργίας για μείζονα περιστατικά.

Επιλέξτε όλα τα πλαίσια για αποτελεσματική διαδικασία διαχείρισης των μειζόνων περιστατικών

Διάγραμμα ροής διαδικασίας διαχείρισης μείζονος περιστατικού ITIL

Διάγραμμα ροής διαδικασίας διαχείρισης μείζονος περιστατικού ITIL

Ρόλοι και αρμοδιότητες διαχείρισης μείζονος περιστατικού

Ρόλοι και αρμοδιότητες διαχείρισης μείζονος περιστατικού

Ένα μείζον περιστατικό απαιτεί μια ειδική ομάδα προσωπικού για αντιμετώπιση και επίλυση του περιστατικού. Οι ρόλοι MIM περιλαμβάνουν:

Τεχνικοί Service Desk:

Οι τεχνικοί του Service Desk αποτελούν την πρώτη γραμμή άμυνας ενάντια σε μείζονα περιστατικά. Αναλύουν τα δελτία περιστατικών και τα προωθούν στον διαχειριστή περιστατικών. Οι τεχνικοί του Service Desk συμμετέχουν επίσης στην εφαρμογή των επιλύσεων.

Διαχειριστής μειζόνων περιστατικών:

Ο διαχειριστής μειζόνων περιστατικών είναι ο κάτοχος του μείζονος περιστατικού. Ο ρόλος του περιλαμβάνει τη δήλωση του περιστατικού ως μείζον περιστατικό και διασφάλιση της τήρησης της διαδικασίας MIM, καθώς επίσης ότι το περιστατικό επιλύεται το συντομότερο δυνατό. Ενεργεί ως κύριο σημείο επαφής για οποιαδήποτε πληροφορία σχετικά με το μείζον περιστατικό και διαχειρίζεται τη MIT.

MIT:

Η MIT αποτελεί εξειδικευμένη ομάδα η οποία είναι υπεύθυνη για την ανάλυση του μείζονος περιστατικού και τη διαμόρφωση σχεδίου δράσης για αντιμετώπιση της απειλής. Η MIT αποτελείται ιδανικά από τεχνικούς Service Desk, προσωπικό διαχείρισης σε επίπεδο υπηρεσιών, άλλους σχετικούς ενδιαφερόμενους και εξωτερικούς συμβούλους, εάν το απαιτεί η κατάσταση.

Τεχνικό προσωπικό:

Το εξειδικευμένο προσωπικό που είναι υπεύθυνο για τη συντήρηση της υποδομής και των λειτουργιών, όπως sysadmin, διαχειριστές δικτύου και προσωπικού ασφάλειας πληροφοριών, οι οποίοι απαρτίζουν το τεχνικό προσωπικό ενός οργανισμού. Το τεχνικό προσωπικό βοηθά στην αντιμετώπιση του μείζονος περιστατικού και είναι κυρίως υπεύθυνο για την εφαρμογή της επίλυσης του μείζονος περιστατικού.

Διαχειριστής αλλαγών:

Ο διαχειριστής αλλαγών είναι ο κάτοχος της αλλαγής που έχει δημιουργηθεί για την εφαρμογή της επιδιόρθωσης του μείζονος περιστατικού. Ο διαχειριστής αλλαγών αναλαμβάνει στο ακέραιο την κυριότητα του δελτίου αλλαγής και είναι υπόλογος γι’ αυτήν.

Διαχειριστής προβλημάτων:

Εάν δημιουργηθεί ένα πρόβλημα ως απόκριση στο μείζον περιστατικό, ο διαχειριστής προβλημάτων είναι ο κάτοχος του δελτίου προβλήματος. Ο διαχειριστής προβλημάτων επιχειρεί να εξακριβώσει τις βασικές αιτίες του περιστατικού και να εξασφαλίσει πως δεν θα συμβεί ξανά ή ότι ο οργανισμός είναι τουλάχιστον προετοιμασμένος για την επόμενη φορά που θα συμβεί το περιστατικό.

Εξωτερικοί σύμβουλοι ή ανεξάρτητοι προμηθευτές:

Σε ορισμένες περιπτώσεις, το μείζον περιστατικό μπορεί να απαιτεί εξαιρετικά εξειδικευμένο προσωπικό για να βοηθήσει στην κατανόηση και αντιμετώπιση του περιστατικού. Ο διαχειριστής μειζόνων περιστατικών προσδιορίζει το προσωπικό που απαιτείται και το προσθέτει στη MIT για να μειώσει τον αντίκτυπο του μείζονος περιστατικού.

Πίνακας RACI

Ένας πίνακας RACI ορίζει τις αρμοδιότητες των διαφόρων ενδιαφερομένων σε μια διαδικασία. Ο ακόλουθος πίνακας καθορίζει τους ρόλους και τις αρμοδιότητες των βασικότερων ενδιαφερομένων στο σύνολο της διαδικασίας MIM.

Διαδικασία/ρόλοι Τεχνικοί Service Desk Διαχειριστής μειζόνων περιστατικών MIT Τεχνικό προσωπικό Διαχειριστής αλλαγών Διαχειριστής προβλημάτων Εξωτερικοί σύμβουλοι
Αναγνώριση:
Δήλωση του μείζονος περιστατικού C A R C I I I
Ενημέρωση των ενδιαφερομένων C A R I I I I
Περιορισμός:
Δημιουργία της MIT I R/A C C I C I
Δημιουργία γέφυρας διάσκεψης I A R C I C I
Προετοιμασία ειδικής αίθουσας «πολέμου» I A R I I C I
Δημιουργία δελτίου προβλήματος για αναγνώριση υποκείμενων ζητημάτων I A R C I I I
Ανάλυση:
Εφαρμογή του σχεδίου επίλυσης ως αλλαγή I I I R A C C
Συντήρηση:
Εκτέλεση αναθεώρησης μετά την εφαρμογή I C I R A C I
Δημιουργία σαφούς τεκμηρίωσης C A R C C C C
Μέτρηση μετρικών I A R I I I C

* R - Υπεύθυνος, A - Υπόλογος, C - Σύμβουλος, I - Ενήμερος

5 συνήθη λάθη στη διαχείριση μειζόνων περιστατικών

5 συνήθη λάθη στη διαχείριση μειζόνων περιστατικών

Ακολουθούν 5 συνήθη λάθη που μπορούν να παρακωλύσουν τη διαδικασία MIM:

  1. Μη αυτόματη επικοινωνία και κλιμάκωση:

    Η μεγαλύτερη πρόκληση για τη MIM είναι με διαφορά η επικοινωνία. Σε περίπτωση μείζονος περιστατικού, διάφοροι ενδιαφερόμενοι πρέπει να ενημερώνονται για την κατάσταση του περιστατικού, τη σοβαρότητά του και ποια αντιμετώπιση προβλημάτων έχει γίνει για να επιλυθεί. Η μη αυτόματη επικοινωνία όλων αυτών είναι εξαιρετικά δύσκολη και μπορεί να οδηγήσει σε ασυνεπή επικοινωνία, η οποία να κάνει τα πράγματα χειρότερα. Αυτοματοποιώντας τη διαδικασία, οι βασικοί ενδιαφερόμενοι ενημερώνονται καθ’ όλη τη διάρκεια του κύκλου ζωής των δελτίων και ο διαχειριστής μειζόνων περιστατικών μπορεί να επικεντρώσει όλη την προσοχή του στην επίλυση του προβλήματος.

  2. Αναποτελεσματικά κανάλια αναφοράς μειζόνων περιστατικών:

    Κάθε Service Desk λαμβάνει δεκάδες ή και εκατοντάδες δελτία κάθε μέρα, από προβλήματα με φορητούς υπολογιστές έως αιτήσεις υπηρεσίας. Ανάμεσα σε αυτή τη στοίβα δελτίων, ενδέχεται να υπάρχουν και μερικά πιθανά μείζονα περιστατικά. Η μη δημιουργία ξεχωριστού καναλιού για αναφορά μειζόνων περιστατικών καθυστερεί τον εντοπισμό τους.

  3. Περιττή επανάληψη προσπαθειών:

    Η αποτυχία ανάθεσης εργασιών με οργανωμένο τρόπο μπορεί να προκαλέσει περιττή επανάληψη προσπαθειών εντός της MIT. Είναι σημαντικό να αναθέτετε εργασίες και να διατηρείτε τη MIT ενήμερη για το τι έχει ανατεθεί σε κάθε μέλος.

  4. Κακή τεκμηρίωση:

    Η έλλειψη κατάλληλης τεκμηρίωσης θα αναγκάσει τη MIT να ξεκινάει από την αρχή κάθε φορά που προκύπτει ένα παρόμοιο μείζον περιστατικό, με αποτέλεσμα καθυστερήσεις στην επίλυση μειζόνων περιστατικών και πρόκληση περιττής διακοπής λειτουργίας.

  5. Αποτυχία ανάλυσης της βασικής αιτίας:

    Όπως και με τη διαχείριση περιστατικών, η MIM μπορεί να στερείται διορατικότητας, καθώς πρωταρχικός στόχος της είναι να διορθώσει το πρόβλημα και να ξεκινήσει η λειτουργία των υπηρεσιών το συντομότερο δυνατό. Εάν δεν συνδυαστεί με διαχείριση προβλημάτων για αναγνώριση υποκείμενων ζητημάτων, η υποκείμενη αιτία ενός μείζονος περιστατικού θα συνεχίσει να καθιστά τον οργανισμό ευάλωτο σε μείζονα περιστατικά.

5 βέλτιστες πρακτικές διαχείρισης μειζόνων περιστατικών

5 βέλτιστες πρακτικές διαχείρισης μειζόνων περιστατικών

Εδώ θα βρείτε τους καλύτερους τρόπους για προσέγγιση της διαδικασία ΜΙΜ.

  1. Ενεργοποίηση πολλαπλών καναλιών για αναφορά μειζόνων περιστατικών:

    Όσον αφορά τον χειρισμό μειζόνων περιστατικών, ο χρόνος είναι ουσιαστικής σημασίας. Είναι ζωτικό για τους οργανισμούς να αναγνωρίζουν και να ταξινομούν μείζονα περιστατικά μόλις εντοπιστούν. Η προσφορά πολλαπλών τρόπων αναφοράς περιστατικών στους χρήστες θα κάνει τη διαδικασία πιο γρήγορη και πιο προσιτή. Μπορείτε να ενεργοποιήσετε τη δημιουργία δελτίων μέσω email ή μιας διαδικτυακής πύλης, ή ακόμη και να δημιουργήσετε μια ειδική γραμμή υποστήριξης για αναφορά ύποπτων μειζόνων περιστατικών. Η δημιουργία λογισμικού εποπτείας δικτύου για τον εντοπισμό ανωμαλιών μπορεί να σας βοηθήσει να αντιμετωπίσετε προληπτικά μείζονα περιστατικά.

  2. Αυτοματοποιήστε τις διαδικασίες του Service Desk:

    Η ταχύτητα και η αποτελεσματικότητα διαδραματίζουν καίριο ρόλο στον έλεγχο του αντίκτυπου ενός μείζονος περιστατικού και η αυτοματοποίηση διαφόρων διαδικασιών του Service Desk το επιτυγχάνει αυτό αποδεσμεύοντας τους τεχνικούς σας από επαναλαμβανόμενες εργασίες, όπως ειδοποίηση των ενδιαφερομένων. Η αυτοματοποίηση του συστήματος ειδοποιήσεων και η δημιουργία ροών εργασίας μειζόνων περιστατικών αποτελούν καλούς τρόπους αυτοματοποίησης των διαδικασιών του Service Desk για βελτίωση του χρόνου επίλυσης και δόμηση της διαδικασίας MIM.

  3. Προσπαθήστε για άμεση, σχετική επικοινωνία:

    Είναι σημαντικό να ενημερώνετε τη διοίκηση του οργανισμού σας και τους βασικούς ενδιαφερόμενους για κάθε μείζον περιστατικό. Η ενημέρωση της διοίκησης θα είναι χρήσιμη για τη λήψη των απαραίτητων εγκρίσεων και αδειών που απαιτούνται για επίλυση του μείζονος περιστατικού. Η έγκαιρη επικοινωνία εξασφαλίζει πως όλο το προσωπικό των μειζόνων περιστατικών έχει την ίδια ενημέρωση και επιτρέπει ομαλή, αποτελεσματική συνεργασία. Επίσης, κρατά ενήμερους τους τελικούς χρήστες για τυχόν διακοπή λειτουργίας, ώστε να μπορούν να προετοιμαστούν σχετικά.

  4. Δημιουργία σαφούς τεκμηρίωσης:

    Η σαφής τεκμηρίωση βοηθά τον διαχειριστή μειζόνων περιστατικών να καταγράψει όλο το έργο που έχει γίνει για επιδιόρθωση του μείζονος περιστατικού, του αντίκτυπού του, των επηρεαζόμενων υπηρεσιών, καθώς και άλλες βασικές πληροφορίες σχετικά με το μείζον περιστατικό. Η τεκμηρίωση αυτή είναι σημαντική ώστε να δείξει στη διοίκηση το πλεονέκτημα της ύπαρξης μιας διαδικασίας MIM, συμπεριλαμβανομένης της απόδοσης επένδυσης (ROI). Η σαφής τεκμηρίωση θα βοηθήσει επίσης με οποιοδήποτε παρόμοιο μείζον περιστατικό στο μέλλον.

  5. Αξιοποιήστε ενοποιήσεις αγοράς με το λογισμικό ITOM:

    Οι ισχυρές ενοποιήσεις με το λογισμικό ITOM επιτρέπουν στο τμήμα IT να διαχειρίζεται προληπτικά μείζονα περιστατικά. Η αντενεργή αναγνώριση μειζόνων περιστατικών βασίζεται στην εισροή δελτίων για ενεργοποίηση κόκκινης σημαίας όταν ένα μείζον περιστατικό βρίσκεται σε εξέλιξη. Από την άλλη μεριά, μια προληπτική διαδικασία MIM η οποία αξιοποιεί ενοποιήσεις ITOM διαθέτει συστήματα για την εποπτεία δικτύων και υπηρεσιών και μπορεί αυτόματα να επισημάνει ανωμαλίες που θα μπορούσαν να αποτελέσουν πιθανά μείζονα περιστατικά.

Μάθετε πώς να ρυθμίζετε τη δική σας διαδικασία βέλτιστης πρακτικής διαχείρισης μειζόνων περιστατικών

Μετρικά και KPI διαχείρισης μειζόνων περιστατικών

Σε ό,τι αφορά τη MIM, ακολουθούν ορισμένα σημαντικά μετρικά και KPI προς εξέταση.

KPI Τύπος Σχόλια
Μέσος χρόνος επίλυσης (MTTR) Ο μέσος χρόνος από τη στιγμή που ένα μείζον περιστατικό αναφέρεται, έως την επίλυσή του. Υποδηλώνει πόσο γρήγορα μπορεί το Service Desk να επιλύσει μείζονα περιστατικά. Ένας μικρότερος MTTR αποτελεί ένδειξη ότι η MIT είναι αποτελεσματική και αποδοτική.
Μέσος χρόνος επιβεβαίωσης (MTTA) Ο μέσος χρόνος για απόκριση σε ένα μείζον περιστατικό. Ένας μικρότερο MTTA αποτελεί ένδειξη ότι το Service Desk ανταποκρίνεται γρήγορα σε μείζονα περιστατικά.
Μέσος χρόνος μεταξύ αποτυχιών (MTBF) Ο μέσος χρόνος μεταξύ αποτυχιών. Υπολογίζεται διαιρώντας τον συνολικό χρόνο λειτουργίας με τον συνολικό αριθμό αποτυχιών. Υποδηλώνει την απόδοση των υποδομών IT σας. Ένας μεγαλύτερος MTBF αποτελεί ένδειξη ότι οι υποδομές IT σας έχουν καλή απόδοση.
Μέσος χρόνος εντοπισμού (MTTD) Ο μέσος χρόνος που απαιτείται για εντοπισμό μειζόνων περιστατικών ή ανωμαλιών. Μετρά πόσο γρήγορα εντοπίζεται ένα μείζον περιστατικό. Ένας μικρότερος MTTD αποτελεί ένδειξη ότι το Service Desk εντοπίζει γρήγορα μείζονα περιστατικά.
Ποσοστό αύξησης ή μείωσης μειζόνων περιστατικών Η ποσοστιαία αύξηση προβλημάτων στους επόμενους μήνες σε σχέση με τον πρώτο μήνα. Αυτό σας βοηθά να προσδιορίσετε τις τάσεις στην εμφάνιση μειζόνων περιστατικών.

Σενάριο μειζόνων περιστατικών

Σενάριο μειζόνων περιστατικών

Είναι σημαντικό να θυμάστε πως δεν αποτελούν όλα τα περιστατικά υψηλής προτεραιότητας μείζονα περιστατικά. Καθώς η διαδικασία MIM περιλαμβάνει σημαντική δέσμευση πόρων όπως η εφαρμογή μιας ξεχωριστής MIT, είναι σημαντικό να ταξινομηθούν προσεκτικά τα μείζονα περιστατικά.

Πηγή: https://blog.cloudflare.com/details-of-the-cloudflare-outage-on-july-2-2019/

Η διακοπή λειτουργίας του Cloudflare το 2019 αποτελεί καλό παράδειγμα του τι είναι ένα μείζον περιστατικό. Στην περίπτωση αυτή, μια τυποποιημένη διαδικασία λειτουργίας για ενημέρωσης ενός διαχειριζόμενου κανόνα για το τείχος προστασίας εφαρμογών ιστού (WAF) αύξησε τη χρήση των CPU που εξυπηρετούσαν την κυκλοφορία HTTP/HTTPS σε σχεδόν 100 τοις εκατό στους διακομιστές στο δίκτυο του Cloudflare. Η διακοπή που ακολούθησε είχε ως αποτέλεσμα μείωση της επισκεψιμότητας του Cloudflare σε ποσοστό 80%, επηρεάζοντας εκατομμύρια χρήστες του διαδικτύου σε όλο τον κόσμο.

Αντίκτυπος: Μεγάλος

Η διακοπή είχε ως αποτέλεσμα οι πελάτες του Cloudflare (και οι πελάτες τους) να βλέπουν μια σελίδα σφάλματος 502 όταν επισκέπτονταν οποιονδήποτε τομέα του Cloudflare. Τα σφάλματα 502 δημιουργήθηκαν από τους διακομιστές ιστού προσκηνίου του Cloudflare, οι οποίοι εξακολουθούσαν να διαθέτουν πυρήνες CPU, ωστόσο δεν μπορούσαν να φτάσουν τις διαδικασίες που εξυπηρετούσαν την κυκλοφορία HTTP/HTTPS. Υπολογίζεται ότι τουλάχιστον το ήμισυ του συνόλου του διαδικτύου δεν ήταν προσβάσιμο για τα είκοσι επτά λεπτά που διήρκεσε η διακοπή της λειτουργίας.

Επείγων χαρακτήρας: Υψηλός

Όλοι οι ιστότοποι του Cloudflare δεν ήταν προσβάσιμοι, προκαλώντας διακοπές υπηρεσιών για χιλιάδες οργανισμούς και εκατομμύρια χρήστες. Η διακοπή επηρέασε επίσης τις εσωτερικές λειτουργίες του Cloudflare, εμποδίζοντας τους εργαζομένους του Cloudflare να έχουν πρόσβαση σε διάφορες υπηρεσίες, όπως το εργαλείο διαχείρισης αλλαγών και ο πίνακας εσωτερικού ελέγχου της εταιρείας. Η διακοπή έπρεπε να αντιμετωπιστεί ώστε να συνεχιστούν οι λειτουργίες κανονικών υπηρεσιών.

Χρονοδιάγραμμα περιστατικών, από τον εντοπισμό μέχρι την επίλυση:

Ο διαχειριζόμενος κανόνας WAF εφαρμόστηκε στις 13:42. Τρία λεπτά αργότερα, τα εργαλεία λειτουργίας δικτύου του Cloudflare άρχισαν να σηματοδοτούν τη μείωση της κυκλοφορίας, πολλές άλλες πλήρεις δοκιμές των υπηρεσιών του Cloudflare άρχισαν να αποτυγχάνουν, οι τελικοί χρήστες παρατήρησαν πλήθος σφαλμάτων 502 και το Cloudflare έλαβε πολλές αναφορές περί εξάντλησης της CPU από τα σημεία παρουσίας του σε πόλεις ανά την υφήλιο.

Η ομάδα μηχανικής αξιοπιστίας του ιστότοπου, η ομάδα μηχανικής του Λονδίνου και άλλες σχετικές ομάδες ένωσαν τις δυνάμεις τους για να αντιμετωπίσουν προβλήματα και να βρουν μια επιδιόρθωση. Στις 14:00, ο WAF αναγνωρίστηκε ως αιτία του περιστατικού. Και στις 14:07, εφαρμόστηκε παγκόσμιος τερματισμός WAF για επαναφορά των κανονικών επιπέδων κυκλοφορίας.

Μέχρι τις 14:52, το Cloudflare ήταν 100% ικανοποιημένο από το γεγονός ότι κατανόησε την αιτία της διακοπής λειτουργίας και είχε στα χέρια του μια επιδιόρθωση, οπότε και ο WAF επανενεργοποιήθηκε σε παγκόσμιο επίπεδο.

Γλωσσάρι

Γλωσσάρι

Αλλαγή:

Η προσθήκη, τροποποίηση ή αφαίρεση οτιδήποτε μπορεί να έχει άμεση ή έμμεση επίδραση στις υπηρεσίες.

Διαχείριση αλλαγών:

Η διαδικασία ολοκλήρωσης αλλαγών με ελάχιστες διακοπές και διενέξεις.

Κλιμάκωση:

Η πράξη μεταβίβασης κυριότητας ενός δελτίου βάσει μιας λειτουργικής ή ιεραρχικής ανάγκης.

Συμβάν:

Ένα περιστατικό το οποίο είναι σημαντικό για τη διαχείριση μιας υπηρεσίας ή ενός περιουσιακού στοιχείου.

Αποτυχία:

Ένα περιστατικό όπου μια υπηρεσία ή ένα περιουσιακό στοιχείο δεν λειτουργεί σύμφωνα με το συμφωνημένο SLA.

Ιεραρχική κλιμάκωση:

Η μεταβίβαση της κυριότητας με κάθετο τρόπο σε τεχνικό Service Desk ή σχετική αρχή υψηλότερης βαθμίδας.

Αντίκτυπος:

Μέτρηση της σοβαρότητας ενός περιστατικού.

Περιστατικό:

Μια μη προγραμματισμένη διακοπή σε μια υπηρεσία IT ή μείωση της ποιότητας μιας υπηρεσίας IT. Η αποτυχία ενός στοιχείου ρύθμισης παραμέτρων, ακόμη και αν δεν έχει επηρεάσει ακόμη μια υπηρεσία, αποτελεί και αυτή περιστατικό (π.χ. αποτυχία ενός δίσκου από ένα σύνολο κατοπτρικών τόμων).

Διαχείριση περιστατικών:

Η διαδικασία διαχείρισης του κύκλου ζωής όλων των περιστατικών για αποκατάσταση των λειτουργιών κανονικής υπηρεσίας όσο το δυνατόν γρηγορότερα και ελαχιστοποίηση του αντίκτυπου στις επιχειρηματικές δραστηριότητες.

Προτεραιότητα περιστατικών:

Ανάθεση προτεραιοτήτων σε περιστατικά και καθορισμός του τι αποτελεί μείζον περιστατικό.

Μείζον περιστατικό:

Ένα περιστατικό με υψηλό αντίκτυπο και επείγοντα χαρακτήρα, το οποίο απαιτεί ξεχωριστή διαδικασία από τη διαχείριση περιστατικών.

Διαχειριστής μειζόνων περιστατικών:

Το άτομο που είναι υπεύθυνο για τη MIT και την εφαρμογή της διαδικασίας MIM.

Μέσος χρόνος επιβεβαίωσης (MTTA):

Μέτρηση του πόσο γρήγορα επιβεβαιώνεται ένα περιστατικό από το Service Desk.

Μέσος χρόνος εντοπισμού (MTTD):

Μέτρηση του πόσο γρήγορα εντοπίζεται μια πιθανή απειλή σε μια υπηρεσία ή ένα στοιχείο διαμόρφωσης.

Μέσος χρόνος μεταξύ αποτυχιών (MTBF):

Μέτρηση του πόσο συχνά αποτυγχάνει μια υπηρεσία ή ένα περιουσιακό στοιχείο.

Μέσος χρόνος επισκευής/επίλυσης/απόκρισης/ανάκτησης (MTTR):

Μέτρηση του πόσο γρήγορα αποκαθίσταται μια υπηρεσία μετά από αποτυχία.

Λειτουργία κανονικής υπηρεσίας:

Μια λειτουργία υπηρεσίας που συμμορφώνεται με τη συμφωνία επιπέδου υπηρεσιών (SLA).

Πρόβλημα:

Αιτία ή πιθανή αιτία ενός ή περισσότερων περιστατικών.

Πίνακας RACI:

Ορίζει τους ρόλους και τις αρμοδιότητες σε διαλειτουργικά ή διατμηματικά έργα και διαδικασίες.

Service Desk:

Το σημείο επικοινωνίας μεταξύ των παρόχων υπηρεσιών και των χρηστών του οργανισμού.

Διαχειριστής Service Desk:

Αυτός που επιβλέπει τις καθημερινές δραστηριότητες του Service Desk και είναι υπεύθυνος για την απόδοσή του.

Στόχος επιπέδου υπηρεσίας (SLO):

Ορίζει τον στόχο των παρόχων υπηρεσιών και αποτελεί μέσο μέτρησης της απόδοσής τους.

SLA:

Συμφωνία μεταξύ του παρόχου υπηρεσιών και του πελάτη, σχετικά με το αναμενόμενο επίπεδο υπηρεσίας και τον αναμενόμενο χρόνο παράδοσης.

Επείγων χαρακτήρας:

Μέτρηση του πόσο γρήγορα πρέπει να επιλυθεί ένα περιστατικό.

Ανακαλύψτε διαφορετικούς τρόπους με τους οποίους η ITSM μπορεί να ενισχύσει πραγματικά τις επιχειρηματικές λειτουργίες σας.

Τώρα που σας παρουσιάσαμε τα μείζονα περιστατικά και πώς να ρυθμίζετε τη διαδικασία MIM, είναι επίσης σημαντικό να εφαρμόσετε μια ακέραιη διαδικασία διαχείρισης περιστατικών, ώστε να εξοπλίσετε το Service Desk του οργανισμού σας για να διαχειρίζεται τόσο κανονικά όσο και μείζονα περιστατικά. Κατεβάστε το δωρεάν αντίγραφο του εγχειριδίου διαχείρισης περιστατικών και τους άλλους πόρους ITSM.

  • Εγχειρίδιο διαχείρισης περιστατικών

    Εγχειρίδιο διαχείρισης περιστατικών

  • Το έξυπνο βιβλίο για πιο ευφυή ITSM

    Το έξυπνο βιβλίο για πιο ευφυή ITSM

  • Εγχειρίδιο των ηρώων της ITIL

    Εγχειρίδιο των ηρώων της ITIL

 
Κάνοντας κλικ στο ‘Αποκτήστε δωρεάν πόρους ITSM', συμφωνείτε να γίνει επεξεργασία των προσωπικών δεδομένων σας σύμφωνα με την Πολιτική προστασίας προσωπικών δεδομένων.