Ultimo aggiornamento il: September 19, 2019
La gestione degli incidenti informatici è uno dei processi fondamentali dell’help desk. In questa guida, si apprenderanno le nozioni di base per la gestione degli incidenti, i suoi componenti, i ruoli e le responsabilità coinvolte e il funzionamento della gestione degli incidenti con altri componenti del service desk.
La presente guida alla gestione degli incidenti tratterà i seguenti argomenti:
Un incidente informatico è qualsiasi interruzione dei servizi informatici di un’organizzazione che influisce sul singolo utente o sull’intera azienda. In breve, un incidente è qualsiasi cosa che interrompe la continuità aziendale.
La gestione degli incidenti è il processo di gestione delle interruzioni del servizio informatico e di ripristino dei servizi secondo accordi sul livello di servizio (SLA) concordati.
La portata della gestione degli incidenti inizia con la segnalazione di un problema da parte di un utente finale e termina con un membro del team del service desk che risolve tale problema.
Se è in atto una corretta gestione degli incidenti, la raccolta delle informazioni relative agli incidenti è ottimizzata e meno caotica, senza che vi sia la necessità di uno scambio di e-mail, avanti e indietro, a tale scopo. I team del service desk possono pubblicare i moduli nel portale di gestione autonoma dell’utente per assicurare che tutte le informazioni pertinenti siano raccolte al momento della creazione del ticket.
La fase successiva della gestione degli incidenti è la categorizzazione e assegnazione della priorità dell’incidente. Questa fase non solo aiuta a ordinare i ticket ma anche ad assicurare che siano indirizzati ai tecnici, i più qualificati per lavorare sul problema. Inoltre, la categorizzazione dell’incidente aiuta il sistema di service desk ad applicare agli incidenti gli SLA più adatti e di comunicare tali priorità agli utenti finali. Una volta che un incidente è stato categorizzato e gli è stata assegnata la priorità, i tecnici possono diagnosticare l’incidente e fornire una risoluzione all’utente finale.
Se il processo di gestione degli incidenti viene attivato con le relative automazioni, i team del service desk possono controllare la conformità allo SLA e inviare notifiche ai tecnici quando una violazione dello SLA è vicina. Inoltre i tecnici hanno l’opzione di inoltrare ad un livello superiore eventuali violazioni degli SLA configurando escalation automatiche, se applicabili all’incidente. Dopo la diagnosi del problema, il tecnico offre all’utente finale una risoluzione, che può essere convalidata dall’utente finale stesso. Questo processo a più fasi assicura che qualsiasi problema informatico che influisce sulla continuità aziendale sia risolto al più presto possibile.
Gli incidenti in un ambiente informatico possono essere categorizzati in diversi modi. L’urgenza dell’incidente e la gravità del suo impatto sugli utenti o sull’attività in generale sono alcuni fattori che influenzano la categorizzazione. La classificazione e la categorizzazione degli incidenti informatici aiuta a identificare e indirizzare gli incidenti al giusto tecnico, risparmiando così tempo e risorse. Ad esempio, è possibile classificare gli incidenti come incidenti di entità minore o grave in base al loro impatto sull’attività e alla loro urgenza. Generalmente, gli incidenti di grave entità sono quelli che riguardano i servizi critici per l’attività, ovvero che influiscono sull’intera organizzazione e necessitano di risoluzioni immediate. Gli incidenti di minore entità, solitamente, hanno un impatto sul singolo utente o su un dipartimento e potrebbero già avere implementata una risoluzione documentata.
La gestione degli incidenti copre ogni aspetto di un incidente in tutto il suo ciclo di vita. Velocizza il processo di risoluzione e rende trasparente la gestione del ticket. Senza la gestione degli incidenti, la gestione dei ticket può essere difficoltosa. Alcuni dei problemi che possono verificarsi comprendono:
Sei alla ricerca di un modo per ottimizzare la gestione degli incidenti nella tua organizzazione?
Pianifica una dimostrazione di ServiceDesk PlusLe pratiche di gestione degli incidenti sono ampiamente utilizzate da parte dei team del service desk IT. Solitamente, i service desk sono l’unico punto di contatto per l’utente finale per segnalare problemi ai team di gestione informatica.
Il processo di gestione degli incidenti può essere riassunto come segue:
Sulla base del tipo di incidente, questi processi possono essere semplici o complessi e possono inoltre includere diversi flussi di lavoro e compiti oltre al processo di base descritto in precedenza.
È possibile registrare un incidente tramite telefonate, e-mail, SMS, moduli Web pubblicati sul portale di gestione autonoma o tramite messaggi di chat live.
È possibile suddividere gli incidenti in categorie e sotto-categorie sulla base dell’area di IT o attività nella quale l’incidente causa un’interruzione, quale rete, hardware, etc.
È possibile determinare la priorità di un incidente come una funzione del suo impatto e urgenza utilizzando una matrice di priorità. L’impatto di un incidente indica il livello di danno che il problema causerà all’utente o all’azienda. L’urgenza di un incidente indica il periodo di tempo entro il quale l’incidente dovrebbe essere risolto. La priorità degli incidenti può essere classificata come:
Una volta che l’incidente è stato categorizzato e gli è stato assegnato la priorità, viene indirizzato automaticamente ad un tecnico con le relative competenze.
In base alla complessità dell’incidente, può essere suddiviso in sotto-attività o compiti. Generalmente, i compiti sono creati quando la risoluzione dell’incidente richiede il contributo di più tecnici provenienti da diversi dipartimenti.
Durante l’elaborazione dell’incidente, il tecnico deve assicurarsi che lo SLA non sia violato. Un SLA è il tempo accettabile entro il quale un incidente ha bisogno di risposta (risposta SLA) o risoluzione (risoluzione SLA). Gli SLA possono essere assegnati agli incidenti sulla base dei loro parametri, quali categoria, richiedente, impatto, urgenza, etc. Nei casi in cui un SLA sta per essere violato o è già stato violato, è possibile inoltrare l’incidente ad un livello funzionale o gerarchico superiore per assicurare che sia risolto al più presto.
Un incidente è considerato risolto quando il tecnico ha elaborato una soluzione temporanea o una soluzione definitiva per il problema.
È possibile chiudere un incidente una volta che il problema è stato risolto e l’utente ha preso atto della risoluzione e ne è soddisfatto.
Dopo la chiusura di un incidente, è buona prassi documentare tutti i risvolti positivi tratti da tale incidente. Ciò aiuta a migliorare la preparazione dei team in caso di incidenti futuri e crea un più efficace processo di gestione degli incidenti. Il processo di revisione post-incidente può essere suddiviso in vari aspetti, come mostrato di seguito, ed è particolarmente utile per gli incidenti di grave entità.
Oltre ai fattori di cui sopra, è necessario valutarne altri che riguardano l’utente finale. A questo scopo, dopo la chiusura dell’incidente, viene condotto un sondaggio per raccogliere le opinioni degli utenti finali interessati dall’incidente. Tale sondaggio deve essere utilizzato per raccogliere informazioni in alcuni settori chiave, quali:
Costruisci un flusso di lavoro personalizzato per la gestione degli incidenti
Prova ServiceDesk Plus adessoSebbene ciascuna organizzazione possa avere i propri ruoli e responsabilità personalizzate, seguono alcuni dei ruoli più comuni coinvolti nella gestione degli incidenti informatici.
Si tratta del soggetto che solitamente subisce un’interruzione del servizio e che solleva un ticket dell’incidente per avviare il processo di gestione degli incidenti.
Si tratta del primo punto di contatto per i richiedenti quando desiderano sollevare una richiesta o un ticket dell’incidente. Generalmente, il service desk di livello 1 si compone da tecnici che hanno una conoscenza di base dei problemi più comuni che possono verificarsi in un ambiente informatico, compreso reimpostazione password e problemi di Wi-Fi.
Questo service desk si compone da tecnici con una conoscenza avanzata di gestione degli incidenti. Essi generalmente ricevono richieste più complesse da parte degli utenti finali. Inoltre ricevono le richieste che vengono inoltrate dal livello 1.
Generalmente questo livello si compone da tecnici specializzati che hanno una conoscenza avanzata di determinati settori dell’infrastruttura IT. Ad esempio, i tecnici della manutenzione hardware e assistenza al server sono specializzati in settori molto specifici.
Questo soggetto svolge un ruolo decisivo nel processo di gestione degli incidenti, ovvero ha la responsabilità, fra le altre cose, di monitorare l’efficacia del processo, consigliare miglioramenti e assicurare che il processo sia seguito.
Questo soggetto possiede il processo seguito per la gestione degli incidenti. Ha la responsabilità di analizzare, modificare e migliorare il processo per assicurare che gli interessi dell’organizzazione siano soddisfatti al meglio.
Ogni ruolo ha responsabilità uniche, come mostrato di seguito.
Le metriche che influiscono sulle decisioni importanti sono definite indicatori chiave di prestazione (KPI). Seguono alcuni dei KPI per una gestione efficace degli incidenti informatici.
Il tempo medio impiegato per risolvere un incidente.
Il tempo medio impiegato per rispondere a ogni incidente.
La percentuale degli incidenti risolti all’interno di un SLA.
La percentuale di incidenti risolti nella prima chiamata.
Il numero di incidenti identici registrato entro un intervallo di tempo specifico.
La percentuale di incidenti risolti che sono stati riaperti.
Il numero di incidenti che sono in attesa in coda senza una risoluzione.
Il numero di incidenti di grave entità confrontato con il totale degli incidenti.
La spesa media relativa a ciascun ticket.
Il numero di utenti finali o clienti che sono rimasti soddisfatti con i servizi informatici a loro erogati.
Se è in atto un corretto processo di gestione degli incidenti ITIL, è possibile:
Nella scelta di un software per il sistema di gestione dei ticket o l’help desk IT, ci sono alcune caratteristiche che possono fare la differenza nella gestione degli incidenti informatici. Ecco alcune delle caratteristiche da valutare nella scelta del software di gestione degli incidenti:
Ottieni il tuo proprio software di gestione degli incidenti ITIL
Inizia adesso il periodo di prova gratuitoLa gestione degli incidenti è una raccolta di politiche, processi, flussi di lavoro e documentazione che consente ai team IT di gestire un incidente dall’inizio alla fine. Il processo di gestione degli incidenti implica l’identificazione di un incidente, la registrazione con le relative informazioni, la diagnosi del problema e il ripristino del servizio in modo tempestivo. Il processo di gestione degli incidenti è simile al lavoro del vigile del fuoco, il cui principale obiettivo è quello di ridurre al minimo i danni all’attività.
Invece, la gestione dei problemi informatici è quel processo volto a identificare la causa principale che conduce a uno o più incidenti, e successivamente ad avviare azioni volte a correggere il problema. La gestione dei problemi ha l’obiettivo di ridurre l’impatto del problema sull’attività, adottando un approccio più organizzato che prevede l’analisi della causa principale, utilizzata per individuare il problema sottostante. Il problema viene risolto per evitare simili incidenti in futuro. In definitiva, l’identificazione dei problemi sottostanti aiuta nella gestione degli incidenti e assicura, in modo proattivo, il proseguimento delle normali operazioni.
La gestione dei cambiamenti ITIL è il processo di modifica dell’infrastruttura IT di un’organizzazione in un modo standardizzato e sistematico. Si tratta di un processo ben pianificato, composto da varie fasi e stati che le modifiche IT possono subire.
Generalmente, le modifiche IT sono avviate dopo i processi di gestione dei problemi informatici per risolvere il problema informatico identificato, per sostituire una risorsa difettosa che conduce ad altri incidenti, o come parte della risoluzione di un incidente di grave entità. L’obiettivo della gestione degli incidenti informatici è quello di ridurre al minimo le interruzioni informatiche e di ripristinare immediatamente i servizi. In alcuni casi, la modifica delle implementazioni può portare a incidenti, la maggior parte dei quali sono incidenti di minore entità causati da interruzioni temporanee del servizio o dalla mancata disponibilità del servizio. L’impatto di tali incidenti può essere minimizzato, in modo proattivo, informando gli utenti finali sull’implementazione modificata, sugli incidenti previsti o sulla non disponibilità del servizio. Nel caso di un incidente di grave entità causato da una modifica, i team di gestione dei cambiamenti possono immediatamente annullare la modifica per ripristinare la normalità.
L’integrazione dei processi di gestione delle risorse informatiche con quelli di gestione degli incidenti informatici facilita la diagnosi e la risoluzione dell’incidente per i tecnici di livello 2 e 3. Ad esempio, quando un utente segnala un problema di connessione internet limitata, il problema potrebbe riguardare il laptop o il router al quale l’utente è connesso. Se sono disponibili tutte le informazioni riguardanti il laptop dell’utente, incluso il router a cui è collegato, dettagli e relazioni, i tecnici sono in grado di individuare la causa dell’incidente e di fornire la giusta risoluzione. Da un punto di vista della gestione delle risorse, il collegamento degli incidenti informatici alle risorse aiuta i service desk IT a identificare e ritirare le risorse difettose che causano altri incidenti nell’organizzazione.
Interruzione non pianificata di un servizio IT o riduzione della qualità di un servizio IT. Anche l’errore di configurazione di un elemento, anche se non ha ancora avuto ripercussioni su un servizio, è considerato incidente (es. errore di un disco nei componenti di mirroring).
Il processo che trova un incidente.
Creazione e conservazione di una registrazione di un incidente sotto forma di un ticket.
Registrazione di un incidente con la dovuta diligenza in modo che sia posto nella categoria appropriata.
Chiusura di un ticket dell’incidente aperto una volta che l’incidente è stato risolto.
Un insieme di regole che definiscono la gerarchia di escalation degli incidenti, incluso i fattori scatenanti che portano all’escalation. Generalmente i fattori scatenanti si basano sulla severità dell’incidente e sul tempo di risoluzione.
Gestione del ciclo di vita di tutti gli incidenti per ripristinare, nel modo più rapido possibile, il normale funzionamento del servizio e ridurre al minimo l’impatto sull’attività.
Una serie di report prodotti dall’addetto alla gestione dell’incidente per diversi gruppi di destinazione (es. team responsabili per la gestione informatica, gestione a livello di servizio, altri processi di gestione dei servizi o la gestione degli incidenti stessa).
La persona responsabile ad attuare, in modo efficace, il processo di gestione degli incidenti e ad eseguire i report. Rappresenta inoltre il primo livello di escalation se non è possibile risolvere un incidente entro il livello di servizio concordato.
Contiene le fasi predefinite che dovrebbero essere adottate per affrontare un particolare tipo di incidente.
Controllo dello stato di elaborazione degli incidenti in sospeso, in modo da poter introdurre delle contromisure il più presto possibile, qualora i livelli di servizio rischiano di essere violati.
Assegnazione di priorità agli incidenti e definizione di ciò che costituisce un incidente di grave entità.
Una raccolta di dati con tutti i dettagli di un incidente, che documentano la storia dell’incidente dalla registrazione alla chiusura.
Un report che include informazioni relative agli incidenti, alla modalità della loro gestione e altri dati che consentono di misurare le prestazioni del processo di gestione degli incidenti.
La soluzione alternativa o la correzione che risolve l’incidente e ripristina il servizio al meglio delle sue qualità.
La posizione in cui si trova l’incidente nel processo di gestione degli incidenti. Gli stati comuni includono:
Un pacchetto esclusivo di caratteristiche e di presentazioni di gestione degli incidenti.
Elenco completo di funzionalità imprescindibili che è possibile utilizzare come riferimento per il proprio service desk IT.
Presentazioni dettagliate con i casi di utilizzo specifici per iniziare con la gestione degli incidenti ITIL.