"Model FCAPS dari ISO menyebutkan fault management sebagai salah satu dari lima area fungsional utama dalam manajemen jaringan proaktif dan mendefinisikan tujuannya: untuk mengenali, mengisolasi, memperbaiki, dan mencatat fault yang terjadi di jaringan."

Network fault management atau manajemen fault jaringan adalah proses mendeteksi, mengisolasi, dan memperbaiki masalah jaringan dengan cepat. Sebagai elemen penting dalam manajemen jaringan, manajemen fault membantu meminimalkan downtime dan mencegah kerusakan perangkat dengan penyelesaian masalah yang cepat. Hal ini memastikan jaringan tetap beroperasi secara optimal dan melindungi bisnis dari kerugian.

Monitoring fault jaringan adalah langkah pertama dalam manajemen fault, yang merupakan syarat penting untuk keberhasilan manajemen jaringan. Dengan semakin kompleksnya infrastruktur jaringan hybrid, proses manajemen fault bisa menjadi lebih berat tanpa adanya sistem fault management yang baik. Tool fault management mengikuti siklus empat langkah untuk menyelesaikan masalah:

  • Deteksi: Mengidentifikasi gangguan layanan atau anomali performa.
  • Isolasi: Menemukan dan mengisolasi sumber masalah untuk ditindaklanjuti.
  • Pemberitahuan: Memberikan notifikasi kepada admin jaringan melalui alarm atau pemberitahuan.
  • Resolusi: Menyelesaikan masalah menggunakan otomatisasi atau tindakan manual.

Bagaimana Opmanager mengatasi fault jaringan

 Fault management - ManageEngine OpManager

Network fault management memastikan Anda selalu mengetahui kondisi jaringan Anda, baik saat terjadi gangguan tak terduga maupun penurunan performa. Dengan OpManager, software manajemen fault jaringan otomatis yang bekerja 24/7, Anda dapat mendeteksi, memulihkan, dan mengurangi dampak gangguan jaringan dengan mudah. Kemampuan OpManager sebagai sistem manajemen fault jaringan membantu Anda mengisolasi dan menyelesaikan masalah dalam waktu singkat menggunakan workflow empat langkah.

1. Deteksi: Menjadi yang pertama mengetahui peristiwa yang terjadi

Software fault detection OpManager terus-menerus memantau jaringan untuk mendeteksi fault dan segera mengetahui jika terjadi penurunan performa atau gangguan layanan. Deteksi dapat dilakukan melalui pemantauan aktif dan pasif.

 Deteksi Fault — ManageEngine OpManager

Fault management aktif mendeteksi kejadian dengan memeriksa status perangkat melalui ICMP ping, TCP, or UDP port checks, custom scripts, remote queries, dan lainnya. Ini adalah pendekatan aktif untuk mengidentifikasi dan memperbaiki masalah potensial secara real-time, bahkan terkadang sebelum masalah tersebut menjadi fault.

Sebaliknya, passive atau event-based management memantau jaringan untuk mendeteksi kejadian yang menunjukkan adanya gangguan atau kegagalan, tetapi hanya setelah kejadian tersebut terjadi. Hal ini dilakukan melalui SNMP traps, pesan syslog, Windows Event Log, metode lainnya.

2. Isolasi: Fokus hanya pada fault yang dapat ditindaklanjuti

Setelah masalah terdeteksi, mengidentifikasi akar penyebabnya sangat penting untuk mempercepat waktu penyelesaian. Tujuan utama dari proses isolasi ini adalah untuk menghilangkan peristiwa yang tidak relevan, sehingga mengurangi alarm yang tidak perlu dan hanya menampilkan fault yang dapat ditindaklanjuti. Sistem manajemen fault jaringan OpManager melakukan ini dengan bantuan tiga metode yang dibahas di bawah ini.

Deduplication

Jika terjadi peristiwa seperti penggunaan memori tinggi yang berlangsung selama 30 menit, tool Anda tidak seharusnya mengirim banyak peringatan dengan memeriksa setiap tiga menit. OpManager akan mencatat peristiwa yang berulang dalam riwayat alarm, menghindari duplikasi, dan mencegah pengiriman alarm ganda untuk masalah yang sama.

Correlation

Device-dependencies:

 Fault correlation - ManageEngine OpManager

Ketika router inti mengalami downtime, perangkat yang bergantung padanya juga akan terpengaruh. Jika tool fault management Anda mengirimkan alarm untuk semua perangkat tersebut, waktu untuk menemukan akar masalah akan lebih lama. Fitur device dependencies memungkinkan Anda menetapkan perangkat induk (parent) dan perangkat bergantung (dependent), sehingga mencegah munculnya alert palsu dengan hanya menghasilkan satu alarm untuk perangkat sumber saja (core router). Dengan fitur network mapping, admin dapat dengan mudah menemukan dan menyelesaikan masalah lebih cepat.

Root cause analysis (RCA):


 Fault correlation - ManageEngine OpManager

Untuk menemukan penyebab masalah, Anda perlu membandingkan dan melihat hubungan antara kinerja beberapa monitor. Dengan profil RCA OpManager, Anda dapat drag dan drop monitor yang ingin dianalisis, lalu kurva kinerja akan dibuat untuk masing-masing. Anda bisa membandingkan hingga 20 monitor dalam satu jendela, dan grafik kinerja akan ditampilkan untuk monitor yang dipilih, membantu Anda menganalisis dan melihat korelasi kinerja beberapa monitor sekaligus.

Alarm Correlation dalam Fault Management

Anda juga bisa menggunakan aturan korelasi alarm OpManager untuk menghubungkan metrik dari entitas penting dan mendapatkan informasi kontekstual mengenai pola alarm. Dengan ini, Anda dapat mengurangi noise alarm secara signifikan dan segera mengambil langkah perbaikan pertama jika terjadi pelanggaran terhadap kriteria yang telah ditentukan.

Automation

Automation memungkinkan resolusi masalah menjadi lebih cepat dengan menghilangkan kejadian yang tidak relevan (seperti lonjakan kecil yang tidak signifikan), mengembalikan status alarm, dan menekan alarm yang sudah diketahui. OpManager menawarkan beberapa fitur automasi, termasuk:

  • Downtime scheduler: Atur jadwal downtime selama periode pemeliharaan rutin untuk menghentikan OpManager memantau jaringan dan mencegah munculnya alert yang tidak perlu.
  • Pause status polling: Saat menangani masalah tertentu, gunakan fitur ini untuk menghentikan polling sementara hingga masalah terselesaikan, sehingga mencegah munculnya alert palsu.

3. Pemberitahuan: Dapatkan pemberitahuan dari mana saja

Setelah kejadian yang dapat ditindaklanjuti diisolasi, OpManager secara otomatis memberi tahu admin NOC dengan menampilkan fault secara visual dan pemberitahuan melalui trouble ticketing dan alert melalui monitoring NOC.

 Fault notification - ManageEngine OpManager

4. Resolusi: Atasi gangguan dengan cepat dan mudah

Tidak semua gangguan yang terdeteksi memerlukan perhatian langsung. Dalam banyak kasus, sistem fault management, seperti OpManager secara otomatis menjalankan skrip atau workflow segera setelah tanda masalah terdeteksi, memulihkan layanan, dan menjaga jaringan tetap berjalan. Jika automasi gagal karena kendala tertentu, OpManager akan mengeskalasi alarm ke admin yang sesuai, disertai detail kejadian dan langkah tindak lanjut. Dengan begitu, meskipun Anda sedang berpindah lokasi atau sibuk menangani kebutuhan jaringan lainnya, OpManager tetap dapat mencegah sebagian gangguan agar tidak mengganggu operasional.

 Fault management - ManageEngine OpManager

Dalam beberapa kasus, resolusi otomatis tidak dapat dilakukan sehingga diperlukan intervensi manual. Anda dapat melakukan troubleshooting untuk menilai kerusakan dan menemukan solusi cepat menggunakan tool troubleshooting berbasis web bawaan yang interaktif dan terintegrasi.

Mengapa Anda Memerlukan OpManager

"Menurut survei yang dilakukan oleh Gartner, rata-rata biaya downtime jaringan untuk perusahaan adalah sekitar $5.600 per menit, yang berarti lebih dari $300.000 per jam rata-rata, dan bahkan bisa mencapai $540.000 per jam pada kisaran yang tinggi."

Dengan potensi kerugian besar akibat downtime yang dapat terjadi pada bisnis, sangat penting untuk mengambil langkah yang tepat untuk mencegah atau meminimalkannya. Menghindari downtime dan menjaga uptime bergantung pada monitoring dan manajemen fault jaringan yang efektif. Sistem manajemen fault otomatis yang canggih, seperti ManageEngine OpManager, membantu administrator menyelesaikan masalah dengan cepat, melindungi availability jaringan, dan menjaga pendapatan bisnis.

Jaga jaringan Anda tetap optimal dengan OpManager.

Download uji coba gratis 30 hari

Ulasan pelanggan

OpManager

OpManager - 10 Langkah Lebih Maju dari Kompetitor, Satu Langkah Lebih Maju Sebelum Menjadi Tidak Tertandingi.
- Network Services Manager, Government Organization
Peran Reviewer: Infrastruktur dan Operasi Jumlah Pegawai: Pemerintah/PS/ED 5.000 - 50.000
"Saya memiliki hubungan jangka panjang dengan ManageEngine. Terdapat satu atau dua fitur yang tidak tersedia, yang seharusnya bisa membuat OpManager menjadi tool yang terbaik di pasaran. Namun, produk ini adalah yang paling lengkap dan paling mudah untuk digunakan di pasaran."

OpManager

Implementasi Mudah, Dukungan Luar Biasa dan Tool Berbiaya Rendah
- Team Lead, IT Service Industry
Peran Reviewer: Infrastruktur dan Operasi Nilai Perusahaan: 500 juta - 1 miliar dolar AS
"Kami telah menggunakan OpManager sejak tahun 2011 dan secara keseluruhan, pengalaman kami sangat bagus. Tool ini memainkan peran yang penting dalam memberikan nilai kepada organisasi kami dan kepada pelanggan kami. Dukungan yang diberikan sangat bagus dan staf bertanggung jawab penuh untuk menyelesaikan masalah. Solusi ini tidak pernah berhenti untuk berinovasi, dan itu terlihat jelas karena selalu ada versi yang lebih baru."

OpManager

Implementasi Mudah Dengan Katalog Kaya Fitur, Dukungan Perlu Diperbaiki Sedikit
- NOC Manager in IT Service Industry
Peran Reviewer: Manajemen Program dan Portofolio Nilai Perusahaan: 500 juta - 1 miliar dolar AS
"Vendor telah memberikan dukungan selama fase implementasi dan POC pemberian lisensi uji coba. Permintaan fitur dan umpan balik biasanya ditindaklanjuti dengan cepat. Dukungan vendor yang diberikan cukup membantu selama fase implementasi. Setelah itu, vendor memberikan dukungan tambahan dengan melakukan perbaikan."

OpManager

Alat monitoring Hebat
- CIO in Finance Industry
Peran Reviewer: CIO Nilai Perusahaan: 1 miliar - 3 miliar USD
"Manage Engine menyediakan serangkaian alat yang telah meningkatkan ketersediaan aplikasi internal kami. Dari monitoring, manajemen dan peringatan, kami telah mampu performa puncak dalam Data Center kami."

OpManager

Implementasinya sederhana, mudah digunakan. Sangat intuitif.
- Principal Engineer in IT Services
Peran Reviewer: Arsitektur dan Teknologi Perusahaan Inovasi Nilai Perusahaan: 250 juta - 500 juta USD
"Dukungan ManageEngine sangat membantu dan responsif terhadap semua kebutuhan kami."
 
 

Studi Kasus - OpManager

OpManager

Hinduja Global Solutions menghemat $3 juta per tahun dengan menggunakan OpManager

Industri: IT

Hinduja Global Solutions (HGS) adalah perusahaan manajemen proses bisnis India yang berkantor pusat di Bangalore dan merupakan bagian dari Grup Hinduja. HGS menggabungkan teknologi yang didukung otomatisasi, analitik, dan layanan digital yang berfokus pada proses back-office.

Pelajari lebih lanjut

OpManager

Organisasi Layanan Kesehatan Berbasis AS Memantau Perangkat Jaringan Menggunakan OpManager dan Network Configuration Manager

Industri: Kesehatan

Salah satu kelompok radiologi terbesar di Amerika Serikat, dengan tim yang terdiri atas lebih dari 200 ahli radiologi bersertifikat, menyediakan informasi dan interpretasi radiologi kepada lebih dari 50 mitra rumah sakit dan klinik spesialis.

Pelajari lebih lanjut

OpManager

Perusahaan data real estate yang berbasis di Belanda menghindari downtime sistem menggunakan OpManager dan Firewall Analyzer

Industri: Properti

Vabi adalah perusahaan yang berbasis di Belanda yang menyediakan "data real estate yang terstruktur untuk semua orang". Sejak 1972, perusahaan ini fokus pada pembuatan software yang menghitung kinerja bangunan. Sejak saat itu, cakupan perusahaan telah diperluas dari sekadar perhitungan hingga berbagai aspek lainnya.

Pelajari lebih lanjut

OpManager

Perusahaan berita dan media global

Industri: Telekomunikasi dan Media

Bonita menggunakan OpManager untuk memantau infrastruktur jaringan mereka dan mengatasi hambatan

Pelajari lebih lanjut

OpManager

Bonita

Industri: Bisnis dan Layanan

Bonita menggunakan OpManager untuk memantau infrastruktur jaringan mereka dan mengatasi hambatan

Pelajari lebih lanjut

OpManager

Thorp Reed dan Armstrong

Industry : Pemerintahan

Randy S. Hollaway dari Thorp Reed dan Armstrong mengandalkan OpManager untuk mendapatkan peringatan dan laporan dengan cepat

Pelajari lebih lanjut