situasi wargame

Jenius sebagai perusahaan fintech, melayani 24/7, 365 adalah waktu yang diberikan kepada nasabah, masalah teknikal akan selalu ada, dari mulai service, infrastruktur yang terganggu, atau terjadi human error. Dan sebagai team engineering, hal ini tentu sudah harus diantisipasi, tidak saja dengan modal pengetahuan, tapi juga pengalaman, karena pengalaman akan berbeda tergantung dari latar belakang developer/engineer tersebut sebelumnya.

Wargame adalah salah satu cara untuk mendapatkan pengalaman yang dibutuhkan untuk menghadapi kemungkinan-kemungkinan yang terjadi di production, Jenius selalu mengadakan sesi khusus untuk Wargame, di sini engineer ditantang untuk menyelesaikan issue yang terjadi baik di production ataupun environment lain seperti SIT, UAT atau Staging, engineer diharapkan dapat melakukan task yang ada di wargame tersebut. Wargame menjadi salah satu pendekatan lain terhadap konsep Chaos Monkey, dengan melakukan hal ini secara rutin, dapat meningkatkan keawasan dari team development, operation, infrastruktur, jika terjadi issue, maka tim akan bisa menemukan cara penyelesaian.

Dalam dunia development, terutama sebagai engineer yang bertanggung jawab terhadap production, latihan ini akan melatih analisa dan keputusan apa yang diambil untuk menyelesaikan issue yang terjadi, skenario bisa didapat dari apa yang terjadi di lapangan, laporan dari pengguna, atau ide-ide gila dari kemungkinan kegagalan yang terjadi dalam story yang dibuat ketika membangun fitur dan lainnya.

Dalam Wargame, bisa dilakuan banyak skenario untuk melakukan latihan ini dilakukan oleh penyelenggara/perusak biasanya, misalkan jika aplikasi yang dibangun ada frontend dan backend, bisa dilakukan ‘pengrusakan’ di sisi backend, karena ini yang sering terjadi dan lihat apa yang terjadi di frontend. misalkan putuskan koneksi ke database, mematikan load-balancer dan lainnya, hal ini tergantung dari imajinasi penyelenggara/perusak.

Dari kasus yang terjadi di wargame tersebut, hendaknya ditulis apa yang terjadi, kemudian dokumentasikan langkah-langkah yang diambil dalam penyelesaian. jika masalah sudah teratasi, buatlah semacam root cause analysis (RCA), rca ini dibuat sebagai bahan acuan team production jika hal yang sama terjadi, dan ini juga bisa menjadi hal baru untuk tim development agar membuat patch atau fixing untuk issue/bug yang terjadi.