Engineer Tokopedia jelaskan cara menjaga stabilitas platform

Oleh: Lely Maulida - Selasa, 29 Des 2020 11:58 WIB

Melalui acara START Summit Extension, para tim Engineer Tokopedia membagikan praktik terbaik mereka dalam membangun dan meningkatkan budaya kewaspadaan terhadap sistem platform Tokopedia. 

Sebagai platform dengan total pengguna aktif sebanyak lebih dari 100 juta setiap bulannya Tokopedia perlu menanamkan budaya yang dapat diimplementasikan pada setiap divisi dan tim di dalamnya agar selalu memberikan pengalaman dan pelayanan yang terbaik. Budaya melayani pelanggan merupakan salah satunya, dimana sebagai perusahaan yang menanamkan nilai customer-centric, memastikan pengalaman pengguna merupakan prioritas utama.

Seluruh tim, termasuk tim teknologi Tokopedia juga tak luput dalam menanamkan budaya tersebut. Melalui acara START Summit Extension, para tim Engineer Tokopedia membagikan praktik terbaik mereka dalam membangun dan meningkatkan budaya kewaspadaan terhadap sistem platform Tokopedia. 

Dengan tema “High Severity! Behind Tokopedia’s Reliable Incident Management”, Engineer Tokopedia - Timothy Agustian memberikan penjelasan tentang bagaimana budaya kerja yang diterapkan oleh setiap karyawan dapat membentuk keseharian tim Engineer. Menurut Timothy, sebagai perusahaan yang dipercaya oleh jutaan penjual dan pembeli, seluruh tim teknologi Tokopedia memiliki tanggung jawab yang besar untuk mengelola setiap insiden yang terjadi. Menyelesaikan suatu insiden tanpa ada pihak yang dirugikan merupakan prioritas utama, sehingga menanamkan budaya kewaspadaan yang tinggi dan keandalan dalam mengelola serta mengidentifikasi masalah teknis sangatlah penting. 

  • Tahap I: Preparation & Monitoring

Dijelaskan lebih lanjut, Tokopedia memiliki beberapa tahapan dalam mengelola insiden. Tahapan yang pertama adalah Preparation & Monitoring, dimana tahap ini merupakan fase pertama untuk mempersiapkan sistem ketika insiden belum terjadi. Fase ini mencakup pelatihan anggota tim tentang use case yang perlu ditangani, mengumpulkan dokumentasi hingga monitoring platform

  • Tahap II: Alerting

Tahap kedua dalam proses mengelola insiden Tokopedia, yakni Alerting. Saat alarm sudah berbunyi, ini merupakan tanda bahwa terdapat suatu insiden. Insiden yang baik adalah jika alerting-nya juga baik, sehingga tim dapat langsung mengetahui saat insiden terjadi dan tidak mengetahuinya dari pihak eksternal atau pengguna.