Analisis Pengaruh Feature Decontamination terhadap Kinerja Deteksi Ransomware Menggunakan Random Forest

Penulis

  • Sriyanto Institut Informatika dan Bisnis Darmajaya
  • Zuriati Politeknik Negeri Lampung
  • Zarnelly Universitas Islam Negeri Sultan Syarif Kasim Riau
  • Yuri Fitrian STMIK Pringsewu

DOI:

https://doi.org/10.61293/jscr.v8i1.955

Kata Kunci:

Data Leakage, Feature Decontamination, Intrusion Detection, Random Forest, Ransomware

Abstrak

Penelitian ini bertujuan untuk menganalisis pengaruh feature decontamination terhadap keandalan kinerja model dalam deteksi ransomware pada dataset UNSW-NB15. Permasalahan utama dalam dataset deteksi intrusi adalah keberadaan feature contamination atau data leakage, yang dapat menyebabkan model menghasilkan performa yang tinggi namun tidak merepresentasikan kondisi sebenarnya. Penelitian ini menggunakan dua skenario eksperimen, yaitu tanpa feature decontamination dan dengan feature decontamination. Tahapan preprocessing meliputi encoding fitur kategorikal, normalisasi menggunakan StandardScaler, serta penyeimbangan data menggunakan SMOTE. Model klasifikasi yang digunakan adalah Random Forest, dipilih karena kemampuannya dalam menangani data tabular. Hasil penelitian menunjukkan bahwa model tanpa feature decontamination menghasilkan performa sempurna dengan nilai akurasi, precision, recall, dan F1-score sebesar 1.000, yang mengindikasikan adanya data leakage. Setelah dilakukan feature decontamination, performa model menjadi lebih realistis dengan akurasi sebesar 0.9028, precision sebesar 0.8820, recall sebesar 0.9506, dan F1-score sebesar 0.9150, serta nilai AUC sebesar 0.9795. Temuan ini menunjukkan bahwa feature decontamination berperan penting dalam meningkatkan validitas evaluasi model dengan menghilangkan bias dari fitur yang terkontaminasi. Dengan demikian, integritas data menjadi faktor kunci dalam pengembangan sistem deteksi ransomware yang andal.

Unduhan

Diterbitkan

2026-05-15