Analisis Pengaruh Feature Decontamination terhadap Kinerja Deteksi Ransomware Menggunakan Random Forest

Authors

  • Sriyanto Institut Informatika dan Bisnis Darmajaya
  • Zuriati Politeknik Negeri Lampung
  • Zarnelly Universitas Islam Negeri Sultan Syarif Kasim Riau
  • Yuri Fitrian STMIK Pringsewu

DOI:

https://doi.org/10.61293/jscr.v8i1.955

Keywords:

Data Leakage, Feature Decontamination, Intrusion Detection, Random Forest, Ransomware

Abstract

Studi ini memfokuskan analisis pada dampak dekontaminasi fitur (feature decontamination) terhadap stabilitas model klasifikasi saat mengidentifikasi ransomware menggunakan dataset UNSW-NB15. Isu krusial pada data deteksi intrusi umumnya terletak pada kebocoran data (data leakage) atau kontaminasi fitur, yang berisiko memicu peningkatan performa model secara semu tanpa menggambarkan kapabilitas aslinya di lingkungan nyata. Penelitian ini menggunakan dua skenario eksperimen, yaitu tanpa feature decontamination dan dengan feature decontamination. Tahapan preprocessing meliputi encoding fitur kategorikal, normalisasi menggunakan StandardScaler, serta penyeimbangan data menggunakan SMOTE. Model klasifikasi yang digunakan adalah Random Forest, dipilih karena kemampuannya dalam menangani data tabular. Hasil penelitian menunjukkan bahwa model tanpa feature decontamination menghasilkan performa sempurna dengan nilai akurasi, precision, recall, dan F1 score sebesar 1.000, yang mengindikasikan adanya data leakage. Setelah dilakukan feature decontamination, performa model menjadi lebih realistis dengan akurasi sebesar 0.9028, precision sebesar 0.8820, recall sebesar 0.9506, dan F1-score sebesar 0.9150, serta nilai AUC sebesar 0.9795. Temuan ini menunjukkan bahwa feature decontamination berperan penting dalam meningkatkan validitas evaluasi model dengan menghilangkan bias dari fitur yang terkontaminasi. Dengan demikian, integritas data menjadi faktor kunci dalam pengembangan sistem deteksi ransomware yang andal.

Published

2026-05-15