Analisis Pengaruh Feature Decontamination terhadap Kinerja Deteksi Ransomware Menggunakan Random Forest
DOI:
https://doi.org/10.61293/jscr.v8i1.955Keywords:
Data Leakage, Feature Decontamination, Intrusion Detection, Random Forest, RansomwareAbstract
Studi ini memfokuskan analisis pada dampak dekontaminasi fitur (feature decontamination) terhadap stabilitas model klasifikasi saat mengidentifikasi ransomware menggunakan dataset UNSW-NB15. Isu krusial pada data deteksi intrusi umumnya terletak pada kebocoran data (data leakage) atau kontaminasi fitur, yang berisiko memicu peningkatan performa model secara semu tanpa menggambarkan kapabilitas aslinya di lingkungan nyata. Penelitian ini menggunakan dua skenario eksperimen, yaitu tanpa feature decontamination dan dengan feature decontamination. Tahapan preprocessing meliputi encoding fitur kategorikal, normalisasi menggunakan StandardScaler, serta penyeimbangan data menggunakan SMOTE. Model klasifikasi yang digunakan adalah Random Forest, dipilih karena kemampuannya dalam menangani data tabular. Hasil penelitian menunjukkan bahwa model tanpa feature decontamination menghasilkan performa sempurna dengan nilai akurasi, precision, recall, dan F1 score sebesar 1.000, yang mengindikasikan adanya data leakage. Setelah dilakukan feature decontamination, performa model menjadi lebih realistis dengan akurasi sebesar 0.9028, precision sebesar 0.8820, recall sebesar 0.9506, dan F1-score sebesar 0.9150, serta nilai AUC sebesar 0.9795. Temuan ini menunjukkan bahwa feature decontamination berperan penting dalam meningkatkan validitas evaluasi model dengan menghilangkan bias dari fitur yang terkontaminasi. Dengan demikian, integritas data menjadi faktor kunci dalam pengembangan sistem deteksi ransomware yang andal.
Downloads
Published
Issue
Section
License
Copyright (c) 2026 Jurnal Sistem Cerdas dan Rekayasa (JSCR), E-ISSN:2656-7504

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.









