Implementasi TF-IDF dan Regresi Logistik dalam Deteksi URL Phishing TLD Indonesia [IAU]

Authors

  • 01 Rifqi Safiq Hibatul Azis Student Author

Keywords:

URL phishing, TF-IDF, Logistic Regression , TLD Indonesia

Abstract

Serangan phishing merupakan ancaman siber yang terus berkembang dengan memanfaatkan situs web tiruan untuk mencuri data sensitif pengguna, khususnya pada domain Top-Level Domain (TLD) Indonesia yang menjadi target strategis aktor kejahatan siber lokal. Penelitian ini bertujuan untuk membangun sistem deteksi URL phishing yang mampu mengidetifikasi pola unik pada URL berbahaya tanpa mengorbankan efiseinsi komputasional. Metode yang diusulkan adalah kombinasi Term Frequency-Inverse Document Frequency (TF-IDF) untuk ekstraksi fitur dengan Regresi Logistik sebagai algoritma klasifikasi, yang dioptimalkan menggunakan teknik seleksi fitur statistik. Optimasi dilakukan melalui reduksi dimensi fitur TF-IDF untuk mengatasi masalah overfitting akibat ruang vektor berdimensi tinggi. Dataset yang digunakan dalam penelitian ini mencakup URL phishing dan valid dengan fokus pada domain Indonesia, sehingga representatif untuk deteksi ancaman lokal. Penelitian ini mengususlkan hipotesis bahwa pendekatan seleksi fitur pada ekstraksi TF-IDF mampu meningkatkan performa Regresi Logistik secara signifikan dalam mendeteksi URL phishing, sekaligus mempertahankan efisiensi komputasional untuk implementasi praktis.

Published

2026-02-23