Deteksi Email Phishing Berbahasa Indonesia Berbasis Analisis Tekstual Email Menggunakan Pendekatan NLP [IAU]

Authors

  • Wildan Zacky Ramandhito Telkom University Author

Keywords:

Phishing, Email Phishing, Natural Language Processing, Deteksi Teks, Machine Learning, Random Forest

Abstract

Phishing merupakan salah satu bentuk kejahatan siber yang dilakukan dengan tujuan memperoleh informasi sensitif, seperti kata sandi, data kartu kredit, dan informasi pribadi lainnya, melalui penyamaran sebagai entitas yang sah pada media komunikasi elektronik seperti email atau pesan singkat (SMS). Salah satu bentuk yang paling umum adalah email phishing, yang sering kali sulit dikenali oleh pengguna awam karena tampilannya menyerupai email resmi. Ciri umum dari email phishing meliputi kesalahan ketik, tata bahasa yang tidak baku, serta tautan berbahaya yang mengarah pada situs palsu guna mencuri data korban.

Penelitian ini bertujuan untuk mengembangkan sistem deteksi email phishing berbahasa Indonesia dengan memanfaatkan teknik Natural Language Processing (NLP) dan algoritma machine learning Random Forest. NLP digunakan untuk mengekstraksi fitur linguistik dari komponen email seperti subjek, isi pesan, dan tautan, sedangkan algoritma Random Forest dipilih karena memiliki performa klasifikasi yang unggul dengan akurasi mencapai 96% dalam pengujian terhadap sepuluh fitur utama. Mengingat minimnya penelitian dan sistem deteksi phishing dalam Bahasa Indonesia, pendekatan ini diharapkan dapat memberikan kontribusi terhadap pengembangan sistem keamanan siber yang lebih inklusif dan kontekstual.

Published

2025-09-02