BISA AI - AI For Everyone
Spam Email Classification with Decision Tree

Felina Khasanah

Sosial Media


0 orang menyukai ini
Suka

Summary

Pada portofolio ini membahas berkaitan dengan klasifikasi email spam yaitu sebuah teknik untuk mengklasifikasi jenis email apakah email tersebut masuk kategori spam atau bukan spam (ham), menggunakan dataset dari link ini. Dalam klasifikasi ini menggunakan model Decision tree untuk menguji keakuratannya. 

Description

Exploratory Data Analysis

  • Koneksi Project ke Drive  

         

         Pada baris kode diatas berfungsi untuk menghubungkan projek Google Colab untuk dapat mengakses data yang tersimpan dalam Google Drive.

  • Mengimport Library 

         

          Pada tahap ini mendefinisikan main library yang dibutuhkan dalam analisis yang dilakukan.

  • Mendefinisikan Dataset  

         

Dari Kode diatas df = pd.read_csv berfungsi untuk membaca data yang tersimpan dalam google drive.

  • Menampilkan Data Statistik dari DataFrame

         

Dengan fugsi df.describe() kita dapat mengetahui statistik dari DataFrame yang kita miliki seperti rata-rata, standar deviasi dsb.

  • Mengidentifikasi Kebardaan Missing value pada DataFrame

         

Dengan fungsi df.isnull().sum() kita dapat mengidentifikasi jika adanya missing value dari tiap kolom, dan saat running kode untuk setiap label menunjukan angka 0 sehingga kita dapat melanjutkan ketahap berikutnya.

  • Visualisasi Status Spam

         

          

  • Menghandel data dengan splitting

         

Dengan kode diatas kita membagi data train dengan data test.

  • Membuat Model Decision Tree

         

Dari Model Decision Tree yang dibangun kita dapat melihat nilai precision, recall f1-score dan suport dsb.

  • Menghitung Akurasi

         

Dari baris kode diatas kita dapat mengetahui nilai akurasi dari model yang dibangun 0.89 %.

Informasi Course Terkait
  Kategori: Artificial Intelligence
  Course: Machine Learning For Beginner