Foto User
Data Classification "BC" Using Method SVM

Salim Maula Achyaruddin

Sosial Media


0 orang menyukai ini
Suka

Summary

Pada kali ini, saya akan membuat klasifikasi data menggunakan metode SVM, untuk memenuhi tugas akhir dari course Data Science. Dan untuk dataset yang saya ambil untuk klasifikasi ini adalah “Breast Cancer”, yang dimana dataset tersebut saya mengambil dari kaggle.com

Description

Langkah pertama import library-library pyhton yang dibutuhkan untuk klasifikasi data menggunakan metode SVM 

Kemudian mengimport dataset yang telah di unduh di kaggle.com, serta menampilkan data menggunakan keyword df.head().

Selanjutnya, untuk mengetahui ada berapa banyak atribut dan kolom yang ada pada dataset ini, kita tampilkan dengan menggunakan keyword df.shape. Kemudian kita tampilkan juga atribut kolom dengan menggunakan keyword df.columns.

Selanjutnya kita akan menghilangkan atau menghapus atribut dengan menggunakan keyword df.drop(['id'], axis=1, inplace=True). Disini saya menghilangkan/menghapus atribut “id”

Bisa dilihat pada gambar diatas, pada gambar sebelumnya terdapat 569 data dan 32 kolom, tapi setelah kita hapus maka menjadi 31 kolom.

Selanjutnya kita kategorikan untuk malignant (M) menjadi 1 dan Benign (B) menjadi 0, dengan menggunakan keyword berikut.

Selanjutnya, agar kita mengetahui statistik, kita masukkan keyword df.describe().T


 

 

 

Selanjutnya, masukkan keyword berikut untuk menghasilkan Array


 

Setelah itu, kita visualisasikan data menggunakan keyword berikut.

Dapat dilihat dari grafik diatas, bahwa kanker payudara jinak (Benign ‘B’=0) kasusnya lebih banyak dibanding dengan kanker payudara ganas (Malignant ‘M’=1).

 

Langkah terakhir, kita akan menampilkan visualisasi data tetapi hanya diagnosisnya saja, dan gambar berikut adalah data yang didapatkan dalam percobaan klasifikasi data menggunakan metode SVM.

 

Maka, dapat disimpulkan bahwa kanker payudara jinak (Benign ‘B’=0) kasusnya lebih banyak dibanding dengan kanker payudara ganas (Malignant ‘M’=1). Dari grafik diatas membuktikan bahwa kasus kanker payudara jinak terdapat 350 kasus, sedangkan kanker payudara ganas terdapat 200 kasus. Maka klasifikasi data menggunakan metode SVM dapat mempermudah untuk mendapatkan data yang diperlukan.

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Data Science