Klasifikasi Data (Heart Disease) Metode KNN

Mochamad Aldi Sidik Maulana

Sosial Media


1 orang menyukai ini
Suka

Summary

Klasifikasi dapat didefinisikan sebagai proses memprediksi kelas atau kategori dari nilai yang diamati atau titik data yang diberikan. Algoritma KNN atau sering disebut K-Nearest Neighbor merupakan algoritma yang melakukan klasifikasi berdasarkan kedekatan jarak suatu data dengan data yang lain. Dekat atau jauh suatu jarak dihitung berdasarkan jarak Euclidean. KNN merupakan salah satu algoritma non parametrik yang digunakan dalam pengklasifikasian.

Description

Berikut langkah - langkah pengklasifikasian data :

  1. Mencari dan mengunduh dataset pada https://www.kaggle.com/
  2. Buka Google Colab pada https://colab.research.google.com/
  3. Kemudian kita dapat memulainya dengan memasukan library yang dibutuhkan dan dataset yang telah diunduh tersebut pada Google Colab.
  4. Menampilkan 5 data teratas dari dataset yang telah kita masukan.
  5. Menampilkan jumlah pasien pengidap penyakit jantung dan bukan beserta visualisasi dan persentasenya (0 = bukan, 1 = pengidap).
  6. Menampilkan visualisasi dan persentase dari jumlah pasien pengidap penyakit jantung berdasarkan jenis kelamin.
  7. Menampilkan data rata-rata dari pasien pengidap dan bukan.
  8. Menampilkan visualisasi data dari jumlah pasien pengidap dan bukan berdasarkan umur.
  9. Menampilkan visualisasi data dari jumlah pasien pengidap dan bukan berdasarkan jenis kelamin.
  10. Menampilkan visualisasi data dari jumlah pasien pengidap dan bukan berdasarkan umur dan detak jantung.
  11. Menampilkan visualisasi data dari jumlah pasien pengidap dan bukan berdasarkan gejala yang dialami.
  12. Membagi dataset menjadi data train dan data test.
  13. Melakukan cek menggunakan data train dan prediksi dengan data test menggunakan algoritma KNN.
  14. Menampilkan hasil score maksimal dari algoritma KNN pada pengklasifikasian data.

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Data Science