Cardiovascular Disease Prediction Decision Tree

Khalid Rinaldy

Sosial Media


1 orang menyukai ini
Suka

Summary

Portofolio ini membahas tentang prediksi penyakit kardiovaskular menggunakan algoritma Decision Tree C4.5. Hasil akhir menunjukkan bahwa akurasi model sebesar 73%.

Description

Latar Belakang

Penyakit jantung menjadi salah satu penyakit mematikan di dunia, termasuk Indonesia. Laporan Riset Kesehatan Dasar 2018 menunjukkan, rata-rata prevalensi penyakit ini di Tanah Air sebesar 1,5% pada tahun tersebut. Tercatat, ada 11 provinsi yang memiliki prevalensi penyakit jantung di atas rata-rata nasional tersebut.  Kalimantan Utara memiliki prevalensi penyakit jantung tertinggi di Indonesia sebesar 2,2%. Penyakit kardiovaskular dapat dideteksi dengan variabel-variabel seperti kadar kolesterol, kadar glukosa, serta penggunaan rokok dan alkohol.

Sehingga penulis ingin membuat algoritma Machine Learning yang dapat memprediksi penyakit kardiovaskular tubuh menggunakan Dataset yang diperoleh dari kaggle.com. Semoga artikel ini bermanfaat bagi penulis maupun pembaca.

 

Sumber informasi data : Data Penyakit Jantung di Indonesia

Sumber Dataset : https://www.kaggle.com/datasets/sulianova/cardiovascular-disease-dataset


 

Langkah-langkah
 

  • Import library yang dibutuhkan dan melakukan pembacaan file dataset yang berformat csv.


 

  • Melakukan pengecekan apakah ada missing value. Tidak dilakukan pra-proses normalisasi karena model algoritma Decision Tree tidak memerlukan normalisasi data.

  • Membagi fitur dan label serta membagi data menjadi data latih dan data uji. Data latih 75% dan data uji sebesar 25%.


 

  • Melakukan pelatihan model Decision Tree yang telah diimport menggunakan library sklearn. Model Decision Tree yang digunakan adalah C4.5, dengan maksimal kedalaman tree 4.


 

  • Pengujian akurasi model yang telah dilatih sebelumnya. Didapatkan:
  1. Precision score sebesar 73.5%
  2. Recall Score sebesar 72.1%
  3. Accuracy Score sebesar 72.9%
  4. F1 Score sebesar 72.8%

 

  • Melakukan visualisasi Model Decision Tree yang telah dibuat menggunakan plot_tree


 

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Data Science