Prediksi Diabetes dengan Model Decision Tree

Vitri Tundjungsari

Sosial Media


0 orang menyukai ini
Suka

Summary

Dalam course Data Science ini saya melakukan pembuatan dan pengujian model Machine Learning dengan model Decision Tree. Dalam tugas akhir, saya melakukan: (1) membaca data, (2) membersihkan data, (3) menyiapkan data, (4) membuat dan menyimpan model, (5) menggambarkan model, dan (6) memprediksi hasil dengan model. Data untuk tugas akhir ini saya ambil dari Kaggle (https://www.kaggle.com/datasets/uciml/pima-indians-diabetes-database). Data ini berisikan data pasien penyakit diabetes dengan beberapa atribut, seperti: Pregnancies, Glucose, BMI, dan lain-lain. Selanjutnya terdapat atribut Outcome yang menunjukkan hasil apakah pasien tersebut positif diabetes atau tidak. Pemodelan yang saya buat memberikan hasil akurasi 69, 69%. 

Description

Dalam course Data Science ini saya melakukan pembuatan dan pengujian model Machine Learning dengan model Decision Tree. Dalam tugas akhir, saya melakukan: (1) membaca data, (2) membersihkan data, (3) menyiapkan data, (4) membuat dan menyimpan model, (5) menggambarkan model, dan (6) memprediksi hasil dengan model. Data untuk tugas akhir ini saya ambil dari Kaggle (https://www.kaggle.com/datasets/uciml/pima-indians-diabetes-database). Data ini berisikan data pasien penyakit diabetes dengan beberapa atribut, seperti: Pregnancies, Glucose, BMI, dan lain-lain. Selanjutnya terdapat atribut Outcome yang menunjukkan hasil apakah pasien tersebut positif diabetes atau tidak. Pemodelan yang saya buat memberikan hasil akurasi 69, 69%. Penjelasan lebih detail dapat dilihat pada halaman 2 hingga 6.

Sebagai dosen program studi Teknik Informatika, saya juga aktif melakukan penelitian dengan algoritma Machine Learning, seperti: klasifikasi dan regresi. Beberapa judul penelitian terkait Machine Learning, antara lain: Sistem Prediksi Kelulusan Mahasiswa dengan Algoritma C 4.5, Sentiment Analysis untuk UMKM. Saya juga mengajar beberapa kelas untuk mata kuliah Data Mining di Universitas Esa Unggul.

Berikut adalah Tugas Akhir yang saya kerjakan untuk sertifikasi dalam course Data Science ini.

Nama: Vitri Tundjungsari

PREDIKSI PENYAKIT DIABETES DENGAN MODEL DECISION TREE

 

Langkah 1: Import Pandas dan Decision Tree Classifier dari sklearn (lihat gambar 1)

Langkah 2: Memanggil file Bernama ‘kaggle_diabetes.csv’ yang disimpan di Google Drive (lihat gambar 1)

Langkah 3: Import pandas yang digunakan untuk membaca dan manupulasi data dalam bentuk df (dataframe) (lihat gambar 1)

Langkah 4: membaca data dalam dataframe (lihat gambar 1 dan gambar 2)

Gambar 1. Langkah 1 s.d. 4

Gambar 2. Hasil pembacaan data

Langkah 5: membersihkan data, mengganti data yang tidak ada dengan angka 0 (lihat gambar 3)

Gambar 3. Membersihkan data

Langkah 6: membaca 5 baris pertama data pada dataframe (lihat gambar 4)

Gambar 4. Membaca 5 baris pertama data dalam data frame

 

Langkah 7: Menyiapkan data dengan membagi data dalam features dan target variable (lihat gambar 4)

  • Features tdd Pregnancies, Glucose, BloodPressure, SkinThickness, Insulin, BMI, DiabetesPedigreeFunction, Age
  • Target tdd: Outcome

Langkah 8: Membagi dataset dalam training set (70%) dan test set (30%) (lihat gambar 4)

Langkah 9: Menyiapkan Decision Tree Classifier Object dan melakukan train serta test (lihat gambar 5)

Langkah 10: Menguji akurasi model. Didapatkan hasil 69,69% akurat (lihat gambar 5)

 

 

Gambar 5. Melakukan Training dan Test Serta Menguji Akurasi Model

 

Langkah 11: Install Pydot dan Import Pydot untuk menggambarkan Decision Tree (lihat gambar 6)

Langkah 12: Import Tree dan Decision Tree Classifier untuk menggambarkan model Decision Tree (lihat gambar 6)

Langkah 13: Menggambarkan hasil model Decision Tree (lihat gambar 7 dan 8)

Gambar 6. Visualisasi Model Decision Tree (1)

Gambar 7. Visualisasi Model Decision Tree (2)

 

Gambar 8. Visualisasi Model Decision Tree (3)

 

Langkah 14: Melakukan prediksi hasil jika diberi input tertentu. Misal untuk input dalam contoh ini, maka hasil prediksi adalah NO (tidak menderita diabetes) (lihat gambar 9)

Gambar 9. Prediksi Model Decision Tree

 

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Persiapan Sertifikasi Kompetensi Okupasi Associate Data Scientist