Diabetes Dataset with Decision Tree Classifier

Ellen Suharto

Sosial Media


0 orang menyukai ini
Suka

Summary

Penerapan klasifikasi Data Science menggunakan kode merupakan salah satu satu cara untuk mendapatkan hasil cepat, akurat untuk jumlah data yang sangat besar. Pada percobaan ini saya membuat klasifikasi data diabetes menggunakan diagram Tree Classifier. Data akan diproses menggunakan Test Train Split untuk fitur kolom data Diabetes Pedigree Function dan Age. Hasil akhir menunjukan 0.5909090909090909 dari tes data yang dilakukan.

Description

1. Import Library

2. Connect to Google Drive

3. Membaca Dataset diabetes.csv Menggunakan Pandas dan Menyimpannya Dalam Dataframe

4. Memilih Fitur-Fitur dari Variabel X dan Variabel y

5. Bagi data menjadi data latih dan data uji

6. Melatih Model Menggunakan Kelas SVC dan Mencetak Hasil Nilai Akurasi dari Library sklearn

7. Mencetak Tipe Data dari Setiap Kolom

8. Melatih Model Desicion Tree Classifier, Mengonversi Nilai Kelas Menjadi Tipe Data String, Eksport Decision Tree Menjadi Format Dot

9. Konversi Dot Data dan Menampilkan Decision Tree Diagram

Kesimpulan

Data yang dijalankan untuk fitur Diabetes Pedigree Function dan Age untuk Variabel X, sedangan Variabel y menggunakan kolom target Outcome menghasilkan hasil nilai akurasi sebesar 0.5909090909090909 dari tes data yang dilakukan. Data tersebut ditampilkan dalam model data Decision Tree Diagram.

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Data Science