fingki sri marsanti
Klasifikasi merupakan metode supervised learning dengan menerapkan algoritme tertentu untuk secara akurat menetapkan data uji ke dalam kategori tertentu. Salah satu algoritma machine learning untuk proses klasifikasi adalah Decision Tree.
Klasifikasi adalah proses untuk menemukan model yang menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. Proses klasifikasi biasanya terdiri dari dua fase, yaitu learning dan test. Pada fase learning sebagian data yang telah diketahui kelas datanya diumpankan untuk membentuk model perkiraan. Kemudian, pada fase test model yang sudah terbentuk diuji dengan sebagian data lainnya untuk mengetahui akurasi dari model tersebut. Bila akurasinya mencukupi model ini dapat dipakai untuk prediksi kelas data yang belum diketahui. Salah satu algortima yang banyak digunakan pada proses klasifikasi yaitu Decision Tree.
Decision Tree
Decision Tree merupakan salah satu cara data processing dalam memprediksi masa depan dengan cara membangun klasifikasi atau regresi model dalam bentuk struktur pohon. Terdapat tiga elemen dalam satu decision tree, yaitu :
(Sumber : glints.com)
Algoritma Decision Tree
Keterangan :
S : himpunan
A : atribut
N : jumlah partisi atribut A
|Si| : jumlah kasus pada partisi ke-I
|S| : jumlah kasus dalam S
Keterangan :
S : himpunan kasus
A : fitur
N : jumlah partisi S
Pi : proporsi dari Si terhadap S
Klasifikasi dataset Drug200 menggunakan algortima Decision Tree
Dataset
Dataset drug200.csv memiliki beberapa fitur diantaranya usia, jenis kelamin, tekanan darah, dan kolesterol pasien. Kemudian untuk targetnya yaitu obat yang diresponkan oleh setiap pasien.
Klasifikasi yang dilakukan berupa pengklasifikasien biner, dimana akan menggunakan bagian training dataset untuk membangun model Decision Tree, lalu digunakan untuk memprediksi kelas pasien yang tidak diketahui atau untuk meresepkan pada pasien baru.
Modeling
Prediksi
Visualisasi
Evaluasi Model
Akurasi model Decision Tree yaitu sebesar 98.3%