Danny Sugiarto
Portofolio ini menggambarkan perbandingan beberapa algoritma klasifikasi machine learning seperti Logistic Regression, Random Forest Classifier, dan KNN Classifier pada dataset Drug Classification yang diambil dari Kaggle.
Comparison of Models Drugs Classification
Data diambil dari Kaggle: Drug Classification
Compare setiap kolom dengan jenis obat yang digunakan.
1. Age → Drug
Mari kita lihat bagaimana usia mempengaruhi pilihan obat.
Nampaknya obat sepertinya ada perubahan dari obat A ke B tergantung umur.
2. Gender (Sex) → Drug
Karena datanya non numerik, harus dikelompokkan terlebih dahulu.
Lalu perhatikan bar graph untuk melihat bagaimana gender mempengaruhi pilihan obat.
3. Blood Pressure (BP) → Drug
Karena ini bukan numerik, kita harus mengelompokkannya terlebih dahulu.
Lalu buat plot untuk melihat bagaimana tekanan darah mempengaruhi pilihan obat.
- Obat A dan B hanya digunakan oleh penderita darah tinggi.
- Obat C hanya digunakan oleh penderita tekanan darah rendah.
Setelah dilakukan perbandingan skor model-model tersebut, Random Forest Classifier memiliki skor tertinggi sedangkan KNN memiliki skor terendah.