Foto User
Comparison of Models Drugs Classification

Danny Sugiarto

Sosial Media


0 orang menyukai ini
Suka

Summary

Portofolio ini menggambarkan perbandingan beberapa algoritma klasifikasi machine learning seperti Logistic Regression, Random Forest Classifier, dan KNN Classifier pada dataset Drug Classification yang diambil dari Kaggle.

Description

Comparison of Models Drugs Classification

  • Step 1 - Import library dependencies and read file

Data diambil dari Kaggle: Drug Classification

  • Step 2 - Checking for empty rows / data

  • Step 3 - Exploratory Data Analysis

Compare setiap kolom dengan jenis obat yang digunakan.

1.  Age → Drug

Mari kita lihat bagaimana usia mempengaruhi pilihan obat.

Nampaknya obat sepertinya ada perubahan dari obat A ke B tergantung umur.

2.  Gender (Sex) → Drug

Karena datanya non numerik, harus dikelompokkan terlebih dahulu.

Lalu perhatikan bar graph untuk melihat bagaimana gender mempengaruhi pilihan obat.

3.  Blood Pressure (BP) → Drug

Karena ini bukan numerik, kita harus mengelompokkannya terlebih dahulu.

Lalu buat plot untuk melihat bagaimana tekanan darah mempengaruhi pilihan obat.

-  Obat A dan B hanya digunakan oleh penderita darah tinggi.
-  Obat C hanya digunakan oleh penderita tekanan darah rendah.

  • Step 4 - Machine Learning

Setelah dilakukan perbandingan skor model-model tersebut, Random Forest Classifier memiliki skor tertinggi sedangkan KNN memiliki skor terendah.

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Data Science