Eva Yulia Puspaningrum
Klasifikasi suatu proses dalam mencari dan menentukan model atau fungsi yang dapat menjelaskan serta membedakan kelas data dengan tujuan dapat menggunakan data tersebut untuk memperkirakan kelas suatu objek yang statusnya tidak diketahui. Dataset yang digunakan berasal dari National Institute of Diabetes and Digestive and Kidney Diseases. Dapat diambil di Kaggle dengan link: https://www.kaggle.com/datasets/uciml/pima-indians-diabetes-database. Tujuannya adalah untuk memprediksi secara diagnostik apakah pasien menderita diabetes atau tidak. Dataset terdiri dari beberapa variabel prediktor medis dan satu variabel target, Hasil. Variabel prediktor meliputi pregnancies, Glucose, BloodPressure, SkinThickness, Insulin, BMI, DiabetesPedigreeFunction, age, Outcome. Dimana outcome merupakan target dari data tersebut.
Implementasi Klasifikasi Data Diabetes Indian Pima:
Model 2 memiliki akurasi sebesar 66%. Nilai Presisi 64% (TP/TP+FP) dan Recall 16% (TP/TP+FN) dan F-Measuer 26% ((2*Presisi*Recall)/(Presisi+Recall))