RISKA ANDANA
klasifikasi data dengan mechine learning dengan model SVM menggunakan Google Collaboratory, dataset yang digunakanakan yaitu “Diabetes prediction”
disini akan mengklasifikasikan dataset mengenai diabetes prediction dengan model SVM, sebelum membahas lebih lanjut kita harus tahu mengenai klasifikasi dan SVM.
Classification dapat didefinisikan sebagai proses memprediksi kelas atau kategori dari nilai yang diamati atau titik data yang diberikan. Secara matematis, classification adalah tugas mendekati fungsi pemetaan (f) dari variabel input (X) ke variabel output (Y).
lalu upport Vector Machine (SVM) merupakan salah satu metode dalam supervised learning yang biasanya digunakan untuk klasifikasi (seperti Support Vector Classification) dan regresi (Support Vector Regression). Dalam pemodelan klasifikasi, SVM memiliki konsep yang lebih matang dan lebih jelas secara matematis dibandingkan dengan teknik-teknik klasifikasi lainnya. SVM juga dapat mengatasi masalah klasifikasi dan regresi dengan linear maupun non linear.
disini saya menggunakan google collaboratory
pertama adalah menghubungan google collab dan google drive
Lalu setelah itu ambil data yang akan digunakan di google drive, sebelum mengambil data kita import pandas dulu. Dengan menampilkan data 5 teratas
Selanjutnya melakukan proses filter, data umur dengan range di atas 40 dan di bawah 50 tahun sebanyak 105 records dan 9 coloumns
Dengan outcome atau final result dengan 1 = memiliki penyakit diabetes dan 0=tidak memiliki penyakit diabetes.
Kemudian melakukan proses pemisahan data parameternya dengan data target (outcome)
X = parameter
Y = target (outcomes)
Lalu data akan dibagi dua ada data traing dan data testing, sebelumnya import lybrary train_test_split menggunakan sklearn
Selanjutnya akan melakukan klasifikasi dengan model svm
Setelah di traing lalu di prediksi berdasarkan data test yang telah dibagi dua tadi. Untuk menentukan x_test target(outcome)nya hasilnya seperti apa menggunakan model svc
lalu kita cek nilai akurasi prediksinya, berapa persen antara hasil prediksi dan nilai sebenarnya. Dengan hasil nilai akurasi sebesar 77,9%
Maka hasil prediksi menggunakan model SVM berdasarkan data test dan data traing yang digunakan tadi, nilai prediksinya 77,9%