Al Fathjri Wisesa
Data mining adalah proses pengumpulan dan pengolahan data yang bertujuan untuk mengekstrak informasi penting pada data. Proses pengumpulan dan ekstraksi informasi tersebut dapat dilakukan menggunakan perangkat lunak dengan bantuan perhitungan statistika, matematika, ataupun teknologi Artificial Intelligence.
classification, ia adalah metode yang paling umum digunakan dalam data mining. Classification adalah tindakan untuk memprediksi kelas suatu objek.
Dataset
Data Training dan Data Testing
Support Vector Machine
Dalam teknik SVM, kita berusaha untuk menemukan fungsi pemisah (classifier) terbaik diantara fungsi yang tidak terbatas jumlahnya untuk memisahkan dua macam objek. Dalam dua dimensi, pemisah tersebut berupa garis.
Decision Tree
Decision Tree atau pohon keputusan merupakan algoritma yang menggunakan graph berbentuk seperti pohon yang digunakan sebagai pendukung pengambilan keputusan.
K-Nearest Neighbors
K-Nearest Neighbor (KNN) merupakan algoritma klasifikasi yang termasuk dalam kategori supervised learning dimana data baru diklasifikasi berdasarkan data pembelajaran yang ditentukan berdasarkan tetangga terdekatnya.
Naive Bayes
sebagai algoritma supervised learning, pendekatan ini membuat prediksi menggunakan data latih yang berupa fitur-fitur beserta nilai dari variabelyang ingin diprediksi. Naive Bayes Classifier bekerja berdasarkan Teorema Bayes, dalam bentuk memprediksi kelas suatu pengamatan (observasi) jika diketahui nilai dari fitur-fiturnya.