ATHA FAJAR MAULANA MAKKA
Machine learning adalah ilmu pengembangan algoritme dan model secara statistik yang digunakan sistem komputer untuk menjalankan tugas tanpa instruksi eksplisit, mengandalkan pola serta inferensi sebagai gantinya.
Clustering adalah sebuah proses untuk mengelompokan data ke dalam beberapa cluster atau kelompok sehingga data dalam satu cluster memiliki tingkat kemiripan yang maksimum dan data antar cluster memiliki kemiripan yang minimum.
K-Means merupakan algoritma yang umum digunakan untuk clustering doku- men. Prinsip utama K-Means adalah menyusun k prototype atau pusat massa (centroid) dari sekumpulan data berdimensi. Sebelum diterapkan proses algoritma K-means, dokumen akan di preprocessing terlebih dahulu.
Density-Based Spatial Clustering of Application with Noise (DBSCAN) merupakan sebuah metode clustering yang membangun area berdasarkan kepadatan yang terkoneksi (density- connected). Setiap objek dari sebuah radius area (cluster) harus mengandung setidaknya sejumlah minimum data.
Melakukan Prediksi Mall Customers dengan Clustering :
4. melihat jumlah dari masing-masing gender
5. membuat model K-MEANSdengan jumlah cluster = 9
6. membuat model DBSCAN menggunakan cluster berjumlah = 9
7. hasil dari DBSCAN