MALL CUSTOMERS CLUSTERING with K-MEANS & DBSCAN

ATHA FAJAR MAULANA MAKKA

Sosial Media


0 orang menyukai ini
Suka

Summary

Machine learning adalah ilmu pengembangan algoritme dan model secara statistik yang digunakan sistem komputer untuk menjalankan tugas tanpa instruksi eksplisit, mengandalkan pola serta inferensi sebagai gantinya.
Clustering adalah sebuah proses untuk mengelompokan data ke dalam beberapa cluster atau kelompok sehingga data dalam satu cluster memiliki tingkat kemiripan yang maksimum dan data antar cluster memiliki kemiripan yang minimum.

K-Means merupakan algoritma yang umum digunakan untuk clustering doku- men. Prinsip utama K-Means adalah menyusun k prototype atau pusat massa (centroid) dari sekumpulan data berdimensi. Sebelum diterapkan proses algoritma K-means, dokumen akan di preprocessing terlebih dahulu.

Density-Based Spatial Clustering of Application with Noise (DBSCAN) merupakan sebuah metode clustering yang membangun area berdasarkan kepadatan yang terkoneksi (density- connected). Setiap objek dari sebuah radius area (cluster) harus mengandung setidaknya sejumlah minimum data.

Description

Melakukan Prediksi Mall Customers dengan Clustering :

  1. melakukan import library dan membaca dataset
  2. membaca info, jumlah ukuran dataset dan mengecek missing values
  3. EDA 

4.  melihat jumlah dari masing-masing gender 

5. membuat model K-MEANSdengan jumlah cluster = 9 

6.  membuat model DBSCAN menggunakan cluster berjumlah = 9 

7. hasil dari DBSCAN 

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Machine Learning Dengan Scikit Learn Python