Customers Clustering using K-Means and DBScan

Yuliana

Sosial Media


0 orang menyukai ini
Suka

Summary

Pada pembelajaran ini saya menggunakan Jupyter Notebook dan bahasa pemograman python sebagai tools dalam melakukan clustering data customers. Saya melakukan clustering pada data menggunakan algoritma K-Means dan DBScan. Saya mengambil data set dari Kaggle.com bernama “Mall Customer Segmentation Data”

Description

Melakukan Clustering pada data menggunakan algoritma K-Means dan DBScan. Saya mengambil data set dari Kaggle.com bernama “Mall Customer Segmentation Data ” https://www.kaggle.com/code/datark1/customers-clustering-k-means-dbscan-and-ap/data?select=Mall_Customers.csv"

  • Load Data dan Preprocessing

Hal pertama yang harus dilakukan yaitu download dataset lalu upload pada jupyter notebook, setelah itu melakukan import library yang dibutuhkan. Saya menggunakan library pandas, numpy, matplotlib, dan seaborn. Selanjutnya membaca dataset yang bernama brain_stroke.csv menggunakan perintah .read_csv() dan .head(), data yang akan ditampilkan yaitu 5 baris data teratas.

 

  • Exploratory Data Analysis

Kemudian saya melakukan perubahan value pada kolom gender, dimana pada kolom ini awalnya berisikan value Male dan Female. Lalu saya merubah value nya menjadi 0 untuk Male dan 1 untuk Female. Selanjutnya menggunakan perintah df.shape untuk mengetahui jumlah data dalam bentuk baris dan kolom. Pada output terlihat bahwa data berukuran 200 baris dan 5 kolom.

menggunakan fungsi sample untuk menampilkan 10 data sampel

 lalu menggunakan perintah df.info agar mengetahui informasi dari setiap kolom data, dan terlihat tidak ada value data yang null. Pada output juga terlihat tidak ada value yang kosong. Selanjutnya menggunakan fungsi rename untuk merubah nama kolom dari ‘Annual Income(k$)’ menjadi ‘income’ dan nama kolom ‘spending score(1-100)’ menjadi ‘spendscore’.

menggunakan fungsi describe untuk menampilkan informasi deskriptif statistik dataframe

  • Clustering

K-Means

3D of K-Means

DBScan

  • Model Performance and Evaluation

 

Informasi Course Terkait
  Kategori: Artificial Intelligence
  Course: Machine Learning Dengan Scikit Learn Python