Foto User
Analisis Nilai Dataset Retail Store Sale Transaksi

Indah Putri Jamanti

Sosial Media


0 orang menyukai ini
Suka

Summary

Proyek Akhir - Menganalisa Nilai pada Dataset Retail Store Sale Transaction
Proyek ini bertujuan untuk mengevaluasi kualitas layanan pada sektor ritel dengan menggunakan pendekatan machine learning berdasarkan metode Servqual. Data penjualan ritel diperoleh dari file berformat Excel (XLSX), kemudian dianalisis menggunakan Google Colab yang terhubung dengan akun Google Drive. Fokus utama dari proyek ini adalah membangun model klasifikasi machine learning (seperti Decision Tree) untuk memprediksi kepuasan pelanggan terhadap layanan ritel berbasis data survei.

Platform dan tools yang digunakan:

  • Google Colab – untuk pemrograman dan analisis
  • Google Drive – sebagai tempat penyimpanan data
  • Python (pandas, matplotlib, scikit-learn) – untuk pengolahan data dan membangun model machine learning

Langkah-langkah analisis:

  1. Menghubungkan Google Colab dengan Google Drive untuk mengakses dataset Retail Sales Dataset yang berisi data persepsi dan harapan pelanggan terhadap layanan toko ritel.
  2. Membaca dan membersihkan data, termasuk memeriksa nilai kosong (missing value), memisahkan kolom persepsi dan harapan, serta menghitung nilai GAP (Persepsi - Harapan) untuk setiap indikator layanan berdasarkan lima dimensi Servqual.
  3. Membagi data menjadi set pelatihan (X_train, y_train) dan set pengujian (X_test, y_test).
  4. Membangun model machine learning (menggunakan algoritma Decision Tree) untuk memprediksi kepuasan pelanggan berdasarkan nilai GAP dari dimensi Servqual.
  5. Mengevaluasi performa model menggunakan metrik:
    Mean Squared Error (MSE): 131.393.190,09
    R-squared (R²): 0,909
    Hasil ini menunjukkan bahwa model memiliki kemampuan prediksi yang sangat baik, dengan R² yang berarti sekitar 90,9% variasi dalam data target dapat dijelaskan oleh model.


Visualisasi hasil analisis, termasuk:

  • Grafik rata-rata GAP per dimensi Servqual.
  • Diagram batang perbandingan persepsi vs harapan.
  • Visualisasi hasil prediksi model untuk melihat performa klasifikasi secara visual.

Description

Proyek Akhir – Menganalisa Nilai pada Dataset Retail Store Sale Transaction
Dalam proyek analisis data ini, saya memanfaatkan machine learning untuk memahami topik yang dekat dengan kehidupan sehari-hari, yaitu kepuasan pelanggan dalam layanan penjualan ritel. Langkah ini dimulai dengan menggunakan Google Colab sebagai platform analisis. Google Colab sangat cocok karena menyediakan lingkungan interaktif untuk eksperimen data science, memungkinkan saya menulis kode Python, menjalankan skrip, dan menampilkan visualisasi secara langsung.

Data yang digunakan berasal dari file Excel (XLSX) berjudul Retail Sales Dataset, yang berisi hasil survei pelanggan mengenai lima dimensi kualitas layanan menurut metode SERVQUAL, yaitu:

  • Bukti fisik (tangibles)
  • Keandalan (reliability)
  • Daya tanggap (responsiveness)
  • Jaminan (assurance)
  • Empati (empathy)
  • File ini saya simpan terlebih dahulu di Google Drive agar mudah diakses dan diproses melalui Google Colab.

Langkah-langkah analisis yang dilakukan :

  1. Menghubungkan Google Colab dengan Google Drive, lalu mengimpor file Excel ke dalam Colab.
  2. Memisahkan data menjadi dua bagian utama: nilai harapan (H) dan nilai persepsi (P) dari pelanggan.
  3. Menghitung nilai GAP (P - H) untuk setiap dimensi layanan. Nilai GAP ini digunakan untuk mengetahui sejauh mana layanan yang diterima sesuai atau tidak sesuai dengan harapan pelanggan.
  4. Membangun model machine learning menggunakan algoritma Linear Regression untuk memprediksi tingkat kepuasan pelanggan berdasarkan nilai GAP pada lima dimensi layanan.
  5. Data dibagi menjadi data pelatihan (X_train, y_train) dan data pengujian (X_test, y_test) agar model dapat dilatih dan diuji performanya secara adil.
     

Hasil Evaluasi Model :
Mean Squared Error (MSE): 131.393.190,09
R-Squared (R²): 0,909
Nilai R² sebesar 90,9% menunjukkan bahwa model mampu menjelaskan sebagian besar variasi tingkat kepuasan pelanggan berdasarkan lima dimensi layanan Servqual. Ini menandakan bahwa model memiliki akurasi dan kestabilan yang tinggi. Meski nilai MSE terlihat besar, hal ini bisa disebabkan oleh skala data survei, dan masih dalam batas wajar untuk konteks ini.

Visualisasi yang Dibuat :
Grafik batang nilai rata-rata persepsi, harapan, dan GAP untuk setiap dimensi layanan. Scatter plot antara nilai aktual dan nilai prediksi dari model machine learning. Confusion matrix (jika dilakukan klasifikasi puas/tidak puas). Visualisasi ini membantu memperjelas bahwa daya tanggap merupakan dimensi dengan GAP terbesar dan menjadi prioritas utama untuk perbaikan layanan, sedangkan bukti fisik memiliki GAP terkecil, menunjukkan kinerja yang memuaskan di aspek tersebut.

Insight Data :
Semua dimensi SERVQUAL memiliki nilai GAP negatif, menandakan bahwa layanan belum memenuhi harapan pelanggan secara umum. Daya tanggap memiliki GAP terbesar menunjukkan area yang paling membutuhkan perbaikan. Bukti fisik memiliki GAP terkecil menunjukkan bahwa tampilan atau fasilitas fisik toko sudah cukup memenuhi ekspektasi pelanggan. Model machine learning menunjukkan prediksi yang akurat dan andal, terbukti dari R² sebesar 0,909.

 

  • Dataset : 

https://www.kaggle.com/datasets/marian447/retail-store-sales-transactions/data

  • Visual dan Coding Proyek Akhir :

https://colab.research.google.com/drive/1peHFYbsk23PPopN16BGWjwiynmh89hWZ#scrollTo=Sn2sGO9dWcKC 

  • Spreadsheets EDA : 

https://docs.google.com/spreadsheets/d/1pI-gjsalwEQTIrnJplgpc02ZAoCj7sMaFB5xyb-jakE/edit?usp=sharing 

Informasi Course Terkait
  Kategori: Algoritma dan Pemrograman
  Course: Machine Learning For Beginner