Prediksi Harga Laptop Dengan Bayesian Ridge

Karina Ghaisani

Sosial Media


0 orang menyukai ini
Suka

Summary

Pada projek ini, saya menerapkan algoritma regresi Bayesian Ridge untuk memprediksi harga laptop. Bayesian Ridge digunakan karena harga laptop sebagai variabel dependen berupa angka kontinu. Tujuan dari proyek ini adalah untuk memperkirakan harga laptop berdasarkan spesifikasi yang dimilikinya, serta memberikan insight bisnis dengan membandingkan hasil prediksi terhadap harga rata-rata produk lain dengan spesifikasi serupa, sehingga dapat membantu dalam penetapan harga yang lebih kompetitif di pasar.

Description

Dataset

Dataset yang digunakan merupakan dataset Laptop Price yang diambil dari situs Kaggle. Dataset ini terdiri dari 13 atribut. Secara keseluruhan, dataset ini memiliki total 1303 data.

 

Preprocessing Data

Sebelum membangun model prediksi harga laptop, saya terlebih dahulu melakukan proses pembersihan dan persiapan data agar siap digunakan oleh algoritma. Kolom yang dianggap tidak relevan seperti laptop_ID dan Product dihapus agar tidak menimbulkan bias atau beban berlebih pada model. Kemudian, data teks pada kolom Ram dan Weight dibersihkan dengan menghilangkan satuan seperti "GB" dan "kg", lalu diubah menjadi angka. Setelah data bersih, saya memisahkan fitur (X) dan label target (y), lalu membagi data ke dalam data latih dan data uji untuk melatih dan mengevaluasi model secara adil. Karena data terdiri dari fitur numerik dan kategorikal, maka saya pisahkan keduanya: fitur numerik diproses menggunakan PowerTransformer agar distribusi datanya lebih normal, sedangkan fitur kategorikal diproses menggunakan OneHotEncoder agar bisa dibaca oleh model. Semua proses ini digabungkan dalam sebuah ColumnTransformer sehingga seluruh tahapan preprocessing berjalan otomatis saat pelatihan maupun prediksi.

 

Pemodelan Data

Setelah data selesai diproses, saya membangun model prediksi harga laptop menggunakan algoritma Bayesian Ridge Regression yang mampu menangani korelasi antar fitur serta mengontrol kompleksitas model secara otomatis. Seluruh proses preprocessing sebelumnya digabungkan ke dalam pipeline, sehingga setiap data yang masuk akan diproses secara konsisten sebelum diprediksi. Model kemudian dilatih menggunakan data latih untuk mempelajari hubungan antara spesifikasi laptop dengan harganya, seperti RAM, CPU, ukuran layar, berat, dan sistem operasi. Setelah dilatih, model dievaluasi dengan data uji menggunakan metrik MAE, MSE, RMSE, dan R-squared untuk mengukur seberapa akurat model dalam memprediksi harga laptop berdasarkan spesifikasinya.

 

Pengujian Prediksi

Setelah model selesai dilatih, saya mengujinya pada data baru yang berisi spesifikasi laptop seperti perusahaan, tipe, ukuran layar, resolusi, prosesor, RAM, kapasitas penyimpanan, kartu grafis, sistem operasi, dan berat. Data baru ini secara otomatis diproses oleh pipeline, sehingga preprocessing seperti transformasi numerik dan encoding kategori tetap berjalan konsisten. Setelah diproses, model memprediksi harga laptop berdasarkan spesifikasi yang diberikan, dan hasil prediksi ditambahkan kembali ke dalam data untuk ditampilkan.

 

Perbandingan Hasil Prediksi dengan Rata-rata Harga Pasar

Setelah model berhasil memprediksi harga laptop baru berdasarkan spesifikasinya, saya melanjutkan analisis untuk memberikan insight bisnis yang lebih praktis. Dengan membandingkan hasil prediksi sebesar sekitar €1046 dengan rata-rata harga pasar dari laptop lain yang memiliki spesifikasi CPU, Memory, dan GPU yang sama yaitu sekitar €1100, saya dapat melihat bahwa harga prediksi model sedikit lebih rendah dibanding rata-rata segmen. Insight ini memberikan gambaran awal bahwa laptop baru dengan spesifikasi tersebut masih cukup kompetitif di pasaran. Perbedaan harga ini bisa menjadi bahan pertimbangan bagi tim bisnis, khususnya dalam menyusun strategi pricing agar tetap menarik bagi konsumen namun tetap menguntungkan bagi perusahaan.


Simpulan

Dalam project ini, saya membangun model prediksi harga laptop berbasis Bayesian Ridge Regression dengan preprocessing otomatis menggunakan pipeline, lalu menambahkan analisis business intelligence dengan membandingkan hasil prediksi terhadap rata-rata harga pasar pada segmen spesifikasi (CPU, Memory, GPU) yang sama. Hasil ini memberikan gambaran akurat tidak hanya soal prediksi harga, tapi juga posisi harga produk di tengah kompetitor serupa, yang dapat membantu pengambilan keputusan bisnis terkait penetapan harga.

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Data Science