ANALISA KORELASI DATA PENJUALAN RUMAH

Ainul Kharis

Sosial Media


1 orang menyukai ini
Suka

Summary

Pada portofolio ini saya melakukan analisa data House Price Prediction untuk mengetahui hubungan antara ruang keluarga (sqft_living) dan ukuran parkir (sqft_lot) dengan harga jual rumah (price) dalam memprediksi penjualan rumah. Dalam pengujian ini saya menggunakan teknik korelasi yaitu dengan menguji apakah hubungan antara dua atau lebih variabel berbanding lurus atau terbalik atau bahkan tidak mempunyai hubungan sama sekali.

Sebelum mengetahui kebenarannya, maka diperlukan hipotesis atau dugaan terlebih dahulu. Untuk lebih mudah mengetahuinya, maka perlu dibuatkan visualisasi Diagram Sebar (Scatter Plot) yaitu suatu plot/diagram yang memetakan relasi diantara dua variabel di sumbu x dan sumbu y, untuk membuktikan kebenarannya dalam statistika.

Description

Analisa

Pertama, buka dataset House Price Prediction yang sudah didownload sebelumnya dari https://www.kaggle.com/datasets/shree1992/housedata. Kemudian buka menggunakan Google Spreadsheet atau Microsoft Excel. Selanjutnya pilih variabel yang akan dilakukan untuk mengetahui nilai rata-rata (mean) dan nilai korelasinya (correlation).

Variabel yang akan diujikan:

  1. Sqft_living vs Price
  2. Sqft_lot vs Price

Kedua, lakukan pemeriksaan di setiap variabel untuk melihat apakah ada data yang missing value (tak bernilai 0.0/?). Jika ditemukan ada, maka data tersebut harus dilakukan penghapusan atau eliminasi terlebih dahulu agar tidak memberikan efek bias pada saat perhitungan atau pengolahan data.

    

Ketiga, melakukan pengolahan data antara variabel sqft_living dengan price dan variabel sqft_lot dengan price

  • Sqft_living dengan price

Untuk mengetahui nilai rata-ratanya dapat menggunakan rumus berikut:

=AVERAGE(A2:A4549) dan =AVERAGE(B2:B4549) 

Dan untuk mengetahui nilai korelasinya dapat menggunakan rumus berikut:

=CORREL(A2:A4549;B2:B4549)

Didapatkan nilai rata-rata (mean) sqft_living sebesar 2132,67942 dan price sebesar 342.970.837.755,00. Selanjutnya dilakukan perhitungan korelasi dengan menggabungkan setiap nilai rata-rata variabel, maka didapatkan hasil korelasinya bernilai low positive correlation (+ 0,218074847) artinya hubungan korelasinya searah dan kuat. Jadi, semakin luas ruang keluarga (sqft_living), maka harganya semakin tinggi (price).

  • Sqft_lot dengan price

Untuk mengetahui nilai rata-ratanya dapat menggunakan rumus berikut:

=AVERAGE(A2:A4552) dan =AVERAGE(B2:B4552)

Dan untuk mengetahui nilai korelasinya dapat menggunakan rumus berikut:

=CORREL(A2:A4552;B2:B4552)

Didapatkan nilai rata-rata (mean) sqft_lot sebesar 14835,2806 dan price sebesar 340.242.494.681,00. Selanjutnya dilakukan perhitungan korelasi dengan menggabungkan setiap nilai rata-rata variabel, maka didapatkan hasil korelasinya bernilai no correlation (- 0,09722596) artinya menandakan bahwa hubungan antara keduanya tidak memiliki keterkaitan ketika parkiran mobil (sqft_lot) rendah maupun tinggi tidak akan mempengaruhi harga (price).

Kesimpulan

Berdasarkan data hasil pengujian diatas pada pengujian pertama antara sqft_living terhadap price menghasilkan nilai korelasi (+ 0,218074847). Menunjukkan bahwa nilai korelasi bernilai low positive correlation, artinya memiliki hubungan korelasi yang positif tetapi sangat rendah. Sedangkan pada pengujian kedua antara sqft_lot terhadap price menghasilkan nilai korelasi (- 0,09722596). Menunjukkan bahwa nilai korelasi bernilai no correlation, artinya hubungan antara keduanya tidak ada keterkaitan, baik ketika nilainya rendah maupun tinggi tidak akan mempengaruhi harga. 

Informasi Course Terkait
  Kategori: Artificial Intelligence
  Course: Master Class Matematika for Computing