BUDI KARYADI
Korelasi merupakan salah satu Teknik statistika yang digunakan untuk mencari hubungan antara dua variable yang bersifat kuantitatif. Data dikatakan memiliki keterhubungan apabila nilai korelasi mendekati -1 atau 1. Jika nilai korelasi mendekati 0 maka kedua variable tersebut kurang memiliki keterhubungan, namun jika nilai korelasi mendekati 1 maka data tersebut dikatakan positif korelasi dan jika nilai korelasi -1 maka dikatakan negative korelasi.
DESCRIPTION
Data set yang akan disajikan terkait dengan “House Price Prediction” yang bersumber dari https://www.kaggle.com/datasets/shree1992/housedata. Variable pada dataset tersebut berjumlah 18 yaitu date, price, bedrooms, bathrooms, sqft_living, sqft_lot, floors, waterfront, view, condition, sqft_above, sqft_basement, yr_built, yt_renovated, street, city, statezip, country. Dalam variable-variable tersebut dibagi menjadi 2 jenis yaitu variable independent dan variable dependent. Variable dependent adalah variable yang saling ketergantungan yang terdiri dari date, bedrooms, bathrooms, sqft_living, sqft_lot, floors, waterfront, view, condition, sqft_above, sqft_basement, yr_built, yt_renovated, street, city, statezip, country. Sedangkan variable independent adalah variable yang tidak ketergantungan atau dapat dikatakan variable yang akan dilakukan prediksi yaitu variable price. Pada Analisa ini akan dilakukan pemilihan 3 variable dependent bedrooms, bathrooms, sqft_living dan sqft_above.
Pada pengujian korelasi antara variable price dan bedrooms didapatkan korelasi senilai 0,2003362894 yang berarti Positive Correlation.
Pada pengujian korelasi antara variable price dan bathrooms didapatkan korelasi senilai 0,3271099183 yang berarti Positive Correlation.
Pada pengujian korelasi antara variable price dan sqt_living didapatkan korelasi senilai 0,4304100254 yang berarti Positive Correlation.
Pada pengujian korelasi antara variable price dan sqt_above didapatkan korelasi senilai 0,3675696016 yang berarti Positive Correlation.
Kesimpulan
Berdasarkan pengujian yang telah dilakukan terhadap 4 variable dependent dapat disimpulkan bahwa sqt_living memiliki nilai 0,4304100254 yang memperlihatkan nilai korelasi kuat positif, artinya semakin luas living room maka harga jual rumah tersebut juga akan tinggi. Korelasi kedua variable tersebut bagus meskipun dengan tingkatan rendah atau dikategorikan sebagai low positive correlation