Nurul Febi Anisa
Exploratory Data Analysis (EDA) atau dikenal pula dengan analisis data eksploratif merupakan pendekatan analisis untuk suatu data guna membuat gambaran keseluruhan (susmmary) data sehingga mudah untuk dipahami. Metode analisis ini menyediakan berbagai alat untuk meringkas dan memperoleh wawasan tentang sekumpulan data dengan cepat menggunakan grafik sebagai bentuk visualisasi data, tanpa menggunakan model statistik, atau formulasi hipotesis. Langkah pertama dalam menganalisis data adalah mempelajari karakteristik data tersebut. Exploratory Data Analysis ini menggunakan Microsoft Excel dapat dilakukan dengan rumus-rumus yang ada pada Excel. Dengan menggunakan rumus-rumus pada excel dapat membandingkan apakah ada korelasi antara harga jual rumah dengan ukuran ruang keluarga dan luas parkiran dengan harga rumah. Untuk melakukan Exploratory Data Analysis pada Microsoft Excel menggunakan rumus Average dan Correl.
Langkah awal sebelum melakukan EDA korelasi antara ukuran ruang keluarga dengan harga jual rumah dan luas parkiran dengan harga jual rumah yaitu terlebih dahulu mengunduh data House price prediction (History penjualan rumah)
pada website dibawah ini :
https://www.kaggle.com/datasets/shree1992/housedata
Setelah mengunduh lalu file di rename dengan format csv yaitu rumah.csv lalu file bisa dipindahkan ke drive
setelah itu file bisa dibuka dengan Microsoft Excel
Setelah itu maka dapat dilakukan Exploratory Data Analysis
Pada sheet ke-1 dari workbook merupakan proses untuk mengetahui korelasi dari data harga jual rumah dengan ukuran ruang keluarga menggunakan rumus Excell Correl dan Average serta visualisasi dengan chart Scatterplot.
Correlation
SQFT_LIVING Dengan Rumus :
=CORREL(A:A,B:B)
SQFT_LOT Dengan Rumus :
=CORREL(A:A,B:B)
Average SQFT_LIVING Dengan Rumus :
=AVERAGE(A2:A4601)
Average SQFT_LOT Dengan Rumus :
=AVERAGE(A2:A4601)
Pada sheet ke-1 korelasi antara harga jual rumah dengan ukuran ruang keluarga menggunakan rumus Excel Correl dan Average serta visualisasi menggunakan chart Scatterplot.
Yaitu jika nilai korelasi mendekati -1 dengan nilai -0,01 yang artinya berhubungan negatif. Sehingga dapat disimpulkan bahawa semakin kecil ukuran ruang keluarga maka semakin kecil juga harga dari rumah tersebut.
1 = perfect correlation
-1 = negative correlation
0 = no correlation
Pada sheet ke-2 dari workbook merupakan proses untuk mengetahui korelasi dari data harga jual rumah dengan luas parkiran menggunakan rumus Excel Correl dan Average serta visualisasi menggunakan chart Scatterplot.
1 = perfect correlation
-1 = negative correlation
0 = no correlation
Korelasi antara harga jual rumah dengan ukuran ruang keluarga menggunakan rumus Correl. Yaitu jika nilai korelasi mendekati -1 dengan nilai -0,002 yang artinya berhubungan negatif. Sehingga dapat disimpulkan bahawa semakin kecil luas parkiran maka semakin rendah juga harga dari rumah tersebut.
Dari hasil uji coba diatas disimpulkan bahwa Sqft_Living dan Sqft_Lot mempengaruhi data Price atau data penjualan rumah.