Ongki Alaric Giovani
Microsoft Excel merupakan software program software spreadsheet yang berfungsi untuk visualisasi dan analisa data. Excel telah dilengkapi dengan berbagai formula yang memudahkan aktivitas analisa data. Visualisasi data yang disediakan pada Excel juga beragam sehingga dapat disesuaikan dengan aplikasi yang diinginkan. Analisa korelasi merupakan metode yang digunakan untuk mengetahui hubungan antara variabel, sehingga dapat meningkatkan pemahaman terhadap data yang ingin dianalisa. Pada analisa korelasi dengan jumlah variabel di bawah 3, korelasi juga dapat dianalisa dengan memvisualisasikan data pada suatu grafik. Pada kali ini saya akan menganalisa korelasi variabel dataset auto-mobile yang sudah tersedia di Kaggle.
LATAR BELAKANG
Analisa korelasi berfungsi untuk menganalisa data berdasarkan hubungan antara data yang dikorelasikan. Terdapat berbagai tool yang dapat digunakan untuk menganalisa korelasi variabel, salah satunya adalah Microsoft Excel. Microsoft Excel merupakan software program software spreadsheet yang berfungsi untuk visualisasi dan analisa data. Analisa dilakukan menggunakan software Microsoft Excel dengan cara memvisualisasikan data pada scatter plot serta mencari nilai fungsi Correl antara kedua variabel. Fungsi CORREL mengembalikan koefisien korelasi dua rentang sel. Korelasi positif berarti bahwa jika nilai dalam satu array meningkat, nilai dalam array lain juga meningkat. Koefisien korelasi yang mendekati 0, menunjukkan korelasi tidak ada atau lemah.
Akan dilakukan dua analisa korelasi, antara lain :
DATASET
Automobile dataset merupakan dataset yang berisi data dari “1985 Ward's Automotive Yearbook”. Automobile dataset terdiri atas tiga jenis entitas:
(a) spesifikasi mobil dalam hal berbagai karakteristik,
(b) peringkat risiko asuransi yang ditetapkan,
(c) kerugian yang dinormalisasi dalam penggunaan dibandingkan dengan mobil lain.
Link Dataset : https://www.kaggle.com/datasets/toramky/automobile-dataset
ANALISA KORELASI
Pada awalnya dataset perlu dimasukkan terlebih dahulu ke dalam Excel :
Kemudian mengambil data Engine-Size dan Price ke sheet baru, lakukan hal yang sama pada data Highway-MPG dan Price. Selanjutnya mengkonversi data price dari bentuk string ke number :
Kemudian menampilkan kedua data pada scatter plot :
Kemudian digunakan Fungsi CORREL untuk mengetahui korelasi antara data harga terhadap data MPG dan ukuran mesin.
KESIMPULAN
Berdasarkan hasil pada grafik scatter plot dan nilai fungsi CORREL, terlihat korelasi positif pada korelasi harga dan ukuran mesin yang menandakan bahwa harga akan semakin naik jika ukuran mesin bertambah. Pada korelasi harga dan konsumsi bahan bakar didapatkan korelasi negatif, yang menandakan bahwa kedua variabel memiliki hubungan banding-terbalik, dimana harga semakin menurun seiring kenaikan MPG.