Analisa Korelasi Data dengan Microsoft Excel

Ongki Alaric Giovani

Sosial Media


0 orang menyukai ini
Suka

Summary

Microsoft Excel merupakan software program software spreadsheet yang berfungsi untuk visualisasi dan analisa data. Excel telah dilengkapi dengan berbagai formula yang memudahkan aktivitas analisa data. Visualisasi data yang disediakan pada Excel juga beragam sehingga dapat disesuaikan dengan aplikasi yang diinginkan. Analisa korelasi merupakan metode yang digunakan untuk mengetahui hubungan antara variabel, sehingga dapat meningkatkan pemahaman terhadap data yang ingin dianalisa. Pada analisa korelasi dengan jumlah variabel di bawah 3, korelasi juga dapat dianalisa dengan memvisualisasikan data pada suatu grafik. Pada kali ini saya akan menganalisa korelasi variabel dataset auto-mobile yang sudah tersedia di Kaggle.

Description

LATAR BELAKANG

Analisa korelasi berfungsi untuk menganalisa data berdasarkan hubungan antara data yang dikorelasikan. Terdapat berbagai tool yang dapat digunakan untuk menganalisa korelasi variabel, salah satunya adalah Microsoft Excel. Microsoft Excel merupakan software program software spreadsheet yang berfungsi untuk visualisasi dan analisa data. Analisa dilakukan menggunakan software Microsoft Excel dengan cara memvisualisasikan data pada scatter plot serta mencari nilai fungsi Correl antara kedua variabel. Fungsi CORREL mengembalikan koefisien korelasi dua rentang sel.  Korelasi positif berarti bahwa jika nilai dalam satu array meningkat, nilai dalam array lain juga meningkat. Koefisien korelasi yang mendekati 0, menunjukkan korelasi tidak ada atau lemah.

Akan dilakukan dua analisa korelasi, antara lain :

  • Korelasi antara ukuran mesin dan harga
  • Korelasi antara konsumsi bahan bakar dan harga

DATASET

Automobile dataset merupakan dataset yang berisi data dari “1985 Ward's Automotive Yearbook”. Automobile dataset terdiri atas tiga jenis entitas: 

(a) spesifikasi mobil dalam hal berbagai karakteristik, 

(b) peringkat risiko asuransi yang ditetapkan, 

(c) kerugian yang dinormalisasi dalam penggunaan dibandingkan dengan mobil lain. 

Link Dataset : https://www.kaggle.com/datasets/toramky/automobile-dataset 

ANALISA KORELASI

Pada awalnya dataset perlu dimasukkan terlebih dahulu ke dalam Excel :

Kemudian mengambil data Engine-Size dan Price ke sheet baru, lakukan hal yang sama pada data Highway-MPG dan Price. Selanjutnya mengkonversi data price dari bentuk string ke number :

Kemudian menampilkan kedua data pada scatter plot :

Kemudian digunakan Fungsi CORREL untuk mengetahui korelasi antara data harga terhadap data MPG dan ukuran mesin.

KESIMPULAN

Berdasarkan hasil pada grafik scatter plot dan nilai fungsi CORREL, terlihat korelasi positif pada korelasi harga dan ukuran mesin yang menandakan bahwa harga akan semakin naik jika ukuran mesin bertambah. Pada  korelasi harga dan konsumsi bahan bakar didapatkan korelasi negatif, yang menandakan bahwa kedua variabel memiliki hubungan banding-terbalik, dimana harga semakin menurun seiring kenaikan MPG.

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Kalkulus