Visualisasi dan Korelasi Data Menggunakan Excel

Yasmin Khairunnisa

Sosial Media


0 orang menyukai ini
Suka

Summary

Visualisasi data adalah kumpulan data yang ditampilkan dengan grafis. Visualisasi data pada portofolio ini menggunakan diagram scatter dan melakukan uji korelasi data. Diagram Scatter berfungsi untuk melakukan pengujian terhadap seberapa kuatnya hubungan antara 2 (dua) variabel serta menentukan jenis hubungan dari 2 (dua) variabel. Uji Korelasi yang digunakan untuk mengetahui keeratan hubungan antara beberapa variabel. Biasanya uji korelasi ini akan sangat berhubungan dengan uji regresi yang menunjukkan apakah masing-masing variabel saling mempengaruhi.

Description

Visualisasi data yang akan dilakukan pada portofolio ini yaitu dengan menggunakan Scatterplot antara data Engine - size dengan Price dan antara data Highway - mpg dengan Price . Selain itu , juga dilakukan uji korelasi terhadap Engine - size dengan Price dan Highway - mpg dengan Price beserta dengan menghitug nilai averagenya. Data tersebut didapatkan dengan mengunduh dari link berikut https://www.kaggle.com/datasets/toramky/automobile-dataset.

Berikut pengerjaan pembuatan visualisasi data dengan scatterplot dan pengujian uji korelasi :

  1. Melakukan formatting dan merapihkan data.

Untuk mempercantik tampilan serta memudahkan penglihatan kita terhadapdata-data pada Microsoft Excel.

Hasil Formating dan perapihan data

  • Data yang diunduh masih berbentukCSV yaitu data terkumpul di dalam satu kolom.

Untuk memisahkan data menjadi beberapa kolom dapat dilakukan Block salah satu column data -> klik menu Data -> Text to Columns.

  • Agar data terlihat lebih rapih dilakukanformatting cells dengan menggunakan fill dan border.
  • Fill digunakan untuk memberi warna pada latar belakang(background) dari cell.

Block semua baris pertamacell -> klik kanan-> Format Cells -> Fill -> pilih warna->Ok

  • Border bertujuan untuk memberi garistepi pada cell yang dipilih. Block semua cell -> klik kanan-> Format Cells -> Border -> pilih border-> Ok
  • Setelah merapihkan data, selanjutnya data akan dibuatvisualisasinya dengan scatterplot dan uji korelasi beserta mengitung nilai averagenya. 

2. Membuat visualisasi data dengan scatterplot dan menguji korelasiantara Engine - size dan Price di lembar ke-2.

Hasil Scatterplot dan korelasiantara data Engine - size dan Price

  • Copy-kan kolom data Engine - size dan Price dan letakkan di halaman ke-2 atau sheet ke-2.
  • Membuat diagram Scatterplot dengan cara Block kolom data Engine- size dan Price-> Klik menu Insert -> Scatter
  • Menghitung nilai average data Engine - size dan Price dengan cara menggunakan rumus =Average(number1, [number2], ...) dan mendapatkan nilai average nya sebesar:
  1. Average Engine– size = 126,9073171
  1. Average Price = 13207,12935
  • Uji Korelasi data Engine - size dan Price. Dengan cara menggunakan rumus =Correl(Array1, Array2)
  • Didapatkan analisis dan uji korelasiantara data Engine - size dan Price

Hasil koreasi dengan nilai sebesar 0,872335167. Korelasi antara data Engine - size dan Price bernilai positif yang menunjukkan hubungan kedua variabel ini mempunyai hubungan searah. Artinya, ketika variabel Engine - size tinggi, maka nilai variabel Price akan tinggi pula.

3. Membuat visualisasi data dengan scatterplot dan menguji korelasiantara Highway - mpg dan Price di lembar ke-3.

Hasil Scatterplot dan korelasiantara data Highway- mpg dan Price

  • Copy-kan kolom data Highway - mpg dan Price dan letakkan di halaman ke-3 atausheet ke-3.
  • Membuat diagram Scatterplot dengan cara : Block kolom data Highway - mpg dan Price -> Klik menu Insert -> Scatter
  • Menghitung nilai average data Highway - mpg dan Price dengan cara menggunakan rumus =Average(number1, [number2], ...) dan mendapatkan nilai average nya sebesar:
  1. Average Highway- mpg = 30,75121951
  2. Average Price = 13207,12935
  • Uji Korelasi data Highway - mpg dan Price dengan cara menggunakan rumus =Correl(Array1, Array2)
  • Didapatkan analisis dan ujikorelasi antara data Highway- mpg dan Price

Hasil koreasi dengan nilai sebesar -0,704692265. Korelasi antara data Highway - mpg dan Price bernilai negatif yang menunjukkan hubungan kedua variabel mempunyai memiliki hubungan yang berlawanan. Dimana jika nilai variabel Highway - mpg tinggi, maka nilai variabel Price justru rendah atau menurun.

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Basic Excel