Cara Membuat Visualisasi Data Dengan Scatter Plot

Hijatun Nafisah

Sosial Media


6 orang menyukai ini
Suka

Summary

Scatter Plot sering juga disebut dengan grafik sebar, adalah penggunaan titik-titik untuk mewakili nilai untuk dua variabel numerik yang berbeda. Posisi setiap titik pada sumbu horizontal dan vertikal menunjukkan nilai untuk titik data individual. Scatter plot digunakan untuk mengamati hubungan antar variabel. Pada portofolio ii menjelaskan bagaimana cara membuat visualisasi data Scatter Plot dengan menggunakan excel. Variabel yang diuji adalah antara Engine-size vs Price dan Highway-mpg vs Price. Tujuan dari pembuatan portofolio ini adalah mengetahui nilai rata-rata dan nilai korelasi antar variabel tersebut.

Description

Scatter Plot sering juga disebut dengan grafik sebar, adalah penggunaan titik-titik untuk mewakili nilai untuk dua variabel numerik yang berbeda. Posisi setiap titik pada sumbu horizontal dan vertikal menunjukkan nilai untuk titik data individual. Scatter plot digunakan untuk mengamati hubungan antar variabel. Pada portofolio ii menjelaskan bagaimana cara membuat visualisasi data Scatter Plot dengan menggunakan excel. Variabel yang diuji adalah antara Engine-size vs Price dan Highway-mpg vs Price. Tujuan dari pembuatan portofolio ini adalah mengetahui nilai rata-rata dan nilai korelasi antar variabel tersebut.

 

Data yang digunakan diambil dari https://www.kaggle.com/datasets/toramky/automobile-dataset

Merapihkan data

  1. Buka data yang akan dirapihkan
  2. Klik kolom A => Data => Text To Columns

3. Dan berikut Hasilnya

Setelah itu barulah kita menguji korelasi pada data tersebut

 

Cara Membuat Visualisasi Data Dengan Scatter Plot Pada Ms Excel

  • Visualisasi Data Antara Engine-size dan Price
  1. Copy variabel yang akan kita uji yaitu Engine-size dan Price pada sheet lain
  2. Klik cell Price => Insert => Scatter

3. Klik Design, pilih Format Diagram

4. Merapihkan posisi titiknya dengan cara, klik diagram (data vertikal/horizontal) => format axis => axis option =>pada pilihan minimum kita ketik angka sesuai ketentuan

5. Selanjutkan tambahkan garis trendline agar memudahkan untuk menentukan hubungan pada kedua variabel tersebut. Caranya, klik diagram =>tekan tanda + berwarna hijau di bagian kanan atas diagram => ceklis trendline => klik panah, cari display R -squared value on chart

6. Mengetahui nilai R dengan rumus =SQRT(cell nilai R2)

7. Cari rata-rata pada variabel dengan rumuh =AVERAGE(range yang ditentukan)

 

Lakukan hal yang sama untuk visualisasi Scatter diagram antara Highway-mpg dan Price

 

HASIL

  • Engine-Size dan Price

Dari data diagram diatas didapatkan :

a) Average Engine-Size : 126,907

b) Average Price : 1302,1

c) R2 :0,7024

d) R : 0,83809

Dari hasil diatas terlihat bahwa ada hubungan linier antara Engine-Size dan Price dimana semakin tinggi Engine-Size, semakin tinggi pula pricenya, adapun hubungannya dapat dikatakan kuat positif melalui hasi korelasi sebesar 0,83809

 

  • Highway-mpg dan Price

Dari data diagram diatas didapatkan :

a) Average Highway-mpg : 30,75121951

b) Average Price : 1320,12935

c) R2 :0,68768

d) R : 0,4729

Dari hasil diatas terlihat bahwa ada hubungan linier antara Highway-mpg dan Price dimana semakin tinggi Highway-mpg, semakin rendah pricenya, adapun hubungannya dapat dikatakan kuat negatif melalui hasi korelasi sebesar 0,687677

 

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Basic Excel