Visualisasi Data dan Uji Korelasi

RAHMAT AMIN BADALI

Sosial Media


0 orang menyukai ini
Suka

Summary

Summary 

Visualisasi data merupakan suatu teknik yang digunakan untuk mempermudah dalam pembacaan informasi hasil analisa dengan membuatnya dalam bentuk garis, titik, atau batang pada grafik. Scatter plot merupakan diagram sebar yang menggunakan titik-titik untuk mewakili nilai dua variabel yang sedang dibandingkan. Tujuan dari analisa ini adalah untuk memvisualisasikan data menggunakan grafik scatter plot agar dapat diketahui korelasi antara engine size dengan price dan highway mpg dengan price serta menghitung nilai rata-ratanya. 

Description

Description 

Visualisasi data digunakan untuk mempermudah dalam menginformasikan secara jelas kepada pembacanya dengan menggunakan tabel/grafik. Pada analisa kali ini digunakan dataset mobil yang diunduh lewat situs kaggle.com pada link berikut : 

https://www.kaggle.com/datasets/toramky/automobile-dataset

Dataset tersebut berisikan informasi dan karakteristik mobil seperti harga, ban, bahan bakar, kecepatan dan lain lain dari berbagai tipe mobil. 

Merapihkan data 

1. Setelah dataset didownload, data kemudian dirapihkan dengan menggunakan fitur Text to Columns pada tab Data. 

            Gambar 1.1 data setelah dirapihkan 

 

2. Varibel yang akan diuji adalah highway mpg dengan price dan engine size dengan price. Pisahkan kolom variabel engine size dengan price ke lembar 2 dan highway mpg dengan price ke lembar 3. 

                                                                        

                   Gambar 1.2 lembar 2                                                                          Gambar 1.3 lembar 3

 

Menghitung Rata Rata Variabel

1. Perhitungan rata rata tiap variabel dilakukan dengan memilih semua data yang ingin dihitung kemudian digunakan rumus AVERAGE. 

    

            Gambar 2.1 rata rata engine size dan price                                 Gambar 2.2 rata rata highway mpg

          Dari hasil perhitungan didapatkan nilai rata rata dari tiap variabel adalah sebagai berikut 

Rata – Rata

Engine Size

Price

Highway mpg

126

13207

30,75

 

Scatter Plot dan Korelasi

  1. Visualisasi data dengan menggunakan grafik scatter plot pada tab Insert dengan memilih dua variabel data yang ingin dibandingkan terlebih dahulu. 
  2. Perhitungan korelasi digunakan rumus CORREL dengan memilih dua data variabel yang ingin dibandingkan. 

Gambar 3.1 scatter plot pada tab insert

 

Gambar 3.2 scatter plot perbandingan engine size dan price

 

Gambar 3.3. scatter plot perbandingan highway-mpg dan price

 

           Dari hasil analisa diatas didapatkan nilai korelasi antar variabel adalah sebagai berikut 

Korelasi Engine Size dan Price

Korelasi Highway-mpg dan Price

0.872335167

-0.704692265

 

Conclusion

Berdasarkan hasil analisa dan uji korelasi antara variabel engine-size dan price, didapatkan nilai korelasi sebesar 0.872335167. Nilai ini termasuk kedalam korelasi positif, yang artinya dua variabel tersebut berjalan dengan arah yang sama. Misalnya, apabila variabel X mengalami kenaikan, maka akan diikuti juga dengan kenaikan pada  varibel Y. Pada kasus ini dapat dilihat bahwa jika variabel price naik atau bertambah maka juga akan diikuti oleh kenaikan pada variabel engine-size. 

Sementara itu berdasarkan hasil analisa dan uji korelasi antara variabel highway-mpg dan price, didapatkan nilai korelasi sebesar -0.704692265. Nilai ini termasuk kedalam korelasi negatif, yang artinya kedua variabel tersebut berjalan dengan arah yang berbeda. Misalnya, apabila variabel X mengalami kenaikan, maka akan diikuti dengan penurunan pada variabel Y. Pada kasus ini dapat dilihat bahwa jika variabel price naik atau bertambah , maka juga akan diikuti dengan penurunan atau pengurangan pada variabel highway-mpg.

Pada hasil perhitungan nilai rata-rata masing-masing variabel didapatkan nilai rata-rata engine size sebesar 126, nilai rata-rata price sebesar 13207, dan nilai rata-rata highway-mpg sebesar 30,75. 

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Basic Excel