UJI KORELASI MENGGUNAKAN R

Ta'fif Lukman Afandi

Sosial Media


3 orang menyukai ini
Suka

Summary

Korelasi adalah salah satu metode untuk mengetahui ada tidaknya hubungan antar variabel. Pada portofolio ini jenis korelasi yang digunakan yaitu korelasi pearson pada dataset Automobile. Nilai korelasi berada di antara -1 sampai dengan 1. Nilai korelasi negatif menandakan variabel tersebut memiliki hubungan yang berbanding terbalik sedangkan korelasi positif menandakan variabel tersebut memiliki hubungan yang sebanding. Adapun uji korelasi yang dilakukan yaitu variabel engine size, highway mpg, dan bore dengan price. Berdasarkan hasil uji hipotesis disimpulkan bahwa variabel tersebut memilik korelasi akan tetapi highway mpg dengan price memiliki korelasi yang negative.

Description

Deskripsi Data

Himpunan data ini terdiri dari data Buku Otomotif Ward dari tahun 1985. 

Sumber: https://www.kaggle.com/datasets/toramky/automobile-dataset

 

Data Cleaning

Sebelum melakukan uji hipotesis maupun korelasi, kita perlu melakukan pembersihan data. Pada portofolio ini akan melakukan pembersihan data berupa imputasi missing value. Hal tersebut dikarena pada dataset terdapat missing value yang diberi symbol “?”. Imputasi missing value dilakukan dengan menggunakan mean, median, dan modus. Mean digunakan untuk data numeric yang diasumsikan berdistribusi normal secara histogram, Median digunakan untuk data numeric yang diasumsikan tidak berdistribusi normal secara histogram, dan modus digunakan untuk data kategorik.

 

Eksplorasi Data Analisis

Korelasi

a. Engine Size dengan Price

Berdasarkan hasil korelasi pearson antara engine size dan price diketahui bahwa p-value sebesar 0.000 sehingga dapat disimpulkan bahwa hipotesis menolak H0 maka kedua variabel memiliki hubungan dengan korelasi sebesar 0.86. Nilai 0.86 menandakan bahwa hubungan keduanya kuat dan sebanding.

b. Bore dengan Price

Berdasarkan hasil korelasi pearson antara bore dan price diketahui bahwa p-value sebesar 0.000 sehingga dapat disimpulkan bahwa hipotesis menolak H0 maka kedua variabel memiliki hubungan dengan korelasi sebesar 0.53. Nilai 0.53 menandakan bahwa hubungan keduanya cukup kuat dan sebanding.

c. Highway MPG dengan Price

Berdasarkan hasil korelasi pearson antara highway mpg dan price diketahui bahwa p-value sebesar 0.000 sehingga dapat disimpulkan bahwa hipotesis menolak H0 maka kedua variabel memiliki hubungan dengan korelasi sebesar -0.69. Nilai -0.69 menandakan bahwa hubungan keduanya cukup kuat dan berbanding terbalik.

Link Coding: https://gitlab.com/tafif5880/r/-/blob/main/EDA/Data_Cleaning_dan_Eksplorasi_Data_Analisis_dengan_R.ipynb 

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Statistika dan Probabilitas