Ta'fif Lukman Afandi
Korelasi adalah salah satu metode untuk mengetahui ada tidaknya hubungan antar variabel. Pada portofolio ini jenis korelasi yang digunakan yaitu korelasi pearson pada dataset Automobile. Nilai korelasi berada di antara -1 sampai dengan 1. Nilai korelasi negatif menandakan variabel tersebut memiliki hubungan yang berbanding terbalik sedangkan korelasi positif menandakan variabel tersebut memiliki hubungan yang sebanding. Adapun uji korelasi yang dilakukan yaitu variabel engine size, highway mpg, dan bore dengan price. Berdasarkan hasil uji hipotesis disimpulkan bahwa variabel tersebut memilik korelasi akan tetapi highway mpg dengan price memiliki korelasi yang negative.
Deskripsi Data
Himpunan data ini terdiri dari data Buku Otomotif Ward dari tahun 1985.
Sumber: https://www.kaggle.com/datasets/toramky/automobile-dataset
Data Cleaning
Sebelum melakukan uji hipotesis maupun korelasi, kita perlu melakukan pembersihan data. Pada portofolio ini akan melakukan pembersihan data berupa imputasi missing value. Hal tersebut dikarena pada dataset terdapat missing value yang diberi symbol “?”. Imputasi missing value dilakukan dengan menggunakan mean, median, dan modus. Mean digunakan untuk data numeric yang diasumsikan berdistribusi normal secara histogram, Median digunakan untuk data numeric yang diasumsikan tidak berdistribusi normal secara histogram, dan modus digunakan untuk data kategorik.
Eksplorasi Data Analisis
Korelasi
a. Engine Size dengan Price
Berdasarkan hasil korelasi pearson antara engine size dan price diketahui bahwa p-value sebesar 0.000 sehingga dapat disimpulkan bahwa hipotesis menolak H0 maka kedua variabel memiliki hubungan dengan korelasi sebesar 0.86. Nilai 0.86 menandakan bahwa hubungan keduanya kuat dan sebanding.
b. Bore dengan Price
Berdasarkan hasil korelasi pearson antara bore dan price diketahui bahwa p-value sebesar 0.000 sehingga dapat disimpulkan bahwa hipotesis menolak H0 maka kedua variabel memiliki hubungan dengan korelasi sebesar 0.53. Nilai 0.53 menandakan bahwa hubungan keduanya cukup kuat dan sebanding.
c. Highway MPG dengan Price
Berdasarkan hasil korelasi pearson antara highway mpg dan price diketahui bahwa p-value sebesar 0.000 sehingga dapat disimpulkan bahwa hipotesis menolak H0 maka kedua variabel memiliki hubungan dengan korelasi sebesar -0.69. Nilai -0.69 menandakan bahwa hubungan keduanya cukup kuat dan berbanding terbalik.
Link Coding: https://gitlab.com/tafif5880/r/-/blob/main/EDA/Data_Cleaning_dan_Eksplorasi_Data_Analisis_dengan_R.ipynb