Dimas Anugrah Firdlous
Pada Portofolio kali ini akan dilakukan sebuah uji korelasi variabel dengan case study dataset automobile yang diambil dari situs kaggle. uji korelasi sendiri merupakan teknik analisis yang digunakan untuk mengetahui ada tidaknya hubungan antar 2 variabel yang diuji. pada portofolio kali ini variabel yang diuji adalah engine size vs price, bore vs price, dan highway mpg vs price dengan menggunakan bahasa pemrograman python. tujuan dari portofolio ini untuk mengetahui nilai korelasi antar variabel tersebut.
Pada portofolio kali ini akan dilakukan uji korelasi antar dua varibel pada dataset automobile untuk datasaetnya berasal dari https://www.kaggle.com/datasets/toramky/automobile-dataset
Sebelum melakukan uji korelasi dilakukan terlebih dahulu tahap preprocessing untuk mengatasi data null, mising value, dsb. Setelah dilkukan preparation terdapat bahwa dalam daset ini tidak terdapat data dengan nilai null namun pada dataset kali ini terdapat mising value dengan value “?” maka pada porotofolio ini teknik untuk menghandle missing value tersebut adalah dengan menghapus nilai “?” dan menggantinya dengan nilai mean setiap kolom.
Mencari nilai “?”
Mengubah tipe kolom menjadi numerik dan mengganti '?' dengan nilai rata-rata
A. Engine Size Dengan Price
Corelation : 0.8721522
B. Bore dengan Prize
Corelation :0.54256017
C. Highway MPG dengan Price
Corelation : -0.70813924
Berdasarkan hasil analisis dan uji korelasi yang dilakukan didapatkan bahwa untuk korelasi engine size dengan price didaptkan nilai korelasi sebesar 0.8721522 Korelasi bernilai positif menunjukan bahwa hubungan kedua variabel mengalami kenaikan secara signifikan serta menandakan hubungan antara kedua variabel tersebut kuat dan sebanding, Kemudian untuk nilai korelasi bore dengan price didapatkan sebesar 0.54256017 Korelasi bernilai positif dan memiliki hubungan yang cukup kuat dan sebanding namun masih dibawah engine size terhadap price, dan terkahir Highway mpg dengan Price nilai korelasinya didapatkan sebesar -0.704692265. korelasi bernilai negatif itu kebalikannya dimana hubungan variabel mengalami penurunan, serta memiliki hubungan antar variabel kuat namun berbanding terbalik.