Akhmad Miftahusalam
Korelasi merupakan metode untuk mengetahui ada tidaknya hubungan antar variabel. Pada portofolio ini akan melihat hubungan antara variabel dependen yaitu price dan variabel independen engine size. Berdasarkan hasil uji korelasi disimpulkan bahwa kedua variabel tersebut memiliki hubungan positif yang kuat karena nilai korelasinya 0,87
Dataset
Berikut merupakan data yang diperoleh dari keagle. Terdapat tanda tanya (?) yang mengindikasikan missing value. Oleh karena itu akan dilaksanakan preprocessing data.
Data Preprocessing
Proses yang pertama kali dilakukan adalah mengecek data untuk memperoleh insight.
Berdasarkan hasil tersebut terdapat ketidaksesuaian antara tipe data dengan nama kolom. Hal tersebut disebabkan adanya missing value. Missing value pada data tersebut disimbolkan dengan tanda tanya(?). Proses selanjutnya akan menangani missing value.
Missing value yang disimbolkan dengan"?" akan diubah menjadi NaN. Selanjutnya berfokus ke variabel price yang akan digunakan dalam project. Pada variabel price tipe data diubah menjadi float dan menghapus nilai NaN. Mengambil kolom price yang akan digunakan sebagai variabel dependen dengan dimasukan kedalam y dan mengambil kolom engine-size yang akan digunakan sebagai variabel independen dan dimasukan kedalam x.
Statistika Deskriptif
Selanjutnya cek statistika deskriptif dari variabel yang akan digunakan, sehingga diperoeh sebagai berikut
Uji Korelasi antara Price dan Engine-size
Berdasarkan scatter plot diperoleh terdapat hubungan positif antara engine-size dan price. Dimana semakin besar nilai engine-size maka nilai akan semakin besar. Hal tersebut juga didukung dengan nilai korelasi antara kedua variabel tersebut yang bernilai 0,872. Karena nilai korelasi mendekati 1 maka kedua variabel tersebut memiliki hubungan yang kuat