Grace Yudha Satriawan
Pada artikel kali ini kita akan menganalisis dataset Automobile dengan Excel
pertama-tama kita fix error, pada error ini normalized-loses disimpan dengan tipe data text walaupun seharusnya bertipe data number karena terdapat mising data di kolomnya, maka kita harus perbaiki terlebih dahulu dengan cara:
Setelah itu kita dapat mengisi missing value dari kolom normalized losses, kali ini dengan menggunakan mean dari normalized losses. untuk itu kita harus mencari mean dari normalized losses terlebih dahulu dengan menggunakan fungsi =AVERAGE()
Kemudian untuk mengisi nilai yang kosong kita seleksi kolom yang mempunyai nilai kosong, kemudian pada find & select klik pada go to special
Pada dialog go to special, pilih blanks kemudian ok
Maka semua cell yang kosong pada kolom tersebut akan terseleksi, setelah itu tekan F2 kemudian isikan dengan nilai mean dari normalized-losses, kemudian tekan ctrl+enter untuk mengisi semua cell yang terseleksi.
Untuk menganalisa data tanpa mengganggu data yang sudah ada kita dapat menyalin sheet yang sudah ada ke sheet yang baru untuk dimodifikasi, untuk menyalin sheet klik kanan pada sheet yang akan di salin kemudian pilih move or copy
Kemudian pada dialog yang muncul centang pada create a copy
pada artikel ini kita hanya akan menganalisa Engine-size, highway-mpg dan Price sehingga kita hanya akan menggunakan kolom tersebut, untuk sheet yang satu ini kita hanya akan menganalisa engine-size dan price terlebih dahulu, maka dari itu kita dapat mendelete kolom yang tidak digunakan. Seleksi kolom tersebut kemudian klik delete, saat dialog muncul pilih shift cell left, sehingga cell lainnya otomatis bergeser ke kiri
maka tabel akan menjadi seperti berikut
Selanjutnya untuk menganalisa korelasi dari engine-size dan price kita dapat gunakan scatter plot. untuk menampilkan scatter plot kita seleksi kolom engine size dan price kemudian pada tab insert>charts> pilih scatter plot
maka tampil scatter plot seperti berikut, dengan sumbu X adalah engine-size dan sumbu y adalah price. dilihat dari scatter plotnya korelasi dari engine size dan price dapat dipastikan positif karena semakin naik nilai engine size makan semakin naik pula nilai dari price, kita dapat membuktikan dengan menggunakan formula =CORREL
pada contoh diatas engine size dan price memiliki nilai korelasi sebesar 0,86175223
nilai average dari engine size adalah 126,90732
Kita akan menganalisa kembali dengan kolom highway-mpg, sekali lagi kita akan membuat sheet baru dengan copy dari sheet awal.
Kemudian kita masukan scatter plot dengan cara yang sama seperti di atas
dari scatter plot di atas yang menurun kita dapat memastikan bahwa korelasi dari highway-mpg dan price mempunyai korelasi yang negatif, artinya semakin tinggi highway-mpg maka semakin rendah nilai price.
pada contoh diatas highway-mpg dan price memiliki nilai korelasi sebesar -0,69052589
nilai average dari highway-mpg adalah 30,75121951