Dhita Robasa Marline
Dalam menyampaikan informasi data, penyampaian informasi dalam bentuk visual/gambar penting dilakukan. Hal ini dilakukan agar menghindari adanya kesalahan informasi dan memudahkan dalam pemahaman hasil analisis data. Salah satu bentuk visualisasi data yang tersedia pada Microsoft Excel adalah Scatter Plot. Scatter Plot digunakan untuk menggambarkan suatu data dengan menggunakan koordinat cartesian yang bertujuan untuk melihat relasi antara 2 variabel. Pada portofolio ini, saya akan mengolah data pada studi kasus yang didapat melalui tautan https://www.kaggle.com/datasets/toramky/automobile-dataset kemudian memvisualisasikannya dalam bentuk scatter plot, dan melakukan uji korelasi.
1. Formatting dan Merapikan Data
Pertama-tama, unduh data yang akan digunakan terlebih dahulu dari laman https://www.kaggle.com/datasets/toramky/automobile-dataset. Setelah data berhasil diunduh, data akan terlihat berantakan dan tidak tersusun seperti gambar di bawah ini :
Untuk merapikan data tersebut, seleksilah data yang akan dirapikan dengan cara klik kolom A, kemudian lakukan klik Data -> Text to collumn -> Delimited -> Next -> Centang hanya “Comma” -> Finish.
Setelah melakukan langkah di atas, data akan tersusun dengan baik. Agar terlihat lebih rapi, saya mengubah format cell menjadi autofit column width dan alignment cell saya ubah menjadi middle align dan center. Selanjutnya, lakukanlah freeze panes agar judul per kolom tetap terlihat ketika kita menelusuri data hingga ke bawah dengan cara Klik View -> Freeze Panes -> Freeze Top Row. Hasil data yang telah dirapikan akan seperti gambar di bawah ini.
2. Engine Size dan Price
Hal yang dilakukan pertama-tama adalah meng-copy data “Engine Size” dan “Price” pada lembar ke-2. Setelah itu, saya melakukan proses data cleaning dengan cara mengisi data null yang pada studi kasus ini disimbolkan dengan “?”.
Selanjutnya, buatlah visualisasi data Scatter Plot dengan cara: Seleksi kolom Engine Size dan kolom Price secara keseluruhan -> Insert -> Charts -> Scatter
Setelah membuat visualisai datanya, tahapan selanjutnya adalah mencari korelasi dan average nilai dari Engine Size dan Price. Dengan formula sebagai berikut:
Untuk Mencari Korelasi : =CORREL(A2:A206;B2:B206)
Untuk Mencari Average Engine Size : = AVERAGE(A2:A206)
Untuk Mencari Average Price : =AVERAGE(B2:B206)
Kesimpulan
Berdasarkan uji korelasi data tersebut didapatkan hasil positif sebesar 0,861752, yang mana terjadi jika ketika satu variabel meningkat ketika variabel lainnya meningkat, dan menurun ketika variabel lainnya menurun. Hal ini juga dibuktikan dengan visualisasi dari data tersebut, grafik tersebut menandakan bahwa semakin besar nilai engine size maka akan semakin besar juga nilai dari price.
3. Highway-mpg dan Price
Hal yang dilakukan pertama-tama adalah meng-copy data “Highway-mpg” dan “Price” pada lembar ke-3. Setelah itu, saya melakukan proses data cleaning dengan cara mengisi data null yang pada studi kasus ini disimbolkan dengan “?”.
Selanjutnya, buatlah visualisasi data Scatter Plot dengan cara: Seleksi kolom Highway-mpg dan kolom Price secara keseluruhan -> Insert -> Charts -> Scatter
Setelah membuat visualisai datanya, tahapan selanjutnya adalah mencari korelasi dan average nilai dari Highway-mpg dan Price. Dengan formula sebagai berikut:
Untuk Mencari Korelasi : =CORREL(A2:A206;B2:B206)
Untuk Mencari Average Highway-mpg : = AVERAGE(A2:A206)
Untuk Mencari Average Price : =AVERAGE(B2:B206)
Kesimpulan
Berdasarkan uji korelasi data tersebut didapatkan hasil negatif sebesar -0,69052573, yang mana mengindikasikan terdapat hubungan yang berbalik arah antar variabel tersebut. Hal ini juga dibuktikan dengan visualisasi dari data tersebut, grafik tersebut menandakan bahwa semakin besar nilai highway-mpg maka akan semakin kecil nilai dari price.