Fayza Apriliza
Pada tugas akhir course “Basic-Basic Excel” menggunakan dataset Automobile yang dapat diunduh melalui tautan https://www.kaggle.com/datasets/toramky/automobile-dataset untuk melakukan visualisasi dan uji korelasi data menggunakan Excel. Data terdiri atas 26 kolom dan 205 baris, dimana kolom price merupakan data target atau variabel dependent.
Berikut gambaran data mentah:
Formatting dan Merapihkan Data
Pada tahap ini saya mengaktifkan Freeze Top Row untuk membekukan cell pada baris pertama. Selain freeze panes, saya juga mengatur alignment cell menjadi justify dan mengganti format cell pada kolom price menjadi currency dengan dollar. Hasilnya sebagai berikut.
Hubungan Engine Size dengan Price
Sebelum melakukan visualisasi, dilakukan proses data cleaning dengan menghapus data yang null dalam kasus ini ditandai dengan simbol “?”. Sehingga hubungan engine size dengan price ditunjukkan pada grafik scatter plot sebagai berikut.
Berdasarkan grafik tersebut, ketika engine size semakin besar maka price juga semakin tinggi. Hubungan price dengan engine size berkorelasi secara positif dibuktikan dengan hasil perhitungan menggunakan fungsi CORREL pada excel adalah sebesar 0,872335, yakni nilai mendekati 1. Dimana rata-rata engine size sebesar 126,88 dan price sebesar 13207,13.
Hubungan Highway-mpg dengan Price
Sebelum melakukan visualisasi, dilakukan proses data cleaning dengan menghapus data yang null dalam kasus ini ditandai dengan simbol “?”. Sehingga hubungan highway-mpg dengan price ditunjukkan pada grafik scatter plot sebagai berikut.
Berdasarkan grafik tersebut dapat diambil insight ketika highway-mpg semakin besar maka price semakin rendah. Hubungan price dengan highway-mpg berkorelasi secara negatif dibuktikan dengan hasil perhitungan menggunakan fungsi CORREL pada excel adalah sebesar -0,70469, yakni nilai mendekati -1. Dimana rata-rata highway-mpg sebesar 30,69 dan price sebesar 13207,13.