Fayza Apriliza
Pada tugas akhir course “Excel for Analytics and Optimization” menggunakan dataset Automobile yang dapat diunduh melalui tautan https://www.kaggle.com/datasets/toramky/automobile-dataset untuk melakukan exploratory dan analisis data. Dataset terdiri atas 26 kolom dan 205 baris, dimana kolom price merupakan data target atau variabel dependent.
Berikut gambaran data mentah:
Formatting dan merapihkan data
Pada tahap ini saya mengaktifkan Freeze Top Row untuk membekukan cell pada baris pertama. Selain freeze panes, saya juga mengatur alignment cell menjadi justify dan mengganti format cell pada kolom price menjadi currency dengan dollar. Hasilnya sebagai berikut.
Pehitungan statistic deskriptif
Memahami dataset dengan melakukan beberapa teknik, seperti count, mean, min, max, standar deviasi, dsb. Hasil statistik deskriptif sebagai berikut.
Hubungan Engine Size dengan Price menggunakan fungsi CORR
Sebelum melakukan visualisasi, dilakukan proses data cleaning dengan menghapus data yang null dalam kasus ini ditandai dengan simbol “?”. Sehingga hubungan engine size dengan price ditunjukkan pada grafik scatter plot sebagai berikut.
Berdasarkan grafik tersebut, ketika engine size semakin besar maka price juga semakin tinggi. Hubungan price dengan engine size berkorelasi secara positif dibuktikan dengan hasil perhitungan menggunakan fungsi CORREL pada excel adalah sebesar 0,872335, yakni nilai mendekati 1. Dimana rata-rata engine size sebesar 126,88 dan price sebesar 13207,13.
Hubungan Highway-mpg dengan Price menggunakan fungsi CORR
Sebelum melakukan visualisasi, dilakukan proses data cleaning dengan menghapus data yang null dalam kasus ini ditandai dengan simbol “?”. Sehingga hubungan highway-mpg dengan price ditunjukkan pada grafik scatter plot sebagai berikut.
Berdasarkan grafik tersebut dapat diambil insight ketika highway-mpg semakin besar maka price semakin rendah. Hubungan price dengan highway-mpg berkorelasi secara negatif dibuktikan dengan hasil perhitungan menggunakan fungsi CORREL pada excel adalah sebesar -0,70469, yakni nilai mendekati -1. Dimana rata-rata highway-mpg sebesar 30,69 dan price sebesar 13207,13.