Automobile Dataset Analytics using Excel

Fayza Apriliza

Sosial Media


3 orang menyukai ini
Suka

Summary

Pada tugas akhir course “Excel for Analytics and Optimization” menggunakan dataset Automobile yang dapat diunduh melalui tautan https://www.kaggle.com/datasets/toramky/automobile-dataset untuk melakukan exploratory dan analisis data. Dataset terdiri atas 26 kolom dan 205 baris, dimana kolom price merupakan data target atau variabel dependent. 

Description

Berikut gambaran data mentah:

Formatting dan merapihkan data

Pada tahap ini saya mengaktifkan Freeze Top Row untuk membekukan cell pada baris pertama. Selain freeze panes, saya juga mengatur alignment cell menjadi justify dan mengganti format cell pada kolom price menjadi currency dengan dollar. Hasilnya sebagai berikut.

 

Pehitungan statistic deskriptif

Memahami dataset dengan melakukan beberapa teknik, seperti count, mean, min, max, standar deviasi, dsb. Hasil statistik deskriptif sebagai berikut.

 

Hubungan Engine Size dengan Price menggunakan fungsi CORR

Sebelum melakukan visualisasi, dilakukan proses data cleaning dengan menghapus data yang null dalam kasus ini ditandai dengan simbol “?”. Sehingga hubungan engine size dengan price ditunjukkan pada grafik scatter plot sebagai berikut.

Berdasarkan grafik tersebut, ketika engine size semakin besar maka price juga semakin tinggi. Hubungan price dengan engine size berkorelasi secara positif dibuktikan dengan hasil perhitungan menggunakan fungsi CORREL pada excel adalah sebesar 0,872335, yakni nilai mendekati 1. Dimana rata-rata engine size sebesar 126,88 dan price sebesar 13207,13.

 

Hubungan Highway-mpg dengan Price menggunakan fungsi CORR

Sebelum melakukan visualisasi, dilakukan proses data cleaning dengan menghapus data yang null dalam kasus ini ditandai dengan simbol “?”. Sehingga hubungan highway-mpg dengan price ditunjukkan pada grafik scatter plot sebagai berikut.

Berdasarkan grafik tersebut dapat diambil insight ketika highway-mpg semakin besar maka price semakin rendah. Hubungan price dengan highway-mpg berkorelasi secara negatif dibuktikan dengan hasil perhitungan menggunakan fungsi CORREL pada excel adalah sebesar -0,70469, yakni nilai mendekati -1. Dimana rata-rata highway-mpg sebesar 30,69 dan price sebesar 13207,13.

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Excel for Analytics And Optimization