Yasmin Khairunnisa
Visualisasi data adalah kumpulan data yang ditampilkan dengan grafis. Visualisasi data pada portofolio ini menggunakan diagram scatter dan melakukan uji korelasi data. Diagram Scatter berfungsi untuk melakukan pengujian terhadap seberapa kuatnya hubungan antara 2 (dua) variabel serta menentukan jenis hubungan dari 2 (dua) variabel. Uji Korelasi yang digunakan untuk mengetahui keeratan hubungan antara beberapa variabel. Biasanya uji korelasi ini akan sangat berhubungan dengan uji regresi yang menunjukkan apakah masing-masing variabel saling mempengaruhi.
Visualisasi data yang akan dilakukan pada portofolio ini yaitu dengan menggunakan Scatterplot antara data Engine - size dengan Price dan antara data Highway - mpg dengan Price . Selain itu , juga dilakukan uji korelasi terhadap Engine - size dengan Price dan Highway - mpg dengan Price beserta dengan menghitug nilai averagenya. Data tersebut didapatkan dengan mengunduh dari link berikut https://www.kaggle.com/datasets/toramky/automobile-dataset.
Berikut pengerjaan pembuatan visualisasi data dengan scatterplot dan pengujian uji korelasi :
Untuk mempercantik tampilan serta memudahkan penglihatan kita terhadapdata-data pada Microsoft Excel.
Untuk memisahkan data menjadi beberapa kolom dapat dilakukan Block salah satu column data -> klik menu Data -> Text to Columns.
Block semua baris pertamacell -> klik kanan-> Format Cells -> Fill -> pilih warna->Ok
2. Membuat visualisasi data dengan scatterplot dan menguji korelasiantara Engine - size dan Price di lembar ke-2.
Hasil koreasi dengan nilai sebesar 0,872335167. Korelasi antara data Engine - size dan Price bernilai positif yang menunjukkan hubungan kedua variabel ini mempunyai hubungan searah. Artinya, ketika variabel Engine - size tinggi, maka nilai variabel Price akan tinggi pula.
3. Membuat visualisasi data dengan scatterplot dan menguji korelasiantara Highway - mpg dan Price di lembar ke-3.
Hasil koreasi dengan nilai sebesar -0,704692265. Korelasi antara data Highway - mpg dan Price bernilai negatif yang menunjukkan hubungan kedua variabel mempunyai memiliki hubungan yang berlawanan. Dimana jika nilai variabel Highway - mpg tinggi, maka nilai variabel Price justru rendah atau menurun.