Reza Rahman Hakim
Diagram Scatter berfungsi untuk melakukan pengujian terhadap seberapa kuatnya hubungan antara 2 (dua) variabel serta menentukan jenis hubungan dari 2 (dua) variabel tersebut apakah hubungan Positif, hubungan Negatif ataupun tidak ada hubungan sama sekali. Grafik scatterplot atau yang memiliki nama lain grafik pencar merupakan diagram grafis yang dibangun dari dua sumbu X dan Y (variabel X dan variabel Y). Nilai dari sepasang variabel ini digambarkan sebagai titik-titik point. Karena itu scatter diagram sering pula disebut sebagai scatter plots. Grafik pola poin tersebut dapat menunjukkan pola hubungan. Paling sering diagram pencar digunakan untuk membuktikan atau menyangkal hubungan sebab akibat. Dalam analisis statistik, scatterplot sering digunakan untuk mengetahui apakah sebuah variabel memiliki hubungan yang berbanding lurus atau justru berbanding terbalik.
Langkah :
Langkah pertama dalam pengvisuaslisasian data dengan diagram scatter plot adalah mengumpulkan data.Pada studi kasus kali ini data yang akan digunakan berasal dari platform Kaggle. Untuk dapat menggunakannya dapat menggunakan link sebagai berikut :
https://www.kaggle.com/datasets/toramky/automobile-dataset
Menyiapkan Tabel
Setelah data berhasil di download, langkah pertama adalah merapihkan data. Untuk merapihkan data dapat dilakukan dengan cara klik pada kolom pertama->Data->Text To Columns. Pilih delimited untuk memisah-misahkan data dan tentukan Comma sebagai tanda pembatas untuk pemisahan datanya.
Jika sudah akan terlihat lebih rapi dibandingkan sebelumnya.
Membuat Data Visualisasi Diagram Scatterplot pada data Engine-size dan Price
3. Klik kiri pada kolom Price, lalu buka tab Insert dan tambahkan chart dengan jenis scatter. Jika sudah akan tampak seperti gambar di bawah ini.
4. Edit chart scatter sesuai keinginan dan kebutuhan.
5.Tambahkan chart elements trendline untuk menampilkan trendline pada data yang telah disajikan dalam diagram
6. Untuk menampilkan nilai R-squared dapat mengklik kanan pada trendline -> Format trendline -> Centang bagian “Display R-squared value on chart”. Jika sudah dilakukan tampilan diagram scatternya akan tampak seperti berikut.
7. Menentukan nilai rata-rata pada 2 variabel data yang disajikan yaitu Engine-size dan juga Price. Untuk dapat mendapatkan nilai rata-rata dapat menggunakan rumus yang tersedia di Microsoft Excel yaitu =AVERAGE().
8. Langkah selanjutnya adalah menentukan nilai R. Nilai R dapat ditemukan dari nilai R2 dengan menggunakan fungsi =SQRT() untuk mengembalikan akar kuadrat. Maka hasil akhir yang akan dihasilkan akan membentuk diagram seperti berikut.
Dengan membuat diagram diatas bisa kita dapatkan :
Hasil diatas telah memperlihatkan dimana terdapat hubungan linear antara variable Engine-size dan juga variable Price. Dapat dilihat juga, semakin tinggi nilai dari variable Engine-Size maka semakin tinggi juga Nilai pada Variabel Price. Hubungan kedua variable ini bisa dikatakan memiliki nilai positif dengan memiliki nilai R atau nilai korelasinya yaitu 0,704202
Membuat Data Visualisasi Diagram Scatterplot pada data Highway-mpg dan Price
Langkah yang dilakukan sama seperti mengvisualisasikan data sebelumnya yaitu seperti berikut.
3. Klik kiri pada kolom Price, lalu buka tab Insert dan tambahkan chart dengan jenis scatter
4. Edit tampilan chart scatter sesuai keinginan dan kebutuhan.
5. Tambahkan chart elements trendline untuk menampilkan trendline pada data yang telah disajikan dalam diagram
6. Untuk mendapatkan nilai r-squared secara otomatis dapat mengklik kanan pada trendline -> Format trendline -> Centang bagian “Display R-squared value on chart”.
7. Menentukan nilai rata-rata pada 2 variabel data yang disajikan yaitu Engine-size dan juga Price. Untuk dapat mendapatkan nilai rata-rata dapat menggunakan rumus yang tersedia di Microsoft Excel yaitu =AVERAGE().
8. adalah menentukan nilai R. Nilai R dapat ditemukan dari nilai R2 dengan menggunakan fungsi =SQRT() untuk mengembalikan akar kuadrat. Jika semua langkah telah dilakukan maka akan mendapatkan hasil diagram scatter seperti gambar di bawah ini.
Dengan membuat diagram diatas bisa kita dapatkan :
Dapat disimpulkan, semakin tinggi nilai pada variable Highway-mpg maka akan semakin rendah nilai variable Price, hubungan kedua variable tersebut dapat dikatakan kuat negatif dengan nilai korelasi yaitu 0,686222