Excel for Analytics and Optimization

Kania Nur Ainiyyah

Sosial Media


1 orang menyukai ini
Suka

Summary

Microsoft Excel merupakan sebuah program aplikasi dimana kegunaannya dikhususkan untuk pengolahan data yang dilakukan menggunakan formula dasar hingga pivot table dalam spreadsheet. Microsoft Excel bekerja dengan sistem workbook yang didalam workbook ini terdapat worksheet atau lembar kerja. Microsoft Excel mampu mengolah data secara automatis dengan memasukan rumus pada worksheet atau lembar kerja. Salah satu keunggulan dari Microsoft Excel yaitu mampu memvisualisasi data. Visualisasi data sangat penting untuk dilakukan, sebab dengan visualisasi untuk penyampaian informasi data dapat dengan mudah dipahami dan dapat meminimalisir terjadinya kesalahan informasi. Visualisasi data salah satunya dapat berbentuk chart scatter plot. Scatter plot digunakan untuk melihat sebaran data dalam koordinat dua dimensi atau tiga dimensi. Untuk membuat chart scatter plot data yang dibutuhkan harus berupa data angka. Pada kesempatan ini akan membahas tentang hubungan antara engine-size dengan price dan hubungan antara highway-mpg dengan price. Data-data yang akan dibahas dalam kedua pembahasan ini akan divisualisasikan dengan menggunakan chart scatter plot. Adanya visualisasi data ini dapat memberikan kemudahan dalam memahami hubungan antara variabel satu dengan variabel lainnya. Apabila sudah memvisualisasi data dalam bentuk chart scatter plot kemudian nanti ditentuin dengan nilai korelasi untuk mengetahui seberapa kuat hubungan antara beberap variabel. Hasil dari uji korelasi ini memiliki hubungan dengan uji regresi yang akan mengetahui apakah masing-masingg variabel saling mempengaruhi atau tidak.

Description

Microsoft Excel akan digunakan untuk pengolahan data hingga visualisasi data. Adapun tahapan yang dapat dilakukan untuk pengolahan data hingga visualisasi data antara lain:

 

Mengunduh Data

 

Langkah-langkah membuat chart scatter plot dan visualisasi data lainnya serta menghitung nilai korelasi yaitu:

Merapihkan Data dan Membersihkan Missing Value

Apabila data sudah diunduh, kemudian data tersebut dirapihkan dengan menggunakan ukuran kolom dan menambahkan table untuk memudahkan filter sehingga apabila data sudah rapih maka dengan mudah menemukan data yang ingin dianalisis. Berikut ini merupakan gambar dari data yang sudah berhasil untuk dirapihkan.

 

Langkah-langkah untuk memberi table pada data dengan cara tekan Ctrl+A > klik insert > klik table pada fitur tables > OK.

Pada data tersebut masih banyak kolom-kolom yang bernilai “?” yang mengakibatkan hasil analisis menjadi kurang akurat, sehingga perlu dihapus dengan cara sebagai berikut: pada kolom yang terdapat nilai “?” pilih tanda panah kebawah pada fitur filter kolom, kemudian pada text filters pilih nilai “?” saja, lalu klik OK. Maka akan menampilkan baris-baris yang bernilai “?”, untuk membersihkannya bisa dengan cara hapus baris-baris yang terdapat nilai “?” dengan tekan Ctrl+A > tekan delete yang berada pada keyboard. Kemudian pada text filters pilih select All, lalu klik OK. Ulangi langkah ini untuk kolom-kolom yang terdapat nilai “?”.

 

Maka hasilnya akan seperti dibawah ini.

 

Pada gambar diatas banyak garis-garis yang kosong. Untuk mengatasinya yaitu dengan cara difilter dengan klik tanda panah kebawah pada fitur filter kolom > klik select All untuk mengosongkan list terlebih dahulu > lalu pilih “Blanks” > klik OK.

 

Kemudian data “Blanks” telah difilter, lalu langkah selanjutnya yaitu menghapus baris-baris “Blanks” yaitu dengan cara drag baris-baris “Blanks” setelah itu hapus dengan cara > klik kanan > klik Delete Row.

 

Maka data sudah rapih dan siap untuk dianalisis.

 

Visualisasi Data

  • Selanjutnya, pada file tersebut buatlah lembar kerja kedua yang berisikan kolom engine-size dan price. Lalu untuk membuat chart scatter plot pilih kolom engine=size dan price lalu pada menu Insert > Chart > Pilih Scatter yang diinginkan.
  • Kemudian untuk mengetahui nilai korelasi antar kedua variabel tersebut rumus fungsi =CORREL(Array1;Array2). Hasil dari korelasi kedua variabel tersebut yaitu 0,841495603, artinya kedua variabel tersebut berkolerasi positif, dimana jika engine-size mobil lebih besar maka harga tersebut akan menjadi mahal dan sebaliknya.

 

  • Selanjutnya, pada file tersebut buatlah lembar kerja ketiga yang berisikan kolom highway-mpg dan price. Lalu untuk membuat chart scatter plot kolom highway-mpg dan price pada menu Insert > Chart > Pilih Scatter yang diinginkan.
  • Kemudian untuk mengetahui nilai korelasi antar kedua variabel tersebut menggunakan rumus fungsi =CORREL(Array1;Array2). Hasil dari korelasi kedua variabel tersebut yaitu -0,72009, artinya kedua variabel tersebut berkorelasi negative, dimana jika highway-mpg suatu mobil lebih besar maka harga mobil tersebut akan lebih murah dan sebaliknya.

 

  • Selanjutnya yaitu menghitung rata-rata dari nilai korelasi 1 dan nilai korelasi 2 dengan menggunakan rumus =AVERAGE(value1;value2). Dan hasil dari kedua rata-rata nilai korelasi tersebut adalah 0,0607.

 

  • Dan terakhir yaitu hasil analisis data menggunakan pivot table.

 

  • Sekian penjelasan dan langkah-langkah untuk membuat visualisasi dan menghitung korelasi dari data Automobile.

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Excel for Analytics And Optimization