Felina Khasanah
Eksploratory Data Analysis merupakan tahapan proses dalam mengelola data untuk membantu dalam melakukan tahapan analisis untuk mengidentifikasi data mentah hingga menjadi data yang siap untuk digunakan. Dalam tahapan analisis kita dapat menemukan anomaly, pola dan menguji hipotesis dengan mengambil kesimpulan dari proses analisis yang dilakukan. Pada portofolio ini menjelaskan beberapa tahapan dalam Exploratory Data Analysis.
Dataset
Dataset yang digunakan diambil dari kaggle berkaitan dengan kualitas tidur dan Lifestyle yang terdiri dari 374 baris dan 13 kolom, melalui link ini.
Exploratory Data Analysis
Pada kode diatas berfungsi untuk menghubungkan projek google colab untuk dapat mengakses data yang tersimpan dalam google drive.
Pada tahap ini mendefinisikan library yang dibutuhkan dalam analisis yang dilakukan.
Dari kode diatas df =pd.read_csv berfungsi untuk membaca data yang tersimpan dalam google drive kemudian pada df berikutnya ditampilkan 5 baris tertas dan 5 baris terbawah.
Dengan fungsi df.describe() kita dapat mengetahui statistik dari DataFrame yang kita miliki seperti rata-rata, standar deviasi, dsb.
Dengan fungsi df.info() kita dapat mengetahui detail struktur infomasi dari DataFrame, seperti rangeindex mengidentifikasi terdapat 374 baris yaitu dimulai dari index 0 - 373 yang memiliki 13 kolom, dan memiliki tiga tipe data dalam DataFrame yaitu float, integer, dan object.
Dengan fungsi df.isnull().sum() kita dapat mengidentifikasi jika adanya missing value dari tiap kolom, dan dari data diatas dapat diketahui tidak ada data yang missing value pada masing - masing kolom dalam DataFrame.
Dari baris kode diatas dapat mengidentifikasi untuk menghitung nilai unik yang ada pada kolom sleep disorder, dimana memiliki tiga label yang mengidentifikasi kategori None dengan jumlah data 219, Sleep Apnea dengan jumlah data 78 dan Insomnia dengan jumlah data 77.
Dari hasil output diatas dengan peta heatmap yaitu jika warna semakin gelap memiliki korelasi yang kuat dan sebaliknya jika warna semakin terang memiliki korelasi yang lemah.