EDA For Sleep Disorder

Felina Khasanah

Sosial Media


0 orang menyukai ini
Suka

Summary

Eksploratory Data Analysis merupakan tahapan proses dalam mengelola data untuk membantu dalam melakukan tahapan analisis untuk mengidentifikasi data mentah hingga menjadi data yang siap untuk digunakan. Dalam tahapan analisis kita dapat menemukan anomaly, pola dan menguji hipotesis dengan mengambil kesimpulan dari proses analisis yang dilakukan. Pada portofolio ini menjelaskan beberapa tahapan dalam Exploratory Data Analysis.

Description

Dataset

Dataset yang digunakan diambil dari kaggle berkaitan dengan kualitas tidur dan Lifestyle yang terdiri dari 374 baris dan 13 kolom, melalui link ini

Exploratory Data Analysis

  • Koneksi Projek ke Drive

         

Pada kode diatas berfungsi untuk menghubungkan projek google colab untuk dapat mengakses data yang tersimpan dalam google drive.

  • Import Library

         

Pada tahap ini mendefinisikan library yang dibutuhkan dalam analisis yang dilakukan.

  • Menyiapkan Dataset

         

Dari kode diatas df =pd.read_csv berfungsi untuk membaca data yang tersimpan dalam google drive kemudian pada df berikutnya ditampilkan 5 baris tertas dan 5 baris terbawah.

  • Menampilkan Data Statistik dari DataFrame

         

Dengan fungsi df.describe() kita dapat mengetahui statistik dari DataFrame yang kita miliki seperti rata-rata, standar deviasi, dsb.

  • Menampilkan Detail Struktur Informasi dari DataFrame

         

Dengan fungsi df.info() kita dapat mengetahui detail struktur infomasi dari DataFrame, seperti rangeindex mengidentifikasi terdapat 374 baris yaitu dimulai dari index 0 - 373 yang memiliki 13 kolom, dan memiliki tiga tipe data dalam DataFrame yaitu float, integer, dan object.

  • Mengidentifikasi Keberadaan Missing Value pada DataFrame

         

Dengan fungsi df.isnull().sum() kita dapat mengidentifikasi jika adanya missing value dari tiap kolom, dan dari data diatas dapat diketahui tidak ada data yang missing value pada masing - masing kolom dalam DataFrame.

  • Menghitung Jumlah Nilai kategori dalam kolom Sleep Disorder

         

Dari baris kode diatas dapat mengidentifikasi untuk menghitung nilai unik yang ada pada kolom sleep disorder, dimana memiliki tiga label yang mengidentifikasi kategori None dengan jumlah data 219, Sleep Apnea dengan jumlah data 78 dan Insomnia dengan jumlah data 77. 

  • Melihat Korelasi Matrix dengan Peta Heatmap

         

Dari hasil output diatas dengan peta heatmap yaitu jika warna semakin gelap memiliki korelasi yang kuat dan sebaliknya jika warna semakin terang memiliki korelasi yang lemah.

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Data Science