Big Data Pyspark Student Mental Health Dataset

Ardi Rudini

Sosial Media


0 orang menyukai ini
Suka

Summary

Dataset yang saya gunakan adalah Student Mental Health Dataset yang diperoleh melalui open dataset Kaggle. Tools yang digunakan adalah Google Collaboratory dan PySpark

Description

Dataset dapat diakses pada link berikut ini : 

Instalasi Pyspark

Text

Description automatically generated

Membuat spark session

Graphical user interface, text

Description automatically generated

Mounting google drive dan melakukan pengecekan terhadap tipe data

A screenshot of a computer

Description automatically generated

Mengecek Banyaknya isi data

A computer screen capture

Description automatically generated with medium confidence

Mengganti dan menyederhanakan beberapa nama column 

Graphical user interface, text

Description automatically generated

A screen shot of a computer

Description automatically generated with medium confidence

Mengecek Missing Value

Graphical user interface

Description automatically generated with medium confidence

Mengganti value column menjadi 0 1

Graphical user interface, text

Description automatically generated with medium confidence

Membuat column Mental health berdasarkan kondisi Depression, Anxiety, dan Pannic Attack

Graphical user interface, text

Description automatically generated with medium confidence

Calendar

Description automatically generated

Piechart Mental Health

Graphical user interface, text

Description automatically generated

Melakukan data splitting

Graphical user interface, text, website

Description automatically generated

Melakukan fitting dengan logistic regression

Text

Description automatically generated

Setelah semua proses, didapati hasil seperti dibawah ini:

Text

Description automatically generated

Graphical user interface

Description automatically generated

Informasi Course Terkait
  Kategori: Artificial Intelligence
  Course: Big Data Analytics dengan PySpark