Introducing Data Mining

Vinny Ramayani Saragih

Sosial Media


0 orang menyukai ini
Suka

Summary

Task sebagai berikut:

  1. lakukan exploratory data dengan python dan pre-processing data
  2. visualisasikan dengan matplotlib
  3. pilih model supervised learning diantara svm,naive bayes,atau knn untuk modelkan dataset
  4. buatlah evaluasi model dari dataset yang telah anda modelkan

Description

Hubungkan gcollab dengan gdrive

Input dan baca data set dengan pandas

Lakukan eksploratori data untuk melihat

*ph-> pH air

*Kekerasan-> Kapasitas air untuk mengendapkan sabun dalam mg/L

*Padatan-> Total padatan terlarut dalam ppm

*Kloramin-> Jumlah Kloramin dalam ppm

*Sulfat-> Jumlah Sulfat yang dilarutkan dalam mg/L

*Konduktivitas-> Konduktivitas listrik air dalam S/cm

*Organic_carbon-> Jumlah karbon organik dalam ppm

*Trihalomethanes-> Jumlah Trihalomethanes dalam g/L

*Kekeruhan-> Ukuran sifat pemancar cahaya air dalam NTU (Unit Kekeruhan Nephelometric)

*Potabilitas-> Menunjukkan apakah air aman untuk dikonsumsi manusia

Cek null values

Mengisi null values dengan nilai rata rata 

Cek korelasi 

Tidak ada kolom berkorelasi dalam data.

Distribusi data

Data Preprocessing

Modeling

Svm

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Introduction Data Mining