MOHAMAD FRANANDA ADIEZWARA RAMADHAN
IMPELEMENTASI PADA DATASET IRIS
DASAR TEORI
Data mining merupakan proses mengumpulkan dan memproses data dengan tujuan mengekstraksi informasi penting dari data
INTRUKSI:
JAWABAN :
Langkah pertama buka google colab, dan hubungkan antara google colab dan google drive, datasetnya ada di folder dataset yang terdapat di google drive
Import library drive agar bisa mounting, untuk melakukan mount ke directory yang ada drive,lalu running dengan cara menekan tombol play, bisa dilihat pada gambar dibawah google colab saya sudah terhubung dengan google drive saya
Import library pandas dan unzip drivenya agar menghasilkan data csv, dan esktrak dengan nama iris.csv
Panggil dengan library pandas, simpan di df, atau suatu variable, sehingga kita bisa melihat data iris yang tersusun atas 4/5 parameter
Kita gunakan Teknik visualisasi scatter plot untuk melakukan visualisasi fitur dari sepal_width dan sepal_length, ada berada pada ruang vector dimana
Visualisai data berdasarkan petal_length dan petal_width
Coba kita gunakan visualisasi data jenis pair plot
Coba dapatkan data untuk mendapatkan nilai statistik
Saya akan mencoba pisahkan antara data dan label
Langkah selanjutnya membuat model machine learning dengan algoritma decision tree