Klasifikasi Vertebrata.csv

Nur Azlina

Sosial Media


0 orang menyukai ini
Suka

Summary

Protofolio ini dibuat bertujuan untuk pemenuhan tugas dari course “Python Data Science Untuk Pemula”

Description


 

Soal : 

Membuat klasifikasi data menggunakan machine learning dengan jupyter notebook pada komputer ataupun google collaboratory dengan mengambil dataset dari kaggle.com.


 

Jawaban :

Disini saya menggunakan data set dari kaggle.com dengan nama dataset “vertebrata.csv”

Setiap vertebrata diklasifikasikan ke dalam salah satu dari 5 kategori: mamalia, reptil, burung, ayam, dan amfibi, berdasarkan satu set atribut penjelas (variabel prediktor). Untuk mengilustrasikan hal ini, pertama-tama kita akan memuat data ke dalam objek Pandas DataFrame dan menampilkan datanya.

Program diatas digunakan untuk mengimport modul yang digunakan dalam tugas yaitu modul pandas yang dialiaskan dengan pd. Lalu memanggil library dari google collab dan mengupload data frame vertebrata.csv yang sudah di download dari kaggle.

Program diatas digunakan untuk menampilkan data set yang sudah di upload sehingga pembaca dapat tau isi dari dataset tersebut.

Selanjutnya, Mengubah masalah menjadi tugas klasifikasi biner (mamalia versus non-mamalia)dengan mengganti label kelas dari instance ke non-mamalia kecuali yang termasuk dalam kelas mamalia.

Program diatas adalah program untuk mengubah kolom class, fishes, birds, amphibians dan reptiles dengan non-mammals sehingga data yang tampil selanjutnya dimana kolom class, fishes, birds, amphibians dan reptiles sudah diganti ke label kelas non mamalia.

Kita dapat menerapkan tabulasi silang Panda untuk memeriksa hubungan antara berdarah panas dan Memberikan atribut Birth sehubungan dengan kelas.

Program diatas adalah program untuk mencari hubungan antara kolom warm-blood dengan gives birth sehingga Hasil di atas menunjukkan bahwa adalah mungkin untuk membedakan mamalia dari non-mamalia menggunakan kedua atribut ini saja karena setiap kombinasi nilai atributnya hanya akan menghasilkan instance yang termasuk dalam kelas yang sama.

Langkah selanjutnya adalah menerapkan phon pengklasifikasian atau disebut juga dengan decision tree classifier .

Mengimport sklearn mengambil method tree lalu menyimpan kolom class pada Y , menghilangkan kolom name dan Class lalu disimpan di X. Pengkalasifikasian disini dibatasi hanya menghasilkan pohon dengan kedalaman 3 saja.

Perintah sebelumnya akan mengekstrak atribut prediktor (X) dan kelas target (Y) dari kumpulan data vertebrata dan buat objek pengklasifikasi pohon keputusan menggunakan entropi sebagai pengotornya

Program diatas adalah program untuk menampilkan diagram dalam bentuk gambar.

Sehingga hasilnya seperti dibawah ini :

Selanjutnya, kita menerapkan pohon keputusan untuk mengklasifikasikan contoh pengujian berikut :

Pertama-tama mengekstrak prediktor dan atribut kelas target dari data uji dan kemudian menerapkan pengklasifikasi pohon keputusan untuk memprediksi kelas mereka.

Selanjutnya, kita menghitung akurasi class pada data.

Dari perhitungan tersebut diperoleh Akurasi data pada data uji adalah sebesar 0,75

 

 

Kesimpulan :

Kelas :

  1. Mamalia
  2. Non-mamalia

Dengan kategori :

  1. Berdarah panas
  2. Aquatik
  3. Melahirkan
  4. Makhluk udara
  5. Memiliki kaki
  6. Hibernasi

Ditampilkan sebuah diagram pohon biner dimulai dengan root kategori pertama dengan pilihan benar atau salah sampai kategori paling akhir, dalam kasus ini makhluk berdarah panas dan makhluk melahirkan digabung menjadi satu kategori, lalu setelah menjadi pohon, dilakukan pengetesan set data dan akurasi

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Python Data Science untuk Pemula