Klasifikasi Iris Plants dengan KNN

Arief Rachman Hakim

Sosial Media


1 orang menyukai ini
Suka

Summary

Tanaman Bunga iris merupakan salah satu tanaman hias dari genus dari famili Iridaceae yang mencakup 260-300 spesies tumbuhan berbunga. Nama tersebut diambil dari bahasa yunani yang berarti pelangi yang juga merupakan salah satu nama dari dewi pelangi di Yunani. Tanaman ini dapat ditemukan diberbagai negara di dunia dengan berbagai spesies. Pada kesempatan kali ini, saya akan melakukan klasifikasi tanaman bungan iris dengan KNN. Dalam dataset tersebut terdapat tiga spesies yang akan menjadi fitur yaitu, Iris Versicolor, Iris Setosa, dan Iris Virginica yang dikategorikan berdasarkan panjang serta lebar petal dan sepal-nya.

Description

Dataset yang digunakan :

https://scikit-learn.org/stable/datasets/toy_dataset.html (Dataset yang tersedia di Scikit-Learn)

Library yang digunakan :

  • numpy
  • pandas
  • matplotlib
  • sklearn

Deskripsi Dataset :

sumber : https://www.datacamp.com/tutorial/machine-learning-in-r 

Terdapat tiga spesies dari tanaman bunga iris yang menjadi Target (0: Setosa, 1: Versicolor, dan 2: Virginica) yang dibedakan berdasarkan panjang dan lebar dari sepal dan tepal. Menurut https://www.dictio.id/t/apa-saja-bagian-bagian-bunga/146591/2

Sepal atau kelopak bunga merupakan lingkaran terluar atau terdalam dari struktur bunga. Pada umumnya, sepal berwarna hijau dan memiliki penampilan seperti daun meski ukurannya lebih kecil dibanding daun. Seluruh sepal pada bunga menyusun kaliks dan memiliki fungsi utama untuk melindungi tunas bunga yang sedang berkembang. Pada saat bunga mekar, kaliks kerap melipat ke arah luar.

Petal merupakan bagian bunga yang umumnya berwarna mencolok, dapat menarik perhatian serangga dan hewan-hewan lainnya seperti tikus, burung, dan kelelawar, yang merupakan vektor dalam proses penyerbukan ( polinasi ). Petal biasanya berwarna terang. Seluruh tumbuhan berbunga memiliki bunga, tetapi tidak semua bunga berwarna terang. Petal pada bunga-bunga tertentu tereduksi (tidak tumbuh sempurna) atau tidak ada sehingga tumbuhan sangat tergantung pada angin atau air untuk membantu polinasinya.

 

Tutorial :

1. Import Library

 

2. Import Dataset dari library Sklearn

Dalam library Sklearn terdapat berbagai dataset yang dapat digunakan untuk praktik Data Science, atau Machine Learning. Untuk jumlahnya dapat dilihat dalam gambar dibawah ini.

Untuk Dataset Iris Plants Sklearn mengambil sumber dari berbagai sumber :

 

3. Identifikasi Iris dataset dengan Python

Terdapat 4 fitur dan 1 Target yang dapat digunakan sebagai klasifikasi :

 

4. Memformat dataset dari Sklearn menjadi Dataframe pandas

Header columns akan menggunakan nama fitur dari dataset, untuk Target akan diubah menjadi Series yang baru kedalam Dataframe

Hasil :

 

5. Mengecek apakah ada data yang Null

 

6. Split Dataset

x = untuk fitur (lebar dan panjang dari tepal & sepal)

y = untuk target

 

7. Mengetahui shape dari data yang sudah di-split

 

8. Mencoba menampilkan dari data train

 

9. Membuat model KNN

 

10. Menampilkan Hasil Akurasi

 

11. Evaluasi Model

Hasil akhir menghasilkan akurasi sebesar 97%

 

12. Dokumentasi Kode

https://drive.google.com/drive/folders/1MybKOM3XW4CDybZ-KB22q8UE8RhE_iNj?usp=sharing 

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Python Data Science untuk Pemula