Arief Rachman Hakim
Tanaman Bunga iris merupakan salah satu tanaman hias dari genus dari famili Iridaceae yang mencakup 260-300 spesies tumbuhan berbunga. Nama tersebut diambil dari bahasa yunani yang berarti pelangi yang juga merupakan salah satu nama dari dewi pelangi di Yunani. Tanaman ini dapat ditemukan diberbagai negara di dunia dengan berbagai spesies. Pada kesempatan kali ini, saya akan melakukan klasifikasi tanaman bungan iris dengan KNN. Dalam dataset tersebut terdapat tiga spesies yang akan menjadi fitur yaitu, Iris Versicolor, Iris Setosa, dan Iris Virginica yang dikategorikan berdasarkan panjang serta lebar petal dan sepal-nya.
https://scikit-learn.org/stable/datasets/toy_dataset.html (Dataset yang tersedia di Scikit-Learn)
sumber : https://www.datacamp.com/tutorial/machine-learning-in-r
Terdapat tiga spesies dari tanaman bunga iris yang menjadi Target (0: Setosa, 1: Versicolor, dan 2: Virginica) yang dibedakan berdasarkan panjang dan lebar dari sepal dan tepal. Menurut https://www.dictio.id/t/apa-saja-bagian-bagian-bunga/146591/2 :
Sepal atau kelopak bunga merupakan lingkaran terluar atau terdalam dari struktur bunga. Pada umumnya, sepal berwarna hijau dan memiliki penampilan seperti daun meski ukurannya lebih kecil dibanding daun. Seluruh sepal pada bunga menyusun kaliks dan memiliki fungsi utama untuk melindungi tunas bunga yang sedang berkembang. Pada saat bunga mekar, kaliks kerap melipat ke arah luar.
Petal merupakan bagian bunga yang umumnya berwarna mencolok, dapat menarik perhatian serangga dan hewan-hewan lainnya seperti tikus, burung, dan kelelawar, yang merupakan vektor dalam proses penyerbukan ( polinasi ). Petal biasanya berwarna terang. Seluruh tumbuhan berbunga memiliki bunga, tetapi tidak semua bunga berwarna terang. Petal pada bunga-bunga tertentu tereduksi (tidak tumbuh sempurna) atau tidak ada sehingga tumbuhan sangat tergantung pada angin atau air untuk membantu polinasinya.
1. Import Library
2. Import Dataset dari library Sklearn
Dalam library Sklearn terdapat berbagai dataset yang dapat digunakan untuk praktik Data Science, atau Machine Learning. Untuk jumlahnya dapat dilihat dalam gambar dibawah ini.
Untuk Dataset Iris Plants Sklearn mengambil sumber dari berbagai sumber :
3. Identifikasi Iris dataset dengan Python
Terdapat 4 fitur dan 1 Target yang dapat digunakan sebagai klasifikasi :
4. Memformat dataset dari Sklearn menjadi Dataframe pandas
Header columns akan menggunakan nama fitur dari dataset, untuk Target akan diubah menjadi Series yang baru kedalam Dataframe
Hasil :
5. Mengecek apakah ada data yang Null
6. Split Dataset
x = untuk fitur (lebar dan panjang dari tepal & sepal)
y = untuk target
7. Mengetahui shape dari data yang sudah di-split
8. Mencoba menampilkan dari data train
9. Membuat model KNN
10. Menampilkan Hasil Akurasi
11. Evaluasi Model
Hasil akhir menghasilkan akurasi sebesar 97%
12. Dokumentasi Kode
https://drive.google.com/drive/folders/1MybKOM3XW4CDybZ-KB22q8UE8RhE_iNj?usp=sharing