Afina Lina Nurlaili
Supervised Learning dalam bahasa indonesia adalah pembelajaran yang ada supervisornya. Maksud disini ada supervisornya adalah label di tiap data nya. Label maksudnya adalah tag dari data yang ditambahkan dalam machine learning model. Pada kasus ini menggunakan algoritma klasifikasi neural network untuk memprediksi pola gender dimana pola tersebut sudah ada contoh data yang lengkap, jadi pola yang terbentuk adalah hasil pembelajaran data lengkap tersebut. Tentunya jika kita memasukan data baru, setelah kita melakukan ETL (Extract Transform Load) maka kita mendapat info feature feature dari sample baru tersebut. Kemudian dari feature feature tersebut di compare dengan pattern clasification dari model yang didapat dari labeled data. Setiap label akan dicompare sampai selesai, dan yang memiliki percentage lebih banyak akan diambil sebagai prediksi akhir.
Dataset menggunakan data dari : https://www.kaggle.com/datasets/elakiricoder/gender-classification-dataset
Untuk memulai klasifikasi, kita memerlukan dataset yang memiliki label.
Dataset Gender contains 7 features and a label column.
longhair - This column contains 0's and 1's where 1 is "long hair" and 0 is "not long hair".
foreheadwidthcm - This column is in CM's. This is the width of the forehead.
foreheadheightcm - This is the height of the forehead and it's in Cm's.
nosewide - This column contains 0's and 1's where 1 is "wide nose" and 0 is "not wide nose".
noselong - This column contains 0's and 1's where 1 is "Long nose" and 0 is "not long nose".
lipsthin - This column contains 0's and 1's where 1 represents the "thin lips" while 0 is "Not thin lips".
distancenosetoliplong - This column contains 0's and 1's where 1 represents the "long distance between nose and lips" while 0 is "short distance between nose and lips".
gender - This is either "Male" or "Female".