Gender Classification Using Neural Network

Afina Lina Nurlaili

Sosial Media


0 orang menyukai ini
Suka

Summary

Supervised Learning dalam bahasa indonesia adalah pembelajaran yang ada supervisornya. Maksud disini ada supervisornya adalah label di tiap data nya. Label maksudnya adalah tag dari data yang ditambahkan dalam machine learning model. Pada kasus ini menggunakan algoritma klasifikasi neural network untuk memprediksi pola gender dimana pola tersebut sudah ada contoh data yang lengkap, jadi pola yang terbentuk adalah hasil pembelajaran data lengkap tersebut. Tentunya jika kita memasukan data baru, setelah kita melakukan ETL (Extract Transform Load) maka kita mendapat info feature feature dari sample baru tersebut. Kemudian dari feature feature tersebut di compare dengan pattern clasification dari model yang didapat dari labeled data. Setiap label akan dicompare sampai selesai, dan yang memiliki percentage lebih banyak akan diambil sebagai prediksi akhir.

Dataset menggunakan data dari : https://www.kaggle.com/datasets/elakiricoder/gender-classification-dataset

Description

Untuk memulai klasifikasi, kita memerlukan dataset yang memiliki label. 

Dataset Gender contains 7 features and a label column.

longhair - This column contains 0's and 1's where 1 is "long hair" and 0 is "not long hair".
foreheadwidthcm - This column is in CM's. This is the width of the forehead.
foreheadheightcm - This is the height of the forehead and it's in Cm's.
nosewide - This column contains 0's and 1's where 1 is "wide nose" and 0 is "not wide nose".
noselong - This column contains 0's and 1's where 1 is "Long nose" and 0 is "not long nose".
lipsthin - This column contains 0's and 1's where 1 represents the "thin lips" while 0 is "Not thin lips".
distancenosetoliplong - This column contains 0's and 1's where 1 represents the "long distance between nose and lips" while 0 is "short distance between nose and lips".

gender - This is either "Male" or "Female".

  • Import Library yang akan digunakan
  • Load data gender yang diambil dari Gdrive dan disimpan dalam variabel data_frame
  • Normalisasi data
  • Menampilkan nama feature-feature
  • Menghitung korelasi antar feature
  • Menyimpan korelasi feature dengan target (gender) kemudian menghitung rata-rata korelasi tersebut
  • Seleksi feature 
  • Menampilkan feature yang telah terseleksi (korelasi feature > rata-rata korelasi)
  • Membagi data training dan data testing dengan proporsi 70% untuk training, 30% untuk testing
  • Menyimpan feature dari dataset asli ke dalam variable x_ dan menyimpan target ke dalam variabel y_. Sedangkan x_select untuk dataset yang telah diseleksi 
  • Membuat model 1 untuk dataset asli. Karena menggunakan neural network maka terdiri dari input, hidden layer, dan output. 
  • Param didapatkan dari: dense = size_dense x size_dense_1 = (12×8) = 96, dense_1  = size_dense_1 x size_dense_2 = (8×1) = 104, dense_2 = size_dense_1 + size_dense_2 = (8+1) = 9
  • Proses Training data dan menampilkan hasil training
  • Model 2 untuk dataset yang telah terseleksi feature nya
  • Menghitung akurasi maksimum
  • Proses Testing
  • Evaluasi Proses Testing menggunakan confusion matrix untuk Model 1
  • Evaluasi Proses Testing menggunakan confusion matrix untuk Model 2

Informasi Course Terkait
  Kategori: Data Science / Big Data
  Course: Master Class On Job Training: Data Science Intensive Program Batch 33