Ulung Wijayanto
Proyek ini bertujuan memprediksi potensi dropout dan keberhasilan akademik mahasiswa dengan menggunakan algoritma machine learning, khususnya Multilayer Perceptron (MLP) dan Decision Tree. Melalui eksplorasi data dan analisis fitur-fitur seperti latar belakang pendidikan orang tua serta performa akademik mahasiswa, dikembangkan model klasifikasi untuk menentukan status mahasiswa (Dropout, Enrolled, Graduate). Hasil evaluasi menunjukkan bahwa meskipun MLP mengalami overfitting dengan akurasi latih 100%, Decision Tree memberikan hasil prediksi yang lebih stabil pada data uji. Pendekatan ini berpotensi menjadi sistem peringatan dini untuk membantu institusi pendidikan dalam menangani risiko dropout mahasiswa.
Terima kasih! Berdasarkan informasi tambahan bahwa MLP menghasilkan akurasi 100% dan Decision Tree sebesar 33%, berikut adalah revisi deskripsi lengkap proyek akhir yang sudah diperbaiki agar sesuai:
Dropout mahasiswa merupakan salah satu masalah serius yang berdampak pada efektivitas dan efisiensi sistem pendidikan tinggi. Dengan semakin besarnya data akademik yang tersedia, penerapan Machine Learning menjadi solusi potensial untuk memprediksi apakah seorang mahasiswa akan lulus, dropout, atau masih dalam proses studi (enrolled). Proyek ini bertujuan untuk membangun model prediksi berbasis data historis mahasiswa menggunakan algoritma Machine Learning, serta mengevaluasi kinerjanya.
Eksplorasi Data (EDA)
Dataset berisi lebih dari 30 fitur, latar belakang pendidikan orang tua, mode pendaftaran, performa akademik per semester, dan informasi lainnya. Dari visualisasi pie chart, diketahui distribusi target tidak seimbang: 49.9% Graduate, 32.1% Dropout, dan 17.9% Enrolled. Ini menjadi pertimbangan penting saat evaluasi model.
Pra-pemrosesan dan Pembagian Data
Data disaring untuk kasus khusus: mahasiswa dengan pendidikan ibu > 23 dan ayah > 24. Data lalu dibagi menjadi data latih (70%) dan data uji (30%) menggunakan train_test_split.
Model 1: Multilayer Perceptron (MLPClassifier)
MLP digunakan sebagai model jaringan saraf dengan satu hidden layer.
Hasil: Akurasi pada data latih mencapai 100%, namun f1-score pada data uji sangat rendah. Hal ini menunjukkan overfitting, yaitu model terlalu menghafal data latih dan gagal generalisasi ke data baru.
Model 2: Decision Tree Classifier
Sebagai pembanding, digunakan juga Decision Tree yang lebih sederhana dan mudah diinterpretasikan.
Hasil: Akurasi pada data latih tinggi, namun akurasi pada data uji hanya 33%, dengan f1-score lebih seimbang. Meskipun hasil ini masih rendah, model lebih stabil dan tidak overfit seperti MLP.
Evaluasi dan Interpretasi
Evaluasi dilakukan dengan classification report (precision, recall, f1-score). MLP unggul di akurasi pelatihan tapi lemah di generalisasi. Sementara Decision Tree memberi prediksi lebih realistis pada data uji, walau tetap dipengaruhi oleh distribusi data yang tidak seimbang dan jumlah sampel yang sedikit.
Model Multilayer Perceptron memberikan hasil akurasi pelatihan sempurna namun gagal saat diuji, menandakan overfitting. Sebaliknya, Decision Tree meskipun hanya menghasilkan 33% akurasi, memberi gambaran prediksi yang lebih realistis. Hasil ini menunjukkan pentingnya penanganan data tidak seimbang serta perlunya pemilihan model yang sesuai dengan kondisi data. Proyek ini membuka peluang pengembangan sistem prediktif untuk membantu kampus dalam mengidentifikasi dan mendukung mahasiswa berisiko dropout secara lebih dini.