Arief Rachman Hakim
Kenaikan gaji adalah suatu hal yang sangat dinantikan dari sebuah pekerjaan. Namun, kadang kita tidak memperhatikan apa hal yang dapat menyebabkan kenaikan gaji tersebut terjadi. Salah satu metrics yang dapat kita gunakan untuk mengetahui kapan kenaikan gaji adalah lama pengalaman dalam bidang yang kita tekuni. Semakin lama bidang yang kita tekuni, maka biasanya gaji pun akan mengikuti. Oleh karena itu, saya kali ini akan membuat sebuah prediksi kenaikan gaji dengan algoritman Linear Regresi dengan mengambil dataset dari kaggle.
https://www.kaggle.com/datasets/rohankayan/years-of-experience-and-salary-dataset
1. Import gdrive
2. Import library python untuk kebutuhan mengolah data
3. Membaca dataset, untuk fitur bawaan diubah menjadi Tahun Pengalaman dan Gaji
4. Identifikasi value yang null dan tipe data dari fitur
5. Identifikasi dataset apakah cocok dengan Linear Regresi dengan Scatter Plot
Seperti yang dapat kita lihat, persebaran data cocok mengindikasikan garis linear yang cocok dengan linear regresi
6. Identifikasi Korelasinya antar fitur
7. Membuat model training data dengan Algoritma Linear Regresi
x = Tahun Pengalaman ( variable independen )
y = Gaji (variable dependen)
Selanjutnya data di split menjadi data train dan data test
8. Score dengan Algoritma Linear Regresi menghasilkan 98%
9. Identifikasi hasil dengan Algoritma Linear Regresi dengan matplotlib
Seperti dapat kita lihat, data test berada disekitar garis linear yang menandakan prediksinya akurat dan minim outlier
10. Evaluasi model dengan input data sendiri
Dinputkan sejumlah data :
Data inputan dicocokkan dengan format pada dataset diawal yaitu dengan penggunaan angka decimal/float yang menunjukan lama waktu per-tahunnya
0.5 = 6 bulan
1 = 1 tahun
5 = 5 tahun
10 = 10 tahun
11. Final Evaluasi
Menambah keterangan agar lebih terbaca hasil prediksinya. Terlihat semakin lama pengalaman maka gaji akan semakin besar
12. Dokumentasi Kode
https://drive.google.com/drive/folders/1nsIjLPTDdrW5nR6uGVdDRw-tXLpi8hhD?usp=sharing