AMALYA MIFTAHUL JANNAH
SUMMARY
Klasifikasi data adalah proses untuk memprekdisi suatu kategori data dengan teknik menggelompokan data berdasarkan keterikatan data terhadap sampel yang telah ada.
DESCRIBTION
Dalam Klasifikasi data menggunakan Machine Learning, dataset yang diolah bisa diperoleh dari Kanggle.com dengan data yang disajikan merupakan data gaji karyawan berdasarkan jabatannya, guna memprediksi tingkat kejujuran calon pegawai dalam memberikan informasi mengenai gajinya di perusahaan sebelumnya.
Berikut tampilan implementasi praktik klasifikasi data menggunakan source code Random Forest Regressor secara keseluruhan:
Langkah – Langkah pengklasifikasian data menggunakan Machine Learning pada Google Colaboratory:
Dalam penggunaan model random forest regression yang dibuat adalah hasil dari 10 decision tree, di mana ditunjukan semakin banyak data anak tangga maka menggambarkan semakin banyak pula interval pembagiannya/ semakin banyak pembagian cabang keputusan yang dibuat. Kemudian dari sisi prediksi dengan y_pred pada model random forest hasilnya juga sangat dekat dengan data setnya yairu 167.000 dollar/tahun . Hal tersebut bisa dikatakan random forest lebih presisi karena lebih dekat diangka 175.000 dollar/tahun jika dibandingkan dengan 1 decisoin tree yaitu 150.000 dollar/tahun.