Anna Jessika Ginting
Algoritma NaiveBayes merupakan sebuahmetoda klasifikasi menggunakan metode probabilitas dan statistik yg dikemukakan oleh ilmuwan Inggris Thomas Bayes. Algoritma Naive Bayes memprediksi peluang di masa depan berdasarkan pengalaman di masa sebelumnya sehingga dikenal sebagai TeoremaBayes. Ciri utamadr Naïve Bayes Classifier ini adalah asumsiyg sangat kuat (naïf) akan independensi dari masing-masing kondisi / kejadian.
Data yang akan digunakan adalah data Caesarian. Data tersebut memiliki 6 variabel :
Langkah-Langkah untuk Melakukan Klasifikasi dengan Algoritma NaiveBayes di Phyton
Langkah pertama adalah memanggil library yang akan digunakan :
Selanjutnya, masukkan data yang telah satu folder dengan file .ipynb :
Kemudian untuk melihat tampilan beberapa data awal dapat menggunakan perintah berikut :
Sehingga akan menghasilkan output sebagai berikut :
Selanjutnya akan mencari info dari setiap variabel yang ada :
Selanjutnya menentukan variabel independen dan variabel dependennya :
Variabel dependennya adalah Caesarian, sedangkan variabel independen nya adalah semua variabel yang ada kecuali Caesarian, yaitu Age, Dev_number, Dev_time, Blood Preasure, HeartProblem.
Klasifikasi Naive Bayes ini terdapat di dalam packageSklearn, sehingga harus memanggilnya terlebih dahulu :
Langkah selanjutnya adalah melakukan proses training data, dengan random state nya adalah 1 2 3.
Nilai random state sebenarnya bebas, karena nilai ini digunakan agar hasil data random yang didapatkan sama.
Kemudian akan melihat data testing untukvariabel independen :
Sehingga akan menghasilkan output sebagai berikut :
Untuk mengaktifkan fungsi klasifikasi NaiveBayes, dapat menggunakan script berikut :
Kemudian memasukkan data trainingpada fungsi klasifikasi Naive Bayes :
Untuk menentukan hasil prediksidata testing, dapat menggunakan scriptberikut :
Kemudian akan membandingkan dengan nilai testingyang sebenarnya :
Dapat dilihat bahwa ada sekitar perbedaan 9 data antara data testing yang diprediksi dengan data testing yang sebenarnya.
Selanjutnya dapat mencari nilai probabilitas dari hasil prediksi, sehingga dapat melihat kenapa data tersebut dibulatkan menjadi 0 ataupun 1:
Hasil yang dapat dilihat adalah yang bagian kanan. Misalkan data pertama 0.86 dibulatkan menjadi 1, data kedua 0.25 dibulatkan menjadi 0, begitu seterusnya. Kemudian akan membuat Confussion Matrix :
Untuk menghasilkan tampilan ConfusionMatrix yang lebih rapi dapat menggunakan cara berikut :
Selanjutnya didapatkan nilai akurasi sebagai berikut :
Nilai akurasi yang didapatkan dari hasil ini hanya 0,44 atau 44 %, yang artinya hasilprediksinya belum cukup tepat.
Untuk melihatoverall statistik dalamsatu kesatuan, dapat menggunakan perintahberikut :
Lalu outputnya akan tampil sepertiini :
Berikut klasifikasi data Caesarian dengan Algoritma Naive Bayes terlah berhasil dilakukan.