Sinu
Sentiment analisis pada data twitter/Tweet menggunakan algoritma naive bayes classifier. Program ini dapat menghitung seberapa positif/negatif suatu tweet. Klasifikasi juga dikelompokkan menjadi 5 yaitu ,extremely Negative,extremely positive ,Negative,Neutral dan Positive.
Twitter Sentiment Analysis using Naive Bayes
Program ini dapat mengklasifikasikan suatu tweet berdasarkan sentiment pengguna . Apakah tweet tersebut bersifat negative ataupun positive . saya menggunakan dataset https://www.kaggle.com/datasets/datatattle/covid-19-nlp-text-classification .
dataset terdiri dari 4 kolom :
Kasus text classification merupakan kasus machine learning supervised,oleh karena itu kita harus membuat label pada masing-masing tweet,tetapi dikarenakan pada dataset masing-masing tweet sudah memiliki label ,hal ini tidak diperlukan lagi.
Langkah-Langkah Membuat Text-Classification :
Di dapatkah hasil akhir dengan accuracy sebesar 44% . hasil ini bisa terjadi dikarenakan adanya label yang berlebihan , akan lebih baik jika hanya menggunakan positive,negative dan netral. Tetapi walaupun memiliki hasil accuracy 44% ,model sudah dapat memprediksi dengan baik, hanya saja sering kali label “extremely positive” dianggap menjadi "positive" , begitu juga untuk yang negative.