Twitter Sentiment Analysis using Naive Bayes

Sinu

Sosial Media


2 orang menyukai ini
Suka

Summary

Sentiment analisis pada data twitter/Tweet menggunakan algoritma naive bayes classifier. Program ini dapat menghitung seberapa positif/negatif suatu tweet. Klasifikasi juga dikelompokkan menjadi 5 yaitu ,extremely Negative,extremely positive ,Negative,Neutral  dan Positive.

Description

Twitter Sentiment Analysis using Naive Bayes

Program ini dapat mengklasifikasikan suatu tweet berdasarkan sentiment pengguna . Apakah tweet tersebut bersifat negative ataupun positive . saya menggunakan dataset https://www.kaggle.com/datasets/datatattle/covid-19-nlp-text-classification

dataset terdiri dari  4 kolom :

  1. Location : # lokasi pengguna mengupload tweet
  2. Tweet at : # waktu pengguna mengupload tweet
  3. Original Tweet : # teks dari tweet tersebut
  4. Label : # label dari tweet tersebut (positif/negatif)

Kasus text classification merupakan kasus machine learning supervised,oleh karena itu kita harus membuat label pada masing-masing tweet,tetapi dikarenakan pada dataset masing-masing tweet sudah memiliki label ,hal ini tidak diperlukan lagi.

Langkah-Langkah Membuat Text-Classification :

  1. Lakukan EDA(Exploratory Data Analysis) : melihat apakah ada missing values pada data , dan menghapus value tersebut.
  2. Lakukan Preprocessing Text : Text akan melalui proses stemming ,tokenize,spell checker,replace punctuation , Capitalize dan remove whitespace
  3. Training Model : Menggunakan Count Vectorize ,lalu train test split data ,kemudian menggunakan naive bayes dengan metode MultinomialNB
  4. Evaluate Model : Model di evaluasi menggunakan classification report dan confusion matrix

Di dapatkah hasil akhir dengan accuracy sebesar 44% . hasil ini bisa terjadi dikarenakan adanya label yang berlebihan , akan lebih baik jika hanya menggunakan positive,negative dan netral. Tetapi walaupun memiliki hasil accuracy 44% ,model sudah dapat memprediksi dengan baik, hanya saja sering kali label “extremely positive” dianggap menjadi "positive"  , begitu juga untuk yang negative.

 

 

Informasi Course Terkait
  Kategori: Artificial Intelligence
  Course: Deep Learning Dengan Keras Python