Nur Alfi Laily
Pada proyek ini, akan dilakukan analisis sentimen tweets dari Twitter mengenai COVID-19 menjadi 3 kategori yaitu “positive”, “neutral”, dan “negative”. Dataset yang digunakan diperoleh dari Kaggle. Proses analsi sentimen akan menggunakan CNN-LSTM dengan memanfaatkan representasi teks berupa FastText.
Dataset
Dataset diperoleh dari Corona Virus tweets NLP - Text Classification melalui Kaggle.
Dataset tersebut terdiri dari 6 kolom:
Metode
Data Preprocesing
Text Representation
Menggunakan FastText.
Modeling
Menggunakan CNN-LSTM dengan arsitektur sebagai berikut.
Hasil
Akurasi
Loss
Akurasi pada data validasi pada epoch ke-15 adalah 63.61%.
Link dataset: kaggle.com/datasets/datatattle/covid-19-nlp-text-classification