Sentyment Analysis with FastText

Eki Virgiana

Sosial Media


0 orang menyukai ini
Suka

Summary

Sentiment analysis, atau analisis sentimen, adalah proses mengidentifikasi, mengekstrak, dan mempelajari sentimen atau opini yang terkandung dalam teks atau data lainnya. Tujuan dari sentimen analisis adalah untuk menentukan apakah sentimen yang terkandung dalam teks tersebut bersifat positif, negatif, atau netral.

Description

Sentiment analysis, atau analisis sentimen, adalah proses mengidentifikasi, mengekstrak, dan mempelajari sentimen atau opini yang terkandung dalam teks atau data lainnya. Tujuan dari sentimen analisis adalah untuk menentukan apakah sentimen yang terkandung dalam teks tersebut bersifat positif, negatif, atau netral.  Pada portofolio kali ini saya membuat sentyment analysis menggunakan salah satu teknik word embedding yaitu FastText.


FastText adalah sebuah model pembelajaran mesin dan juga library yang dikembangkan oleh Facebook AI Research. Model ini digunakan untuk pemrosesan bahasa alami (natural language processing/NLP) dengan fokus pada representasi kata (word embeddings) yang efisien. Dibawah ini adalah langkah langkah dalam membuat model sentyment analysis menggunakan FastText

 

1.Prepare Corpuse

Langkah pertama yang dilakukan adalah prepare corpuse, dalam NLP dataset teks disebut dengan corpuse, untuk menyiapkan dataset teks hanya tinggal membacanya menggunakan pandas, lalu disini saya juga membuat stopwords dalam bahasa indonesia

 

 

2.Load Model dan One Hot Encodding

Langkah selanjutnya setelah menyiapkan data teks dan stopwords adalah meload model FastText yang sebelumnya sudah ditraining. selanjutnya menjadikan dataframe menjadi representasi vektor menggunakan fungsi norm_sent_vector

3. Modelling

Setelah menjadikan data teks representasi vector, langkah selanjutnya adalah dataset splitting menggunakan train_test_split, selanjutnya kita bisa melakukan modeling menggunakan salah satu algoritma machine learning, sebagai contoh disini saya menggunakan algoritma K-Nearest Neighbor dan menggunakan parameter tuning seperti dibawah

4. Prediksi

Setelah kita berhasil membuat model sentyment analysis selanjutnya adalah memprediksi menggunakan kalimat yang belum pernah dilihat model kita, tujuanya adalah untuk menguji kinerja model apakah overfit atau underfit. dibawah ini adalah contoh prediksi menggunakan model sentyment analysis

Informasi Course Terkait
  Kategori: Natural Language Processing
  Course: Word Embedding untuk NLP