Eki Virgiana
Sentiment analysis, atau analisis sentimen, adalah proses mengidentifikasi, mengekstrak, dan mempelajari sentimen atau opini yang terkandung dalam teks atau data lainnya. Tujuan dari sentimen analisis adalah untuk menentukan apakah sentimen yang terkandung dalam teks tersebut bersifat positif, negatif, atau netral.
Sentiment analysis, atau analisis sentimen, adalah proses mengidentifikasi, mengekstrak, dan mempelajari sentimen atau opini yang terkandung dalam teks atau data lainnya. Tujuan dari sentimen analisis adalah untuk menentukan apakah sentimen yang terkandung dalam teks tersebut bersifat positif, negatif, atau netral. Pada portofolio kali ini saya membuat sentyment analysis menggunakan salah satu teknik word embedding yaitu FastText.
FastText adalah sebuah model pembelajaran mesin dan juga library yang dikembangkan oleh Facebook AI Research. Model ini digunakan untuk pemrosesan bahasa alami (natural language processing/NLP) dengan fokus pada representasi kata (word embeddings) yang efisien. Dibawah ini adalah langkah langkah dalam membuat model sentyment analysis menggunakan FastText
1.Prepare Corpuse
Langkah pertama yang dilakukan adalah prepare corpuse, dalam NLP dataset teks disebut dengan corpuse, untuk menyiapkan dataset teks hanya tinggal membacanya menggunakan pandas, lalu disini saya juga membuat stopwords dalam bahasa indonesia
2.Load Model dan One Hot Encodding
Langkah selanjutnya setelah menyiapkan data teks dan stopwords adalah meload model FastText yang sebelumnya sudah ditraining. selanjutnya menjadikan dataframe menjadi representasi vektor menggunakan fungsi norm_sent_vector
3. Modelling
Setelah menjadikan data teks representasi vector, langkah selanjutnya adalah dataset splitting menggunakan train_test_split, selanjutnya kita bisa melakukan modeling menggunakan salah satu algoritma machine learning, sebagai contoh disini saya menggunakan algoritma K-Nearest Neighbor dan menggunakan parameter tuning seperti dibawah
4. Prediksi
Setelah kita berhasil membuat model sentyment analysis selanjutnya adalah memprediksi menggunakan kalimat yang belum pernah dilihat model kita, tujuanya adalah untuk menguji kinerja model apakah overfit atau underfit. dibawah ini adalah contoh prediksi menggunakan model sentyment analysis