MOHAMAD FRANANDA ADIEZWARA RAMADHAN
Sentimen Analisis Sederhana dengan NLP
DASAR TEORI
Text preprocessing merupakan suatu proses untuk menyeleksi data text agar menjadi lebih terstruktur lagi dengan melalui serangkaian tahapan yang meliputi tahapan case folding, tokenizing, filtering dan stemming. Tapi, sesungguhnya tidak ada aturan pasti tentang setiap tahapan dalam text preprocessing. Semua itu tergantung dengan jenis serta kondisi data yang kita miliki.
STEP BY STEP SENTIMEN ANALISIS SEDERHANA DENGAN NLP
Langkah pertama unduh terlebih dahulu dataset yang akan dilakukan preprocessing pada Kaggle
Lalu lakukan mounting google drive agar dataset bisa diakses dan agar google drive terhubung dengan google colab, lalu import library yang dibutuhkan agar package yang dibutuhkan juga terdownload
Lalu temukan null value atau missing value, lalu drop atau hapus null value atau missing value tersebut
Import library yang dibutuhkan dan download juga package yang diperlukan seperti pandas, numpy dan sebagainya
Lalu Langkah selanjutnya lakukan text processing, dimana proses untuk menyeleksi data text agar menjadi lebih terstruktur lagi dengan melalui serangkaian tahapan atau proses seperti case folding,tokenizing,filtering,stemming. Lalu lakukan train test split data untuk mengevaluasi performa model machine learning, metode model evaluasi ini membagi dataset menjadi 2 bagian yakni bagian yang digunakan untuk training data dan untuk testing data dengan proposi tertentu
Lalu gunakan juga modul scikit learn untuk membantu melakukan processing data ataupun melakukan training data untuk kebutuhan data machine learning atau nlp tersebut
Lalu Langkah selanjutnya lakukan evaluasi model dengan melakukan akurasi klasifikasi ( pembagian data jumlah prediksi benar terhadap total prediksi, gunakan metrik evaluasi precision,recall dll, agar bisa mengukur performa model klasifikasi yang saya buat (model akurasinya 81%)