Portofolio Basic Text Processing

MOHAMAD FRANANDA ADIEZWARA RAMADHAN

Sosial Media


0 orang menyukai ini
Suka

Summary

Sentimen Analisis Sederhana dengan NLP

Description

DASAR TEORI

Text preprocessing merupakan suatu proses untuk menyeleksi data text agar menjadi lebih terstruktur lagi dengan melalui serangkaian tahapan yang meliputi tahapan case folding, tokenizing, filtering dan stemming. Tapi, sesungguhnya tidak ada aturan pasti tentang setiap tahapan dalam text preprocessing. Semua itu tergantung dengan jenis serta kondisi data yang kita miliki.

 

STEP BY STEP SENTIMEN ANALISIS SEDERHANA DENGAN NLP

Langkah pertama unduh terlebih dahulu dataset yang akan dilakukan preprocessing pada Kaggle 

Lalu lakukan mounting google drive agar dataset bisa diakses dan agar google drive terhubung dengan google colab, lalu import library yang dibutuhkan agar package yang dibutuhkan juga terdownload 

Lalu temukan null value atau missing value, lalu drop atau hapus null value atau missing value tersebut 

Import library yang dibutuhkan dan download juga package yang diperlukan seperti pandas, numpy dan sebagainya 

Lalu Langkah selanjutnya lakukan text processing, dimana proses untuk menyeleksi data text agar menjadi lebih terstruktur lagi dengan melalui serangkaian tahapan atau proses seperti case folding,tokenizing,filtering,stemming. Lalu lakukan train test split data untuk mengevaluasi performa model machine learning, metode model evaluasi ini membagi dataset menjadi 2 bagian  yakni bagian yang digunakan untuk training data dan untuk testing data dengan proposi tertentu 

Lalu gunakan juga modul scikit learn untuk membantu melakukan processing data ataupun melakukan training data untuk kebutuhan data machine learning atau nlp tersebut 

Lalu Langkah selanjutnya lakukan evaluasi model dengan melakukan akurasi klasifikasi ( pembagian data jumlah prediksi benar terhadap total prediksi, gunakan metrik evaluasi precision,recall dll, agar bisa mengukur performa model klasifikasi yang saya buat (model akurasinya 81%)

Informasi Course Terkait
  Kategori: Natural Language Processing
  Course: Basic Text Processing