Rendy
Text Processing adalah tahapan untuk menyeleksi data text agar menjadi lebih terstruktur lagi dengan melalui serangkaian tahapan yang meliputi tahapan case folding, filtering, tokenizing dan stemming.
Dataset yang digunakan pada adalah dataset yang bersumber dari Amazon mengenai ulasan dan skor untuk produk-produk amazon. Sedangkan alat yang akan digunakan adalah Googel Colaboratory.
1. Import library
Melakukan import library-library yang akan digunakan.
Pandas = library standar yang digunakan untuk manipulasi data
String = Untuk melakukan formatting pada string
Re = Fungsi untuk mencocok suatu ekspresi tertentu
NLTK = Library untuk memproses data bahasa manusia
2. Membaca data
3. Membuat fungsi yang berguna untuk melakukan preprocessing
4. Menggunakan fungsi untuk melakukan pembersihan data
5. Hasil data bersih