Foto User
Basic Text Processing

Rendy

Sosial Media


0 orang menyukai ini
Suka

Summary

Text Processing adalah tahapan untuk menyeleksi data text agar menjadi lebih terstruktur lagi dengan melalui serangkaian tahapan yang meliputi tahapan case folding, filtering, tokenizing dan stemming.

Description

Dataset yang digunakan pada adalah dataset yang bersumber dari Amazon mengenai ulasan dan skor untuk produk-produk amazon. Sedangkan alat yang akan digunakan adalah Googel Colaboratory.

 

1. Import library

Melakukan import library-library yang akan digunakan.

Pandas = library standar yang digunakan untuk manipulasi data
String = Untuk melakukan formatting pada string
Re = Fungsi untuk mencocok suatu ekspresi tertentu
NLTK = Library untuk memproses data bahasa manusia

2. Membaca data

 

3. Membuat fungsi yang berguna untuk melakukan preprocessing

4. Menggunakan fungsi untuk melakukan pembersihan data

5. Hasil data bersih

Informasi Course Terkait
  Kategori: Natural Language Processing
  Course: Basic Text Processing