Vektorisasi Data Teks
Sebelum melakukan analisis data teks, data teks perlu diubah ke dalam bentuk data numerik dengan menggunakan teknik-teknik vektorisasi data teks. Beberapa teknik yang dapat digunakan dalam vektorisasi data teks yaitu Bag of Words, TF-IDF, dan word embedding. Vektorisasi data teks penting dilakukan dalam mengolah data teks karena komputer hanya dapat mengerti dan memproses data numerik. Selain itu, dengan vektorisasi data teks yang tepat dapat menghasilkan hasil terbaik dalam analisis yang dilakukan.
Share Kelas Ini :
Informasi Umum
Pada course ini akan dibahas berbagai teknik untuk vektorisasi data teks yang dibagi kedalam beberapa silabus diantaranya Bag of Words dan TF-IDF, implementasi count vectorization dan TF-IDF pada python, word embedding, dan implementasi word embedding pada python. Metode-metode yang digunakan pada artificial intelegence dan machine learning memerlukan input berupa data numerik. Karena itu, data teks perlu untuk diubah dahulu kebentuk numerik sebelum dapat diproses untuk keperluan analisis lebih lanjut. Dengan mempelajari course ini, peserta diharapkan dapat memahami bagaimana memproses data teks menjadi data numerik hingga dapat menyimpan informasi yang terkandung dalam data teks menjadi bentuk data numerik. Dengan menyelesaikan course ini, diharapkan peserta dapat memiliki pemahaman dan kompetensi untuk menjadi data analyst, data scientist, ataupun AI engineer khususnya dalan industri yang bergerak dalam bidang NLP.
Target Pembelajaran
- Peserta mampu memahami dan mengimplementasi konsep dasar dari vektorisasi data teks.
- Peserta mampu mengolah data teks dengan menggunakan python dan juga teknik-teknik yang telah dicontohkan.
- Peserta mampu mengimplementasikan vektorisasi data teks pada real case data text.
Spesifikasi
- Komputer yang terinstall python 3 dan jupyter notebook (untuk pengerjaan offline).
- Komputer dengan browser, koneksi internet, dan akun gmail agar dapat menggunakan Google Colaboratory (untuk pengerjaan online).
Kriteria Kelulusan
Peserta diwajibkan untuk mengambil kuis dari setiap silabus yang ada di course. Tugas akhir dapat diakses jika peserta telah menyelesaikan kuis di setiap silabus dengan nilai yang memenuhi kriteria ketuntasan minimal (KKM) yaitu 70. Setelah peserta menyelesaikan kuis dan tugas akhir, maka peserta akan mendapatkan sertifikat.
Skema Penilaian
A. Kuis (80%)
Soal kuis di setiap silabus terdiri dari soal-soal pilihan ganda yang harus dijawab oleh peserta. Nilai kuis dapat diperoleh jika peserta dapat menyelesaikan kuis di setiap silabus dengan sempurna. Nilai kuis setiap silabus akan diakumulasikan sebanyak 10 %.
B. Tugas akhir (20%)
Tugas akhir terdiri dari satu soal analisis yang diambil dari silabus. Nilai tugas akhir dapat diperoleh jika peserta berhasil menyelesaikan tugas akhir dengan baik.