Fadli Rizaldy
BISA AI Academy merupakan edutech platform pembelajaran digital yang terdaftar sebagai Lembaga Pelatihan Kerja Naungan Dinas Tenaga Kerja dan Lembaga Kursus Pelatihan Naungan Dinas Pendidikan. Bisa AI Academy menyediakan berbagai kelas GRATIS seputar Kecerdasan Artifisial, Data Science, Internet of Things dan Blockchain. Untuk mendampingi peserta yang ingin belajar di website Bisa AI Academy, maka dibuat sistem rekomendasi untuk menyarankan course yang berhubungan dengan course yang dipilih peserta. Dengan sistem rekomendasi ini, diharapkan para pengguna lebih terarah dalam menjelajahi pembelajaran di Website Bisa AI Academy.
Dataset
Dataset yang digunakan merupakan data dummy yang discrapping dari website Bisa AI Academy langsung. Dataset hanya memerlukan dua kolom yang mana terdapat nama course dan deskripsi course. Dataset dummy yang dibuat sesuai struktur database yang ada sehingga jika model akan dideploy dan digunakan akan bisa kompatibel.
Model
Model yang dibuat menggunakan algoritma TF-IDF. TFIDF (singkatan dari bahasa inggris: term frequency–inverse document frequency, bahasa Indonesia: frekuensi istilah–inversi frekuensi dokumen) adalah ukuran statistik yang menggambarkan pentingnya suatu istilah terhadap sebuah dokumen dalam sebuah kumpulan atau korpus. Ukuran ini sering dipakai sebagai faktor pembobot dalam pencarian temu balik informasi, penambangan teks, dan pemodelan pengguna. Nilai tf–idf bertambah sebanding dengan jumlah kemunculan istilah dalam dan bergantung pada jumlah dokumen dalam korpus yang memiliki istilah tersebut.
Model ini menggunakan TFIDF karena ingin menggunakan keyword keyword yang spesifik pada deskripsi sehingga bisa dibandingkan deskripsi yang sejenis antar course.
A. Load Data
Pertama-tama load data dari file excel yang telah didapat dari scrapping.
B. Membuat Model
Pertama inisiasikan course yang ingin dicari rekomendasinya, dalam kasus ini ingin mencari rekomendasi dari course Deep learning.
Selanjutnya inisiasi model TFIDF dan lalu masukkan kolom deksripsi ke dalam model untuk dijadikan suatu titik titik vektor. Selanjutnya masukkan nama course yang ingin dicoba didapatkan rekomendasi course serupa dengannya lalu ditransform menjadi titik vektor juga. Selanjutnya, untuk mendapatkan course serupa, titik titik tersebut akan dihitung jaraknya menggunakan euclidean distance sehingga masing masing course akan memiliki jarak tertentu dengan course yang ingin dicari rekomendasinya. Model yang dibuat mengurutkan course yang memiliki jarak terdekat dengan course yang dicari (top 10 terdekat). Selanjutnya, untuk membuat model dapat terintegrasi ketika dideploy, hasil yang didapat akan diubah dalam bentuk dictionary agar mudah dijadikan json dan dijadikan API. Berikut adalah hasilnya.
Dari hasil tersebut, hasil rekomendasi yang didapat cukup baik karena berhubungan antara deep learning dan course course yang direkomendasikan.
Sekian model dari saya, Terima kasih.
Referensi: