Ahmad Farriz Abdan Syakuran
Food Recomendation System adalah aplikasi yang menggunakan teknik-teknik analisis data untuk memberikan rekomendasi makanan menggunakan Simple Content Based Filtering kepada pengguna berdasarkan preferensi mereka. Dengan memanfaatkan machine learning dan algoritma rekomendasi, sistem ini dapat menyesuaikan rekomendasi makanan sesuai dengan selera pengguna.
TF-IDF (Term Frequency-Inverse Document Frequency) adalah sebuah metode yang digunakan dalam pemrosesan teks untuk mengevaluasi pentingnya sebuah kata dalam suatu dokumen dalam sebuah koleksi dokumen (corpus). Dalam sebuah korpus teks besar, terdapat kata-kata yang muncul secara umum (seperti "the", "a", "is" dalam bahasa Inggris) yang kurang memberikan informasi yang bermakna tentang isi sebenarnya dari dokumen tersebut. Jika kita langsung menggunakan data hitungan kata-kata ini ke dalam sebuah pengklasifikasi, kata-kata yang sangat umum ini akan mengurangi bobot dari kata-kata yang lebih jarang muncul namun lebih bermakna.
Untuk menyeimbangkan dan memberikan bobot yang lebih baik kepada fitur-fitur hitungan kata-kata agar sesuai untuk digunakan oleh pengklasifikasi, umumnya digunakanlah transformasi tf-idf. Transformasi ini memperhitungkan dua hal utama: frekuensi kata dalam dokumen (TF) dan kebalikan frekuensi dokumen kata tersebut dalam seluruh koleksi dokumen (IDF). Dengan menggunakan metode ini, kata-kata yang sering muncul namun kurang informatif akan memiliki bobot yang lebih rendah, sementara kata-kata yang muncul jarang namun lebih informatif akan memiliki bobot yang lebih tinggi, sehingga meningkatkan kemampuan model dalam menangkap informasi yang relevan dari teks.
Kernel linear adalah sebuah fungsi yang menghitung kernel linear, yaitu kasus khusus dari kernel polinomial dengan degree=1 dan coef0=0 (homogen). Kernel linear mengukur kesamaan antara dua vektor dalam ruang fitur dengan cara yang sederhana, yaitu dengan mengalikan setiap komponen dari dua vektor dan menjumlahkan hasilnya. Ini menghasilkan metrik sederhana yang digunakan dalam metode seperti Support Vector Machines (SVM) untuk menentukan pemisah linier antara kelas-kelas dalam data. Dalam konteks fungsi kernel, kernel linear sering digunakan untuk mengubah data ke dalam ruang dimensi yang lebih tinggi agar dapat dengan lebih baik menemukan pemisah linier antara kelas-kelas yang tidak terpisahkan secara linier dalam ruang dimensi asli.