Muhammad Zaki
Sistem rekomendasi film adalah solusi dirancang untuk membantu pengguna menemukan film sesuai preferensi mereka, bertujuan meningkatkan pengalaman pengguna dengan menyajikan rekomendasi relevan. Fokus pengembangan sistem ini adalah penerapan Content-Based Filtering. Dataset ini berisi lebih dari 20 juta rating dari 27 ribu film oleh lebih dari 138 ribu pengguna antara 1995 hingga 2015
Sumber Dataset
MovieLens 20M Dataset (kaggle.com)
Latar Belakang
Sistem rekomendasi film adalah sebuah sistem yang dirancang sebagai solusi untuk membantu pengguna menemukan film yang sesuai dengan preferensi mereka. Tujuan utama sistem ini adalah meningkatkan pengalaman pengguna dengan menyajikan rekomendasi yang relevan dan menarik. Pengembangan sistem ini terfokus pada penerapan Content-Based Filtering sebagai teknik utama, yang mengandalkan analisis konten film, termasuk genre, tag, dan nilai rating, untuk memberikan rekomendasi film yang memiliki karakteristik serupa dengan film yang disukai pengguna. Dengan pendekatan ini, sistem dapat lebih presisi dalam menyajikan saran berdasarkan kesamaan fitur film yang diinginkan oleh pengguna.
Penjelasan Dataset
Dataset ini memiliki 6 file terpisah diantaranya genome_scores.csv, genome_tags.csv, link.csv, movie.csv, rating.csv, dan tag.csv. Dataset ini menggambarkan rating dari MovieLens, sebuah layanan rekomendasi film. Dataset ini berisi 20.000.263 rating dari 27.278 film, yang dibuat oleh 138.493 pengguna antara tanggal 09 Januari 1995 dan 31 Maret 2015. Dataset ini dibuat pada tanggal 17 Oktober 2016.
Impor Library dan Dataset
Menyiapkan Data
Melakukan merging pada dataframe “movie” dan “rating” menjadi satu dataframe bernama "films"
Melakukan pembersihan data dengan menghapus entri pada "films" yang tidak memiliki informasi genre
Melakukan konversi data ke dalam bentuk list untuk kolom “movieId”, “title”, dan "genres". Lalu, list tersebut dimanfaatkan untuk membentuk dataframe baru, “df_film”, yang merepresentasikan informasi film dengan kolom “film_id”, “film_name”, dan “genre”. Data akhir yang telah dipersiapkan siap digunakan pada tahapan selanjutnya dalam proses modelling.
Pembangunan Model
Hasil