Andreas Parluhutan Rumahorbo
Tingginya mobilitas masyarakat di ruang publik membuat interaksi manusia semakin padat. Perokok adalah orang yang sering ditemui pada padatnya interaksi tersebut. Pengguna fasilitas umum maupun privat terkadang menghindari asap rokok demi menjaga kesehatan. Sehingga pada studi kasus ini dilakukan prediksi berdasarkan model machine learning untuk mendeteksi kemungkinan seseorang adalah perokok aktif atau tidak.Penelitian ini menggunakan metode klasifikasi yang terdapat pada machine learning guna membuat suatu model. Penelitian ini melakukan 4 tahapan dimana peneliti melakukan tahap preparasi data, EDA, visualisasi data (feature dan class-nya), membangun model hingga mengevaluasi nilai accuracy, precision, recall dan f1-score. Hasil penelitian menunjukkan model dengan nilai accuracy tertinggi adalah Random Forest dengan nilai accuracy sebesar 82.8 %. Sedangkan Decision Tree sebesar 77.9%, Logistic Regression sebesar 70.6%, MLP sebesar 74.3%, KNN sebesar 70.09%, XGB sebesar 75.8%, dan SVR sebesar 72.5%
Perilaku merokok telah menjadi perilaku yang tidak menyenangkan bagi sebagian besar masyarakat. Perilaku merokok merupakan salah satu dari aspek tingkah laku yang kompleks karena memberikan dampak biopsikososial yang cukup signifikan, dalam hal ini perilaku merokok telah berdampak pada kondisi fisiologis, kognitif, psikologis hingga lingkungan sosial. Secara kognitif, para perokok tidak memperlihatkan keyakinan yang tinggi terhadap bahaya akan asap rokok. Terdapat dua jenis perokok, yaitu perokok aktif dan pasif. Meskipun risiko kesehatan lebih tinggi pada perokok aktif namun perokok pasif yang secara tidak sengaja menghirup asap rokok, secara tidak langsung juga telah turut memasukkan zat-zat berbahaya ke dalam tubuhnya.Beberapa penelitian melaporkan bahwa sekitar 20% - 30% risiko kesehatan seperti penyakit paru-paru juga dialami oleh perokok pasif.
Interaksi antara perokok aktif dengan perokok pasif ini biasanya terjadi di tempat-tempat umum, seperti di stasiun kereta api, terminal, di dalam bus kota, dan sebagainya. 1 Tingginya mobilitas masyarakat di ruang publik membuat interaksi manusia semakin padat sehingga tidak pernah lepas dari keberadaan asap rokok. Selain di tempat publik, perokok juga termasuk orang yang sering dihindari saat berada di ruangan pribadi seperti rumah, kantor, kamar dan sebagainya. Bodysignal atau Bio-signal merupakan suatu fitur khusus yang berasal dari aktivitas tubuh manusia, sebagai suatu mekanisme reaksi dari aktivitas-aktivitas biologis yang terjadi dalam tubuh. Data biosignal dapat dimanfaatkan untuk mendeteksi kemungkinan seseorang perokok atau bukan. Pada penelitian ini, dataset biosignal diambil dari kaggle. Dataset memiliki sejumlah fitur yang dapat dimanfaatkan untuk memprediksi seseorang terindikasi sebagai perokok atau tidak. Penelitian dilakukan dengan menerapkan salah satu algoritma dalam machine learning yaitu klasifikasi. Klasifikasi merupakan suatu teknik atau metode dalam machine learning, data akan dikelompokkan berdasarkan kelasnya dimana di dalamnya terdapat label atau target. Terdapat beberapa algoritma klasifikasi yang digunakan dalam penelitian ini antara lain: Decision Tree. K-Nearest Neighbors (KNN), Logistic Regression, Multilayer Perceptron (MLP), Random Forest, SVM dan Extreme Gradient Boosting (XGB)