Ricky Indra Gunawan
Speech Emotion Recognition, disingkat SER, adalah tindakan mencoba mengenali emosi manusia dan keadaan afektif dari ucapan. Ini memanfaatkan fakta bahwa suara sering kali mencerminkan emosi yang mendasari melalui tone dan pitch. Ini juga merupakan fenomena yang digunakan hewan seperti anjing dan kuda untuk dapat memahami emosi manusia.
Pengenalan emosi adalah bagian dari pengenalan suara yang semakin populer dan kebutuhannya meningkat pesat. Meskipun ada metode untuk mengenali emosi menggunakan teknik pembelajaran mesin, proyek ini mencoba menggunakan pembelajaran mendalam untuk mengenali emosi dari data.
SER (Speech Emotion Recognition) digunakan di call center untuk mengklasifikasikan panggilan menurut emosi dan dapat digunakan sebagai parameter kinerja untuk analisis percakapan sehingga mengidentifikasi pelanggan yang tidak puas, kepuasan pelanggan, dan sebagainya. untuk membantu perusahaan meningkatkan layanan mereka
Dapat juga digunakan sistem in-car board berdasarkan informasi kondisi mental pengemudi yang dapat diberikan kepada sistem untuk menginisiasi keselamatannya mencegah terjadinya kecelakaan
Langkah pertama yaitu import library yang dibutuhkan dan sambungkan Google Colab dengan Google Drive.
Setelah itu, lakukan data preparation.
Setelah itu, coba lakukan Data Visualization dan Exploratory Data Analysis
Data yang diperoleh telah balance.
Kita juga dapat memplot waveplot dan spektogram untuk sinyal audio
Data Augmentation
Ekstraksi Fitur
Sinyal audio adalah sinyal tiga dimensi di mana tiga sumbu mewakili waktu, amplitudo, dan frekuensi.
Seperti yang dinyatakan di sana dengan bantuan laju sampel dan data sampel, seseorang dapat melakukan beberapa transformasi untuk mengekstraksi fitur berharga darinya.
Pada proyek kali ini, saya menggunakan 5 fitur, yaitu sebagai berikut.
Sampai sekarang kita telah mengekstraksi data, sekarang kita perlu menormalkan dan membagi data kami untuk pelatihan dan pengujian.
Kemudian pada tahap modelling dan training
Diperoleh 99.93% training accuracy dan 99.93% validation accuracy pada epoch terakhir.
Setelah itu, dilakukan evaluasi model.
Berikut confusion matrix hasil evaluasi model.
Berikut evaluasi model dengan menggunakan metric lainnya, seperti precision, recall, dan f1-score.