Penerapan Ekstrasi Fitur untuk klasifikasi suara

Akmal shahib maulana

Sosial Media


0 orang menyukai ini
Suka

Summary

Mengektraksi fitur dari data suara pada dataset suara yang dikelompokkan berdasarkan emosi yang terdengar

Pada proyek ini Ektraksi fitur yang digunakan adalah beberapa yang sudah tersedia pada library librosa pada python seperti  chroma_stft, rmse, spectral_centroid, spectral_bandwidth, rolloff, zero_crossing_rate,mfcc. Fitur yang telah dihasilkan dijadikan sebuah data frame yang kemudian dibagi untuk keperluan train dan test. Algoritma yang digunakan adalah Decision tree yang menghasilkan akurasi sebesar 63%

Description

Dalam ranah Natural Language Processing (NLP), data suara memiliki nilai yang signifikan untuk berbagai aplikasi. Sama halnya dengan data teks dan gambar, data suara membutuhkan ekstraksi fitur untuk diproses oleh algoritma pembelajaran mesin. Proyek ini mempelajari pemanfaatan teknik ekstraksi fitur dari pustaka Python untuk mengklasifikasikan data suara secara efektif. Pada kasus disini saya menggunakan beberapa ekstraksi fitur yang ada yang kemudian hasilnya diolah menggunakan Decision Tree. Hasil dari klasifikasi ini memberikan akurasi sebesar 63% dan Recall dari masing-masing kelas berkisar antara 42% sampai 84%

Key Objectives:

  1. Feature Extraction : Menggunakan teknik ekstraksi fitur yang tepat dari pustaka Python untuk mengekstrak karakteristik yang relevan dan informatif dari data suara. Ekstraksi yang saya gunakan pada proyek ini adalah sebagai berikut :
    • chroma_stft
    • rmse
    • spectral_centroid
    • spectral_bandwidth
    • rolloff
    • zero_crossing_rate
    • mfcc

 

  1. Machine Learning Model Development : Memanfaatkan algoritme pembelajaran mesin, untuk melatih model klasifikasi berdasarkan fitur suara yang diekstraksi. Pada projek ini saya menggunakan algoritma machine learning yang tersedia pada scikit learn yakni DecisionTreeClassifier
  2. Classification Performance Evaluation : Menilai kinerja model klasifikasi yang telah dilatih dengan mengevaluasi akurasi, presisi, recall, dan F1-score pada dataset uji. Hasil dari klasifikasi menggunakan Decision Tree pada projek yakni sebagai berikut :
    • akurasi : 63%
    • Presisi : 38-93% untuk 14 kelas
    • recall : 42-84% untuk 14 kelas
    • f1-score: 40-88% untuk 14 kelas

Informasi Course Terkait
  Kategori: Artificial Intelligence
  Course: Speech Classification Menggunakan Machine Learning