Audio Visualization with high and low feature

Andi Reza Fathurrizky

Sosial Media


1 orang menyukai ini
Suka

Summary

Dengan menggunakan teknik audio visualization yang memiliki fitur untuk menampilkan detail suara tinggi dan rendah, kita bisa melihat secara visual bagaimana suara itu terbentuk dan berubah-ubah. Bayangkan saat kita mendengarkan musik, maka kita akan melihat gambar yang bergerak-gerak mengikuti irama musik tersebut, bahkan kita bisa melihat perbedaan antara suara bass yang dalam dan suara treble yang tinggi. 

 

Description

Audio visualization adalah cara kita mengubah suara (audio) menjadi gambar yang bergerak-gerak. Jadi, saat kita mendengarkan musik, kita bisa melihat gambar yang berubah-ubah sesuai dengan irama dan nada musiknya.

Fitur high dan low level membuat visualisasi ini semakin menarik. Fitur ini memungkinkan kita untuk melihat perbedaan antara suara yang tinggi (treble) dan suara yang rendah (bass) secara terpisah. Suara tinggi biasanya digambarkan dengan warna-warna cerah dan gerakan yang cepat, sedangkan suara rendah seringkali ditampilkan dengan warna yang lebih gelap dan gerakan yang lebih lambat.

  • Langkah awal adalah menginstall salah satu library, yaitu librosa untuk memproses data audio, kemudian mengimport seluruh library yang dibutuhkan untuk meload dan memproses data.
  • langkah selanjutnya adalah menampilkan Waveplot, yaitu Grafik yang menggambarkan data yang berubah-ubah seperti gelombang laut. Grafik ini membantu kita melihat pola-pola dalam data dengan lebih jelas, seperti saat kita melihat ombak yang naik turun di pantai.
  • kemudian menampilkan audio Low-Level Feature, yaitu Fitur low-level adalah unit-unit dasar dalam NLP yang sangat penting untuk membangun sistem yang dapat memahami dan memproses bahasa manusia. Dengan memahami fitur-fitur ini, kita dapat membangun aplikasi NLP yang lebih canggih dan akurat.

       berikut visualisasi menggunakan RMS Energy, yaitu ukuran volume rata-rata dari sebuah suara. Semakin keras suara, semakin tinggi nilai RMS Energy nya.

  • lalu menampilkan zero Crossing Rate, yaitu alat yang berguna untuk "mendengarkan" teks yang telah diubah menjadi suara dan mengekstrak informasi yang berharga dari pola-pola dalam sinyal audio tersebut.
  •  Menampilkan High-Level Feature yang divisualisasikan dengan Chromagram dan Spectogram, Secara sederhana, fitur high dan low membantu kita "melihat" suara. Chromagram dan Spectrogram adalah seperti "kacamata khusus" yang memungkinkan kita melihat detail-detail halus dalam suara, seperti nada tinggi dan rendah, serta bagaimana nada-nada ini berubah seiring waktu.

Informasi Course Terkait
  Kategori: Natural Language Processing
  Course: Speech Pre Processing