Skip to content
This repository has been archived by the owner on Jun 16, 2024. It is now read-only.

Latest commit

 

History

History

semestral

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 
 
 

Semestrální práce z VMM

Vojtěch Sillik, Ondřej Wrzecionko

Audio

Hudební žánry:

  • opera, jazz, reggae (VS)

  • classic, metal, rap (OW)

Od každého žánru máme přibližně 5 trénovacích souborů.

Analýza

Spuštění porovnávačů deskriptorů na trénovacích souborech a následné porovnání pomocí grafů, abychom zjistili, které deskriptory má cenu vyzkoušet pro porovnání.

Deskriptory analyzovány z:

  • jAudio (Java, VS) → area of moments

  • MPEG (Java, OW) → spectral centroid, spectrum spread type

  • MFCC (Python, OW) → průměr koeficientů, časová řada koeficientu

Program

Samotný webový server, na který proběhne nahrání souboru, který se zanalyzuje, porovná s referenční databází skladeb a na základě toho se vykreslí koláčový graf s pravděpodobností jednotlivých žánrů.

Součástí webového serveru je také stránka, kde lze nastavovat jednotlivé parametry pro porovnávání jejich efektivity a rychlosti (šířku okna pro porovnávání časové řady MFCC, počet nejbližších sousedů, váhy jednotlivých deskriptorů).

Prerekvizity pro spuštění

Předpokládáme Python3, moduly scipy, python_speech_features, numpy, matplotlib, streamlit a nainstalovanou Javu ve verzi minimálně 19.

© VS & OW 2022