Par souci d'exhaustivité, voici les options que je suis au courant:
Yaafe et libXtract sont probablement les plus fortement optimisés en termes de performance (voir les repères au dessous de). Ils partagent tous deux le calcul intermédiaire entre les extracteurs de caractéristiques. Par exemple, ils n'exécuteront qu'une FFT par fenêtre et tout extracteur qui nécessite une FFT ne fera que référencer cette FFT. Même chose pour les fonctionnalités de niveau supérieur. Les autres extracteurs mentionnés ne le font pas vraiment car ils dépendent d'une architecture de plugin, c'est-à-dire que chaque extracteur doit être autonome.
Sonic Annotator et ses amis bénéficient d'une architecture de plugin pour que vous puissiez profiter de toutes sortes d'extracteurs de fonctionnalités tierces (y compris libXtract, aubio et Essentia). L'écosystème plugin Vamp est vraiment très varié et merveilleux. Il y a un exemple de code complet dans le SDK Vamp Plugin pour construire un hôte de plugin.
Je connais très peu d'Essentia, sauf qu'elle est plus récente que les autres et provient de l'excellent groupe de technologie musicale de Pompeu Fabra. Cela semble être un grand projet bien organisé. La documentation est très bonne. Ils l'utilisent sur des projets d'analyse de musique à grande échelle (comme Freesound et AcousticBrainz). L'objectif du projet semble être la performance et la correction. Vaut vraiment le coup d'oeil.
MARSYAS est une structure complète, pas seulement des bibliothèques. La documentation est assez bonne. Il est en cours de développement et fait partie d'un MOOC périodiquement offert par George Tzanetakis à l'UVic. Il semble y avoir pas mal d'applications et de projets construits autour de MARYSYAS. CAMEL et Maaate semblent dormants - ils n'ont pas vu de nouvelle version depuis 2010 et 2012 respectivement.
est ici une référence (en secondes) comparant Sonic Annotator, Marsyas et YAAFE faire l'extraction de caractéristiques sur 40 heures de 32 KHz fichiers wav mono:
S.A. Marsyas YAAFE
MFCC 1506 1168 142
Centroid 724 942 235
Rolloff 731 951 194
ZCR 221 620 57
Total 3182 3681 628
Que considérez-vous "caractéristiques"? – RedFilter
Quand je dis "caractéristiques", je fais référence à une définition plus théorique de l'IA. Une caractéristique est n'importe quelle métrique qui peut être utilisée pour distinguer ou grouper l'audio ensemble. Par exemple, la moyenne ou la variance et d'autres choses statistiques peuvent être des caractéristiques. – esiegel