J'ai déjà FFT et pitch + fréquence absolue calculée en temps réel à partir de l'entrée du microphone. Maintenant, je veux calculer le timbre.Comment fonctionnent les coefficients de Cepstrum Mel Frequency?
J'ai vu Mel Coefficients Frequency Cepstrum - MFCCs mais je ne l'ai pas très bien compris. Quelqu'un peut-il me donner quelques conseils sur ce ..
tks pour la réponse. Donc, si je veux obtenir le timbre, le MFCC est-il le bon choix? –
Oui, je le pense, surtout comme une première attaque sur le problème. C'est facile à implémenter, il y a beaucoup d'écrits à ce sujet, et c'est une norme par rapport à laquelle d'autres approches sont comparées (et ça marche généralement bien dans ces comparaisons), donc c'est un bon choix. – tom10
Dans wiki l'algorithme est: 1. Prenez la transformée de Fourier de (un extrait fenêtré de) un signal. 2. Mapper les puissances du spectre obtenu ci-dessus sur l'échelle de mel, en utilisant des fenêtres triangulaires qui se chevauchent. 3. Prenez les journaux des puissances à chacune des fréquences mél. 4. Prenez la transformée en cosinus discrète de la liste des puissances logarithmiques, comme s'il s'agissait d'un signal. 5. Les MFCC sont les amplitudes du spectre résultant. Je comprends tout sauf l'étape 2: utiliser des fenêtres triangulaires qui se chevauchent Que dois-je faire, passer la fréquence à l'échelle mel, mais qu'est-ce que cette fenêtre triangulaire qui se chevauche? –