2009-10-24 14 views
9

J'ai déjà FFT et pitch + fréquence absolue calculée en temps réel à partir de l'entrée du microphone. Maintenant, je veux calculer le timbre.Comment fonctionnent les coefficients de Cepstrum Mel Frequency?

J'ai vu Mel Coefficients Frequency Cepstrum - MFCCs mais je ne l'ai pas très bien compris. Quelqu'un peut-il me donner quelques conseils sur ce ..

Répondre

7

MFCCs combinent l'examen des aspects de l'audition humaine (perception de fréquence logarithmique, la mel scale) et la physique des instruments de musique (ces systèmes ont souvent des Overtones bien définies qui sont harmonic - qui C'est pourquoi les MFCC utilisent la FFT de la FFT), pour donner une représentation simplifiée du timbre d'un instrument (où la fréquence fondamentale et le volume sonore sont factorisés).

On pourrait écrire des pages interminables sur ce sujet, et il y en a beaucoup sur le web, donc une question plus précise qui explique clairement ce que vous voulez savoir serait utile. L'algorithme de calcul des MFCC est répertorié en haut du wikipedia page.

+0

tks pour la réponse. Donc, si je veux obtenir le timbre, le MFCC est-il le bon choix? –

+1

Oui, je le pense, surtout comme une première attaque sur le problème. C'est facile à implémenter, il y a beaucoup d'écrits à ce sujet, et c'est une norme par rapport à laquelle d'autres approches sont comparées (et ça marche généralement bien dans ces comparaisons), donc c'est un bon choix. – tom10

+0

Dans wiki l'algorithme est: 1. Prenez la transformée de Fourier de (un extrait fenêtré de) un signal. 2. Mapper les puissances du spectre obtenu ci-dessus sur l'échelle de mel, en utilisant des fenêtres triangulaires qui se chevauchent. 3. Prenez les journaux des puissances à chacune des fréquences mél. 4. Prenez la transformée en cosinus discrète de la liste des puissances logarithmiques, comme s'il s'agissait d'un signal. 5. Les MFCC sont les amplitudes du spectre résultant. Je comprends tout sauf l'étape 2: utiliser des fenêtres triangulaires qui se chevauchent Que dois-je faire, passer la fréquence à l'échelle mel, mais qu'est-ce que cette fenêtre triangulaire qui se chevauche? –