Je travaille sur un logiciel pour les enfants, et cherche à ajouter la possibilité pour le logiciel de répondre à un certain nombre de sons non-parole. Par exemple, applaudissements, aboiements, sifflements, bruits de pet, etc.Logiciel de reconnaissance vocale ou de bruit non vocal?
J'ai utilisé CMU Sphinx et l'API Windows Speech par le passé, mais pour autant que je sache, aucun d'entre eux n'a de support pour les non-utilisateurs. les bruits de la parole, et en fait je crois les filtrer activement.
En général, je suis à la recherche de « Comment puis-je obtenir cette fonctionnalité » mais je pense que cela peut aider si je le décomposer en trois questions qui sont mes suppositions pour ce que pour rechercher suivant:
- Existe-t-il un moyen d'utiliser l'un des principaux moteurs de reconnaissance vocale pour reconnaître les sons non-mots en changeant un modèle acoustique ou un lexique de prononciation?
- (ou) Existe-t-il déjà une bibliothèque existante pour la reconnaissance de bruit non-mot? (Ou) J'ai un peu de familiarité avec les modèles de Markov cachés et la technologie sous-jacente de reconnaissance vocale de l'université, mais aucune estimation sur la difficulté de créer un très petit reconnaisseur de bruit/son (supposons < 20 bruits à reconnaître). Si 1) et 2) échouent, une estimation sur combien de temps il faudrait pour lancer le mien?
Merci
[Ma réponse] (http://stackoverflow.com/q/8285673/22364) à la question [Identification en temps réel de sons non musicaux, autres que parlés, provenant d'un flux continu de microphones] (http: // stackoverflow.com/q/8285673) pourrait être pertinent. –