Selon le code, il envoie les données audio comme une requête POST à:
https://www.google.com/speech-api/v1/recognize?client=chromium&lang=??&lm=??&xhw=??&maxresults=3
lm
est grammar
dans le code, xhw
est hardware_info
qui est facultatif selon un commentaire. L'audio semble être Speex, x-Speex avec en-tête octets:
// Encode the frame and place the size of the frame as the first byte. This
// is the packet format for MIME type x-speex-with-header-byte.
On dirait qu'il serait assez trivial de modifier le code de chrome à utiliser dans votre propre application.
Mise à jour:
Vous devez également obtenir un speech recognition API key et ils sont limités à 50 demandes par jour. Il n'y a aucun moyen d'augmenter cette limite - même pas en payant.
Hacker Nouvelles soumission où vous avez probablement trouvé ce lien: http://news.ycombinator.com/item?id=1972855 – balu