markov-models

14La chaleur

4Répondre

Je veux commencer à utiliser HMM, mais je ne sais pas comment y arriver. Est-ce que les gens ici peuvent me donner des indications de base, où regarder? Plus que juste la théorie, j'aime faire beaucou

1La chaleur

1Répondre

Règle de mise à jour dans la différence temporelle

La règle de mise à jour TD (0) Q-Learning: Q(t-1) = (1-alpha) * Q(t-1) + (alpha) * (Reward(t-1) + gamma* Max(Q(t))) Ensuite, prendre soit la meilleure action en cours (pour optimiser) ou une action al

0La chaleur

1Répondre

Algorithme de Viterbi en temps linéaire

J'ai un problème avec un modèle de Markov caché et les états SI ont besoin de trouver un algorithme qui retourne le chemin le plus probable dans le modèle de Markov caché pour une séquence donnée X da

2La chaleur

2Répondre

Apprentissage par renforcement et POMDP

Je suis en train d'utiliser multi-couche NN pour mettre en œuvre la fonction de probabilité dans le processus de Markov partiellement Observable .. Je pensais que les entrées au NN seraient: état actu