Je veux commencer à utiliser HMM, mais je ne sais pas comment y arriver. Est-ce que les gens ici peuvent me donner des indications de base, où regarder? Plus que juste la théorie, j'aime faire beaucou
La règle de mise à jour TD (0) Q-Learning: Q(t-1) = (1-alpha) * Q(t-1) + (alpha) * (Reward(t-1) + gamma* Max(Q(t))) Ensuite, prendre soit la meilleure action en cours (pour optimiser) ou une action al
J'ai un problème avec un modèle de Markov caché et les états SI ont besoin de trouver un algorithme qui retourne le chemin le plus probable dans le modèle de Markov caché pour une séquence donnée X da
Je suis en train d'utiliser multi-couche NN pour mettre en œuvre la fonction de probabilité dans le processus de Markov partiellement Observable .. Je pensais que les entrées au NN seraient: état actu