Je dois travailler avec Q Learning, sur un type qui doit déplacer des meubles autour d'une maison (c'est essentiellement ça). Si la maison est assez petite, je peux juste avoir une matrice qui représente des actions/récompenses, mais comme la taille de la maison devient plus grande, cela ne suffira pas. Je dois donc utiliser une sorte de fonction de généralisation à la place. Mon professeur suggère que je n'utilise pas seulement un, mais plusieurs, afin que je puisse les comparer et ainsi. Qu'est-ce que vous recommandez les gars?Fonctions de généralisation pour Q-Learning
J'ai entendu dire que pour cette situation, les gens utilisent des machines à vecteurs de support, également des réseaux neuronaux. Je ne suis pas vraiment à l'intérieur du terrain, donc je ne peux pas le dire. J'avais dans le passé une certaine expérience avec les réseaux neuronaux, mais SVM semble beaucoup plus difficile à comprendre. Y a-t-il d'autres méthodes que je devrais rechercher? Je sais qu'il doit y en avoir un zillion, mais j'ai besoin de quelque chose pour commencer.
Merci
J'espère que cela ne vous dérange pas d'étiqueter comme devoir. Mention de "professeur" me fait penser que c'est approprié. – spender