J'essaie d'utiliser la modélisation de sujet avec Mallet mais j'ai une question.Modélisation de sujet à l'aide d'un maillet
Comment puis-je savoir quand j'ai besoin de reconstruire le modèle? Par exemple, j'ai cette quantité de documents que j'ai explorés sur le web, en utilisant la modélisation de sujets fournie par Mallet, je pourrais être en mesure de créer les modèles et d'en déduire des documents. Mais avec le temps, avec de nouvelles données que j'ai explorées, de nouveaux sujets peuvent apparaître. Dans ce cas, comment puis-je savoir si je devrais reconstruire le modèle du début à la fin?
Je pensais le faire pour les documents que j'ai explorés chaque mois. Quelqu'un peut-il conseiller? Par conséquent, la modélisation de sujet est-elle plus adaptée au texte sous une quantité fixe de sujets (le paramètre d'entrée k, le numéro de sujet). Si non, comment puis-je vraiment déterminer quel numéro utiliser?