J'ai une base de données avec de nombreux CV, y compris des données structurées sur le sexe, l'âge, l'adresse, le nombre d'années de scolarité et de nombreux autres paramètres de chaque personne.Faire des prédictions à partir d'un CV
Pour environ 10% de l'échantillon, j'ai également des données supplémentaires sur une certaine action qu'ils ont faite à un moment donné. Par exemple, que Jane a contracté un prêt immobilier en juillet 1998 ou que John a commencé sa formation de pilote en janvier 2007 et a obtenu sa licence en décembre 2007.
J'ai besoin d'un algorithme qui donnera, pour chacune des actions, le probabilité que cela se produise pour chaque personne dans les incréments de temps futurs. Par exemple, que la chance que Bill prenne un prêt immobilier est de 2% en 2011, de 3,5% en 2012, etc.
Comment devrais-je aborder cette question? Analyse de régression? SVM? Réseau neuronal? Autre chose?
Y a-t-il peut-être même un outil/bibliothèque standard que je peux utiliser avec juste les personnalisations évidentes?
N'essayez pas de le faire vous-même. Embaucher quelqu'un avec une formation statistique décente. –
C'est ce qu'on appelle l'algorithme Crystal Ball. –
Je suppose que c'est aussi largement dépendant du nombre d'enregistrements que vous avez (et de leur représentativité) que vous pouvez réellement déduire des prédictions utiles. – Archimedix