J'apprends JBoss Drools et je joue avec les données génétiques du projet hapmap: (http://hapmap.ncbi.nlm.nih.gov/genotypes/latest/forward/non-redundant/). Chaque fichier dans ce répertoire est un tableau avec les individus en haut, les positions sur le génome à gauche, et les mutations observées pour chaque individu/position.Apprendre JBoss bave: quel devrait être mon modèle
Ici, je voudrais trouver quelques erreurs potentielles dans le fichier (par exemple, un enfant n'a pas de mutation de ses parents) en utilisant Drools.
1) Je veux charger ces données dans Drools. Cela peut être une grande quantité de données (par exemple, genotypes_chr2_YRI_r27_nr.b36_fwd.txt.gz est 20Mo gzipped) Ces données seront-elles stockées en mémoire? ou est-ce que Drools le stocke quelque part? ou devrais-je utiliser un système de persistance?
2) sur le modèle:
Je pensais à mettre les classes suivantes dans un StatefulKnowledgeSession:
class Individual
{
private String name;
//constructor, getters, setters etc...
}
class Position
{
private String name;
private String chromosome;
private int position;
//constructor, getters, setters etc...
}
class ObservedMutation
{
private String individualName;
private String positionName;
private String observed;
//constructor, getters, setters etc...
}
ou devrait ObservedMutation être:
class ObservedMutation
{
private Individual individual;
private Position position;
private String observed;
//constructor, getters, setters etc...
}
Merci pour votre suggestions
Pierre
mise à jour: mon test sapins: http://plindenbaum.blogspot.com/2010/07/rules-engine-for-bioinformatics-playing.html