2009-06-30 15 views
27

Est-ce que quelqu'un sait si un existe?Lucene hébreu analyseur

J'ai été googler pour ce monthes ...

Merci

+0

Il est temps que la communauté open source en crée un. Il me semble que le véritable processus d'endiguement est très difficile, au point de nécessiter de grandes quantités de main-d'œuvre, mais qu'il est possible de trouver des solutions de base, et il est peut-être préférable d'appliquer une approche minimale. Je vais probablement commencer à travailler dessus tout seul. Si quelqu'un est intéressé, s'il vous plaît contactez-moi. –

+0

... Et dans un premier temps, je vais essayer d'utiliser l'énumération de hspell (3). C'est effectivement un stemmer prêt! –

Répondre

21

Mise à jour
HebMorph

Par curiosité suscitée par votre question, j'ai contacté Itamar Syn-Hershko qui était Il était actif sur les listes de diffusion de Lucene il y a environ un an quand il travaillait sur un analyseur hébreu pour Lucene. Je lui ai demandé s'il avait terminé son analyseur. Voici quelques bits pertinents de sa réponse:

Pour faire une histoire courte, non I n'a pas fait. Il n'y a pas d'analyseur hébreu libre pour Lucene, que je peux dire à coup sûr. Je suis pas sûr quel est votre fond sur le sujet, mais croyez-moi quand je dis il n'y a pas de moyen facile de le faire; il pourrait être aussi le Lucene n'est pas construit pour les recherches en hébreu, mais je suis d'accord une solution doit être donnée. Accordé, le le plus sûr moyen d'indexer et de rechercher des textes hébreux est d'utiliser un stemmer spécialisé, et l'intégration avec Lucene n'est pas la la plus facile même après que vous ayez fait ceci. Il ya quelques très bonnes solutions pour la recherche en hébreu sur le marché, seulement celui que je connais d'utiliser Lucene dans c'est noyau; J'ai récemment essayé les contacter, pas de réponse encore ...

Le produit commercial basé sur Lucene mentionné est appelé Attivio et the ATTIVIO website ne prétend avoir le soutien hébreu. À SIGTRS (Hebrew Text Retrieval interest group), il y a eu quelques discussion regarding ATTIVIO qui prétend qu'il est basé Lucene. Donc, apparemment, il est possible de créer un analyseur hébreu décent pour Lucene, mais il n'y a pas d'analyseur libre disponible pour l'instant.

+0

Wow, merci tout un tas! – Roey

+0

Pas de problème; Je suis content que c'était utile. ;) – Naaff

+4

Salut, j'ai finalement eu le temps de commencer à travailler sur un, et jusqu'à présent, il semble prometteur. Voir: http://www.code972.com/blog/hebmorph/. Itamar. – synhershko

0

dtsearch a un appel de plugin de prononciation hébreu "pensim". Il semble être développé par "wizcomtech.com".