2010-05-26 17 views

Répondre

2

Pour obtenir du texte dans Solr, vous devez être capable de l'extraire. Le Framework Lucene Connector est fait pour cela. Si vous obtenez le texte brut d'une autre manière, vous pouvez utiliser le DataImportHandler pour importer des informations. Si vous indexez correctement le texte et que vous configurez correctement le schéma, vous devriez pouvoir obtenir des résultats de recherche réussis.

+0

Où le filtre Apache Tika s'installe-t-il ici? –

+0

Je ne suis pas sûr que ce soit le cas. En regardant les formats de documents supportés par Tika: http://tika.apache.org/formats.html, il supporte plusieurs formats de documents Microsoft. Je ne sais pas lesquels d'entre eux sont pertinents pour Sharepoint. Idéalement, Tika vous permet d'extraire du texte et des méta-données d'un fichier dans un format supporté, de sorte que vous puissiez adapter vous-même la gestion du référentiel (système de fichiers, répertoires, exploration). Mais pourquoi ne pas utiliser le LCF? –

+0

Oui, je suis allé de l'avant en utilisant LCF, est-ce que LCF s'occupera de la recherche en texte intégral? –