J'ai vu ce lien: http://www.lucidimagination.com/Community/Hear-from-the-Experts/Articles/Content-Extraction-Tika Ce que j'ai obtenu est un texte pur sans aucun style de Tika pour Solr à rechercher. Est-il possible d'avoir le texte avec son style de Solr? En d'autres termes, nous devons montrer le texte avec son style original après recherché par solr.Solr Tika, Texte avec style
0
A
Répondre
0
Si vous y pensez, quel est le "style original" dans un pdf? Quels composants du "style" voulez-vous garder?
Ce n'est pas seulement la police et le poids, c'est le contour, le remplissage, l'angle, le chemin, les graphiques, le suivi, la transparence, les transformations et plus encore. Si vous avez tout cela, comment l'afficheriez-vous dans votre interface utilisateur/Web?
Vous ne pouvez pas vraiment reproduire le style d'origine d'une manière autre que l'affichage du PDF d'origine. C'est ainsi que les gens le font habituellement s'ils veulent le formatage original.
Sinon, ils utilisent simplement le texte pur.