Possible en double:
PHP - How to split a paragraph into sentences.Expression régulière pour le comptage des phrases dans un bloc de texte
J'ai un bloc de texte que je voudrais séparer en phrases, quelle serait la meilleur moyen de le faire? J'ai pensé à chercher '.', '!', '?' personnages, mais je me suis rendu compte qu'il y avait quelques problèmes avec cela, comme lorsque les gens utilisent des acronymes, ou terminer une phrase avec quelque chose comme!?. Quelle serait la meilleure façon de gérer cela? Je me suis dit qu'il y aurait quelques regex qui pourraient gérer cela, mais je suis ouvert à une solution non-regex si cela correspond mieux au problème.
Ou, agaçant, vous pourriez obtenir des choses comme «Êtes-vous sûr»? il a demandé. »qui sont sémantiquement correctes mais regardez oh si mal. De plus, les noms contenant de la ponctuation sont également mauvais: «Lequel? recommande d'acheter .... ' –
En fait le? devrait être à l'intérieur des citations. –