court Desc:Trouver Common Phrases dans SQL Server TEXT colonne
Je suis curieux de voir si je peux utiliser les services d'analyse SQL ou un autre service SQL Server pour exploiter des données pour moi qui montrera les points communs entre Champs de texte SQL dans un ensemble de données.
longue Desc
Je suis à la recherche à un sous-ensemble de données qui se compose d'environ 10 000 lignes de blobs de texte qui sont utilisés comme une colonne de notes dans un numéro de suivi (billetterie) du logiciel. Je voudrais utiliser quelque chose hors de la boîte (sans avoir à construire quelque chose) qui pourrait être en mesure d'analyser toutes les lignes et trouver les séquences d'octets couramment utilisés dans la colonne "Notes". En d'autres termes, je veux trouver des phrases couramment utilisées (phrases de deux à trois mots, donc 9 à 20 caractères du blob TEXT). Cela m'aidera à mieux déterminer si les notes de l'associé contiennent des expressions similaires (techniques de dépannage) que nous pourrions normaliser dans notre processus de dépannage.
clôture Remarque
Je préfère ne pas vraiment construire une application pour ce faire que ma méthode ne sera probablement pas la façon la plus efficace de le faire. Sinon, si personne ne connaît une solution prête à l'emploi, pourriez-vous recommander des algorithmes que je pourrais utiliser dans le code, où je pourrais faire des comparaisons de chaînes par rapport à un tableau de valeurs?
J'espère que tout cela a du sens. S'il vous plaît laissez-moi savoir dans les commentaires si quelque chose a besoin d'une clarification.
Merci beaucoup pour la réponse. Votre article m'a expliqué exactement ce dont j'avais besoin. J'ai posté quelques commentaires sur votre site. – regex