2010-04-26 30 views
0

court Desc:Trouver Common Phrases dans SQL Server TEXT colonne

Je suis curieux de voir si je peux utiliser les services d'analyse SQL ou un autre service SQL Server pour exploiter des données pour moi qui montrera les points communs entre Champs de texte SQL dans un ensemble de données.

longue Desc

Je suis à la recherche à un sous-ensemble de données qui se compose d'environ 10 000 lignes de blobs de texte qui sont utilisés comme une colonne de notes dans un numéro de suivi (billetterie) du logiciel. Je voudrais utiliser quelque chose hors de la boîte (sans avoir à construire quelque chose) qui pourrait être en mesure d'analyser toutes les lignes et trouver les séquences d'octets couramment utilisés dans la colonne "Notes". En d'autres termes, je veux trouver des phrases couramment utilisées (phrases de deux à trois mots, donc 9 à 20 caractères du blob TEXT). Cela m'aidera à mieux déterminer si les notes de l'associé contiennent des expressions similaires (techniques de dépannage) que nous pourrions normaliser dans notre processus de dépannage.

clôture Remarque

Je préfère ne pas vraiment construire une application pour ce faire que ma méthode ne sera probablement pas la façon la plus efficace de le faire. Sinon, si personne ne connaît une solution prête à l'emploi, pourriez-vous recommander des algorithmes que je pourrais utiliser dans le code, où je pourrais faire des comparaisons de chaînes par rapport à un tableau de valeurs?

J'espère que tout cela a du sens. S'il vous plaît laissez-moi savoir dans les commentaires si quelque chose a besoin d'une clarification.

Répondre

1

Vous pouvez utiliser les transformations d'exploration de texte dans SQL Server Integration Services (Éditions Enterprise et Dev) pour rechercher des termes et extractions de termes, puis utiliser des règles d'association dans Analysis Services pour créer un modèle d'association de termes. Il y a un aging tutorial qui devrait encore fonctionner (connexion gratuite requise)

Nous annoncerons quelque chose à ce sujet plus tard cette année - vous pouvez laisser des commentaires sur notre site Web (predixionsoftware.com) si vous êtes intéressé par les tests bêta.

-Jamie MacLennan CTO Predixion Software

+0

Merci beaucoup pour la réponse. Votre article m'a expliqué exactement ce dont j'avais besoin. J'ai posté quelques commentaires sur votre site. – regex