2010-10-12 16 views
3

Je suis dans les étapes de planification de la construction d'un DataMart SQL Server pour les informations de contact mail/email/SMS et l'historique. Chaque donnée est située dans un système externe différent. Pour cette raison, les adresses électroniques n'ont pas de numéro de compte et les numéros de téléphone SMS n'ont pas d'adresse électronique, etc. En d'autres termes, il n'y a pas de clé primaire partagée. Certaines données se chevauchent, mais je ne peux pas faire grand-chose sauf garder la version la plus complète lorsque des doublons se produisent.La meilleure façon de construire un DataMart à partir de plusieurs systèmes externes?

Existe-t-il une meilleure pratique pour créer un DataMart avec ces données? Serait-il une pratique acceptable de créer une table de clé avec une colonne pour chaque clé externe? Ensuite, un ID principal unique peut être affecté pour lier cela à d'autres tables DataMart.

Vous cherchez des idées/suggestions sur des approches auxquelles je n'ai peut-être pas encore pensé.

Merci.

Répondre

2

L'adresse électronique ou le numéro de téléphone lui-même sonne comme une clé d'entreprise appropriée. Généralement, une base de données «staging» est utilisée pour charger les données provenant de plusieurs sources, puis affecter des clés de substitution et effectuer d'autres transformations. Connaissez-vous les méthodes d'entrepôt de données et les modèles de conception? Si vous n'avez pas de connaissances ou d'expérience antérieures, envisagez d'embaucher de l'aide. Les projets d'entrepôt de données/BI ont un taux d'échec très élevé et les erreurs peuvent être coûteuses.

+0

Ah, substitut Les clés sont probablement ce que je cherche. Merci. J'ai passé en revue les schémas en étoile, les processus ETL, les cubes, etc. J'apprécie certainement le conseil. Comme le projet est d'abord de plus petite envergure dans un environnement de test, je ne pense tout simplement pas qu'il serait utile, à ce stade, d'engager une aide extérieure. Nous avons déjà du personnel sur place, nous allons probablement passer cela à une fois conceptuellement complète. Nous sommes dans les étapes de planification en ce moment. – MattB

0

Eh bien, sans autres informations pour lier les pièces disparates, votre datamart va être assez rudimentaire. Vous serez en mesure d'obtenir les types de données (sms, email, mail), les métriques pour chaque type au fil du temps ("cette semaine/mois/trimestre/année nous avons en moyenne 42.5 SMS par jour, et 8000 emails par mois! ! "). Avec seulement les numéros de téléphone et les adresses e-mail, vos "autres datamarts" devront probablement être des noms de sociétés téléphoniques ou des domaines Internet. Je suppose que vous pourriez lier de cela dans une sorte d'information géographique (emplacements de fournisseur d'Internet?), Ou peut-être l'information financière pour les compagnies. Un peu flou si vous ne savez pas déjà dans quelle direction vous voulez vous diriger. Pour être honnête, cela ressemble à quelqu'un de haut-niveau a une réaction instinctive au mot à la mode "datamart" couplé avec entendre quelque chose sur l'importance des métriques de communication, alors ils ont envoyé des ordres sur la chaîne pour "obtenir nous quelques datamarts pour exécuter des statistiques sur tous nos e-mails! "

Vous devez savoir ce que vous ou votre employeur prévoyez retirer de ce projet, et puis déterminer si les données que vous collectez actuellement vous donnent une piste à suivre pour ces informations. En ce moment, il semble que vous le faites en arrière ("J'ai ces données, à quoi ça sert?"). Il est tout à fait possible que vous n'ayez pas actuellement les données dont vous avez besoin, ce qui signifie que vous devrez l'acheter (qui sait si vous le pouvez) ou commencer à le collecter, auquel cas vous n'aurez pas de graphiques attrayants et tendance. lignes pour la gestion supérieure à regarder pendant un certain temps ... tomber en droite ligne avec les dportas d'avertissement vous a donné dans son deuxième alinéa;)

+0

Nos objectifs sont de rendre les informations de contact, l'historique des contacts et le comportement plus accessibles dans un emplacement central plutôt que d'utiliser une feuille de calcul Excel mélangée avec des données provenant de plusieurs systèmes. Nous n'avons actuellement aucun moyen de suivre facilement l'historique des contacts. Nous cherchons donc à rassembler ces données dans un environnement central beaucoup plus accessible à tous. Le problème est que les données sont fragmentées et pas facilement accessibles. C'est ce que nous espérons changer. Il est plus petit et ne sera utilisé que par 3 personnes au départ. – MattB

+0

Rationalisez votre collection de données autant que possible. Les e-mails entrants doivent être sur un serveur de messagerie quelque part, vous devriez donc pouvoir extraire des informations. Les appels téléphoniques sont probablement enregistrés dans un système PBX, et s'il s'agit d'un système numérique, vous devriez pouvoir obtenir des informations. SMS ... je ne sais pas comment vous allez enregistrer ces informations, sauf si vous avez un système assis entre les deux personnes à envoyer des SMS. Si vous le faites, il devrait avoir des informations que vous pourriez retirer. Les trois cas nécessiteraient que quelqu'un sache comment entrer dans les données de chaque système, et trouver comment l'obtenir dans le magasin de données. –

+0

Chaque système peut stocker un énorme historique d'informations, ou juste un mois, il n'y a aucun moyen de savoir si vous connaissez le système. Donc, en supposant qu'il ne stocke pas un journal sans fin, vous devez trouver un calendrier pour obtenir régulièrement les données de chaque système. Ensuite, vous devez avoir une conception de datamart adaptée pour que les données extraites puissent être utilisées, de sorte que vous puissiez produire les métriques que vous recherchez. BTW Si vous n'enregistrez pas actuellement l'historique des contacts, alors vous parlez de pousser une nouvelle application en face de vos utilisateurs, l'astuce consiste à les amener à l'utiliser correctement, correctement. "Le diable est dans les détails" –