2010-09-14 21 views
2

Je suis nouveau à la Business Intelligence.Est-ce une bonne idée du flux de travail BI?

Je viens d'être embauché par une entreprise pour compléter leur solution web, en implémentant un module BI. Après beaucoup de lecture, je pense que je pourrais avoir une idée de ce à quoi ressemble un processus BI, vous trouverez ci-joint mon idée d'un processus BI.

Pouvez-vous s'il vous plaît me dire si c'est une vision correcte de tout le flux de travail? Si non, corrigez-moi s'il vous plaît. Une autre question, je ne peux pas voir la place de l'exploration de données dans le schéma, où dois-je l'utiliser si nécessaire?

Merci beaucoup, alt text

Répondre

7

ci-dessous une couple de points que vous pourriez vouloir considérer:

  1. Est-il exact que la couche de présentation est Excel ou un service Web et rien d'autre? Et si vous souhaitiez déployer une plate-forme de reporting Web telle que SSRS, Cognos, Business Objects, Microstrategy, etc.? Ces plates-formes accèdent généralement aux données directement sans services Web.

  2. Vous devrez peut-être générer des données supplémentaires pour les fichiers plats et les bases de données en aval. Les données peuvent être basées sur le cube OLAP ou les données sources brutes. Par conséquent, vous pouvez vouloir les inclure en tant que destinations au niveau de l'entrepôt de données principal et au niveau OLAP. Si vous implémentez une couche de présentation Web, elle peut ne pas se limiter à un cube OLAP. Il est probable que vous receviez une demande de création de rapports sur des données qui ne sont pas contenues dans un cube OLAP et que cela ne vaut pas la peine de l'ajouter simplement pour prendre en charge quelques rapports. Si tel est le cas, vous voudrez probablement noter que l'entrepôt de données principal pourrait être une source pour une plate-forme de reporting Web - et pas seulement OLAP.

  3. Les matrices de données ne contiennent généralement pas de données agrégées - elles contiennent généralement des données de niveau détail. Le cube OLAP effectue des agrégations sur les données détaillées, mais le magasin de données sous-jacent contient lui-même des faits au niveau de la transaction.

  4. Vous pouvez avoir d'autres sources de données importées par le processus ETL, telles que les services Web. Vous pouvez également souligner qu'il existe plusieurs bases de données et fichiers à plat, tout comme vous avez souligné qu'il peut y avoir plusieurs bases de données et des cubes OLAP.

  5. Vous n'avez pas nécessairement besoin de zones de données distinctes pour les cubes OLAP. Si vous créez un entrepôt de données central, vous pouvez créer un cube OLAP central et limiter l'accès aux dimensions et aux tranches de données en fonction des rôles de sécurité du cube.

  6. Vous souhaiterez peut-être indiquer que vous devez charger une base de données intermédiaire avant de charger l'entrepôt de données. Peut-être que ce n'est pas le cas, mais généralement, je recommande d'avoir une base de données intermédiaire séparée afin que vous ayez un endroit à charger avant de fusionner dans l'entrepôt de données. Certains processus ETL peuvent accéder directement à l'entrepôt de données car ils peuvent fusionner à l'entrée, mais il existe de nombreuses instances où il est probablement judicieux de charger les données dans une base de données intermédiaire avant de les fusionner dans la destination finale. Cela signifie également que ETL/Stored Procedures devrait probablement être sa propre entité dans le diagramme, car il s'agit d'une méthode de déplacement de données supérieure à celle d'une destination ou d'un objet. Si vous regardez votre diagramme, toutes vos entités sont des objets réels et non des processus comme MDX.

  7. Vous pouvez indiquer que les données sont chargées dans des magasins de données via un processus ETL. ETL ne se limite pas au chargement de l'entrepôt de données: il s'agit de déplacer des données à tout moment.Même les cubes de traitement nécessitent un processus ETL. Votre serveur OLAP ne doit pas nécessairement être sur un autre serveur physique - il peut s'agir d'un service sur le serveur de base de données. Cela dépend uniquement de la résolution des problèmes de performances par mise à l'échelle ou mise à l'échelle ou si vous avez l'intention de publier des cubes sur plusieurs serveurs OLAP en raison de problèmes de performances géographiques.

+0

Merci beaucoup. Tu m'as apporté beaucoup d'informations intéressantes. Je vous en suis reconnaissant. – Spredzy

+0

Pas de problème. Bonne chance. –