J'ai un entrepôt de données db2 ese 9.7 non-dpf utilisant la compression de données avec 20 To de données qui reçoit 100 millions de lignes par jour via des charges toutes les 10 minutes et reçoit un million par jour avec 50 000 importations par jour. De plus, il y a une petite quantité de données transactionnelles associées aux deux autres grands ensembles de données.Quelle est la meilleure façon de sauvegarder un grand entrepôt de données en temps réel?
Actuellement, nous utilisons des sauvegardes au niveau de l'application - et nous nous appuyons sur le chargement de tables récapitulatives précédemment exportées ou sur le rechargement des 100 millions de lignes par jour en cas de récupération. Mais pour la petite quantité de transactions et les importations - je voudrais des sauvegardes en ligne. Toutefois, il semble que les sauvegardes en ligne propres à un espace de table nécessitent une sauvegarde hors ligne initiale. Et c'est le problème, même si je peux rediriger la sauvegarde hors ligne vers/dev/null, une sauvegarde hors ligne prendra environ 48 heures d'arrêt. Ce qui est inacceptable. Et peut être nécessaire à nouveau à un moment donné dans le futur. À un certain point, nous diviserons probablement ceci en plus de 8 partitions et cela aiderait à la fois à cela et à charger des index. Mais cela peut ne pas arriver pendant un certain temps, et il est difficile de justifier des tâches qui ne devraient pas être nécessaires en premier lieu. EDIT: La raison pour laquelle nous ne sommes pas allés initialement avec DPF, et pourquoi ce n'est pas un problème de conduite pour nos requêtes est que plus de 99% de nos requêtes touchent des tables récapitulatives, et les 1% qui doivent La table avec plus de 3 milliards de lignes par mois peut presque toujours tirer parti du partitionnement de table, du MDC et des index afin de ne scanner qu'une quantité beaucoup plus petite. Ce que cela signifie, c'est que les heuristiques traditionnelles concernant la quantité de données par CPU ne s'appliquent pas toujours.
Un moyen de contourner cette exigence de sauvegarde hors ligne? Des outils tiers qui peuvent m'aider? D'autres suggestions?
aimerait jeter un coup d'œil sur les fonctionnalités db2 - http://amolnpujari.wordpress.com/2009/08/29/db2-9-5-backup-and-recovery-basics/ –