Comme nous l’avons vu précédemment, les points principaux de la méthodologie ne se reposent pas tant sur une technicité complexe de la modélisation physique ou des processus d’intégration de données, mais bien sur une représentation adéquate des objets métiers et de leurs relations dans le cœur du modèle de données.

Les principaux points clés pour le succès d’un projet reposant sur Data Vault seront donc avant tout cette capacité à refléter le métier et donc :

  • L’implication des acteurs métiers dans la phase d’étude d’analyse des besoins analytiques et leur disponibilité dans l’explication des processus opérationnels.
  • Avoir une compréhension des analyses souhaitées à terme, les objets métiers impliqués et les processus opérationnels qui y sont liés.
  • La capacité à analyser ces processus opérationnels pour identifier et comprendre, au-delà des objets métiers mis en œuvre :
    • Les systèmes sources impliqués.
    • L’implémentation de ces objets métiers dans chaque système source (les déclinaisons des définitions pouvant être plus ou moins différentes suivant les systèmes)
    • La propagation des données de chaque objet dans les différents systèmes du SI (interfaces et enrichissement progressif de la donnée…)
  • Sur la base de ces éléments, parvenir à définir l’ensemble des objets métiers requis d’un point de vue transverse à l’organisation. C’est certainement le point crucial de la phase d’étude, car il faut arriver à challenger les différents acteurs métiers pour voir au-delà d’un certain silo fonctionnel ou au-delà de processus purement internes à un secteur métier. Cette définition transverse sera donc également accompagnée par ce qui établira le fondement de la modélisation : la définition des clés métiers (BK : Business Key) ; à savoir : quels attributs d’un objet le définissent et le qualifient pleinement et d’une manière unique, ce quels que soient les secteurs métiers considérés dans l’organisation.
  • La phase précédente devra également faire la distinction entre de réels objets métiers de ce qui ne sont finalement que de simples relations entre objets métiers de base. Avec le choix des BKs, c’est le deuxième point crucial pour l’établissement du cœur du modèle de données, car la souplesse des Links fait toute la force et l’adaptabilité de ce type de modélisation. Les Links représentent en effet des relations entre objets, avec la particularité de ne pas avoir de bridage en termes de cardinalité (un Link est potentiellement N-N).
  • La définition des transformations simples autour de règles métiers transverses et des processus de Data Quality pour le passage de la couche « Raw Data Vault » à la couche « Business Data Vault »

Les autres points seront moins vitaux pour la pérennité et l’adaptabilité du modèle mais davantage liés à des optimisations techniques, notamment liées aux performances dans le cas de volumétries importantes :

  • Découpage des Satellites : en fonction des systèmes sources ou en fonction de la variabilité des attributs, en vue de générer le moins de volumétrie possible lors des changements de version des enregistrements historisés.
  • Définition des structures additionnelles (tables / vues / vues matérialisées) pour accélérer la sortie des données vers les Datamarts sur des données communément utilisées ensemble et nécessitant de combiner un sous-ensemble du modèle.