L'entreposage de données à l'épreuve du temps dans les services professionnels
Contexte et objectifs
Une entreprise impliquée dans la gestion des ressources humaines souhaitait centraliser son environnement de données pour permettre aux différents agents d'y accéder facilement, notamment à des fins de reporting. En outre, elle souhaitait un système flexible capable de s'adapter à des utilisations futures, telles que les applications d'intelligence artificielle.
Le projet a démarré parce que l'entreprise prévoyait de transférer sa gestion des ressources humaines vers un nouveau système, ce qui présentait un risque de perte de données. Pour atténuer ce risque, nous avons développé un entrepôt de données moderne, fournissant une base solide pour une gestion efficace des données.
Approche
Tout d'abord, nous avons analysé les données des bases de données sources. Cette analyse a pris en compte des facteurs tels que la taille des données, la présence d'index et la possibilité d'implémenter une logique incrémentale pour la mise à jour quotidienne des données. Cette approche nous permet d'éviter de télécharger des tables entières chaque fois que nous avons besoin d'une mise à jour.
Ensuite, nous avons analysé les rapports utilisés par les agents et le back-office de la société afin de hiérarchiser la charge de travail tout en conservant une vue d'ensemble de l'objectif à long terme. Nous avons organisé les données de la base de données SQL, documenté toutes les transformations effectuées, déterminé la fréquence d'utilisation de chaque rapport et les avons classés par ordre de priorité en fonction des informations commerciales, de la complexité des requêtes et de la fréquence d'utilisation.
Enfin, nous avons procédé à une refonte de la base de données afin de mettre à jour les champs de données et de mettre en place l'infrastructure dans Azure avec un modèle de données approprié. En outre, nous avons migré les rapports clés identifiés initialement vers le nouveau cadre. Ces rapports serviront d'exemple tangible aux utilisateurs finaux et aux équipes de développement internes.
Résultats
La plateforme de données actualisée offre une série de fonctionnalités, notamment la mise en place de l'infrastructure, l'implémentation d'un modèle de données d'entrepôt, la conception d'une architecture avec de multiples options et la fourniture de la meilleure recommandation pour le client. Elle assure la gouvernance des données et crée de la documentation pour l'équipe du client. L'architecture de l'entrepôt de données basée sur le cloud rassemble différentes sources de données dans un cadre ETL unique, ce qui permet de générer des rapports analytiques et d'analyser les informations.
Nous avons migré sept rapports importants et complexes de l'ancienne structure de base de données vers la nouvelle. Ces rapports sont utilisés par les agents du client et le personnel du back-office pour leur analyse quotidienne.
Notre équipe a coordonné efficacement le processus d'ingestion quotidienne des données, a géré la logique de transformation des données et a établi un réseau sécurisé pour une communication transparente entre les différents composants. En outre, nous avons mis en place un coffre-fort de clés pour stocker en toute sécurité toutes les informations d'identification et les configurations essentielles.