La gestion de projet pour une science des données réussie
Éviter les pièges et suivre les meilleures pratiques pour la gestion des projets de science des données.
L'objectif premier de tout projet de science des données est de résoudre un problème ou de répondre à une question. Cependant, sans une orientation, une discipline et un contrôle appropriés, ces projets peuvent sortir des sentiers battus jusqu'à ce qu'ils finissent par s'éteindre et soient considérés comme un échec. L'application de méthodologies de gestion de projet aux projets de science des données garantit leur réussite et leur utilité.
Cet article aborde les pièges les plus courants au cours du processus de gestion de projet, les meilleures pratiques à suivre et les trois principaux conseils de Agilytic en matière de gestion de projet.
Cadres de gestion des projets de science des données
Il existe une pléthore de cadres de gestion de projet parmi lesquels choisir. Les équipes de science des données ont adapté certains cadres provenant de différentes industries (comme Kanban), et d'autres qui ont gagné une grande popularité au fil des ans (comme Scrum).
Cependant, tous les cadres de gestion de projet ne sont pas adaptés à la science des données en raison de leur nature itérative et en constante évolution, avec une approche unique pour chaque nouveau projet, secteur et problème.
Il est donc extrêmement difficile de s'en tenir à un système rigide dans le domaine de la science des données. C'est pourquoi vous verrez souvent ces équipes adopter des approches hybrides, en fonction de leurs préférences et de la nature d'un projet donné. Ces approches hybrides sont également appliquées de manière assez souple, car il n'est pas possible de suivre un modèle à l'emporte-pièce pour chaque projet.
Toutefois, il est utile de savoir qu'il existe un cycle de vie ou un flux de travail de haut niveau. Bien que chaque projet puisse être unique dans la solution et l'approche qu'il adopte pour résoudre le problème, il est essentiel de disposer d'un ensemble de listes de contrôle pour les projets afin que les étapes critiques du processus ne soient pas négligées ou oubliées.
L'un des cadres de gestion de projet les plus utiles pour les équipes de science des données est le TDSP (Team Data Science Process), qui constitue la base de la gestion de projet à l'adresse Agilytic.
TDSP combine les méthodologies Scrum et CRISP-DM dans un cadre qui récolte les avantages de chacune d'entre elles tout en éliminant certains de leurs inconvénients. Bien sûr, il pourrait être meilleur, mais il constitue un excellent guide de gestion de projet.
Pièges courants dans la gestion des projets de science des données
Attentes des clients
Il y a souvent un décalage entre les attentes d'un client et ce que les scientifiques des données peuvent raisonnablement fournir dans le cadre d'un projet. Comme le dit le vieil adage, "on ne sait pas ce que l'on ne sait pas" : "on ne sait pas ce que l'on ne sait pas". Les clients (ou les parties prenantes) viennent vous voir avec un problème et peuvent avoir une idée de ce à quoi ils aimeraient que la solution ressemble. Cependant, en tant que data scientist, vous êtes l'expert. Vous savez ce dont la science des données est capable sur la base des informations et des données dont vous disposez pour le projet. C'est là que la gestion de projet devient vitale pour la réussite du projet.
Avant de commencer le travail, toutes les personnes impliquées dans le projet doivent savoir exactement ce qui sera fait et quel sera le produit final à livrer. Ces éléments sont élaborés conjointement avec le client afin qu'il sache exactement ce qu'il attend et que l'équipe sache exactement comment elle fournira la solution finale. Au fur et à mesure de l'avancement du projet, il est d'autant plus important de vérifier régulièrement avec le client que le projet reste sur la bonne voie.
Gérer l'incertitude
L'un des problèmes les plus connus des projets de science des données est que rien n'est garanti. Par exemple, il est impossible de garantir une précision de 100 % dans les modèles d'apprentissage automatique, et une grande partie du travail que les scientifiques des données peuvent effectuer dépend entièrement de la qualité et de la quantité des données.
Si les volumes de données utilisables sont beaucoup plus faibles que prévu ou s'il faut nettoyer et préparer les données avant même de commencer le travail, cela aura un impact considérable sur la solution finale, le calendrier et le coût du projet.
Ce n'est qu'un exemple d'incertitude au cours d'un projet de science des données. L'élaboration d'une solution comporte de nombreux aspects, et chacun d'entre eux peut introduire encore plus d'incertitude dans le projet. Toutefois, une gestion de projet efficace permet d'identifier les risques en temps utile, de définir des mesures d'atténuation et de communiquer ces risques de manière transparente à l'équipe et au client.
Fluctuation du champ d'application
Après avoir passé des semaines ou des mois à développer une solution pour un projet, vous pouvez vous retrouver dans une situation où le client souhaite quelque chose que vous n'aviez pas convenu au début du projet. Cela peut être dû au fait que de nouvelles idées sont apparues lorsque les data scientists ont exploré les données, ou que le client a changé d'avis sur la direction qu'il souhaitait prendre.
Dans ces situations, il est important de faire preuve d'une certaine flexibilité. Comme nous l'avons déjà dit, nous ne pouvons pas donner de garanties en matière de science des données, et ces projets sont en constante évolution. Cependant, l'essentiel est de savoir où se situe la limite. Par exemple, supposons que les changements affectent de manière significative le budget ou la capacité de l'équipe à respecter le calendrier convenu. Dans ce cas, les chefs de projet doivent faire preuve d'ouverture et de transparence.
Communication
La communication est un sujet qui est souvent négligé ou qui n'est même pas prioritaire dans les projets de science des données. En général, les scientifiques des données veulent se plonger dans ce qui les passionne. Il n'est donc pas surprenant que la communication ne soit pas en tête de leur liste de tâches.
Cependant, la réussite des projets de science des données dépend fortement d'une bonne communication. Il est pratiquement impossible de développer une solution si vous n'avez aucune idée de ce que veut le client ou si le client ne sait pas comment votre solution peut lui apporter quelque chose d'utile ou de précieux.
Nous pouvons résoudre tous ces problèmes grâce à quelques bonnes pratiques de communication qui sont au cœur de toute approche de gestion de projet. En outre, il est souhaitable qu'un chef de projet distinct suive et applique ces pratiques afin que vos équipes de science des données puissent rester concentrées sur leur fonction principale.
Meilleures pratiques de gestion de projet en science des données
Créer une liste de contrôle
Bien que les détails et la nature de chaque projet de science des données soient différents, il existe des éléments communs. Par exemple, chaque projet doit commencer par une phase de planification au cours de laquelle des propositions et des documents sur le champ d'application sont rédigés et envoyés au client. Ensuite, les scientifiques des données commencent leur travail en extrayant et en explorant les données - en développant une bonne compréhension des données, en recherchant toute anomalie qu'ils doivent nettoyer et traiter, et ainsi de suite.
Il est utile de dresser une liste de contrôle des éléments communs à la plupart des projets gérés par votre équipe. Cette liste vous servira de guide et vous permettra de ne jamais manquer une étape en cours de route. Bien sûr, vous ne suivrez pas toujours cette liste de contrôle à la lettre, mais elle peut vous guider et vous servir de base pour ne pas commencer chaque projet entièrement à partir de zéro.
Décider d'abord des produits à livrer
Tout projet doit commencer par une phase de planification. C'est à ce moment-là que l'équipe de science des données et le client comprennent le problème ou la question à traiter et la solution qui sera développée.
Cependant, l'élément le plus critique de la solution est le produit livrable exact du projet. Qu'obtient le client à la fin du projet et comment ce résultat l'aide-t-il à aller de l'avant ? S'agit-il, par exemple, d'une API qui sera intégrée à son produit, ce qui permettra d'améliorer l'efficacité ou les ventes ? Ou bien cela facilite-t-il une prise de décision efficace afin que le client puisse passer à l'étape suivante d'un voyage vers un autre projet ?
Une définition très précise de ce produit et du résultat attendu dès le début du projet aidera l'équipe et le client à comprendre précisément où se situent les objectifs et ce qu'il faudra faire pour les atteindre.
Définir une cadence de communication
Comme nous l'avons déjà évoqué, la communication est l'épine dorsale de tout projet de science des données réussi. Il n'est donc pas surprenant que presque tous les cadres de gestion de projet aient leurs propres règles ou processus pour traiter cette composante. Cependant, chaque cadre a en commun un processus de communication régulier et cohérent.
Fixez un rythme de communication auquel votre équipe et le client peuvent se tenir régulièrement et rester cohérents. Au minimum, vous devriez rencontrer le client une fois par semaine. En outre, une mise à jour écrite de l'état d'avancement du projet à l'intention de toutes les parties prenantes complétera la communication orale.
Outre les mises à jour régulières à l'intention du client, il est également utile d'organiser régulièrement des réunions internes de l'équipe. Dans le cadre de la méthodologie traditionnelle "scrum", ces réunions sont généralement appelées "stand-ups" et se présentent sous la forme suivante : ce que vous avez fait hier, ce que vous allez faire aujourd'hui et les risques ou problèmes que vous avez rencontrés.
Ces réunions permettent à chacun de se tenir au courant des progrès réalisés par les autres. C'est également un excellent moment pour échanger des idées nouvelles et découvrir quelque chose d'important ou de perspicace pour faire avancer le projet. Les membres de l'équipe devraient également y trouver un espace sûr pour soulever des questions susceptibles d'avoir un impact significatif sur le projet.
Ces séances de remue-méninges ne doivent pas nécessairement avoir lieu pendant le stand-up. Il peut également être utile de prendre du recul à tout moment de la journée et de faire rebondir quelques idées au sein de l'équipe. N'oubliez pas de tenir compte du pouvoir et de la valeur des connaissances partagées.
Faire preuve de transparence
Chaque fois que vous rencontrez un problème ou que vous identifiez un risque potentiel à tout moment du projet, la meilleure pratique consiste à en discuter et à en faire part au client dès que possible.
Le fait de cacher des risques ou des problèmes potentiels au client affecte négativement la capacité de l'équipe à fournir la solution finale et laisse un mauvais goût dans la bouche de tout le monde. C'est pourquoi la transparence devrait être un principe fondamental de la gestion de projet.
Cette pratique s'applique également à toute modification que le client souhaite apporter et qui s'écarte de la portée initiale du projet. Si un client demande des modifications, il est de bonne pratique de communiquer clairement ce que vous obtiendrez (et n'obtiendrez pas) grâce à ces modifications.
AgilyticLes 3 meilleurs conseils en matière de gestion de projet
Les projets prennent toujours plus de temps et de ressources qu'on ne le pense. Il faut toujours s'attendre à des incertitudes et à des difficultés et planifier en conséquence.
Prévoyez des périodes tampons dans votre calendrier. L'ajout de petits espaces de temps entre les réunions vous permet de décompresser ou de prendre des mesures rapides sur un projet immédiatement après la réunion.
En cas de doute, rappelez-vous pourquoi vous êtes là. Prenez régulièrement du recul par rapport à ce que vous faites pour réfléchir avec votre équipe ou pour vous réaligner sur les objectifs et la direction du projet. Cela est particulièrement utile pour les tâches très complexes ou intensives. Il est facile de s'enfoncer dans un trou de lapin pour découvrir ensuite que l'on s'est trompé de direction depuis le début.
Écrit par Joleen Bothma