Un meilleur ciblage grâce à l'enrichissement des données dans le domaine pharmaceutique
Contexte et objectifs
La base de données de qualité inférieure d'une grande entreprise pharmaceutiquel'a empêchée d'effectuer une segmentation précise des médecins généralistes et autres spécialistes en Belgique.
Il était essentiel pour l'entreprise d'obtenir des informations plus précises sur ses clients afin d'allouer efficacement les ressources nécessaires à l'acquisition et à la fidélisation des clients. Nous avons donc entrepris de recueillir des données ouvertes et accessibles au public sur les clients potentiels et de développer la connaissance des clients.
Ce projet d'enrichissement des données visait à améliorer le ciblage commercial à l'avenir (c'est-à-dire à améliorer les messages personnalisés et les canaux de communication).
Approche
Nous avons collaboré avec les départements marketing et opérations pour maximiser la pertinence des résultats. Tout d'abord, nous avons évalué le potentiel de scraping des différentes sources, en sélectionnant les plus pertinentes. Ensuite, nous avons déployé des techniques de web scraping et collecté des données ouvertes sur les médecins à partir de divers sites web publics (par exemple, INAMI, Google search, LinkedIn et des plateformes de rendez-vous comme Doctena). Nous avons utilisé une API de page de résultats de moteurs de recherche (SERP) pour obtenir des résultats filtrés à partir d'une recherche sur Google et PhantomBuster pour LinkedIn.
Nous avons réalisé le web scraping et la consolidation avec le langage de programmation Python. Le processus est reproductible pour tout développement interne futur de l'entreprise pharmaceutique ou pour l'actualisation des données à tout moment.
Enfin, nous avons intégré les données obtenues dans un fichier Excel.
Résultats
À la fin du projet, nous avons fourni un modèle et d'autres ressources permettant au client d'utiliser les données pour créer des segments qui informeront les futures campagnes de marketing, y compris :
La base de données consolidée, enrichie de toutes les données récupérées
Un dictionnaire de données - détaillant les colonnes de chaque base de données, donnant ainsi des informations sur chaque caractéristique.
La documentation de la méthodologie et du code. Nous avons développé des scripts pour construire l'ensemble de données.
Nous avons développé l'ensemble du code en Python pour pouvoir le reproduire à l'avenir et le développer en interne.
Un rapport détaillant l'approche.
La base de données comptait au départ 15 000 médecins et 13 caractéristiques sur ces médecins. Après le projet de "web scraping" et l'exploitation de sept sources au total, ce nombre s'élève désormais à 40 nouvelles caractéristiques, ce qui permet d'obtenir une image plus riche de chaque profil.
De plus, comme nous avons veillé à ce que le code de récupération des données soit reproductible, le client peut procéder à une actualisation des données et à un développement interne à l'avenir.
Grâce à l'analyse des données, le client a amélioré sa connaissance des clients et peut prendre des décisions plus intelligentes concernant la coordination des efforts de commercialisation sur le site . Après avoir achevé le projet en trois semaines, le client a rapidement compris les actions ultérieures nécessaires pour augmenter la fidélisation des clients et le potentiel commercial.