Qu’est-ce que le Reverse ETL ? Un guide pour tout comprendre.

Explication de comment fonctionne un reverse ETL (Smart Bees)
Logo Profil writer Smart Bees
Par Gauthier Haicault
Dernière modification le 22 Mars, 2024

Un constat a été mis en avant montrant que les entreprises exploitent et activent uniquement 30% de leur donnée.

Où pouvons-nous trouver le reste de la donnée non exploitée ? Généralement, on la retrouve dans le datalake ou le data warehouse d’une entreprise où les marketers ont un accès très limité car demandant souvent des compétences minimum en SQL ou en Analytics Engineering. 

Tout le monde parle de stratégie data driven, on peut donc se poser la question de savoir pourquoi 70% de la donnée d’une entreprise se retrouve sous exploitée. La data peut pourtant être une manière de booster ses performances marketing, d’augmenter ainsi son CA en gagnant de nouveaux clients ou en fidélisant certains. Il faut juste savoir l’utiliser ! 

Pour utiliser cette donnée collectée et stockée, et la faire sortir de son enclos, nous avons besoin de la rendre accessible, c’est là qu’intervient la fameuse technologie de Reverse ETL.

Sommaire :

  • Qu’est-ce qu’un reverse ETL ?
  • Quelle est la différence entre ETL et Reverse ETL ?
  • Comprendre les mécanismes du Reverse ETL
  • Pourquoi votre business a besoin d’un reverse ETL ?
  • Les solutions Reverse ETL du marché

1. Qu’est-ce qu’un reverse ETL ?

La technologie Reverse ETL est le process d’envoyer de la donnée qui est stockée dans un entrepôt de données à des outils ou applications business comme des outils CRM, de marketing automation, analytics ou d’activation média.

Le Reverse ETL va permettre que la donnée soit entièrement synchronisée entre les différents outils et applications qu’une entreprise peut utiliser quotidiennement. Le fait de maintenir les flux de données est clé !

2. Quelle est la différence entre ETL et Reverse ETL ?

Là encore, tu retrouves l’acronyme ETL. Je me permets de t’indiquer que ça signifie “Extract Transform and Load”. Lorsque l’on parle d’ETL, on évoque le process de collecter de la donnée à partir de différentes sources, ensuite le process de nettoyer et transformer la donnée pour la rendre accessible aux destinations et pour finir le process d’envoyer la donnée dans un entrepôt de données, généralement le data warehouse.

Donc, pour résumer, la technologie ETL va permettre d’envoyer de la donnée structurée dans un data warehouse et le Reverse ETL, va utiliser cette même donnée en dehors de l'entrepôt pour l’exploiter dans différents outils marketing par exemple.

3. Comprendre les mécanismes du Reverse ETL

Comment marche spécifiquement la logique de Reverse ETL ?

On va compter plusieurs étapes :

  • Extraire les données : pour cette partie, l’idée est de réaliser une requête sur ses tables présentes dans son data warehouse (ex : BigQuery, Snowflake etc.) pour extraire les données qui nous intéressent.
  • Transformer les données : il sera parfois nécessaire de sortir du format spécifique des tables qui sont extraites de certains data warehouse, souvent très structurées. Il faudra penser à transformer la donnée pour que celle-ci match bien avec les destinations ciblées.
  • Charger les données : ici, il s’agit simplement de charger les données transformées ou non dans ses destinations. Cette action peut être réalisée via API, intégration manuelle, par batch ou en temps réel.

Une fois ces premières étapes réalisées, il faut maintenant activer la donnée ! La donnée est maintenant présente dans vos outils marketing, crm, data viz. Vos équipes peuvent maintenant utiliser la donnée dans leur quotidien. Je tiens cependant à soulever un point d’attention : le monitoring de la donnée ! Nous sommes ici dans une logique de flux de données avec des transformations, il est donc important et nécessaire de s’assurer de la fiabilité des données régulièrement. Certains outils de Reverse ETL permettent d'identifier des KO dans les synchronisations.

4 éléments sont très importants quand on parle de Reverse ETL : 

  • La source : la source des données généralement un data warehouse peut avoir un impact sur le format des données.
  • Le modèle : il s’agit ici de la requête spécifique (souvent SQL) que vous allez utiliser pour synchroniser la donnée provenant de votre data warehouse dans les outils business.
  • Les destinations : les outils et applications qui vont recevoir les données provenant du data warehouse.
  • Le mapping : il s'agit de faire correspondre les données de votre data warehouse à des champs spécifiques dans vos destinations cibles.

4. Pourquoi votre business a besoin d’un reverse ETL ?

Le Reverse ETL va permettre aux entreprises d'accéder à des données enrichies et de les exploiter pour améliorer la prise de décision, la personnalisation de leur campagne customer centric etc.

Rendre active votre donnée
Les données qui sont aujourd’hui stockées dans votre entrepôt n'ont qu'un vague potentiel de valeur ajoutée pour votre entreprise. Votre équipe de data analyst l’exploite à des fins d’analyse mais sachez que lorsque vous les utilisez dans des applications ou des outils business, vous avez l'opportunité d’en faire un élément central de vos campagnes de marketing, du développement de produits etc. Il faut voir l’utilisation d’un Reverse ETL comme une opportunité.

Éviter les silos de données :
Le Reverse ETL, par sa technologie permet d’éviter d’avoir des données enfermées. Il permet de donner accès aux équipes internes, notamment marketing, à des ensembles de données holistiques. Les équipes ne sont plus limitées aux données auxquelles elles peuvent accéder dans leurs propres outils : exemple, les équipes produits qui n’exploitent que la donnée provenant de Mixpanel ou les équipes médias qui utilisent uniquement la donnée provenant des plateformes publicitaires (Google Ads, Meta, Snapchat, Tiktok etc.)

Le Reverse ETL rend plus accessible les données à l'ensemble de l'organisation (la “data” n’est plus uniquement l'apanage des ingénieurs ou des analystes qui savent extraire ces données).

Se poser les bonnes questions analytics pour son business : 
Pour répondre à certaines questions, vous avez besoin de données provenant de plusieurs canaux et business units.
> Quels sont les points communs entre mes utilisateurs avec la plus grande LTV (Life Time Value) ? 
> Comment mon programme Welcome impacte la rétention de mes clients ? 
> etc.
Ainsi, au fur et à mesure que votre entreprise se développe, vous souhaitez continuer à poser des questions basées sur les données et à y répondre sans avoir à mettre en place de nouveaux flux toujours plus complexes entre vos outils. Le Reverse ETL vous permet d’accéder à votre base de données centralisée.

5. Les solutions Reverse ETL du marché

La faisabilité d’implémenter un Reverse ETL dans votre entreprise est un autre facteur important à prendre en compte. Il faut penser à l'impact que le processus ETL inverse pourrait avoir sur votre architecture actuelle.

5.1 Segment - Reverse ETL :

Comme une solution CDP packagée qui s'est fait un nom important dans l'écosystème analytics, Segment propose cette technologie de Reverse ETL. 

L'un des principaux avantages est que Segment fournit tous les types de pipelines de données dans une seule plateforme (par exemple, flux d'événements, ETL, ETL inversé). Avec une solution CDP packagée, vous aurez tout au même endroit, ce qui est peut être bien pratique mais peut avoir un coup ! 

Chez Smart Bees, on apprécie la solution, si vous avez besoin d’aide sur l’implémentation de Segment et son exploitation, n’hésitez pas à revenir vers vous ! On a pu utiliser le reverse ETL pour de nombreux use cases comme : envoyer de la donnée BigQuery (segmentation spécifique) vers un CRM Braze, envoyer la donnée BigQuery vers Segment pour enrichir des profils utilisateurs (via Segment Profiles notamment), synchroniser la donnée Snowflake jusqu’à Salesforce pour prioriser les appels des forces commerciales etc et bien sûr, une fonctionnalité assez classique : envoyer des conversions offline sur des plateformes Ads pour augmenter le ROAS.

5.2 DinMo - Reverse ETL :

Par exemple, nous avons déjà pu avancer sur une architecture comprenant DinMo, où le Reverse ETL permettait de transmettre des données first party, comme des attributs, des caractéristiques ou des métriques prédictives personnalisées, pour enrichir la connaissance client dans un CRM (Braze dans ce cas précis).

Donc si on doit retenir cette solution, on peut dire que c’est parfait pour du quick fix mais sur le long terme, on oublie 😉

5.3 Hightouch - Reverse ETL :

Hightouch est l’enfant de Segment, la CDP packagée dont on parle un peu plus haut. Autrefois, la brique Reverse ETL de Segment n’existait pas (en effet, elle est assez récente). Hightouch a été créé autour de cette idée par un ancien de Segment.

Ça en fait donc est la plateforme de Reverse ETL la plus populaire. Elle prend en charge plus de 200 destinations différentes et s'intègre à des outils de données modernes tels que dbt, Fivetran, Looker, etc. Elle offre un contrôle de version, un débogueur en direct, un support pour les alertes, et même un constructeur d'audience sans code pour que vos utilisateurs non techniques puissent construire des audiences en libre-service à l'aide d'une interface visuelle. Nous échangeons régulièrement avec cet outil qui est une vraie alternative aux solutions évoquées ci-dessus.

Pour conclure

Les plateformes de Reverse ETL présentent de nombreuses nuances. Si vous souhaitez investir dans les meilleurs outils de leur catégorie et disposer d'une solution entièrement gérée et opérationnelle en l'espace de quelques minutes, nous vous recommandons d'utiliser les outils précédemment cités.

En fonction de votre maturité, il est préférable d’opter pour une solution spécifique. Si vous avez des questions sur le sujet, n’hésitez pas à nous contacter chez Smart Bees