Google Analytics 4
La notion de scope de données

Un des principaux problèmes rencontrés lors de la création d’un rapport dans l’explorer est la mise en place et la combinaison des métriques et des dimensions de portée / scope différente. Généralement, le résultat proposé est confus et incorrect. Ça peut vite amener à une mauvaise lecture des données et ainsi par conséquent conduire à la prise d’une décision business regrettable. 

Le concept de portée des données a toujours existé dans Google Analytics, mais avec le lancement de GA4 et son nouveau modèle de données, celui-ci a pris un poids d'autant plus important.

Dans cet article, je vais vous expliquer les différents niveaux de cadrage dans GA4, et comment vous pouvez vous assurer que vous combinez les bonnes dimensions et métriques dans les rapports et explorations de GA4.

1. Parlons structure et hiérarchie de données dans Google Analytics 4

Commençons par faire un rappel sur la structure hiérarchique des données dans GA4.

Nous avons en premier lieu les données utilisateurs, puis sessions et ensuite les données d’événements.

Un utilisateur est au top niveau de la hiérarchie des données. Celui-ci représente généralement une combinaison navigateur/appareil qui interagit avec votre site web ou votre application. Pour rappel, le cookie GA4 est le même et fera en sorte que GA4 considère qu’il s’agit du même utilisateur, si et seulement s'il revient plus tard avec la même combinaison navigateur/appareil. 

"Attention cependant à votre configuration de l’identité de reporting dans GA4, en effet, les utilisateurs peuvent être calculés de différentes manières.”

Une session représente la période entre le moment où un utilisateur visite votre site web ou votre application et le moment où il quitte votre site web ou votre application. Un utilisateur peut générer plusieurs sessions si, par exemple, il visite votre site web ou votre application sur plusieurs jours ou plusieurs fois au cours d'une même journée. C’était la métrique phare d’Universal Analytics mais qui prend moins de place dans cette nouvelle architecture. 

Un événement représente une interaction bien définie de l'utilisateur au sein d'une session. Par exemple, l’ajout d’un produit à son panier ou la réalisation d’une transaction sont des événements à collecter dans GA4. 

2. Comment les données sont-elles organisées dans votre GA4 ?

GA4 organise les données en groupes d'utilisateurs, de sessions et d'événements, ces groupes étant connus sous le nom de “scope” ou “portée”.

Dans GA4, il existe trois champs d'application différents pour les données :

  • Le scope utilisateur
  • Le scope session
  • Le scope événement

A. Portée de l'utilisateur

Les dimensions qui ont un scope utilisateur vous montrent d'où viennent vos nouveaux utilisateurs. Cette valeur reste la même lorsque l'utilisateur revient sur votre site web ou votre application lors de ses visites ultérieures. D’où l’importance d’essayer d’unifier ses données utilisateurs avec un user_id pour avoir une donnée la plus fiable possible.

Ces dimensions sont faciles à reconnaître car elles sont toutes suivies de la mention “de l’utilisateur” dans l’interface. 

Par exemple, la dimension "Premier support de l'utilisateur" va enregistrer le support à partir duquel l'utilisateur a trouvé votre site internet lors de sa toute première visite. Cette valeur restera la même pour toutes les visites suivantes, même si l’utilisateur revient sur votre site via des sources, des supports ou des campagnes différents.

Le rapport “Acquisition d’utilisateurs” qui est disponible par défaut dans l'interface GA4 permet d'identifier rapidement de quelles sources proviennent ses utilisateurs lors de leur “première visite”. 

B. Portée de la session

À l’image des dimensions utilisateurs, les dimensions liées à la session vous indiquent d'où viennent les nouveaux utilisateurs et ceux qui reviennent lorsqu'ils commencent une nouvelle session. Je ne pense plus avoir besoin de définir le terme session. Ainsi, la valeur des dimensions liées à une session va changer à chaque fois qu'une nouvelle session sera lancée.

Toutes les dimensions relatives aux sessions sont reconnaissables dans l'interface GA4, car leur nom finit généralement par “de la session”.

Par exemple, la dimension "Support de la session" enregistre le support à partir duquel l'utilisateur a trouvé votre site web pour la session définie. Pour chaque nouvelle session, de nouvelles valeurs seront attribuées aux dimensions. 

Le rapport “Acquisition de trafic” présent également par défaut dans l'interface GA4 est basé sur des dimensions de session. 

C. Champ d'application de l'événement

Toutes les dimensions liées à un événement ne sont pas suivies du suffixe "de l’utilisateur" ou "de la session" dans leur description. Ces dimensions vont permettre d'attribuer des crédits aux événements de conversion. 

Comment trouver ces fameuses dimensions ? Elles sont présentes dans les rapports d’Attribution dans la brique “Publicité”.

3. Pourquoi la compréhension de cette notion de “portée” est cruciale dans Google Analytics 4 ?

Il est important de bien comprendre cette histoire de portée des données, car les dimensions et les métriques que vous combinez, que ce soit dans des rapports par défaut ou via le module d'exploration, doivent appartenir au même périmètre / scope pour que les données rapportées soient significatives.

Grâce aux rapports d’Exploration, notre nouveau terrain de jeu (😉), il est possible de combiner n'importe quelles dimensions et mesures, même celles qui ont une portée différente.

Par exemple, un utilisateur de GA4 pourrait construire une exploration basée sur les dimensions suivantes :

  • Support du premier utilisateur
  • Source de la session
  • Campagne → Rappel : sans préfixe ni suffixe et donc le scope sera : ?

" Si tu n’arrives pas à y répondre, c’est le moment de revenir sur les éléments d’au dessus avant de continuer ta lecture”

Pour un œil non averti, ce rapport à deux scopes pourra vous sembler correct car les rapports d’exploration ont permis à l'utilisateur de combiner ces dimensions. Mais que nenni ! Ce rapport sera rempli d’erreurs. 😱

La raison pour laquelle les données sont renvoyées de manière incorrecte est due à cette fameuse notion de scope dont je vous parle depuis le début. Dans l'exemple ci-dessus, nous avons combiné une dimension relative à l'utilisateur (Premier support de l’utilisateur) avec une dimension relative à la session (Source de la session) et une dimension relative à l'événement (Campagne).

Dans Universal Analytics, l'interface vous empêchait en grande partie de combiner des mesures et des dimensions de portée différente. Avec GA4, on a davantage de liberté mais du coup il faut être sur ses gardes ! 

L'absence de ce filet de sécurité dans GA4 augmente considérablement le risque d'erreurs conduisant à l'analyse de données erronées, en particulier pour les utilisateurs davantage novices.

Pour vous assurer que vous analysez correctement les données de GA4, je vous fais un nouveau rappel :

  • Toutes les dimensions relatives à l'utilisateur sont suivies du suffixe "du premier utilisateur".
  • Toutes les dimensions relatives à la session suivies du suffixe " de la session".
  • Toutes les dimensions relatives aux événements n'ont pas de préfixe ni de suffixe. 

Les rapports ne doivent jamais être créés avec des dimensions n'appartenant pas toutes à la même portée.

4. Comment la portée fonctionne-t-elle avec l'attribution dans Google Analytics 4 ?

J’espère qu'à ce moment de notre article, vous avez une bien meilleure compréhension de ce qu'est la portée dans GA4 et de l'importance de la portée des dimensions dans l'analyse correcte des données.

J’arrive avec un nouveau point : Attribution et Scope sont étroitement liés

Le concept important à prendre en compte dans GA4 est que les différentes portées utilisent des modèles d'attribution différents. Plait-il ? 

Les dimensions ayant une portée utilisateur ou session utilisent le modèle d'attribution cross-canal et last click. Elles ne sont pas affectées par les changements apportés au modèle d'attribution qui est généralement “basé sur les données”. Pour donner davantage de détails, si votre propriété GA4 a été configurée sur un modèle “basé sur les données” dans les paramètres d'attribution (pour rappel il n’y a plus que 3 choix : last click, first click et data driven), les dimensions de scope session et utilisateur reviendront toujours au modèle du dernier clic. Ce paramètre ne peut pas être modifié malgré cette nouveauté GA4 avec la possibilité de changer le modèle d’attribution. Il s’agit d’une petite supercherie à bien avoir en tête ! 

Cependant les dimensions liées à un événement vont utiliser le modèle d'attribution que vous avez sélectionné dans les paramètres d'attribution de GA4. Ainsi, si votre propriété GA4 est configurée sur un modèle “basé sur les données” dans les paramètres d'attribution, les dimensions liées aux événements utiliseront ce modèle basé sur les données. Donc attention, car pour le suivi des données, si vous modifiez le modèle d'attribution dans les paramètres d'attribution de GA4, vous modifiez également le modèle utilisé pour les dimensions liées aux événements marqués comme conversion (exemple : purchase).

5. Quel est l'impact d'un changement de valeur en cours de session sur le cadrage ?

Il s’agit d’un autre point important qui vient répondre au problème de référencement abusif. Les referrals ne se récupéreront plus à la conversion ou la session. En effet, avec la logique de portée, si un changement de source, de support ou de campagne est détecté en cours de session, la source initiale ne se verra pas remplacer.

Je vais vous expliquer tout ça avec un exemple, imaginons, un utilisateur arrive sur votre site web via la source facebook / cpc, puis au cours de la session GA4 va détecter que la source a changé pour devenir du google / organic. 

Initialement dans Universal Analytics, le même parcours aurait déclenché une deuxième session de google organic mais avec la logique de portée, la source d’origine est conservée dans les dimensions définies pour la session. Cela répond à un problème d’attribution qui était visible sur les sites en Single Page App notamment. 

Merci GA4. 💙

Pour conclure

Bien que la notion de “scope” ait toujours été une fonctionnalité de Google Analytics (à renseigner notamment dans la création des dimensions personnalisées), il ne nécessitait pas auparavant un niveau de compréhension très élevé. En effet, comme rappelé, les rapports personnalisés disponibles dans Universal Analytics et les versions précédentes ne permettaient pas de combiner des dimensions et des métriques avec des scopes différents. Avec le nouveau modèle de données de GA4, la compréhension de cet enjeu est clé ! 

Ainsi, j’espère que ces explications sur les différents scopes et leur importance, vous permettront une meilleure lecture de vos rapports. Si vous souhaitez former vos équipes à ces problématiques, n’hésitez pas à contacter Smart Bees. Nous viendrons avec plaisir dans vos locaux !