Google Analytics 4 (GA4) est maintenant devenu l'outil de web analyse incontournable de Google. Adieu Universal Analytics, et bonjour à une nouvelle ère de données.
Cependant, cette transition soulève plusieurs interrogations, notamment concernant les différences de données entre les divers rapports proposés par GA4.
Cet article a pour but de vous aider à comprendre ces différences et à optimiser votre utilisation de GA4 pour une analyse de données plus précise et efficace.
Sommaire :
Les rapports de GA4 tirent leurs données de différentes sources et tables. Certaines de ces tables sont agrégées, tandis que d'autres utilisent des données brutes. Cette distinction est cruciale pour comprendre pourquoi les données peuvent varier d'un rapport à l'autre.
Tables agrégées vs. données brutes : Les données agrégées sont souvent utilisées pour fournir des rapports rapides et faciles à interpréter, mais elles peuvent entraîner une baisse dans la précision et la lecture des données. Les données brutes, en revanche, offrent une granularité maximale, mais nécessitent plus de temps et de ressources pour être analysées et ne sont pas facilement disponibles.
Qu'est-ce que les Signaux Google ? Les signaux Google ou Google Signals permettent d'identifier les utilisateurs connectés à leur compte Google sur différents appareils, facilitant ainsi la création de rapports multi-appareils et le remarketing. Cependant, cette fonctionnalité est désormais retirée de l'identité de reporting dans GA4.
Quel était l’impact des signaux Google sur les données ? Lorsque les signaux Google étaient activés, ils facilitaient l'unification des sessions et des utilisateurs sur différents appareils. Leur absence dans GA4 signifie que les données peuvent maintenant différer selon les appareils utilisés par les utilisateurs.
Vous avez vu, je parle au passé ! En effet, cette fonctionnalité a totalement été retirée de l’identité de reporting, elle n’est plus prise en compte. Ainsi Google Signals n’impactera plus vos rapports. Je voulais revenir dessus car son utilisation posait précédemment plusieurs problèmes dans la lecture des données.
Alors, qu’est ce que la cardinalité ? La cardinalité fait référence au nombre de valeurs uniques attribuées à une dimension. Une dimension à haute cardinalité possède un grand nombre de valeurs uniques, ce qui peut poser des problèmes pour l'agrégation et l'affichage des données.
Où trouver cette cardinalité ?
Dans les rapports standards, les dimensions à haute cardinalité peuvent entraîner l'apparition de la ligne "other" qui agrège les valeurs moins fréquentes. Cela peut nuire à la précision des rapports et compliquer l'analyse des données.
Depuis novembre 2023, la cardinalité affecte également les rapports Explorations. Pour éviter ces problèmes, il est recommandé d'utiliser des dimensions à faible cardinalité ou de filtrer les données pour réduire le nombre de valeurs uniques. Exemple, éviter au maximum d’utiliser un identifiant unique pour chaque utilisateur dans une dimension personnalisée.
Par contre, bonne nouvelle ! On va le voir un peu plus tard, mais BigQuery n'est pas sujet aux limitations de cardinalité, ce qui en fait un outil idéal pour l'analyse de grandes quantités de données détaillées. En utilisant BigQuery, vous pouvez éviter les agrégations forcées et obtenir une vue complète de vos données.
A noter que la limite de lignes pour la plupart des rapports est de 50K pour un GA4 standard et de 1 million pour GA4 360.
Qu'est-ce que l'Échantillonnage? L'échantillonnage est une technique utilisée lorsque le nombre d'événements dépasse une certaine limite. Google Analytics prend un échantillon représentatif des données et extrapole les résultats pour générer des rapports. L’utilisateur gagne en expérience dans son utilisation de Google Analytics car les rapports chargent plus rapidement !
Où trouver ces échantillonnages ? Un peu partout malheureusement … l'échantillonnage peut affecter les rapports Explorer, Standard et API, réduisant ainsi la précision des données. Les rapports peuvent ne pas refléter entièrement la réalité si l'échantillonnage est important.
Mais encore une fois BigQuery est la solution ! Pour éviter l'échantillonnage, il est recommandé de réduire la période d'analyse ou le nombre de dimensions et métriques utilisées. ou tout simplement d’utiliser BigQuery, en effet les données proposées dans l’export BigQuery ne sont pas impactées par l'échantillonnage, offrant une vue non biaisée de vos données.
Rapports standards : Les rapports standards de GA4 sont conçus pour fournir des données rapidement. Cependant, en raison de l'agrégation des données et des limitations de cardinalité, ils peuvent ne pas toujours offrir le niveau de détail souhaité. La cardinalité avec l’apparition de la ligne (other) peut également être un facteur problématique pour la lecture de vos données, de même que l’échantillonage ! Dans le cas où cette cardinalité devient un problème et que des données plus détaillées sont nécessaires, on l’a dit précédemment : il vous reste BigQuery.
L'API : L'API de GA4 permet une gestion automatisée des comptes et l'accès aux données de reporting. Bien qu'elle offre une grande flexibilité, elle est soumise aux mêmes limitations que les rapports standards, telles que les seuils de confidentialité et la cardinalité. De nombreux utilisateurs utilisent l'API Data avec des outils comme Looker Studio et Tableau pour créer des visualisations et des rapports personnalisés
Exploration : Le module Explorer offre des techniques d'analyse avancées et une personnalisation accrue pour obtenir des insights précis. Contrairement aux rapports standards, Explorer utilise des données brutes et offre une personnalisation accrue. Cependant, il peut être sujet à l'échantillonnage et aux limitations de cardinalité, bien que ces risques soient réduits par rapport aux rapports standards.
BigQuery : J’en parle depuis le début, mais pour votre information : BigQuery est une plateforme de données dans le cloud qui permet de stocker et d'interroger rapidement de grandes quantités de données. L'intégration de GA4 avec BigQuery offre une solution puissante pour l'analyse de données à grande échelle. BigQuery permet une analyse détaillée et non limitée par la cardinalité ou l'échantillonnage. En exportant vos données vers BigQuery, vous pouvez effectuer des requêtes SQL sur des ensembles de données volumineux, obtenant ainsi des insights plus précis et complets.
Scénario 1 : Utilisation des rapports standards
Les rapports standards sont idéaux pour obtenir une vue d'ensemble rapide de vos données. Utilisez-les pour suivre les tendances à court terme et identifier les anomalies nécessitant une analyse plus approfondie.
Scénario 2 : Analyse avancée avec Explorer
Pour des analyses détaillées, Explorer offre davantage de flexibilité. Vous pouvez facilement utiliser des segments spécifiques de votre audience.
Scénario 3 : Automatisation avec l'API
L'API est parfaite pour automatiser la collecte et l'analyse des données. Vous l’utilisez par défaut en passant par des outils de visualisation comme Looker Studio pour créer des rapports personnalisés. Mais vous pouvez aussi choisir de faire des exports de données via API avec vos équipes de Data Eng.
Scénario 4 : Analyse dans BigQuery
Pour l'analyse de grandes quantités de données avec une granularité optimale et en évitant les biais, BigQuery est la solution idéale. Vos équipes de Data analyst vont pouvoir s’amuser à exécuter des requêtes SQL complexes et obtenir des insights détaillés qui ne sont pas possibles avec les autres rapports GA4.
En résumé, comprendre les différences entre les rapports standards, Explorer, l'API Data et BigQuery dans GA4 est crucial pour une analyse de données efficace et complète. Chaque rapport a ses propres avantages et limitations. Comprenez vos besoins et aller chercher l’information là où c’est le plus pertinent.
Si vous souhaitez être accompagnés dans votre montée en compétences sur Google Analytics 4, n’hésitez pas à nous contacter chez Smart Bees.