Pourquoi les données BigQuery sont-elles différentes de celles dans Google Analytics 4?

Découvrez pourquoi les données disponibles dans Google Analytics 4 diffèrent de celles exportées dans BigQuery et pourquoi est-ce avantageux.
PUBLIÉ LE
MIS À JOUR LE

Si vous envisagez d'utiliser BigQuery pour exploiter les données issues de Google Analytics 4 (GA4), ou si vous le faites déjà, vous souhaiterez peut-être connaître ou mieux comprendre quelles sont les différences entre les données accessibles au sein des deux outils.

On pourrait penser que les données exportées dans BigQuery sont exactement les mêmes que celles montrées dans les rapports GA4. Eh bien… ce n’est pas le cas, et cela pour plusieurs raisons. Dans cet article, nous explorons pourquoi.

Remarque : dans cet article, nous partons sur le principe que vous utilisez l'exportation de données intégrée de Google Analytics 4 vers BigQuery. Si vous utilisez un connecteur, un pipeline ou l'API de GA4, les informations listées ici ne s’appliqueront pas toujours.

Signaux Google

Un premier facteur à prendre en compte est le fait que les données collectées par GA4 via les signaux Google ne sont pas exportées vers BigQuery. Cela signifie que vous ne pourrez pas utiliser les dimensions de genre, d’âge et d’intérêt.

Dimensions et statistiques non disponibles par défaut

En inspectant le schéma d'exportation GA4 de BigQuery (sa structure de données), vous avez probablement remarqué l'absence de données clés.

Par exemple, vous n’avez pas de page de destination ni même de champ page. L'accès à ces informations nécessite l'utilisation de SQL pour extraire des informations principalement à partir des événements collectés par GA4. Pour les pages, par exemple, vous voudriez utiliser l'événement page_view collecté automatiquement avec son paramètre page_location (l'URL complète de la page) et compter combien de fois il a été déclenché pour chaque URL.

Pour faire simple, BigQuery nécessite de faire usage de logique SQL pour sélectionner les données dont vous avez besoin et les déchiffrer.

Dimensions, métriques et propriétés utilisateur personnalisées

L'un des principaux avantages de l'exportation des données de Google Analytics 4 vers BigQuery réside dans le fait que, lorsqu'elles sont stockées dans cet entrepôt de données, elles ne sont pas soumises aux quotas en matières de dimensions , métriques et propriétés utilisateurs personnalisées qui sont appliqués au niveau des propriétés GA4.

Cela est dû au fait que BigQuery reçoit des données brutes auxquelles vous pouvez accéder librement à l'aide de SQL. L'outil permet un accès direct à celles-ci, offrant ainsi la flexibilité de récupérer des informations qui peuvent ne pas être accessibles dans les rapports GA4.

Échantillonnage, seuil et cardinalité

Contrairement à dans l'interface utilisateur de GA4, les données stockées dans BigQuery ne sont pas soumises à des limitations telles que l'échantillonnage, le seuil ou la cardinalité.

L'échantillonnage se produit lorsque les données que vous essayez de charger avec un rapport sont trop volumineuses et que GA4 doit en utiliser qu’un sous-ensemble afin de répondre à votre demande.

Le seuil est lié aux signaux Google et vise à protéger les données personnelles.

Et enfin, la cardinalité fait référence au nombre de valeurs uniques stockées pour une dimension pendant une journée. Au-dessus de 500, GA4 peut charger certaines de vos données dans une ligne (autre).

BigQuery vous donne accès aux données les plus pures qu’il soit, sans aucune de ces limitations.

Fraîcheur des données

Une fois que vous avez configuré l'exportation de données GA4 vers BigQuery, vos données sont exportées quotidiennement dans un tableau dédié (pour chaque jour), en commençant par le jour où la configuration a été effectuée. Mais le processus a un jour de retard, car les données doivent être « finales ».

Toutefois, si vous choisissez d'exporter des données en streaming, votre projet BigQuery stocke les données presque en temps réel dans des tableaux dédiés (events_intraday_*).

En raison du traitement des données, les rapports disponibles au sein de GA4 peuvent, quant à eux, prendre jusqu'à 48 heures avant de présenter les données finales.

Explorations GA4 et rapports standards vs. BigQuery

L'information clé à garder à l'esprit est que les données de GA4 stockées dans un projet BigQuery sont brutes. Comme mentionné dans les sections précédentes de cet article, ce n’est pas vraiment le cas pour les rapports disponibles directement dans Google Analytics 4.

Mais saviez-vous qu’il existe également des différences entre les types de rapports GA4 ? Vous pouvez consulter la documentation de Google, mais elle ne vous donne pas toutes les informations dont vous avez besoin.

Les rapports standards (de la section Rapports) utilisent des données agrégées, fournissant des données utilisateur individuelles seulement partielles. Les explorations offrent un accès aux événements et utilisateurs brutes mais soumises aux limitations évoquées dans cet article, en plus de celle de la rétention des données.

Vous en voulez plus ? Voici d'autres lectures