L’essentiel à retenir : Le trafic issu des LLM comme ChatGPT reste souvent invisible, noyé dans les sources directes. Sa détection nécessite la création d’un segment personnalisé dans GA4 via une expression régulière (Regex) spécifique. Cette configuration technique indispensable permet d’isoler ces nouvelles audiences pour enfin mesurer l’efficacité réelle des stratégies de visibilité dans les moteurs génératifs.
Vos statistiques vous cachent une vérité gênante : le trafic provenant des LLM atterrit incognito dans vos rapports, faussant ainsi toute votre stratégie d’acquisition. Identifier ces visiteurs provenant de ChatGPT, Gemini ou Perplexity n’est plus une option pour quiconque souhaite comprendre son audience réelle. Voici la méthode technique précise pour configurer vos filtres et transformer enfin cette zone d’ombre en indicateurs de performance fiables.
Pourquoi le trafic LLM est-il invisible dans vos analytics ?
Malheureusement pour vous, si vous n’avez pas bien configurer votre compte GA4, vous risquez de passer à côté du trafic provenant des sources de type LLM.
Le grand malentendu : trafic direct et referral
Vous pensez suivre tout votre trafic ? Faux. Le trafic des LLMs joue souvent à cache-cache et finit massivement noyé dans les catégories fourre-tout « Direct » ou « Referral » de Google Analytics 4.
Le souci technique est simple mais pervers. Contrairement à un site classique, la plupart des IA ne transmettent pas de « referrer » propre. C’est flagrant avec les applications mobiles ou les webviews, ce qui rend le pistage natif quasi impossible sans bidouillage.
Résultat des courses : sans intervention manuelle, cette source grandissante reste une totale boîte noire.
Visibilité vs clics : la partie immergée de l’iceberg
Il faut nuancer deux réalités bien distinctes : le trafic cliqué, où l’utilisateur suit un lien, et la visibilité invisible, où votre marque est citée sans aucun lien sortant.
Ne nous voilons pas la face, l’impact majeur se joue sur cette visibilité. L’IA agit comme un influenceur en « conversion assistée ». D’ailleurs, la visibilité des marques dans ChatGPT représente un enjeu stratégique bien plus vaste que le simple clic.
Pourtant, ici, nous allons nous focaliser uniquement sur la mesure du trafic cliqué. C’est la seule métrique tangible pour commencer à chiffrer l’impact réel.
Les principaux LLM générateurs de trafic
Inutile de surveiller chaque outil obscur. Concentrez vos efforts sur les mastodontes capables de générer du volume vers votre site web dès aujourd’hui.
Voici les suspects habituels à pister en priorité :
- ChatGPT (OpenAI)
- Gemini (Google)
- Perplexity AI
- Copilot (Microsoft)
- Le Chat (Mistral)
Comment traquer le trafic LLM dans GA4 : la méthode pas à pas
Méthode 1 : les paramètres utm, une solution simple mais limitée
Vous connaissez la musique : on marque pour mieux régner. Le principe des paramètres UTM reste basique mais efficace pour flécher vos liens. Si vous contrôlez le lien partagé, ajoutez simplement un tag spécifique. Par exemple, une URL du type ?utm_source=chatgpt&utm_medium=llm_referral permet d’identifier immédiatement la provenance du clic dans vos rapports.
Mais attention, c’est loin d’être la panacée. Cette technique ne fonctionne que si l’IA recrache EXACTEMENT l’URL taguée que vous avez semée. Soyons réalistes : c’est rarement le cas. Si le modèle génère un lien propre, vous perdez la trace.
Méthode 2 : créer un segment personnalisé avec les regex dans ga4
Pour arrêter de naviguer à l’aveugle, il faut passer à la vitesse supérieure. C’est ici que le filtrage par regex devient votre meilleur allié pour isoler le trafic llm.
Direction l’onglet « Explorer » de GA4. Créez une exploration vierge, puis un nouveau « Segment de session ». La magie opère dans la condition : sélectionnez « Source de la session » et choisissez l’opérateur correspondant à une expression régulière. C’est technique, mais redoutable.
Copiez cette formule barbare ci-dessous. Elle capture tout, de ChatGPT à Gemini en passant par Perplexity : ^.ai|.\\.openai.|.copilot.|.chatgpt.|.gemini.|.gpt.|.neeva.|.writesonic.|.nimble.|.outrider.|.perplexity.|.google\\.bard.|.bard\\.google.|.bard.|.edgeservices.|.astastic.|.copy\\.ai.|.bnngpt.|.gemini\\.google.*$
Quelle méthode choisir ?
Alors, on part sur quoi ? Le bricolage rapide des UTM ou la chirurgie de précision des Regex ? Tout dépend de votre soif de données fiables.
| Méthode | Fiabilité | Mise en place | Idéal pour… |
|---|---|---|---|
| Paramètres UTM | Faible (dépend de la reprise de l’URL exacte) | Simple (ajout de tags à vos URL) | Tester rapidement l’impact d’une source spécifique que vous maîtrisez. |
| Segment Regex dans GA4 | Élevée (capture une grande partie des referrers connus) | Moyenne (demande une configuration dans GA4) | Avoir une vue d’ensemble fiable et pérenne de tout le trafic LLM. |
Analyser les données : que vous dit vraiment ce nouveau trafic ?
Savoir traquer, c’est bien. Comprendre ce qu’on regarde, c’est mieux. Une fois le segment créé, il faut choisir les bonnes métriques pour que les chiffres parlent.
Les dimensions et métriques à surveiller de près
Une fois le segment appliqué dans le rapport d’exploration GA4, il faut ajouter les bonnes dimensions. Les deux plus importantes sont « Source/support de la session » et « Chemin de la page ».
La première dimension montre quel LLM envoie du trafic. La seconde indique quelles pages de votre site sont les plus citées et cliquées. C’est une mine d’or.
Pour évaluer correctement la performance, voici les données indispensables à intégrer dans votre tableau de bord :
- Métriques d’engagement : Sessions engagées, Taux d’engagement, Durée moyenne de la session.
- Métriques d’audience : Nouveaux utilisateurs, Utilisateurs totaux.
- Métriques de conversion : Événements clés (conversions).
Interpréter la qualité du trafic llm
Le volume est une chose, mais la qualité en est une autre. Un taux d’engagement élevé et une durée de session longue sont des signaux très positifs. Cela signifie que les utilisateurs venant des LLM trouvent votre contenu pertinent.
À l’inverse, un taux de rebond élevé (ou un faible taux d’engagement) peut indiquer un décalage. L’IA a peut-être cité votre page hors contexte.
Comparer systématiquement ces métriques avec celles de votre trafic organique (SEO) pour avoir un point de référence.