Optimiser son contenu pour le SEO et les LLMs avec Google AI

Optimisez vos contenus pour le SEO et les LLMs grâce à la prédiction des thèmes et questions identifiées par Google AI.
PUBLIÉ LE
MIS À JOUR LE

Ce billet et la démarche décrite ici se basent sur l’article et le script créés par Metehan Yesilyurt. Suite à plusieurs tests et analyses, ce dernier a remarqué plusieurs choses importantes : 

  • le mode AI de Google analyse le contenu de chaque page en l’éclatant en sous-thèmes (on parle de “query fan-out”, en anglais) basés sur le sujet principal qu’il traite. Ceux-ci s’apparentent beaucoup à des champs sémantiques (ou des cocons sémantiques) et sont utilisés par Google pour construire une réponse (pour Gemini) ou même ses résultats de recherche 
  • le contenu d’une page Web est souvent pensé pour répondre à une ou quelques questions (et sous-thèmes). Il est donc rarement complètement optimisé pour traiter un thème de manière optimale pour le SEO et les LLMs.

Fort de ces constats, Metehan a construit un script (en JavaScript) qui vise à extraire les sous-thèmes que Google AI identifie sur la base de votre contenu pour prédire les sujets et questions que celui-ci devrait couvrir. Il est conçu pour être utilisé avec Screaming Frog (le crawler le plus populaire dans l’industrie), ce qui est bien pratique pour obtenir ces données pour une liste de pages, voire même l’intégralité d’un site Internet.

Mais ce n’est pas tout. Ce script a aussi pour but d’évaluer, grâce à l’API de Gemini, à quel point votre contenu traite les sous-thèmes identifiés avec un score et émettre des recommandations pour mieux les couvrir.

Le but ? Améliorer vos contenus existants pour un meilleur référencement SEO sur les sujets en rapport avec les thématiques qu’ils adressent, mais aussi pour le GEO, l’optimisation de votre visibilité dans les LLMs, en répondant à des questions / réponses que Gemini (et autres outils du genre) cherchent.

Ajustement du script

Nous vous invitons bien entendu à consulter l’article rédigé (en anglais) par Metehan. Nous avons toutefois modifié le script original pour trois raisons importantes : 

  • utiliser un modèle à jour et fonctionnel avec un appel à l’API de Gemini qui ne retourne pas d’erreur (le script d’origine - la version pour le français - ne fonctionnait pas pour nous, les appels à l’API retournaient systématiquement des erreurs 404)
  • rendre le script plus robuste pour éviter les problèmes de “time out” liés aux appels à l’API et aux restrictions de Screaming Frog pour les scripts JavaScript. Lors de l’usage du script originel, nous avons rencontré de nombreux problèmes liés à des “time out” que ces modifications adressent
  • pour certaines pages testées, la manière d'extraire les données structurées ne fonctionnait pas (lorsqu'un objet était utilisé). Nous avons modifié la logique utilisée pour éviter ce problème.

Vous pouvez trouver le script modifié ici.

Note : cette version du script date de novembre 2025 et utilise le modèle Gemini 2.5 flash. Avec les ajustements réguliers apportés par Google aux modèles disponibles au sein de Gemini, il est possible qu’au fil du temps la requête à l’API doive à nouveau être ajustée.

Comment est-ce que cela fonctionne ?

Le script doit être ajouté comme “custom JavaScript” dans Screaming Frog.

Avant de procéder, vous devez toutefois : 

  • obtenir une clé issue d’un projet Google Cloud au sein duquel l’API de Gemini est activée
  • votre projet Google Cloud doit aussi être associé à un compte de facturation fonctionnel (l’API est gratuite, mais jusqu’à un certain point)
  • ajouter la clé obtenue au sein du script.

Vous pouvez ensuite lancer votre “crawl” et accéder aux résultats au sein de l’onglet “Custom JavaScript” de Screaming Frog.

En option : une section du script a été commentée (et n’est pas exécutée par défaut). Elle permet de spécifier un sélecteur CSS pour extraire le contenu de seulement la partie de chaque page qui est pertinente (ex : le corps de la page, sans les éléments de navigation). Si vous souhaitez l’utiliser, retirez les deux lignes de commentaire et ajoutez votre sélecteur CSS.

Exemple de données

Regardons un exemple concret. Cela vous permettra de mieux comprendre pourquoi cette démarche est très intéressante.

Nous avons utilisé cette approche pour notre client Folks RH. Elle nous a permis d’identifier des opportunités d’optimisation pour les contenus du site de la marque et des angles additionnels à couvrir. L’idée était autant d’auditer que de trouver de nouvelles manières de développer les informations fournies au sein de ses pages - aussi bien pour le SEO, les LLMs que pour l’expérience utilisateur.

Voici un exemple pour la page https://folksrh.com/fonctionnalite/accueil-et-integration/ (complètement traduit en français) : 

Thème principal identifié

Logiciel d'accueil et d'intégration des employés

Les requêtes “fan-out”

• Quelles sont les fonctionnalités essentielles d'un logiciel d'onboarding ? - Couverture: oui

• Comment automatiser les tâches administratives d'intégration des employés ? - Couverture: partielle

• Logiciel d'onboarding pour améliorer l'expérience des nouvelles recrues - Couverture: oui

• Mettre en place des rappels et échéanciers pour l'accueil des employés - Couverture: oui

• Personnalisation des parcours d'intégration des nouveaux employés - Couverture: oui

• Comparaison des logiciels d'onboarding RH sur le marché - Couverture: non

• Quel est le coût d'un logiciel d'accueil et d'intégration des employés ? - Couverture: non

• Folks RH : avis et témoignages utilisateurs - Couverture: non

• Gestion de la formation et suivi de probation avec un logiciel RH - Couverture: oui

• Logiciel RH sans responsable RH dédié pour PME - Couverture: oui

Les sujets reliés

• Quel est le prix ou la structure tarifaire du logiciel Folks RH pour l'onboarding ?

• Le logiciel Folks RH s'intègre-t-il avec d'autres systèmes RH ou de paie existants ?

• Combien de temps faut-il pour implémenter le logiciel d'accueil et d'intégration Folks RH ?

• Existe-t-il une version d'essai gratuite ou une démo plus approfondie des fonctionnalités ?

• Quelles sont les options de support client et de formation disponibles pour les utilisateurs ?

• Comment Folks RH gère-t-il la conformité réglementaire en matière de données RH ?

Le score de couverture

6.5/10 requêtes couvertes (le score est défini comme suit : Oui = 1, Partielle = 0.5, Non = 0)

Recommandations

*   **Informations tarifaires** Ajoutez une section dédiée ou un lien vers des informations tarifaires

*   **Analyse ou différentiation compétitive** Inclure du contenu qui montre comment Folks RH se distingue de la compétition, sans nécessairement la nommer

*   **Témoignages d’usagers / études de cas** Inclure des témoignages, des exemples d’implémentations qui se sont avérées positives, des témoignages et/ou des études de cas pour fournir des preuves sociales

*   **Guides détaillés** Pour les fonctionnalités telles que l'automatisation ou la personnalisation, proposez des étapes procédurales plus spécifiques ou des liens vers des ressources expliquant comment les implémenter dans le logiciel

*   **Fonctionnalités d’intégration** Fournir des informations concernant l’intégration de la solution avec d’autres outils de RH

*   **Processus d’implémentation** Donner plus de détails concernant ce que le processus d’implémentation implique et combien de temps cela prend

On constate ici que le score de couverture de la page pourrait largement être amélioré, avec un sujet identifié étant évalué comme partiellement traité et trois pas du tout. Bien que l'évaluation de l’IA est parfois discutable, elle est généralement au moins en partie valide - c’est le cas ici.

Rappelez-vous que le script fournit aussi des recommandations claires et actionnables pour mieux traiter les sujets qui ne le sont pas parfaitement. Pour cette page, Gemini indique d’ajouter des informations tarifaires, d’autres effectuant une comparaison avec la compétition, des témoignages et études de cas, des guides, etc.

Encore mieux, une fois les optimisations apportées à la page, on peut relancer le script et voir comment la page est évaluée. À noter que la liste des requêtes retournée peut changer d’un appel à l’API à l’autre (une autre version du script pourrait être développée pour vérifier la couverture des requêtes précédemment identifiées pour une vérification de ce type).

Vous en voulez plus ? Voici d'autres lectures