Vos pages sont-elles citées par les IA ? Auditez votre score GEO gratuitement.

Voir une démo
Authority GEO Signals · Publié le 31 mars 2026

Accès aux bots IA via robots.txt

Autoriser les crawlers IA (GPTBot, ClaudeBot, PerplexityBot) à indexer et citer votre contenu.

TL;DR — Une page bloquée dans robots.txt ne peut jamais être citée par les moteurs IA, peu importe la qualité du contenu. Plusieurs grands sites ont bloqué les bots IA par réaction en 2023–24 sans réaliser la conséquence : ils sont devenus invisibles aux réponses générées par IA.

Pourquoi l'accès aux bots IA est important

Une page bloquée dans robots.txt pour les crawlers IA ne peut pas être citée dans les réponses générées par IA — point final. Aucun balisage schema, aucun bloc FAQ ni aucune référence autoritaire n'aidera si le crawler ne peut pas accéder à la page en premier lieu. L'accès aux bots est la condition zéro dont tous les autres signaux GEO dépendent.

En 2023–24, de nombreux éditeurs et sites web ont ajouté des blocages spécifiques aux IA dans leur robots.txt par réaction — souvent en réponse à des préoccupations concernant l'utilisation des données d'entraînement. La conséquence, que beaucoup n'ont pas anticipée, a été une exclusion immédiate des pools de citation des moteurs IA. Perplexity, le mode de navigation de ChatGPT et les Google AI Overviews respectent tous les directives robots.txt et ne citeront pas les pages qui interdisent leurs crawlers.

Les principaux agents utilisateurs de crawlers IA à connaître :

  • GPTBot — crawler d'OpenAI (utilisé pour l'entraînement et la navigation en temps réel)
  • ClaudeBot — crawler d'Anthropic
  • anthropic-ai — agent utilisateur alternatif d'Anthropic
  • PerplexityBot — crawler de Perplexity
  • Amazonbot — crawler d'Amazon (Alexa/Rufus)
  • Google-Extended — crawler de Google pour les données d'entraînement de Gemini et AI Overviews

Comment implémenter

Vérifiez votre /robots.txt pour toute règle Disallow ciblant ces agents. Pour autoriser explicitement les crawlers IA :

User-agent: GPTBot
Allow: /

User-agent: ClaudeBot
Allow: /

User-agent: anthropic-ai
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: Amazonbot
Allow: /

User-agent: Google-Extended
Allow: /

Si vous voulez autoriser le crawling mais vous désinscrire de l'utilisation des données d'entraînement, consultez le mécanisme de désinscription spécifique de chaque fournisseur.

Erreurs courantes

  • Disallow: / général appliqué à tous les bots — un blocage générique (User-agent: * avec Disallow: /) bloque les crawlers IA avec tous les autres bots
  • Blocage au niveau CDN/WAF — Cloudflare et AWS WAF peuvent bloquer les crawlers IA indépendamment de robots.txt ; vérifiez vos règles de pare-feu
  • Vérifier uniquement Googlebot — vérifier l'accès Googlebot ne signifie pas que les crawlers spécifiques aux IA sont autorisés ; vérifiez chaque agent séparément

Sources

Questions fréquentes

Signaux connexes

Votre score GEO

Découvrez quels signaux GEO manquent sur vos pages et comment les corriger.

Auditer mes pages

Essai gratuit 14 jours

Les crawlers IA sont-ils bloqués sur votre site ?

TrustData vérifie votre robots.txt et la configuration de votre CDN pour les blocages de crawlers IA qui rendent votre contenu invisible.