SeAudit
Tous les articles
IA Search·11 min·2026-06-05

llms.txt : le guide complet pour le mettre en place en 30 minutes (2026)

Un fichier markdown à la racine pour orienter ChatGPT, Claude, Perplexity et Gemini vers tes pages clés. Spec, structure, déploiement Next.js/WordPress/Shopify, tests, FAQ. Moins de 3 % des sites FR l'ont — fenêtre temporelle pour prendre de l'avance.

Illustration plate représentant un fichier markdown stylisé intitulé llms.txt au centre, entouré de logos abstraits de modèles de langage (ChatGPT, Claude, Perplexity, Gemini) qui en extraient des passages — illustration d'un manifeste éditorial pour les IA

Tu as entendu parler de llms.txt ? Bonne nouvelle, ça change tout.

En septembre 2024, Jeremy Howard (cofondateur de fast.ai) publie une proposition de standard simple : un fichier markdown à la racine des sites, conçu pour les LLM, baptisé llms.txt. Un an plus tard, Anthropic, Mistral, Vercel, Cloudflare et des centaines d'éditeurs l'ont adopté. Google et OpenAI n'ont pas encore annoncé de support officiel, mais leurs crawlers le lisent déjà.

Le pari : devenir l'équivalent du robots.txt pour les moteurs IA. Et comme tout standard émergent en SEO, les premiers à le déployer prennent l'avantage.

Ce guide t'explique ce qu'est llms.txt, comment il diffère de robots.txt, ce qu'il faut mettre dedans, et comment le déployer sur ton site en moins d'une heure. Avec un exemple concret : celui qu'on vient de poser sur seaudit.fr/llms.txt.

C'est quoi llms.txt, en une définition

llms.txt est un fichier markdown public placé à la racine d'un site (https://exemple.com/llms.txt), qui résume la proposition de valeur, les pages clés et les ressources d'un site dans un format optimisé pour la consommation par des grands modèles de langage (LLM : ChatGPT, Claude, Perplexity, Gemini, Mistral, Llama, etc.).

C'est un manifeste éditorial pour les IA, à l'opposé du robots.txt qui dit aux crawlers ce qu'ils peuvent / ne peuvent pas crawler. llms.txt dit : « voilà ce qu'on fait, voilà où regarder en premier, voilà comment nous citer correctement ».

La spec est portée par llmstxt.org, maintenue par Jeremy Howard et la communauté.

Pourquoi maintenant : la fenêtre temporelle

Le moment est rare en SEO : un standard utile, simple, avec peu d'adoption en France. Concrètement à mai 2026 :

  • <3 % des sites français du top 10 000 ont un llms.txt valide (relevé manuel sur l'index Majestic, mai 2026).
  • Les sites qui en ont un voient une citation +18 % en moyenne sur Perplexity dans les 60 jours suivant la mise en ligne (étude Profound, mars 2026).
  • ChatGPT et Claude lisent llms.txt avant de crawler le reste du site quand il existe — donc l'effort de citation est concentré sur ton manifeste.

Traduction : le terrain est libre. Si tu poses ton llms.txt cette semaine, tu prends de l'avance sur 97 % de tes concurrents.

llms.txt vs llms-full.txt : la nuance utile

La spec définit deux fichiers, qui ont des rôles différents :

FichierContenuQuand l'utiliser
/llms.txtIndex markdown court (1 à 3 pages) : pitch + liens vers les pages clésToujours. C'est l'entrée du site pour les LLM.
/llms-full.txtContenu markdown condensé de plusieurs pages clés en un seul fichierOptionnel mais recommandé. Permet au LLM de tout charger sans avoir à crawler N URLs.

Pense à llms.txt comme à un sommaire et à llms-full.txt comme au livre. Les deux sont servis en text/plain ou text/markdown (peu importe en pratique, le markdown reste lisible).

La spec en 4 sections

Voici la structure officielle de llms.txt :

# Nom du projet

> Brève description (blockquote, une à deux phrases)

Paragraphes d'introduction libres (facultatif).

## Section 1

- [Titre de la page](https://url.com/page): courte description.
- [Autre page](https://url.com/autre): courte description.

## Optional

- [Ressources additionnelles](https://...): non critiques.

Les règles clés :

  • H1 unique = nom du projet.
  • Blockquote juste après = pitch en une phrase. C'est ce que le LLM extraira en priorité.
  • H2 = sections logiques (Documentation, Pages produit, API, Légal, etc.).
  • Liste de liens par section, format markdown standard.
  • Section Optional en bas pour les ressources accessoires (le LLM peut les ignorer s'il a un budget de contexte limité).

Tu peux mettre autant de H2 que tu veux. Reste sous 5 000 mots pour rester confortable dans la fenêtre de contexte des LLM consommateurs.

Un exemple concret : seaudit.fr/llms.txt

Voici ce qu'on a posé sur SeAudit, légèrement annoté :

# SeAudit

> Audit SEO + GEO automatisé. Note /100 gratuite sur 5 axes (technique,
> contenu, GEO/visibilité IA, performance, confiance) en 30 secondes.
> Audit complet PDF actionnable (Top 10 d'actions + plan 30/60/90 jours)
> livré sous 48-72 h à partir de 97 €.

SeAudit est édité par Tesseract SA (société suisse). Différenciation par le
**GEO** (Generative Engine Optimization) : optimisation pour ChatGPT, Claude,
Perplexity, Gemini et Google AI Overviews — en plus du SEO Google classique.

## Pages clés

- [Home FR](https://seaudit.fr/fr): Note /100 gratuite + commande de l'audit complet.
- [Commander un audit](https://seaudit.fr/fr/audit): Formulaire de commande Stripe.
- [FAQ 100 Q/R](https://seaudit.fr/fr/faq): 100 questions et réponses structurées.
- [Blog](https://seaudit.fr/fr/blog): Articles SEO + GEO pour 2026.

## Méthode d'audit

- 5 axes notés sur 100 : technique (25), contenu (20), GEO/IA (25),
  performance (20), confiance (10).
- Top 10 d'actions priorisé par impact × effort.
- Plan 30/60/90 jours.
- Garantie satisfait ou remboursé sous 14 jours.

## Optional

- [llms-full.txt](https://seaudit.fr/llms-full.txt): contenu condensé.
- [sitemap.xml](https://seaudit.fr/sitemap.xml): URLs indexables.

Tu peux le consulter en vrai : seaudit.fr/llms.txt.

Les choix qu'on a faits :

  • Pitch en blockquote qui couvre les 3 dimensions clés (produit, prix, délai). Si Claude extrait ces 3 lignes pour répondre à « c'est quoi SeAudit ? », on est cités correctement.
  • 6 pages clés, pas plus. Au-delà, le LLM dilue.
  • Section méthode parce que c'est notre différenciation factuelle. Les chiffres (5 axes, /100, 48-72 h) sont citables tels quels.
  • Section Optional pour les fichiers techniques (sitemap, llms-full) — utile pour les crawlers IA avancés, ignorable par les LLM consommateurs.

Comment le déployer en 30 minutes

Trois méthodes selon ta stack.

Option 1 — Site statique (Next.js, Astro, Hugo, Eleventy)

Crée un fichier public/llms.txt (ou static/llms.txt selon le framework). Pousse en prod. Le serveur le servira directement avec le bon MIME type text/plain. C'est ce qu'on a fait sur SeAudit (Next.js).

Ajoute aussi public/llms-full.txt si tu veux la version étendue.

Option 2 — WordPress / CMS

Deux options :

  • Plugin : « LLMs.txt for WordPress » ou « SEO Framework LLMs.txt » génèrent le fichier dynamiquement à partir de tes paramètres SEO. Installation en 5 minutes.
  • Manuel : crée un fichier llms.txt à la racine de ton dossier WordPress (via FTP/SFTP/cPanel). Marche aussi.

Option 3 — Shopify / Webflow / Wix

Plus complexe parce que tu ne contrôles pas la racine. Solutions :

  • Cloudflare Workers devant ton site : intercepte /llms.txt et sert le contenu depuis une variable d'environnement.
  • Redirect 302 vers une URL hébergée ailleurs (GitHub Pages, gist). Moins propre mais ça marche pour le démarrage.

Comment vérifier qu'il marche

Quatre tests rapides :

  1. Fetch HTTP direct : curl -I https://ton-site.com/llms.txt doit retourner 200 et un content-type text-friendly.
  2. Validateur communautaire : colle ton URL sur llmstxt.org/parser (parser officiel) pour vérifier la structure.
  3. Test ChatGPT / Claude : ouvre ChatGPT, demande « lis ce fichier https://ton-site.com/llms.txt et résume-le ». Si le résumé est fidèle = c'est bien lu.
  4. Suivi des citations : sur Profound, Otterly ou Goodie AI, surveille l'évolution des citations sur ton domaine dans les 30 jours suivants.

llms.txt vs robots.txt : la confusion fréquente

Les deux fichiers vivent à la racine. Les deux concernent les crawlers. Mais ils ne disent pas du tout la même chose :

robots.txtllms.txt
Public cibleCrawlers HTTP (Googlebot, GPTBot, etc.)LLM lecteurs (Claude, ChatGPT, Perplexity)
TonDirectif : « tu peux » / « tu peux pas »Éditorial : « voilà ce qu'on fait »
FormatSyntaxe propriétaire (User-agent, Allow, Disallow)Markdown standard
Influence sur l'indexationForte (gates le crawl)Indirecte (oriente les citations)
Conflit possibleSi Disallow un bot IA, il ne lira pas non plus llms.txt

Les deux sont complémentaires. Le robots.txt ouvre la porte aux crawlers IA (GPTBot, PerplexityBot, ClaudeBot, Google-Extended, OAI-SearchBot). Le llms.txt leur dit, une fois entrés, par où commencer.

Si tu fais l'un sans l'autre, tu perds 50 % de la valeur.

5 pièges à éviter

  1. Mettre 50 liens dans llms.txt. Le LLM dilue. Vise 6-12 liens max par section, et 3-5 sections.
  2. Faire un blockquote vague. « Une startup innovante qui révolutionne le X » n'est pas citable. Mets des chiffres, un délai, un prix. Du factuel.
  3. Oublier d'updater quand le site évolue. Tes pages clés bougent ; llms.txt doit suivre. Ajoute une revue trimestrielle au calendrier.
  4. Servir le fichier en HTML au lieu de markdown. Le serveur doit retourner text/plain ou text/markdown. Pas text/html (Next.js fait ça correctement par défaut sur /public/).
  5. Bloquer les crawlers IA dans robots.txt. Si tu Disallow GPTBot, tu coupes la branche sur laquelle tu poses ton llms.txt. Vérifie d'abord ton robots.txt.

FAQ — llms.txt

Est-ce que Google lit llms.txt ?

Officiellement, non — pas encore. Google n'a pas annoncé de support. En pratique, Googlebot crawle le fichier comme n'importe quel autre, et il est probable que les signaux extraits alimentent indirectement Gemini et les AI Overviews. Aucun risque à le mettre, des bénéfices probables à court terme.

Le llms.txt remplace-t-il le robots.txt ?

Non, ils sont complémentaires. robots.txt régule l'accès au crawl. llms.txt éditorialise le contenu pour les LLM. Garde les deux, et fais-les cohabiter (le robots.txt doit autoriser les crawlers IA pour que ton llms.txt soit lu).

Faut-il un llms.txt pour un site e-commerce ?

Oui, surtout pour les catégories et les pages corporate. Liste tes catégories produits principales, ta page « à propos », tes guides d'achat. Évite de lister 10 000 fiches produits — pour ça, le sitemap fait le job.

Combien de temps pour voir un impact ?

Sur Perplexity : généralement moins de 14 jours (re-crawl fréquent). Sur ChatGPT search : 2 à 6 semaines. Sur Claude : variable, dépend des contextes de recherche. Sur AI Overviews Google : indirect et lent, compte 2 à 3 mois.

Faut-il une version par langue ?

Spec officielle : un seul llms.txt à la racine, multilingue si nécessaire. En pratique, tu peux mettre tes liens FR et EN dans le même fichier, ou faire deux variantes llms.fr.txt et llms.en.txt (non standard mais lisible par les LLM).

Combien de temps pour rédiger un bon llms.txt ?

45 minutes pour un site simple si tu connais bien ton produit. 2-3 heures si tu pars d'une feuille blanche et que tu dois clarifier ton pitch en même temps. C'est l'exercice qui révèle souvent que ton pitch est flou — bénéfice secondaire utile.

Et si je n'ai pas envie d'être cité par les IA ?

Alors mets un robots.txt qui Disallow les crawlers IA (GPTBot, ClaudeBot, PerplexityBot, Google-Extended, OAI-SearchBot, anthropic-ai). Et ne mets pas de llms.txt. Note que tu te coupes d'un canal d'acquisition important — choix défendable mais à assumer.

À retenir

  • llms.txt est un manifeste markdown à la racine du site, conçu pour orienter les LLM vers tes pages clés. Spec : llmstxt.org.
  • Moins de 3 % des sites FR top 10 000 l'ont déployé en mai 2026. Fenêtre temporelle pour prendre de l'avance.
  • Structure : H1 nom + blockquote pitch + H2 sections avec liens + section Optional. Sous 5 000 mots.
  • Complémentaire à robots.txt : l'un gate le crawl, l'autre éditorialise pour les LLM.
  • Déployable en 30 minutes sur site statique, plus complexe sur Shopify/Webflow.
  • Mesure l'impact via citations sur Perplexity (~14 j) puis ChatGPT (~2-6 sem).

Tu veux savoir si ton llms.txt (et le reste de ta visibilité GEO) est bon ? Lance ton audit gratuit /100 — on note ton site sur 5 axes, dont la dimension GEO, en 30 secondes. Et si tu veux creuser, tous les articles GEO sont ici.