SEO (Search Engine Optimization)
Discipline qui optimise la visibilité d'un site dans les moteurs de recherche traditionnels.
Le Search Engine Optimization regroupe les techniques d'optimisation on-page (contenu, structure, vitesse), technique (crawl, indexation, schemas) et off-page (backlinks, mentions). Né au début des années 2000, le SEO reste fondamental même à l'ère du GEO : les LLM s'appuient en partie sur l'index Google pour leurs réponses, et un bon SEO renforce le GEO. Les deux disciplines sont complémentaires, pas concurrentes.
Crawl / Crawler
Processus par lequel un robot parcourt automatiquement les pages d'un site pour les analyser.
Le crawl désigne la visite automatisée des pages web par un robot (crawler ou spider). Googlebot pour Google, Bingbot pour Bing, GPTBot pour ChatGPT — chaque moteur a ses crawlers. Le crawl est la première étape : sans crawl, pas d'indexation, pas de visibilité. Le fichier robots.txt contrôle quels crawlers peuvent accéder à quelles parties du site.
Indexation
Inclusion d'une page dans la base de données interrogeable d'un moteur de recherche.
Après le crawl, le moteur indexe la page : il l'analyse, en extrait les mots-clés, les entités et les signaux de pertinence, puis l'ajoute à son index. Seules les pages indexées peuvent apparaître dans les résultats. Une page peut être crawlée mais non indexée (filtrée pour duplicate content, low quality, noindex…). Google Search Console permet de suivre le ratio pages découvertes / indexées.
Canonical URL
URL officielle déclarée pour une page, quand plusieurs URLs servent un même contenu.
La balise <link rel="canonical" href="..."> indique aux moteurs quelle URL est la version canonique d'une page, quand plusieurs URLs renvoient un contenu identique ou similaire (versions HTTP/HTTPS, avec/sans www, paramètres URL, tracking…). Un canonical mal configuré entraîne du duplicate content et de la dispersion d'autorité. C'est l'un des fondamentaux SEO les plus souvent mal implémentés.
Sitemap XML
Fichier listant les URLs d'un site, soumis aux moteurs pour faciliter l'indexation.
Un sitemap XML est un fichier au format XML qui liste les pages d'un site, avec optionnellement leur date de mise à jour, leur priorité et leur fréquence de changement. Il aide les crawlers à découvrir rapidement toutes les pages d'un site, surtout pour les sites volumineux ou peu maillés. Le sitemap est déclaré dans le robots.txt et soumis manuellement à Google Search Console et Bing Webmaster Tools.
Robots.txt
Fichier placé à la racine d'un site qui indique aux crawlers quelles pages crawler ou non.
Le fichier /robots.txt est lu par tous les crawlers respectueux du protocole d'exclusion (REP). Il contient des directives User-agent (à qui s'adresse la règle) et Allow / Disallow (ce qui est permis ou interdit). Il peut aussi déclarer la position du sitemap. Important : robots.txt ne garantit pas la non-indexation (un crawler malveillant peut l'ignorer) — pour cela, utiliser noindex dans la balise meta robots.
Meta description
Résumé d'une page affiché sous le lien dans les résultats de recherche.
La balise <meta name="description" content="..."> fournit aux moteurs un résumé de la page. Google ne l'utilise pas comme facteur de ranking direct, mais elle est souvent affichée telle quelle dans les SERP, ce qui impacte fortement le CTR. Longueur optimale : 120 à 160 caractères (au-delà, troncature dans les résultats). Une meta description bien rédigée est cruciale pour le AEO/GEO : les LLM s'en servent comme indication forte sur le sujet de la page.
Title tag
Titre de la page tel qu'affiché dans l'onglet du navigateur et dans les résultats de recherche.
La balise <title> est l'un des signaux SEO les plus importants : c'est le titre principal de la page dans les SERP. Longueur optimale : 50 à 60 caractères (au-delà, troncature). Doit contenir le mot-clé principal et inciter au clic. Pour le GEO, un title clair aide les LLM à comprendre et à mentionner correctement la source.
Headings H1, H2, H3
Balises HTML hiérarchisant les titres et sous-titres d'une page.
Les balises <h1> à <h6> structurent le contenu d'une page selon une hiérarchie : <h1> est le titre principal (un seul par page), <h2> les grandes sections, <h3> les sous-sections, etc. Cette hiérarchie aide les crawlers SEO ET les LLM à comprendre la structure logique de l'information. Un bon outline (plan H1>H2>H3) est l'un des prérequis du AEO.
Backlink
Lien hypertexte pointant d'un site externe vers votre site.
Un backlink (ou lien retour) est un lien externe qui pointe vers une page de votre site. Le nombre, la qualité et la diversité des backlinks constituent l'un des signaux historiques majeurs du SEO (cœur du PageRank originel de Google). Pour le GEO, les backlinks restent importants : les LLM s'appuient en partie sur l'autorité externe d'un site pour décider de le citer.
Anchor text
Texte cliquable d'un lien hypertexte, visible par l'utilisateur.
L'anchor text est le texte affiché d'un lien (ex : « cliquez ici », « notre guide GEO », le nom de la marque). Pour le SEO, la variété des ancres pointant vers une page envoie un signal sémantique aux moteurs sur le sujet de la page cible. Une suroptimisation d'ancres exactes (toutes identiques au mot-clé) peut être pénalisée. Le mix recommandé : 15 % exactes, 20 % partielles, 25 % marque, 20 % descriptives, 10 % URL nue, 10 % génériques.
Domain Authority (DA)
Score (0-100) attribué à un domaine pour estimer son autorité SEO globale.
La Domain Authority est une métrique tierce (créée par Moz, avec des équivalents : Domain Rating de Ahrefs, Trust Flow de Majestic) qui agrège la qualité et la quantité des backlinks pointant vers un domaine. Score entre 0 et 100, échelle logarithmique. Aucun lien officiel avec le PageRank Google, mais corrélation observée. Pour le GEO, l'autorité de domaine reste un signal important (un LLM cite plus volontiers un site reconnu).
Core Web Vitals (LCP, INP, CLS)
Métriques de performance Google mesurant l'expérience utilisateur réelle.
Les Core Web Vitals sont 3 indicateurs Google : LCP (Largest Contentful Paint, vitesse d'affichage du contenu principal, cible < 2,5 s), INP (Interaction to Next Paint, réactivité aux clics, cible < 200 ms) et CLS (Cumulative Layout Shift, stabilité visuelle, cible < 0,1). Facteur de ranking confirmé depuis 2021. Une page rapide est mieux indexée, mieux notée et mieux exploitée par les LLM.
Schema.org / JSON-LD
Vocabulaire structuré standardisé pour décrire le contenu d'une page de manière machine-lisible.
Schema.org est un vocabulaire ouvert co-développé par Google, Microsoft, Yahoo et Yandex, qui définit des types (Article, Person, Product, FAQPage, LocalBusiness, Organization…) et leurs propriétés. Il est généralement implémenté en JSON-LD (JavaScript Object Notation for Linked Data), inséré dans un <script type="application/ld+json"> dans le <head>. Les schémas sont essentiels pour le AEO, le GEO et l'obtention de rich results dans Google.
Structured data
Données contextuelles ajoutées à une page selon un format normalisé.
Les structured data transforment du contenu HTML en information machine-lisible. Un article peut ainsi déclarer son auteur, sa date de publication, son temps de lecture, ses entités associées, ses sources… Les structured data sont la matière première des LLM modernes : ils s'en servent pour comprendre QUI dit QUOI, QUAND et avec quelle AUTORITÉ. Sans schemas riches, un site est invisible aux yeux des moteurs IA.
SERP (Search Engine Results Page)
Page de résultats affichée par un moteur de recherche en réponse à une requête.
La SERP est la page que Google (ou Bing, ou DuckDuckGo) affiche en réponse à une requête. Elle contient les 10 résultats organiques classiques, mais aussi de plus en plus d'éléments dynamiques : AI Overview, Featured Snippet, People Also Ask, Knowledge Panel, ads, images, vidéos, local pack… La structure de la SERP varie selon le type de requête (informationnelle, transactionnelle, navigationnelle).
Long tail keywords
Requêtes longues et spécifiques, moins concurrentielles mais à fort taux de conversion.
Les long tail keywords sont des expressions de 4 mots et plus, très spécifiques (ex : « meilleur consultant GEO pour PME à Lyon » vs « consultant GEO »). Chaque requête a un volume faible mais le cumul représente souvent la majorité du trafic. Les long tails sont particulièrement adaptées au GEO car les utilisateurs formulent leurs prompts en langage naturel, donc long.
Search intent
Objectif réel d'un utilisateur derrière sa requête de recherche.
Le search intent désigne ce que l'utilisateur cherche vraiment à accomplir. 4 catégories classiques : informationnelle (chercher de l'info), navigationnelle (aller sur un site précis), commerciale (comparer avant achat) et transactionnelle (acheter). Optimiser pour l'intent — et pas seulement le mot-clé — est aujourd'hui essentiel : un site qui répond bien à l'intent ranke mieux et obtient plus de citations IA.