Indexation Google : pourquoi je ne trouve pas mon site WordPress ?

indexation google

Pourquoi votre site WordPress n’apparaît pas sur Google ? Vous avez mis tout votre cœur et votre énergie pour créer un beau site. Mais vos pages et articles restent invisibles sur les moteurs de recherche. Difficile dans ces conditions d’attirer des visiteurs. Pour générer du trafic organique, vous devez indexer votre contenu web. Sans indexation Google, votre site ne sera pas classé et personne ne le trouvera dans les résultats de recherche. Voyons ensemble le processus d’indexation, les raisons qui peuvent bloquer l’apparition de votre site web et comment y remédier.

Au secours, Google ne trouve pas mon site.
Je tape mes requêtes clés sur Google, Bing, Yahoo et les autres. Rien ! Nada. Le désert.
Mon site WordPress est carrément invisible dans les pages de résultats. Mais pourquoi ?

La raison peut être de deux ordres :

  1. Problème d’indexation : Les pages web n’ont pas été répertoriées par Google et consorts. Pour une raison à déterminer les bots n’ont pas visité le site et ignorent tout de son contenu. Ils ne peuvent donc pas les enregistrer sur leurs serveurs ni les proposer dans leurs résultats.
  2. Problème de positionnement : Les URL sont bien indexées par les moteurs de recherche, mais mal référencées, elles se positionnent très loin. Votre site ne peut pas être trouvé par les internautes ni vos (futurs) clients. Pour y remédier, il faudra améliorer votre SEO. Vous remonterez alors dans le classement et apparaitrez dans les premiers résultats Google. Notre article « structure optimisée d’une page web » partage les bonnes pratiques en matière de référencement naturel.

La première chose à vérifier est l’indexation des pages web par les robots. Nous parlerons ici principalement de Google qui représente à lui seul plus de 93 %  des recherches sur internet. De plus, les autres moteurs (Yahoo, Bing…) fonctionnent sur un modèle très similaire.

❔ Qu’est-ce que l’indexation ?

L‘indexation désigne le processus par lequel le robot d’un moteur de recherche parcourt un site, l’analyse, le répertorie et classe (indexe) les URL. Ces pages figurent alors dans l’index Google et pourront être affichées en réponse aux requêtes des internautes.

📑 Comment savoir si mon site est indexé sur Google ?

Il existe plusieurs méthodes pour vérifier si les pages d’un site figurent bien dans l’index Google.

> La commande « site »

indexation avec commande site

La vérification la plus rapide consiste à taper dans la barre de recherche la commande « site : nom de domaine.com » sans les www.
Par exemple => site:trouver-sa-formation.fr

Le résultat obtenu n’est pas le plus précis, mais il donne un ordre de grandeur.

  • Si vous obtenez un nombre de pages répertoriées, le site est bien référencé.
  • Si les résultats affichent «zéro», le site est inconnu.

> La commande « inurl »

indexation avec commande inurl

Pour vérifier si une page particulière est connue de Google, tapez :
« inurl + nom de domaine/slug d’URL ».

Exemple :
inurl:trouver-sa-formation.fr/formation-entrepreneuriat/

> La commande « cache »

indexation avec commande cache

Comment savoir à quand remontent les données affichées ?
En cliquant sur le cache (le triangle renversé en bout d’URL), vous connaîtrez la date du dernier passage de Googlebot.

Un message indique alors :
«Ceci est le cache Google de www.nom de domaine.com. Il s’agit d’un instantané de la page telle qu’elle était affichée le 17 juillet 2022 23:45:33 GMT. La page actuelle peut avoir changé depuis cette date. En savoir plus.»

> Analyse du site dans Google Search Console

Pour vérifier l’indexation dans la Search Console, allez dans le rapport « Indexation des Pages ». (anciennement « Couverture »). Il fournit une liste des URL :

  • indexées (avec les données des pages concernées) ;
  • non indexées (avec un listing énumérant les raisons détaillées).

Cet outil est très utile pour tester les URL,  faire remonter des problèmes techniques et identifier des améliorations potentielles.

⚠️ Attention, Google ne donne accès qu’aux mille premières URL. Au-delà, il fournit un échantillon représentatif.

indexation des pages GSC

> Investigation sur une URL précise dans la Search Console

Depuis le menu « pages », on peut également vérifier l’indexation d’une page en particulier. Il suffit de taper l’URL recherchée dans la barre tout en haut de la page. Si la page revient « non indexée », cliquez sur « demander une indexation ».

inspection indexation sur google search console

> Les outils de crawl

Vous pouvez également lancer le crawl du site avec des outils tels que Xenu ou Screaming Frog SEO Spider. Ils vous informent sur le nombre de pages connues des moteurs. Il est alors intéressant de les comparer avec les résultats obtenus par la Search Console.

outil de crawl pour indexation

🤖 Comment fonctionnent les robots crawlers de Google ?

Même si vous n’informez pas Google de la mise en ligne de votre site, ses robots finiront par le trouver. Imaginez : un bot est comme un internaute fou qui clique sur tous les liens qu’il croise. Googlebot crawle ainsi jusqu’à vingt milliards de sites par jour et toujours selon le même procédé.
Voici les 4 phases du processus d’indexation :

  1. La découverte : le robot arrive sur le site en suivant des liens entrants en provenance d’autres domaines (backlinks) ou en crawlant une liste d’URL issue d’un plan de site (sitemap) ;
  2. L’exploration (ou crawl) : Googlebot explore tout ce que comporte la page. Il analyse les contenus textuels, les médias, etc. avant de la télécharger ;
  3. Le traitement : le robot décortique la page pour en comprendre le sens, le contexte, l’intention, les balises de titres, les attributs d’images, etc. L’URL est prête à être indexée.
  4. L’indexation : les informations extraites sont répertoriées et classées dans d’immenses bases de données (les data centers). Les nouvelles URL seront potentiellement positionnées dans les résultats de recherche afin d’apporter des réponses pertinentes aux requêtes des internautes.

❔ Pourquoi demander à Google d’indexer vos URL ?

Avec ou sans déclaration préalable, le processus global d’indexation va rester le même. Mais le fait de soumettre votre site aux moteurs de recherche va raccourcir le délai d’exécution de la procédure. Google sera prévenu que de nouvelles pages sont disponibles. Les robots iront les scanner et les répertorier. Vous obtiendrez plus rapidement le résultat final : la possibilité de voir vos pages apparaître sur internet.

📝 Comment soumettre son site WordPress aux moteurs de recherche ?

> Trouver le plan de site

Installez un outil SEO gratuit tel que Rank Math SEO* sur votre site WordPress.

Dans votre admin WordPress, allez dans « Extensions + Ajouter ». Tapez le mot-clé « Rank Math ». Le plugin apparaît en première position.
Cliquez sur « Installer maintenant », puis sur « Activer ».  Il est prêt à fonctionner.

Il crée automatiquement un plan de site (sitemap). Vous le trouverez dans l’onglet « Réglages du plan de site ». 

Votre plan de site s’affiche toujours à l’adresse :
https://votre-site.fr/sitemap_index.xml

plan de site rank math

> Soumettre le plan de site sur la Search Console

Il existe plusieurs méthodes pour informer Google de la mise en ligne d’un nouveau contenu ou d’une modification. Soumettre un sitemap à la Search Console reste le moyen le plus efficace.

  1. Connectez-vous à la Google Search Console ;
  2. Sélectionnez la propriété concernée ;
  3. Cliquez sur > Index > Sitemaps ;
  4. Complétez l’URL dans «Ajouter un sitemap» ;
  5. Envoyez.
ajout sitemap search console

> L’indexation instantanée de Rank Math SEO

Rank Math SEO vous permet de soumettre directement vos URL à Google et Bing en utilisant l’API d’indexation. Ce protocole permet la soumission instantanée des pages à tous les moteurs participants.

Pour cela, vous devez d’abord paramétrer Rank Math pour le connecter aux services de Google. Vérifiez que le bouton bleu (« Activer l’onglet état de l’index ») soit bien activé.

connecter search console avec rank math

Puis, vérifiez que le plan de site soit bien activé ainsi que « inclure les images ».
Il vous reste à sélectionner le type de publications que vous souhaitez inclure. Dans les pages « Articles, Pages… », activez le bouton « Inclure dans le plan de site.

publications à indexer

En bas de la page générale, cochez la case « Notifier les moteurs de recherche ». Cela permet de pinger automatiquement Google ou Bing à chaque modification de votre plan de site.

notifier les moteurs de recherche

Vous pourrez ensuite envoyer jusqu’à 100 URL en une seule fois. Une clé API est générée automatiquement par le logiciel SEO et servie aux robots.

indexation instantanée

⏱️ Quel est le délai d’indexation des moteurs de recherche ?

Google déclare que « le crawl d’un site peut varier de quelques jours à quelques semaines ».

De mon côté, j’ai constaté que certains textes sont bien indexés en quelques heures tandis que d’autres doivent patienter plusieurs semaines (en particulier les jeunes sites).

En règle générale, l’indexation de sites est devenue beaucoup plus stricte ces derniers mois (sans parler des bugs !) et les délais se voient grandement allongés. Peut-être avez-vous déjà reçu cette réponse de Google : « page détectée, actuellement non indexée » ? Rassurez-vous, vous n’êtes pas seul dans ce cas.

Google lui-même parle de « problème persistant d’indexation » :

probleme d'indexation

📋 Pourquoi vos pages web ne figurent-elles pas dans l’index Google ?

Google modifie actuellement ses méthodes d’exploration et d’indexation. Son objectif est de limiter le spam et de proposer aux lecteurs des réponses cohérentes avec leurs recherches.

> L’avis de John Mueller, Webmaster Trends Analyst chez Google

«It's normal for pages of a site to not be indexed.»
(Il est normal que des pages d'un site ne soient pas indexées).

Google ne garantit pas de répertorier toutes les pages.

Lors d’une session au Google Seo Office-Hours, John Mueller considère qu’il est normal que 20 % d’un site ne soit pas indexé. Ainsi des URL sont découvertes mais non explorées. Les raisons peuvent être multiples.

John Mueller confirme cependant la forte influence de la qualité globale d’un site sur son indexation. Cet aspect est le plus important pour amener Google à référencer et positionner rapidement une page.

> La jeunesse du site

De l’avis majoritaire des référenceurs, un jeune site sera plus long à être indexé qu’un autre ayant déjà une certaine autorité. Google, bien qu’il le nie, va attendre d’obtenir des garanties quant à la qualité du contenu produit afin d’écarter les sites de spam. C’est l’effet Google Sandbox. Mon article sur « le bac à sable de Google » détaille la conduite à tenir pour éviter la quarantaine promise aux nouveaux venus.

> Le budget crawl

Les robots crawlers ne parcourent pas l’intégralité des gros sites, ceux qui affichent plusieurs milliers de pages. Par contre, ils leur attribuent un « budget crawl », c’est-à-dire un quota de pages à explorer en fonction de :

  • leur PageRank ;
  • la qualité du contenu ;
  • la performance du serveur ;
  • la fréquence de mise à jour ;
  • etc.

Les pages non crawlées ne seront donc pas indexées par les moteurs de recherche.

> Les raisons techniques de non indexation

* La balise meta robots pour empêcher l’indexation

La balise meta robots indique aux bots comment se comporter.

  • Un attribut « index » autorise l’indexation de la page.
  • Un attribut « noindex » demande à Google de ne pas indexer ce contenu. Cette URL peut néanmoins être crawlée.

*Le fichier robots.txt pour bloquer le crawl

Ce fichier, situé à la racine de votre site, permet d’empêcher le crawl. Il indique aux robots les pages qu’ils peuvent explorer et celles qui sont interdites. Il est souvent utilisé pour suspendre l’exploration de certaines zones du site. Il ne peut toutefois pas bloquer l’indexation.

*Le fichier .htaccess

Ce fichier sert à protéger l’accès de votre site par un mot de passe. Google n’étant pas capable de contourner cet obstacle, il ne pourra pas indexer les pages ainsi sécurisées.

*L’URL canonique

Une URL canonique définie pour une page B indique à Google de ne pas tenir compte de la page A, mais d’aller voir la page B. Votre page A ne sera donc pas répertoriée.

Cette balise canonique est souvent utilisée sur les sites e-commerce. Lorsque des pages d’articles sont très proches, voire répétitives (par exemple T-shirt blanc, T-shirt rouge, etc…) on va désigner une seule page de la série à indexer. Et toutes les autres couleurs renverront sur cette page dite « canonique » qui sera donc la seule indexée par les moteurs.

*Le blocage sur WordPress

Avez-vous bloqué la visibilité de votre site pendant sa période de préproduction ? Parfois il arrive que, dans les réglages WordPress, la case « demander aux moteurs de recherche de ne pas indexer ce site » reste cochée… Pensez à le vérifier.

✔️ Quelles solutions face au problème d’indexation par Google ?

> Les conseils de John Mueller

Le représentant de Google donne lui-même un certain nombre de conseils afin d’accélérer l’indexation des pages. Il préconise de :

  • empêcher la surcharge du serveur web afin de réduire son temps de réponse initial ;
  • optimiser la vitesse de chargement du site (le robot Google n’aime pas attendre) ;
  • travailler efficacement les liens internes pour faciliter l’accès aux nouvelles pages ;
  • empêcher l’exploration des pages inutiles ou de faible qualité qui gaspillent le budget crawl ;
  • soumettre des plans de site XML auprès de Google Search Console ;
  • améliorer la qualité de son contenu et du site, ce qui est fondamental pour Google.

> Les outils pour forcer l'indexation

Il existe différents outils avec des modes opératoires pas toujours 100 % bio pour forcer l’indexation.
Je ne vous parlerai que de IndexMeNow*, car je l’utilise moi-même.
Cet un outil payant a été créé par un référenceur français Stéphane Madaleno pour apporter une solution aux problèmes d’indexation de Google.
Il utilise un processus interne sans « effets indésirables » côté SEO.
Il fonctionne sans abonnement.
Il propose trois packs de crédits à validité illimitée. Le coût de revient est de 0.82$ par URL avec le forfait de base.

Voici la promesse d’IndexMeNow

  • 80 % des pages indexées en 24 heures ;
  • 90 % en 48 heures ;
  • 96-100 % d’ici 10 jours ;
  • chaque URL non indexée sous 10 jours est entièrement recréditée.

Voilà ce que j’ai pu constater avec la soumission de mes propres pages :

  • Toutes les URL de petits sites ayant un an ou plus d’existence ont été indexées sous 24 à 36 heures.
  • Un nouveau site de 19 pages a vu 10 pages indexées en 24 heures, 8 autres le 2e jour et la dernière m’a été recréditée.
  • Une URL est revenue en « non indexable » suite à une erreur d’URL canonique (de ma part). Elle m’a été recréditée immédiatement. Après rectification, je l’ai à nouveau soumise et elle a été indexée le lendemain.

Côté SEO, je n’ai relevé aucun problème. Tous mes articles sont bien positionnés sur Google. IndexMeNow est garanti sans spams ni backlinks douteux (je n’en ai eu aucun).

Si, vous aussi, vous avez des difficultés à faire indexer vos pages cet outil peut vous éviter une crise de nerf !

🎁 Bonus : code promo IndexMeNow

Les problèmes d’indexation peuvent s’avérer préjudiciables pour votre site WordPress : pas d’indexation Google, pas de trafic naturel !
J’espère que ce tuto vous aura éclairé sur les différentes solutions à mettre en œuvre pour être visible dans les résultats de recherche.
Et vous, quelle technique d’indexation utilisez-vous pour votre site WordPress ? Partagez vos conseils en commentaires !

Cet article vous a plu ? 📌 Épinglez-le sur Pinterest pour le retrouver plus tard !

logo pinterest
indexation sur moteur de recherche
indexation site web

Envie d'en savoir davantage sur les sites DIY et la visibilité web ?

Peut-être aimerez-vous aussi ces articles :

bac à sable google

Comment éviter le bac à sable Google ?

Le bac à sable Google existe-t-il toujours ? Comment l'éviter ou pouvoir en sortir ?...

structure optimisée d'un article de blog

Structure optimisée d'un article de blog

17 conseils pour rédiger un article que vos lecteurs adoreront et Google aussi...

Wordpress org Vs WordPress com : que choisir pour son site

WordPress .org ou .com ?

Vous voulez créer un site web professionnel ? Quel WordPress choisir ? .com ou .org ?...

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Retour en haut