promto
SEO

SEO technique : Pourquoi le code de votre site peut bloquer vos robots Google

Promto.be
7 min
SEO technique : Pourquoi le code de votre site peut bloquer vos robots Google

Vous avez écrit le meilleur contenu du monde. Vous avez construit des backlinks de qualité. Vous avez optimisé chaque balise meta.

Mais Google ne voit rien. Votre site est invisible.

Pourquoi ? Parce que votre code bloque Google. Pas intentionnellement. Mais techniquement.

Voici les erreurs de code qui tuent votre SEO — et comment les corriger.

1. Le robots.txt bloquant

Le problème

Le fichier robots.txt dit aux robots ce qu'ils peuvent ou ne peuvent pas crawler.

❌ User-agent: *
❌ Disallow: /

Cette ligne interdit à TOUS les robots d'explorer votre site ENTIER. Votre site est invisible.

Comment ça arrive

  • Configuration par défaut d'un CMS
  • Erreur de copier-coller
  • Développeur qui oublie d'enlever après une phase de test
  • Plugin SEO mal configuré

Comment vérifier

Allez sur : votresite.be/robots.txt

Doit contenir :

✅ User-agent: *
✅ Allow: /
✅ Sitemap: https://votresite.be/sitemap.xml

Ne doit PAS contenir :

❌ Disallow: /
❌ Disallow: /blog/
❌ Disallow: /*.html$

Exception légitime

Vous pouvez bloquer des pages sans valeur SEO :

✅ Disallow: /admin/
✅ Disallow: /panier/
✅ Disallow: /recherche/

Mais ne bloquez jamais des pages que vous voulez voir indexées.

2. La balise noindex

Le problème

<meta name="robots" content="noindex" />

Cette balise dit à Google : "N'indexe pas cette page."

Comment ça arrive

  • CMS en mode "maintenance" qui ajoute noindex
  • Plugin SEO qui met noindex sur toutes les pages par défaut
  • Environnement de staging poussé en production
  • Copier-coller d'un template avec noindex

Comment vérifier

Dans le <head> de chaque page importante, vérifiez :

❌ <meta name="robots" content="noindex, nofollow">
✅ <meta name="robots" content="index, follow">

Ou simplement : absence totale de balise meta robots (index, follow est le défaut).

Outil rapide

Extension Chrome "SEO Meta in 1 Click" affiche le status index/noindex de chaque page.

3. Le canonical incorrect

Le problème

La balise canonical indique la version "officielle" d'une page quand plusieurs URLs mènent au même contenu.

❌ <link rel="canonical" href="https://votresite.be/page-inexistante" />

Si le canonical pointe vers une mauvaise URL, Google indexe la mauvaise page. Ou aucune.

Erreurs courantes

  • Canonical vers HTTP alors que le site est en HTTPS
  • Canonical vers www alors que le site est sans www
  • Canonical vers une 404
  • Canonical vers un autre domaine par erreur

Comment vérifier

✅ <link rel="canonical" href="https://votresite.be/page-actuelle" />

Le canonical doit pointer vers la page elle-même (self-referencing) ou vers la version canonique correcte.

4. Le JavaScript bloquant le rendu

Le problème

Googlebot exécute le JavaScript. Mais c'est coûteux. Il le fait en deux temps :

  1. Crawl initial : il lit le HTML brut
  2. Render : il exécute le JS (peut être retardé de jours ou semaines)

Si votre contenu principal est généré en JavaScript :

  • Google ne le voit pas au premier crawl
  • Il peut ne jamais le voir si le JS est trop complexe
  • Votre contenu n'est pas indexé

Exemples de problèmes

❌ <div id="content"></div>
❌ <script>document.getElementById('content').innerHTML = 'Mon contenu';</script>

Le contenu n'existe pas dans le HTML source. Il est injecté par JS.

Solution

  • SSR (Server-Side Rendering) : le contenu est dans le HTML dès le départ
  • SSG (Static Site Generation) : le HTML est pré-généré
  • Next.js : fait les deux nativement

Avec Next.js, votre contenu est dans le HTML. Google le voit immédiatement.

5. Le hreflang incorrect

Le problème

Sites multilingues : les balises hreflang indiquent les versions linguistiques alternatives.

❌ <link rel="alternate" hreflang="fr" href="https://votresite.be/page" />
❌ <link rel="alternate" hreflang="nl" href="https://votresite.be/page" />

Les deux pointent vers la même URL. Google est confus.

Solution

✅ <link rel="alternate" hreflang="fr" href="https://votresite.be/fr/page" />
✅ <link rel="alternate" hreflang="nl" href="https://votresite.be/nl/pagina" />
✅ <link rel="alternate" hreflang="x-default" href="https://votresite.be/fr/page" />

6. Le sitemap XML erroné

Le problème

Un sitemap mal formé ou incomplet empêche Google de découvrir vos pages.

Erreurs courantes :

  • URLs qui retournent 404
  • URLs avec des paramètres inutiles
  • Sitemap non soumis dans GSC
  • Sitemap avec des dates de modification fausses

Comment vérifier

  1. Allez sur votresite.be/sitemap.xml
  2. Vérifiez qu'il est bien formé (XML valide)
  3. Cliquez sur 5 URLs au hasard. Elles fonctionnent ?
  4. Dans GSC : Sitemaps > Vérifier le statut

7. Le temps de réponse serveur

Le problème

Si votre serveur met plus de 2 secondes à répondre, Googlebot abandonne ou réduit votre crawl budget.

Causes :

  • Serveur sous-dimensionné
  • Base de données lente
  • Plugins WordPress qui ralentissent tout
  • Pas de cache

Solution

  • Hébergement performant (Vercel, Netlify, ou VPS dédié)
  • Cache serveur (Redis, Varnish)
  • SSG pour éliminer le calcul serveur
  • Base de données optimisée (ou pas de base de données du tout)

8. Les redirections en chaîne

Le problème

/page-a → /page-b → /page-c → /page-d

Chaque redirection perd un peu d'autorité. Les chaînes longues ralentissent le crawl.

Solution

Redirigez directement de la source vers la destination finale.

✅ /page-a → /page-d

Comment auditer votre SEO technique

Checklist rapide

  • robots.txt n'a pas de Disallow: /
  • Pas de balise noindex sur les pages importantes
  • Canonical correct sur chaque page
  • Contenu visible dans le HTML source (pas uniquement en JS)
  • Sitemap XML valide et soumis
  • Hreflang correct (si multilingue)
  • Temps de réponse serveur < 500ms
  • Pas de chaînes de redirection
  • URLs canoniques dans le sitemap
  • HTTPS partout

Outils

OutilFonction
Google Search ConsoleErreurs d'indexation, couverture
Screaming FrogCrawl complet, audits techniques
PageSpeed InsightsVitesse, diagnostics
SitebulbAudit SEO technique visuel
SEO Meta in 1 ClickVérification rapide des balises

Notre approche chez Promto.be

Chaque site qu'on livre passe par un audit technique complet :

  • ✅ robots.txt optimisé
  • ✅ Aucune balise noindex indésirable
  • ✅ Canonicals auto-générés et corrects
  • ✅ HTML sémantique avec contenu visible
  • ✅ Sitemap XML automatique
  • ✅ Temps de réponse < 100ms (SSG)
  • ✅ Redirections gérées proprement

Le SEO technique n'est pas une option. C'est la fondation. Sans elle, tout le reste est vain.

Conclusion

Vous pouvez écrire les meilleurs articles du monde. Si Google ne peut pas les lire à cause d'un robots.txt bloquant ou d'un JavaScript qui cache le contenu, personne ne les verra.

Le SEO technique n'est pas glamour. Mais c'est la porte d'entrée. Si elle est fermée, tout le reste ne sert à rien.

Faites l'audit. Corrigez les erreurs. Puis concentrez-vous sur le contenu.

Auditez votre SEO technique

Votre projet

Envie d'un site qui performe ?

On discute de votre projet et on vous propose une solution adaptée à votre budget et vos objectifs.