Guide complet de REGEX sur Google Search Console
La Google Search Console, ou GSC, est un outil essentiel pour les spécialistes du référencement, leur permettant d'analyser en profondeur les performances d'un site web.
L'arrivée des expressions régulières, plus communément appelées REGEX, a révolutionné la manière d'extraire des données pertinentes sur le contenu et d'explorer de nouvelles pistes créatives.
La fonctionnalité REGEX était une amélioration très attendue pour l'analyse web. Elle offre la possibilité de filtrer des éléments spécifiques dans n'importe quelle URL, une tâche auparavant ardue, voire impossible.
Dans cet article, nous allons explorer les astuces et les techniques pour utiliser REGEX dans Google Search Console. Vous découvrirez également les différents ensembles d'opérateurs à combiner avec les codes REGEX afin d'obtenir l'interprétation souhaitée des données.
REGEX ou expression régulière : un aperçu
Google Search Console est un service entièrement gratuit mis à disposition des webmasters pour gérer les performances de leurs sites. Il fournit des rapports détaillés sur le taux de clics, les impressions, les clics🖱️ et le classement des mots-clés d'un site, des informations essentielles pour évaluer l'efficacité des stratégies de référencement.
Cependant, le filtrage des performances d'une URL présentait des limitations. GSC autorisait l'exportation d'un maximum de 1 000 lignes pour l'analyse. Il était uniquement possible de filtrer des sections spécifiques d'une URL, telles que le chemin, le domaine ou les préfixes. Les chaînes et variantes complexes restaient hors de portée.
L'introduction des expressions régulières ou REGEX représente un atout majeur pour GSC. L'objectif est de fournir aux experts SEO un outil plus performant pour analyser le fonctionnement et les performances d'un site web en utilisant la GSC.
REGEX permet d'explorer les détails importants du référencement d'un site en appliquant ces codes sur les pages ou les filtres de requête. Ces codes sont construits à partir de métacaractères entourant une chaîne liée au paramètre de filtrage. Lorsque vous entrez l'expression régulière dans le panneau, il affiche le résultat, que vous pouvez sauvegarder pour référence.
Avantages de l'utilisation de Regex sur GSC
L'objectif principal de l'utilisation de la Google Search Console est d'analyser un site web d'un point de vue technique. Les équipes SEO utilisent de nombreux outils et techniques pour élaborer des stratégies d'optimisation qui visent à améliorer le classement d'un site dans les moteurs de recherche et à générer du trafic📈.
REGEX offre un avantage supplémentaire en simplifiant la collecte de données pertinentes, qui peuvent être utilisées pour améliorer les plans d'optimisation. Voici ce qu'il est possible d'analyser grâce aux rapports Regex :
✨ En utilisant les codes Regex sur les requêtes, vous pouvez déterminer le volume de recherches pour des mots-clés ou des expressions spécifiques. Cela vous aide à générer de nouvelles idées de contenu pour votre blog et à augmenter le trafic.

✨ Les codes Regex sont un gain de temps considérable pour les référenceurs travaillant dans de grandes entreprises qui traitent d'énormes volumes de données web. Il suffit de quelques métacaractères et chaînes dans la syntaxe appropriée pour trier les requêtes ou les pages répondant à des critères spécifiques.
✨ Un de ses avantages majeurs est la possibilité de travailler sur des combinaisons précises de mots, de phrases et d'URL. Ces caractères doivent être placés dans un ordre correct afin de former un code Regex fonctionnel.
✨ Cela permet sans aucun doute d'obtenir de meilleures informations sur votre site, notamment les pages les plus performantes, les moins performantes et les tendances.

✨ Vous pouvez appliquer les codes Regex sur des rapports personnalisés afin de suivre le flux de trafic sur les pages web pour des requêtes particulières. Vous pouvez ensuite orienter votre équipe vers une direction spécifique.
Vous pouvez définir différentes combinaisons de caractères Regex pour créer un code et l'utiliser pour identifier une solution d'optimisation pour votre site web.
Où appliquer Regex sur Google Search Console ?
Pour utiliser la fonctionnalité Regex sur GSC, vous devez impérativement accéder à la propriété de votre site web. Cette condition est essentielle car vous ne pourrez pas l'utiliser pour l'analyse si vous ne l'avez pas enregistrée comme propriété dans Google Search Console.

Vous devez vous connecter à la Google Search Console avec votre identifiant Gmail et commencer par ajouter votre propriété en utilisant l'option disponible dans la barre latérale. La propriété est le site web dont vous êtes propriétaire ou pour lequel vous avez les autorisations d'accès sur la console.

Une fois que vous avez ajouté le site web ou l'URL concernée, le panneau vous demandera de le valider✅. La procédure de validation est détaillée dans la colonne et, une fois terminée, vous pouvez sélectionner votre propriété pour les étapes suivantes.

Sous le nom de la propriété listée, cliquez sur l'onglet « Performances » et appuyez sur le bouton « Nouveau » au-dessus du graphique pour accéder aux options de filtrage.

Vous pouvez ensuite choisir « Requête » ou « Pages » pour appliquer le code Regex et filtrer les résultats.
Explication des caractères Regex
Différents ensembles de caractères sont utilisés comme Regex dans le filtrage des requêtes et des pages sur Google Search Console. Chaque métacaractère a une signification distincte dans le filtre. Si vous les comprenez bien, il vous sera plus aisé d'effectuer une analyse sur GSC à l'aide de Regex.
Le tableau ci-dessous explique certains symboles et caractères utilisés dans le code Regex avec un exemple approprié :
| Caractères | Utilisation | Exemple |
| () | Ces parenthèses servent à regrouper des caractères ou des expressions, également appelés groupes de capture. | (Geek) |
| ^ | Le symbole caret ne correspondra qu’au mot ou à la phrase au début d’une chaîne. | ^Mobile |
| $ | Le symbole dollar ne correspondra qu’au mot ou à la phrase à la fin d’une chaîne. | Mobile$ |
| . | Un point est utilisé pour faire correspondre n'importe quel caractère unique dans une chaîne. | to. |
| \ | La barre oblique inverse est utilisée pour ignorer la signification littérale des caractères. | \d |
| [xyz] | Ce code RegEx fera correspondre la requête avec un ou tous ces caractères entre parenthèses ; x, y ou z. | Mobile[xyz] |
| [c-m] | Ce code RegEx fera correspondre la requête avec toute lettre minuscule ou majuscule comprise entre c et m. | Mobile[c-m] |
| [3-7] | Ce code RegEx correspondra à la requête avec des nombres compris entre 3 et 7. | Mobile[0-9] |
| [\w] | Cela fera correspondre chaque mot des pages Web avec les lettres « à » comme vers, dans, vers. | [\w]*Mobile[\w] |
| [\W] | Ce code Regex fera correspondre les pages contenant le mot « mobile » avec d’autres mots, que ce soit dans le titre, la méta ou l’article, comme téléphone mobile, application mobile. | [\W]*Mobile[\W] |
| | | Il s'agit d'un symbole OU simplement utilisé pour appliquer des choix dans le code. | Mobile|PC |
Vous pouvez créer une multitude de codes en combinant ces caractères pour filtrer les requêtes complexes sur GSC.
Regex spécifiques sur Google Search Console
Vous pouvez utiliser les métacaractères de Google Search Console afin de créer des modèles ou des codes uniques répondant à des objectifs spécifiques. En voici quelques-uns, que vous pouvez essayer sur votre portail GSC.
🔶 ^[\w\W\s\S]{70,}$
Séquentiellement, le code fera correspondre tous les mots, chiffres, caractères non-mots ou spéciaux, symboles, espaces blancs et lignes non blanches ou nouvelles sur la page. Tandis que le quantificateur « 70 » signifie que la chaîne est longue ou comporte au moins 70 caractères.
Exemple : Ces types de codes sont applicables pour vérifier les mots de passe, trier les listes de produits avec une description élaborée ou ailleurs.
🔶 (\w+\s){6,}\w+
Ce code Regex comporte trois sections. Il vise à faire correspondre des mots et des nombres avec des espaces entre eux. Par conséquent, le code récupérera les chaînes d’au moins 6 mots ou plus, comme cette phrase ; « Les chaînes d’au moins 6 mots ou plus. »
Exemple : Ces codes sont applicables au filtrage d'articles avec des titres plus longs, des commentaires plus longs sur les réseaux sociaux, etc.
🔶 ^(qui|quoi|où|quand|pourquoi|comment)[“ “]
Ce code Regex est simple et très bénéfique pour les blogueurs et les experts SEO. Il est facile de comprendre qu'il correspondra à toutes les requêtes des moteurs de recherche commençant par l'un de ces mots ; qui, ou quoi, ou où, et autres entre parenthèses. La chaîne doit commencer par l'un de ces mots, suivi d'un espace. Par conséquent, il ne récupérera pas des mots tels que « cependant », « entier », etc.
Exemple : Ces codes conviennent pour comprendre les tendances du marché et les discussions des utilisateurs afin d'obtenir de nouvelles idées de contenu.
🔶 « qui|quoi|où|quand|pourquoi|comment »
Il est similaire au code Regex décrit ci-dessus, mais ici, la fonction correspondra à toutes les chaînes contenant l'un de ces mots, que la chaîne commence ou non par ces mots.
Exemple : Le code est adapté pour mettre en évidence les déclarations douteuses, filtrer les entrées des utilisateurs, etc.
🔶 .*
Le point de métacaractère suivi d'un astérisque est souvent appelé expression générique car vous pouvez l'utiliser pour faire correspondre n'importe quelle chaîne spécifique en la plaçant sous ce code.
Exemple : Le Regex .*Android.* récupérera toutes les pages de votre propriété qui contiennent le mot Android. En utilisant directement le code .* sur le filtre, il extraira toutes les pages apparaissant sur le moteur de recherche en un mois.
🔶 [^\/\.\-:0-9A-Za-z_]
Un symbole caret est suivi d'une barre oblique inverse, qui exclura les caractères indiqués dans le code. Ici, le code correspondra aux chaînes qui n'ont pas de barre oblique, de chiffres, de point, de deux-points, de trait d'union et tous les alphabets en majuscules et en minuscules.
Exemple : Par conséquent, le code est applicable à la capture d'URL, de méta descriptions ou de contenu comportant des caractères spéciaux tels que &%$@.
🔶 ?i)(((est|sont).(marque|site|entreprise)|(marque|site|entreprise).(est|sont)).*(écume|fiable))
Il s'agit d'un long code Regex avec des sections spécifiques. Le caractère « ?i » utilisé au début du code est destiné à un indicateur insensible à la casse. Cela signifie que le code correspondra aux chaînes, qu'elles soient en majuscules ou en minuscules. Les parenthèses qui le suivent contiennent des mots séparés par des caractères pipe (OR).
Le code Regex détectera les requêtes quelle que soit la casse des lettres implicite, qui inclut les mots est ou sont, marque, entreprise ou site, ainsi que écume ou fiable.
Exemple : Ce code Regex peut être utilisé avec précaution pour trouver le modèle de requêtes des clients. Vous pourrez savoir si votre site web a des avis positifs ou négatifs.
🔶 (kwd1|kwd2).*
Il s'agit d'une utilisation simplifiée du code regex de disjonction dans lequel le GSC filtrera les pages ou les requêtes contenant le mot kwd1 ou kwd2, suivi de toute autre lettre ou chiffre.
Exemple : Vous pouvez utiliser le modèle pour extraire des pages de votre site web contenant l'un de ces mots connectés à d'autres mots ou chiffres dans l'URL, le titre, la méta ou le contenu.
🔶 (Mot-clé1 ET Mot-clé2)
Ce code est un exemple clair d'expression de conjonction. « AND » est un opérateur utilisé dans le code Regex. Il est utilisé pour obtenir des pages contenant ces deux mots donnés dans la même séquence.
Exemple : Vous pouvez appliquer le code sur GSC pour obtenir des pages, un titre ou une méta avec deux mots spécifiques dans le même ordre.
🔶 « mot-clé1 mot-clé2 »
Le code permet de faire correspondre une phrase ou un ordre exact de mots sur la page web.
Exemple : Appliquez le code sur GSC pour rechercher les pages dont le titre, la description ou le contenu contient une phrase spécifique.
🔶 (Mot-clé1 | Mot-clé2)
Ce code comporte deux mots et un caractère barre verticale. Cela signifie que le GSC affichera les pages de votre site web contenant soit le « Mot-clé1 », soit le « Mot-clé2 », mais pas les deux.
Exemple : Appliquez le code pour extraire les pages de votre site web contenant l'un des deux mots ou plus séparés par le caractère barre verticale.
🔶 (Mot-clé1)\b(Mot-clé2)\b
Ce code Regex contient deux mots spécifiques avec le caractère « \b » qui est un symbole pour la limite des mots. Il fournira des pages contenant ces deux mots et aucun autre mot, chiffre ou caractère entre eux.
Exemple : Utilisez ce code sur votre filtre GSC pour connaître les pages qui contiennent deux mots distincts en suite.
🔶 (Mot-clé1)\w+(Mot-clé2)
Le code comprend deux mots avec le métacaractère « \w+ » entre les deux, où « w » est en minuscule. Par conséquent, il récupérera toutes les pages contenant ces deux mots, que ce soit dans le titre, la description ou le contenu, quel que soit le nombre de mots entre eux.
Exemple : Vous pouvez appliquer ce code pour extraire toutes les pages de votre site web qui contiennent au moins ces deux mots n'importe où dans le titre, le contenu ou la méta.
🔶 (Mot clé)\bphrase
Il s'agit d'un simple code Regex permettant de faire correspondre la chaîne avec le mot entre parenthèses et suivi de l'expression de mot. Le métacaractère « \b » signifie la limite du mot ou aucun autre caractère entre les mots donnés.
Exemple : Ce code Regex sur votre GSC affichera des pages contenant les mots donnés en série n'importe où dans l'article, par exemple « expression de mot clé ».
🔶 a-url.|.b-url.|.c-url.|.e-url.|.f-url.|.g-url.|.h-url.|.i-url.|.j -url.|.k-url.|.l-url.|.m-url.|.n-url.|.o-url.|.p-url.|.
Ce code Regex répertorie plusieurs URL « a,b,c,e,g….. » séparées par le caractère barre verticale. Par conséquent, il filtrera les chaînes contenant l'une de ces URL.
Exemple : Vous pouvez appliquer de tels modèles sur votre panneau GSC pour obtenir des pages web contenant des URL spécifiques dans le titre ou l'article.
🔶 ^(pomme|balle|chat|ferme de canards)$
Le code donné implique de faire correspondre le début d'une chaîne avec l'un de ces mots donnés, « pomme, balle, chat ou ferme de canards », car le caractère pipe les sépare. Alors que cela garantit également de n'avoir aucun autre mot ou caractère.
Exemple : Vous pouvez utiliser le code pour obtenir des détails sur les pages contenant des mots-clés spécifiques au début.
🔶 .*\/$
Le code Regex donné vise à capturer chaque chaîne, qu'il s'agisse de mots ou de nombres, mais il doit se terminer par une barre oblique.
Exemple : Vous pouvez l'utiliser pour faire correspondre les pages dont les URL se terminent par une barre oblique.
🔶 .(meilleur|meilleur|vs|revue).*
Ce code correspondra aux chaînes qui ont un point au début avec l'un des mots donnés (séparés par un caractère barre verticale) et d'autres mots, chiffres ou caractères spéciaux en continuation.
Exemple : Vous pouvez utiliser de tels modèles de Regex dans des rapports commerciaux pour comprendre les tendances du marché.
🔶 (acheter|pas cher|prix|achat|commande).
Ce code correspondra aux chaînes dont l'un des mots donnés est séparé par un caractère barre verticale et suivi d'autres mots, nombres ou caractères.
Exemple : Ces codes sont utiles pour faire correspondre les recherches transactionnelles ou les requêtes liées aux produits de votre site web.
🔶 (face(b|be)ook) 🔶 (f(a|e)ce(b|be)ook 🔶 (fa(c|s)(e|i)book)
Ces codes comportent une combinaison de mots entre parenthèses ainsi que des barres verticales entre eux.
La première Regex correspondra aux chaînes contenant le mot « face » suivi de « b » ou « be » et se termine par « ook ». Ainsi, les pages récupérées contiendront le mot Facebook ou Facebook.
La deuxième Regex correspondra aux chaînes contenant le mot « f » suivi de « a » ou « e » suivi de « ce » suivi de « b » ou « be » et se termine par « ook ». Ainsi, les pages récupérées auront n'importe quelle combinaison, telle que facebook, fecebook, facebeook ou fecebeook.
La troisième expression régulière correspondra aux chaînes contenant le mot « fa » suivi de « c » ou « s » suivi de « e » ou « I » et se termine par « livre ». Ainsi, les pages récupérées auront n'importe quelle combinaison, telle que Facebook, Facibook, Fasebook ou Fasibook.
Exemple : Vous pouvez utiliser de tels codes pour faire correspondre les fautes d'orthographe potentielles dans vos pages web.
🔶 .wp-.
Le code donné correspondra aux chaînes ayant un point suivi de « wp- » suivi d'autres caractères.
Exemple : Il convient à l'extraction de pages avec des URL WordPress.
🔶 .*/url-1/.* contre .*/url-2/.*
Le code donné a deux URL différentes avec un caractère Regex de comparaison. Il récupérera deux URL spécifiques de votre site web pour comparer leurs statistiques.
Exemple : Vous pouvez appliquer ce code pour comparer le trafic, la fréquentation des utilisateurs et d'autres progrès entre deux pages web spécifiques de votre site.
Autres expressions régulières peu courantes
🔺 (?i)\bmot-clé\b
Ce code correspondra à une chaîne contenant le mot « mot-clé ». La recherche s'effectue indépendamment de la sensibilité à la casse du mot dans les pages web.
🔺 « phrase »
Ce code correspondra simplement aux pages contenant le mot phrase.
🔺 \w{5}
Le code correspondra aux requêtes contenant des caractères de 5 mots.
🔺 \d{3}
Ce code correspondra aux requêtes comportant exactement 3 chiffres.
🔺 ([^” “]*)
Ce code Regex correspondra aux chaînes qui ne contiennent aucun caractère entre guillemets.
🔺 (?i)\b(mot-clé1|mot-clé2|mot-clé3)\b
Ce code donné correspondra aux chaînes contenant l'un des mots séparés par un caractère barre verticale et en majuscule ou minuscule.
🔺 \W+
Le code correspondra à n'importe quel nombre de caractères autres que des mots, généralement des caractères spéciaux.
🔺 \d{3,5}
Le code correspondra à toutes les chaînes comportant des nombres de 3 chiffres et un maximum de 5 chiffres.
🔺 \b\w+\b
Le code fera correspondre n'importe quel nombre de caractères de mots avec des limites de mots.
Derniers mots
Le moteur de recherche Google est devenu une vaste source d'informations après l'introduction des codes Regex dans les filtres de performances. Il suffit de comprendre la structure des codes pour extraire les rapports analytiques.
Vous pouvez créer plusieurs codes Regex sur votre panneau pour obtenir des détails particuliers sur les performances de votre site web et les utiliser pour améliorer votre approche et obtenir de meilleurs résultats.
Ensuite, découvrez les astuces de recherche Google pour vous aider à améliorer votre recherche en ligne.