[Technique] Google Analytics et les expressions régulières

L’utilisation de RegEx (ou expressions régulières) avec Google Analytics est une méthode avancée de filtrage qui pourra vous permettre de gagner (beaucoup) de temps et est utilisée tout les jours par les professionnels et votre agence Google Analytics. En effet, la puissance des RegEx est un excellent moyen de raccourcir et d’optimiser les différents segments et filtres que vous voudrez mettre en place pour construire des rapports en accord avec vos besoins.

Même si vous avez toujours la possibilité de passer par les filtres classiques, la maîtrise des Regex pour Google Analytics vous permettra de franchir un palier significatif dans l’utilisation de cet outil populaire de statistiques de trafic. Comme vous n’avez pas besoin de maîtriser les RegEx de A à X, voici une présentation rapide et accessible à tous de l’essentiel des possibilités d’emploi des expressions régulières avec Google Analytics.

1. Les RegEx expliqués par l’exemple

La richesse du potentiel des RegEx est assez incroyable car c’est un langage complexe avec de nombreuses subtilités, que nous éviterons volontairement ici.

En effet, dans votre utilisation quotidienne de Google Analytics,vous n’aurez généralement besoin que des quelques caractères présentés dans les tableaux ci-dessous avec leur signification (simplifiée) accompagnée d’exemples sur ce qui matche ou ne matche pas cette expression régulière.

. (Point)
Description Je veux n’importe quel caractère.
Exemples m.ch.l kpulse.fr
Matche
  • michel
  • michal
  • m1ch3l
  • m ch l
  • michel@toto.ca
  • jean-michel
  • kpulse.fr
  • fr.kpulse.fr/toto
  • kpulse fr
  • eeekpulse1fr
  • kpulseXfr
  • kpulseXfr/toto
Ne Matche pas  michael
  • kpulse123fr
  • kpulsefr

 

\ (Backslash)
Description Je veux annuler « l’effet RegEx » du caractère suivant.
Exemples 123\.222\.210\.123 kpulse\.fr
Matche
  • 123.222.210.123
  • kpulse.fr
  • fr.kpulse.fr/toto
Ne Matche pas
  • 123\.222\.210\.123
  • kpulse\.fr
  • kpulse fr
  • kpulse

 

^ (Circonflexe)
Description Je veux que l’expression commence par les caractères suivants.
Exemples  ^eur ^mail
Matche
  • eureka
  • europe
  • mail.google.com
  • mail.yahoo.com
  • mail.msn.com
  • mail.com/toto
Ne Matche pas
  • heureux
  • peur
  • l’europe
  • dailymail.com
  • toto.mail.com

 

$ (Dollar)
Description Je veux que l’expression finisse par les caractères précédents.
Exemples alt$  com$
Matche
  • malt
  • salt
  • walt
  • kpulse.com
  • google.com
  • googlecom
Ne Matche pas
  • alterner
  • baltique
  • malts
  • google.com/toto

 

| (Pipe)
Description Je veux les caractères suivants ou précédents.
Exemples bleu|blanc|rouge facebook|twitter
Matche
  • bleublancrouge
  • bleu et rouge
  • rouge blanc
  • blanc
  • facebook
  • facebook.com
  • twitter
  • ihatefacebook
Ne Matche pas
  • blan
  • ble
  • ouge
  • twibook
  • face book

 

+ (Plus)
Description Je veux une ou plus fois le caractère précédent.
Exemples michel+ go+gle
Matche
  • michel
  • michell
  • michelllllll
  • michele
  • michelle
  • michelllllle
  • micheline
  • gogle
  • google
  • gooogle
  • goooooogle.com/toto
Ne Matche pas
  •  miche
  •  ggle

 

? (Point d’interrogation)
Description Je veux zéro ou une fois le caractère précédent.
Exemples  forte?  goo?gle
Matche
  • forte
  • fort
  • fortes
  • forts
  • gogle
  • google
  • google.com
Ne Matche pas
  • fortee
  • for
  • ggle
  • gooogle

 

* (Étoile)
Description Je veux zéro ou plus fois le caractère précédent.
Exemples mdr*  google\.*com
Matche
  • mdr
  • md
  • mdrrrrrrr
  • mdrr
  • google.com
  • google……com
  • googlecom
  • fr.google.com
Ne Matche pas
  • m
  • dr
  • googl.com
  • google

 

( ) (Parenthèses)
Description Je veux grouper les caractères inclus entre les parenthèses.
Exemples (pre|de)(voir|faire)  google\.(com|fr)
Matche
  • prevoir
  • devoir
  • prefaire
  • defaire
  • google.com
  • google.fr
  • google.com/blabla
  • fr.google.com
Ne Matche pas
  • prede
  • voirfaire
  •  google.be

 

[ ] (Crochets)
Description Classe les caractères inclus entre les crochets.
Exemples  [aeiouy]  ab[2468]cd
Matche
  • a
  • e
  • i
  • o
  • u
  • y
  • ab2cd
  • ab4cd
  • ab6cd
  • ab8cd
Ne Matche pas
  • b
  • c
  • d
  • ab1cd
  • abcd
  • ba2cd

 

{X} ou {Y,Z} (Accolades)
Description Je veux exactement X fois ou de Y à Z fois le caractère précédant les accolades.
Exemples  a{3}  b{2,5}
Matche
  • aaa
  • bb
  • bbb
  • bbbb
  • bbbbb
Ne Matche pas
  • a
  • aa
  • aaaa
  • bbb
  • b
  • bbbbbb
  • aaa

 

X-Y (Tiret)
Description Je veux un caractère inclus entre X et Y.
Exemples  [0-9] [a-Za-Z]
Matche
  • 0
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • aa
  • cb
  • zz
  • wE
  • zP
  • zz
  • YY
Ne Matche pas
  • 10
  • 51
  • a
  • z
  • 10
  • a1
  • 3g
  • aa1

2. Les RegEx et Google Analytics

2.1. Quand utiliser les RegEx

Les RegEx et Google Analytics se rencontrent à de nombreuses occasions :

  • Création de filtres
  • Création d’objectifs
  • Édition d’entonnoir d’objectifs
  • Création de rapports personnalisés
  • Création de segments avancés
  • Etc.

Google Analytics et expressions régulières

Ouvrez un formulaire d’édition de filtre dans Google Analytics, choisissez la dimension puis sélectionnez « Correspondance avec expression régulière ».

Comme vous pouvez le voir dans la capture d’écran ci-dessus, c’est une des options de filtrage proposées dans la liste déroulante des différentes interfaces citées précédemment. Elle est donc très facilement accessible pour la création de n’importe quel filtre dans Google Analytics.

2.2. Exemples concrets d’utilisation des RegEx

Les scénarios d’utilisation des RegEx avec Google Analytics sont aussi nombreux que les dimensions de segmentation de trafic et les combinaisons qu’elles peuvent former pour les besoins de vos filtres.

De manière générale, et quels que soient vos besoins, gardez vos expressions régulières aussi simples que possibles tout en vous assurant de garder le bon degré de permissivité voulu dans vos critères de sélection (pas trop de « .* » et autant d’ancrage que possible avec « ^ » et « $ »). Et surtout n’oubliez pas le caractère d’échappement « \ » pour éviter les problèmes sur les métacaractères.

Je veux… Dimensions RegEx à utiliser
Les pages dont l’URL débute par « /blog/ ». URL ^/blog/(.*)
Les recherches incluant l’expression « coca cola » avec ou sans espace. Mot clé (coca\s*?cola)
Les recherches débutant par « coca » suivi de « cola » ou « kola » Mot clé  ^coca\s+([ck]ola)
Les URL terminant par « .php » URL  \.php$
Les recherches exactes sur le terme « eurekalt » Mot clé ^eurekalt$
Les recherches incluant des termes de questionnement Mot clé (comment|pourquoi)
Les visiteurs venant du Bénélux Pays (Belgium|Netherlands|Luxembourg)
Les visiteurs venant de produits iOS ou Android Système d’exploitation (iOS|Android)
Les écrans de moins de 800 pixels de large Résolution d’écran (^[1-7]?[0-9]?[0-9])x([1-5]?[0-9]?[0-9]$)
Les expressions de recherche longue d’un seul mot Mot clé  ^\s*[^\s]+(\s+[^\s]+){0}\s*$
Les expressions de recherche longue de deux mots Mot clé  ^\s*[^\s]+(\s+[^\s]+){1}\s*$
Les expressions de recherche longue de trois mots Mot clé  ^\s*[^\s]+(\s+[^\s]+){2}\s*$
Les expressions de recherche longue de 4 mot ou plus Mot clé  ^\s*[^\s]+(\s+[^\s]+){3,}\s*$
Les expressions contenant des termes liés au « web analytics » en considérant les erreurs de saisie possibles. Mot clé  web\s?anal+[iy]t[iy](c|que)s?
Les pages contenant « 404error.html » dans l’url URL  404error\.html
Les URL commençant par exactement deux chiffres URL  ^[0-9]{2}
Avec caractères spéciaux () ou $ ou . ou [] ou * \( \) \$ \. \[ \] \*