4 toepassingen van RegEx in Google analytics voor niet technische marketeers

Een reguliere expressie (RegEx) is een tool waarmee je met bepaalde tekens patronen kunt herkennen. RegEx wordt vooral gebruikt door webdevelopers, maar zoals we in dit artikel demonstreren kan het ook voor een marketeer die niets van programmeertalen af weet zeer waardevol zijn.

We laten je vier toepassingen zien hoe je RegEx kunt gebruiken in Google Analytics (GA), die je kunnen helpen bij het (snel) analyseren van je website traffic, namelijk;

– filteren van url’s
– filteren van site search zoekwoorden
– doelen maken
– segmenten maken

Als je eenmaal bekend bent met RegEx zul je zien dat je het ook in andere programma’s goed kunt gebruiken. Voor de SEO marktereers is RegEx bijvoorbeeld heel handig in de Screaming Frog SEO Spider.

De RegEx tekens

Zonder dit een technisch verhaal te maken nemen we toch even de belangrijkste tekens door. Ze zijn namelijk onder te verdelen in wildcards, groups, anchors en de escape. Een wildcard is eigenlijk een soort joker, een wildcard kan namelijk voor elk teken, cijfer of letter staan.

Door een gedeelte van een reguliere expressie tussen haakjes of brackets te plaatsen kun je dat deel van de reguliere expressie bij elkaar plaatsen.

Anchors staan niet zelf voor een teken, maar ze staan voor de positie ervoor, erna of ertussen.

Het escape teken kan je gebruiken als je letterlijk op zoek bent naar een teken dat ook gebruikt wordt door RegEx. Een vraagteken wordt bijvoorbeeld gebruikt door RegEx als een wildcard, dat betekent dat wanneer je letterlijk op zoek bent naar een vraagteken je dat moet aangeven als ‘\?’.

Hieronder zet ik een vijftal toepassingen van RegEx uiteen die elke online marketeer zou kunnen gebruiken.

RegEx in Google Analytics (GA)

RegEx kun je in GA op meerdere manieren toepassen:

 

  • Filter urls

 

Voor onze deal community www.solden.be willen we bijvoorbeeld soms snel zien hoe vijf verschillende adverteerders de afgelopen maand gepresteerd hebben op onze website. De optie Matching RegExp in GA is dan erg handig. Je kunt dan bijvoorbeeld dit invullen “ici-paris-xl|groupon|adidas” en je krijgt alleen resultaten terug voor deze drie adverteerders.

Of “.*categorie\/.*-en-” als ik op zoek ben naar categorie pagina’s die meerdere categorieën bevatten (in onze url structuur komt dan altijd ‘-en-’ voor bij deze pagina’s)

.*categorie ga door de tekenreeks totdat ‘categorie’ gevonden is

\/ kijk of categorie eindigt met een letterlijk ‘/’ teken

.*-en- ga door de tekenreeks totdat ‘-en-’ gevonden is

 

  • Filter site search zoekwoorden

 

Als je een zoekveld hebt op je website en je hebt site search geactiveerd in GA, kan je in GA een lijst terugvinden met alle zoektermen die bezoekers hebben gebruikt via Behavior, Site search, Overview, View full report. Op Solden.be wordt bijvoorbeeld veel gezocht naar kortingen van bol.com. Het probleem hiermee is dat mensen met verschillende zoektermen naar dezelfde webshop zoeken waardoor we niet direct kunnen zien hoeveel mensen op zoek zijn naar een korting van bol.com.

Je kunt het advanced filter wel gebruiken voor “exactly matching”, “begins with”, “ends with” of “containing”, maar geen van deze opties laat dan precies die resultaten zien waar je naar op zoek bent. Met de optie Matching RegExp kan dit wel.

In het geval van bol.com zijn we op zoek naar alle mogelijke variaties, zoals bijvoorbeeld bol com, Bol, bol.com etc. Daarnaast willen we eigenlijk geen resultaten terug krijgen die niets met bol.com te maken hebben, zoals Bolero multivit.

Als je het echt helemaal correct wilt doen dan zou je deze RegEx moeten gebruiken:

.*[bB]ol($|[\. ].*com|com)

.*[bB] ga door de tekenreeks totdat de letter b of de hoofdletter B gevonden is

ol, de volgende letters in de tekenreeks, moeten de letters ‘o’ en ‘l’ zijn. (maak een groep aan zodat we regels kunnen onderscheiden met het ‘|’ teken)

 $ einde van de tekenreeks

 | of

   [\. ] het volgende teken is een letterlijke ‘.’ of een spatie|
.*com ga door de tekenreeks totdat er ‘com’ is gevonden

 | of

   com de volgende letters in de tekenreeks zijn ‘com’

Kort ontleed betekent dit dat er gezocht wordt tot bol of Bol in de tekst staat, dit is of het einde, of er wordt nog verder gezocht naar iets dat niet een letter is (spatie of . bijvoorbeeld) en daarna weer net zo lang zoeken tot er com staat. Zo worden alleen de varianten getoond die voor ons relevant zijn in het geval van bol.com.

In dit geval is een vrij ingewikkelde RegEx gebruikt. Als je niet zeker weet of je RegEx klopt, kun je het heel goed testen op deze website. Je ziet dan precies welke regels herkend worden met de RegEx patroon die je hebt gebruikt, zie voorbeeld hieronder:

 

  • Doelen

 

Op onze website is ons belangrijkste doel dat mensen op een kortingscode button klikken. Als mensen dit doen verandert onze url en dit kan in GA herkend worden door gebruik te maken van het reguliere expressie veld. Hierbij is het doel wel alleen betrouwbaar als =open niet ook voorkomt in een url die we via social of een nieuwsbrief oid verspreiden.

 

  • Segmenten

 

Een andere toepassing van RegEx in GA is het aanmaken van segmenten. Je kunt bijvoorbeeld een segment die alleen alle sessies bevat die via Google, Yahoo of Bing (zie hierboven) binnenkomen. Of bijvoorbeeld een segment die alleen bezoekers bevat die uit de grootste steden van België komen (zie hieronder).

Samenvattend:

In Google Analytics (en andere programma’s) kun je veel tijd besparen door RegEx te gebruiken. Je kunt het onder meer gebruiken om urls te filteren, site search zoekwoorden te filteren en doelen of segmenten te maken.

Plaats een reactie

Uw e-mailadres wordt niet op de site getoond.

terug