Regex-filters schrijven en testen voor Google Analytics (met voorbeelden)

Reguliere expressies Regex Google Analytics-filters

Zoals met veel van mijn artikelen hier, doe ik wat onderzoek voor een klant en schrijf daar dan hier over. Om eerlijk te zijn, er zijn een paar redenen waarom ... ten eerste dat ik een vreselijke herinnering heb en vaak mijn eigen website onderzoek voor informatie. Ten tweede: anderen helpen die mogelijk ook op zoek zijn naar informatie.

Wat is een reguliere expressie (Regex)?

Regex is een ontwikkelmethode om een ​​patroon van tekens in de tekst te zoeken en te identificeren om de tekst te matchen of te vervangen. Alle moderne programmeertalen ondersteunen reguliere expressies.

Ik hou van reguliere expressies (regex), maar ze kunnen een beetje frustrerend of irritant zijn om te leren en te testen. Google Analytics heeft een aantal verbazingwekkende mogelijkheden ... waar u weergaven kunt maken met reguliere expressies of uw gegevens kunt filteren binnen reguliere expressies.

Als ik bijvoorbeeld alleen het verkeer op mijn tagpagina's wil zien, kan ik filteren op / tag / in mijn permalink-structuur met behulp van:

/tag\/

De syntaxis is daar cruciaal. Als ik gewoon "tag" zou gebruiken, zou ik alle pagina's krijgen met de term tag erin. Als ik "/ tag" zou gebruiken, zou elke URL die begint met tag worden opgenomen, zoals / tag-beheer omdat Google Analytics standaard elk teken na de reguliere expressie opneemt. Dus ik moet ervoor zorgen dat ik de volgende schuine streep heb ... maar er moet een escape-teken op staan.

pagina filter regex

Basisprincipes van Regex-syntaxis

Syntaxis Omschrijving
^ Begint met
$ Eindigt met
. Een jokerteken voor elk teken
* Nul of meer van het vorige item
.* Komt overeen met alle tekens in
? Nul of één keer van het vorige item
+ Een of meerdere keren van het vorige item
| De OR-operator
[abc] A of b of c (kan een willekeurig aantal tekens zijn)
[az] Bereik van a tot z (kan een willekeurig aantal tekens zijn)
[AZ] Bereik van A tot Z (met hoofdletters)
[0-9] Bereik van 0 tot 9 (kan elk getal zijn)
[a-zA-Z] Bereik van A tot Z of A tot Z
[a-zA-Z0-9] Alle alfanumerieke tekens
1 {} Precies 1 instantie (kan een willekeurig getal zijn)
{1-4} Bereik van 1 tot 4 instanties (kan elk getal zijn)
{1,} 1 of meer instanties (kan elk nummer zijn)
() Groepeer uw regels
\ Ontsnap aan speciale karakters
\d Cijferteken
\D Niet-cijferig teken
\s witte ruimte
\S Niet-witruimte
\w Word
\W Niet-woord (interpunctie)

Regex-voorbeelden voor Google Analytics

Dus laten we wat voorbeelden geven voor sommigen Aangepaste filters​ Een van mijn collega's vroeg me om hulp bij het identificeren van een interne pagina met het pad van /inhoudsopgave naast alle blogposts die met het jaartal in de permalink zijn geschreven:

Mijn aangepaste filterpatroon voor het filterveld Request Url:

^/(index|[0-9]{4}\/)

Dat stelt in feite om te zoeken naar / index OF een willekeurig 4-cijferig numeriek pad dat eindigt met een slash. Ik heb een weergave gemaakt in Analytics en deze als filter toegevoegd:

Google Analytics-weergavefilter

Hier zijn nog een paar voorbeelden:

  • Je hebt een blog met het jaar in het permalink-pad van de URL en je wilt de lijst filteren op elk jaar. Dus ik wil 4 cijfers gevolgd door een schuine streep aan het einde. Vraag URl-filterpatroon aan:

^/[0-9]{4}\/

  • U wilt al uw pagina's met de titel vergelijken certificaat or certificaat daarin. Paginatitel filterpatroon:

(.*)certificat(.*)

  • U wilt twee bestemmingspagina's vergelijken op basis van hun campagnemedium dat is doorgegeven in het Google Analytics-campagne-URL als utm_medium = direct mail or paid search.

(direct\smail|paid\ssearch)

  • U wilt alle producten vergelijken die herenoverhemden zijn op basis van het URL-pad. Vraag URl-filterpatroon aan:

^/mens/shirt/(.*)

  • U wilt alle pagina's vergelijken die zijn genummerd met het URL-pad dat eindigt met het nummer. Vraag URl-filterpatroon aan:

^/page/[1-9]*/$

  • U wilt een reeks IP-adressen uitsluiten. Filterpatroon voor IP-adres uitsluiten:

123\.456\.789\.[0-9]

  • U wilt een thankyou.html-pagina toevoegen waar een inzending succesvol was op basis van de querystring success = true. Vraag URl-filterpatroon aan:

thankyou\.html\?success=true

Hoe u uw Regex-expressies kunt testen

In plaats van vallen en opstaan ​​binnen Google Analytics, spring ik vaak gewoon over naar regex101, een fantastisch hulpmiddel om uw reguliere expressies te testen. Het breekt zelfs uw syntaxis voor u af en geeft de details van uw reguliere expressie:

reguliere expressies regex101

Regex bouwen, testen en debuggen

Wat denk je?

Deze site gebruikt Akismet om spam te verminderen. Ontdek hoe uw reactiegegevens worden verwerkt.