-

Ontdek privacygevoelige informatie in je Google Analytics data

Klantdata in Google Analytics bevat regelmatig persoonlijke en privacygevoelige informatie. Hoe beheer je dat en hoe houd je je aan de regels?

Wat is PII (persoonlijk identificeerbare informatie) en waarom is het belangrijk?

Persoonlijk identificeerbare informatie is informatie die gebruikt zou kunnen worden om een individu te traceren of te bereiken. Voorbeelden van PII zijn:

  • E-mailadressen
  • Voornamen, achternamen en gebruikersnamen
  • Adresgegevens en postcodes
  • Telefoonnummers
  • Burgerservicenummers
  • GPS coördinaten

Google heeft in haar gebruiksvoorwaarden aangegeven dat het verboden is om deze persoonlijk identificeerbare informatie in Google Analytics op te slaan. Als dit toch (vaak onbewust) wordt opgeslagen, riskeer je een waarschuwing of andere maatregelen vanuit Google. Daarnaast, afhankelijk van de locatie van je website, kunnen er lokale, nationale en continentale wetgevingen zijn waardoor er specifieke regels gelden rondom het opslaan van persoonsgegevens. In Europa is de GDPR/AVG (Algemene verordening gegevensbescherming) daar het meest bekende voorbeeld van. Met de aanwezigheid van persoonsgegevens in Google Analytics riskeer je op dat gebied zelfs een boete.

Hoe kunnen persoonsgegevens terechtkomen in mijn Google Analytics data?

Er zijn verschillende paden waarmee persoonsgegevens in Google Analytics terecht komen. De meest voorkomende zijn:

  • Je hebt ingesteld dat je zoektermen wil meten. Een gebruiker vult vervolgens zijn of haar gegevens in in de zoekbalk. Dit wordt dan doorgestuurd naar Google Analytics (het zal je verbazen hoeveel bezoekers hun e-mailadres invullen in de zoekbalk omdat dit wordt verward met de functie om in te loggen).
  • Je hebt ingesteld dat je ingevulde formulieren met een foutmelding wil meten: de persoonsgegevens van de gebruiker komen zo in Google Analytics terecht.
  • De gegevens worden meegestuurd in de URL-parameters om een functionele reden. Bijvoorbeeld bij een nieuwsbrief en/of een doorverwijzing op de website.
  • De data is handmatig geïmporteerd in Google Analytics.

Vervolgens zijn de persoonsgegevens voornamelijk terug te vinden in de rapporten. Met daarin de resultaten van de paginaweergaven, de gebeurtenissen, de campagnes, het zoekgedrag en de aangepaste dimensies. De persoonlijke informatie ligt dan ergens verscholen op pagina 312 (bij wijze van spreken) van deze rapporten, waardoor ze door niemand worden opgemerkt.

Hoe kan ik achterhalen of er persoonlijke data in mijn Google Analytics data zit?

Van alle mogelijke persoonsgegevens komen e-mailadressen het meest voor in Google Analytics. Met de Persoonlijk Identificeerbare Informatie (PII) Checker (een gratis Data Studio Dashboard in) ontdek je of er e-mailadressen in je Google Analytics data verstopt zitten. Wil je een volledige scan op alle mogelijke PII gegevens, lees dan verder hoe we met ons GDPR Monitor dashboard alle persoonlijk identificeerbare informatie kunnen traceren.

Hoe werkt de PII checker?

Na het selecteren van de PII Checker, is het belangrijk dat je je eigen Google Analytics dataset selecteert bovenin het dashboard. Door vervolgens naar beneden te scrollen zie je of er e-mailadressen gevonden zijn in de data rondom je pagina’s, gebeurtenissen, zoektermen en campagnes in de afgelopen vier weken. Als er geen e-mailadressen gevonden zijn, zal de groene tekst dit aangeven. Mochten er wel e-mailadressen gevonden zijn, dan geeft het dashboard ook aan wat er precies gevonden is en wanneer dit in Google Analytics terecht is gekomen.

Het kan altijd gebeuren dat er een situatie ontstaat waardoor er (mogelijk opnieuw) persoonsgegevens worden doorgestuurd naar Google Analytics. Met de (PII) Checker kun je herhaald monitoren of er in de afgelopen vier weken e-mailadressen gevonden zijn.

Help! Er zijn e-mailadressen gevonden in mijn data, en nu?

Het spreekwoord “voorkomen is beter dan genezen” is hier van toepassing. Het is raadzaam om eerst te zoeken naar een oplossing die voorkomt dat er in de toekomst weer persoonsgegevens worden opgeslagen. Een mogelijke oplossing is het instellen van filters in Google Analytics. Dit voorkomt dat de data zichtbaar is. De data is dan echter wel verstuurd naar de servers van Google waardoor dit geen waterdichte oplossing is.

De ideale oplossing vinden we in de manier van meten. Via Google Tag Manager en andere tag management systemen is het mogelijk te zorgen dat persoonsgegevens worden herkend, en vervolgens gecensureerd zodat de persoonlijke data niet verstuurd wordt naar de servers van Google en dus ook niet in Google Analytics terecht komt.

Naast het voorkomen, kun je overwegen of er iets te genezen is. Wat kun je doen met de persoonlijke data die al in Google Analytics terecht is gekomen? Google biedt twee oplossingen om deze data achteraf te verwijderen.

  1. Data Deletion Request: met deze functionaliteit binnen Google Analytics kun je een verzoek indienen bij Google. Je kiest een tijdsperiode en je geeft aan in welke dimensie de persoonsgegevens terecht zijn komen. Wees ervan bewust dat Google dan wel alle data van die dimensie binnen die tijdsperiode verwijdert! Als bijvoorbeeld slechts een heel klein percentage van je pagina’s een e-mailadres bevat, dan wordt alle data rondom paginaweergaven verwijderd! Dit is dus een belangrijke maar moeilijke afweging. Meer informatie over deze functionaliteit kun je hier lezen.
  2. User Deletion API: Google heeft een manier ontwikkeld waarmee je specifieke bezoekers (op basis van hun ClientID) kunt verwijderen uit Google Analytics. Met deze functionaliteit kun je alleen de specifieke bezoekers waarvan persoonlijke data is opgeslagen verwijderen. Deze oplossing heeft daarmee minder impact dan de Data Deletion Request, maar alsnog zul je data missen. Meer informatie over deze oplossing vind je hier.

Met ons GDPR Dashboard blijf je je data op alle GDPR/PII aspecten monitoren

We hebben in dit artikel aangetoond dat persoonlijk identificeerbare informatie makkelijk in Google Analytics kan terechtkomen, maar met onze PII Checker ook eenvoudig kan worden getraceerd. Wat te doen met de vele andere persoonlijke gegevens zoals adressen, telefoonnummers en/of zelfs kentekens? Met een dashboard kun je de Google Analytics data op dagelijkse basis op de aanwezigheid van alle mogelijke persoonsgegevens controleren. Met de dagelijkse rapportage worden eventuele ongewenste gegevens actueel gesignaleerd en loop je, na verwijdering van de gegevens, een minimaal risico om de AVG-wetgeving en de gebruiksvoorwaarden van Google te overtreden en kan de oorzaak van de onterecht geplaatste data snel gevonden worden.

Over de auteur: Marieke Pots is senior data intelligence consultant bij OrangeValley.

Deel dit bericht

Plaats een reactie

Uw e-mailadres wordt niet op de site getoond