Digitale identiteit als vervanger van cookies: de valkuil voor advertising
De heilige graal voor veel adverteerders: een digitale identiteit als opvolger van de aan een apparaat verbonden cookies. Nu bijna iedereen winkelt en surft via meerdere apparaten en de cookies óf niet ingezet kunnen worden óf de inzichten niet met elkaar zijn te verbinden, is een multiscreen of cross device identity cruciaal.
Een identiteit die over de verschillende apparaten heen werkt, biedt adverteerders zicht op hoe er wordt gereageerd op advertenties en welke invloed die hebben op de conversie. Zo’n uniform beeld van de consument maakt cross device marketing mogelijk en zorgt bovendien voor betere multitouch attributie. Daarbij wordt gekeken naar meerdere aspecten in de klantreis dan alleen het laatste contactmoment.
Deterministische data
Giganten als Apple, Google en Facebook hebben in deze industrie een groot voordeel omdat zij gebruikers hebben die zich – al dan niet geforceerd – bij verschillende diensten kenbaar maken met een zelfde ID – het gebruikersaccount. Die bedrijven hebben hun diensten zo weten te omheinen dat zij over kunnen stappen op deterministische data. Daarbij wordt data van gebruikers niet langer op basis van waarschijnlijkheid gelinkt, maar worden de puzzelstukjes aan de hand van een unieke identifier gelegd.
Andere bedrijven zoeken naarstig naar een alternatief om te kunnen concurreren met bijvoorbeeld Google en Facebook. Met een combinatie van browsercookies en ID’s van apparaten koppelen zij met een zekere mate van waarschijnlijkheid data aan gebruikers.
In hun promotiepraatjes spreken bedrijven over een accuraatheid van deze ‘matching’ van 70 tot wel 97 procent. Onterecht claimen zij zeer verfijnde technieken te gebruiken, zegt data-expert Rajiv Maheshwari. In werkelijkheid is die mate van verfijning veel lager dan in andere vormen van machine learning als spamfiltering, aanbevelingen, gezichtsherkenning of fraude-opsporing.
De valkuilen
In zijn praktijk houdt Maheshwari een aantal zaken aan waarop ten minste gelet moet worden. Vooral precisie en vangst – of het Engelse en gangbare ‘recall’ – worden regelmatig onjuist gebruikt.
Precisie is het percentage van geclusterde identiteiten binnen de totale device graph (zie ook onderstaande video) die werkelijk zijn gelinkt aan een individu. Recall staat voor het aantal matches dat correct kan worden vastgesteld. Schermt een aanbieder van software met dit getal, dan wil dat zeggen dat de tool een groot aantal voorspellingen heeft gedaan, maar niet hoeveel van die matches in werkelijkheid niet bestonden.
Een voorbeeld: een gebruiker heeft vijf verschillende ID’s bij browsers en apparaten, A, B, C, D en E. Als ID’s A, B en F – een willekeurig ander ID – in de device graph worden geclusterd, is de precisie 66 procent: twee van de drie zijn immers correct gelinkt. De recall is echter maar 40 procent omdat de software slechts twee van de vijf ID’s met elkaar heeft weten te verbinden. Het hangt van de situatie af welke van de twee percentages belangrijker is.
Hogere precisie kan nodig zijn wanneer een marketeer aan retargeting wil doen, hogere recall is belangrijk zodra een adverteerder zijn bereik wil vergroten via verschillende apparaten.
Regelmatig beloven partijen een database van meer dan een miljard ID’s in de device graph. Wat echter van belang is voor accurate cross device tracking is hoeveel van die ID’s zijn geclusterd. Is er sprake van een enkel ID dan wil dat niet betekenen dat de gebruiker maar over één digitaal ID beschikt.
Tot slot is het voor veel marketingactiviteiten belangrijk dat niet alleen op individueel niveau data worden verzameld, maar ook hiërarchisch in huishoudens worden geclusterd. Diverse algoritmen kunnen clusters al op zo’n manier ordenen.
Meer over de device graph en clusters
Foto: Martin Heigan (cc)
Plaats een reactie
Uw e-mailadres wordt niet op de site getoond