-

Rate this! Waarom alles en iedereen een rating krijgt

Wat gebeurt er als je jouw taxirit of pizza een rating geeft met je smartphone? Want, zeg nu zelf, je kan je huis niet meer verlaten of er wordt je gevraagd naar jouw mening en tevredenheid. In dit artikel ga ik op zoek naar de reden waarom online beoordelingen en recensies onze levens binnendrongen en hoe onze uitgebrachte scores verreikende gevolgen kunnen hebben.

Het nationale symbool van de Volksrepubliek China stijgt op boven de Chinese Muur. Het is een mooi tafereel op mijn visum waarmee ik China wil binnengaan. Ik bevond me op Pudong International Airport in Shanghai en ik keek rond terwijl een jonge kerel in zijn te groot grenspolitie-uniform mijn gegevens verwerkte. Het duurde slechts enkele minuten. Maar tijdens die hele tijd kon ik mijn aandacht niet afhouden van de vier smileys die naar me keken. Er werd me namelijk gevraagd om de diensten van die knul te beoordelen aan de hand van een elektronisch bakje met vier smileys. Cool! Ik vroeg me af wat ik zou betrekken bij mijn beoordeling? Zijn glimlach, de snelheid waarmee hij mijn paspoort scande, zijn kapsel, zijn Engelse uitspraak? Hij gaf mijn paspoort terug en in een vlaag van impulsiviteit duwde ik op de meest lachende smiley. Ik betwijfel dat de jongeman opslag kreeg, maar misschien was de baas wel gelukkig.

Ondanks het feit dat ik me in China bevond, was dit geen unieke ervaring. Er wordt ons namelijk constant gevraagd hoe we ons voelen bij een product of dienst. Ik nam een Uber-taxi en de app vroeg me om de bestuurder te evalueren. Ik telefoneerde naar mijn internetleverancier in verband met een probleem met mijn factuur. Tien minuten later werd ik opgebeld door een vrouwelijke stem die me vroeg of de vriendelijkheid van de telefoniste in lijn lag met mijn verwachtingen. Ooit ging ik uit eten in een populair restaurant. De volgende ochtend kreeg ik een e-mail met de vraag hoe mijn avond was. Misschien eindigde die met een fles Merlot op het nachttafeltje en kleren in het rond, maar daar heeft de restauranteigenaar geen zaken mee. Maar ja, het eten was heerlijk, het personeel was geweldig en de geur van de wasverzachter waarmee de handdoeken in de WC’s gewassen waren maakte mijn avond volledig af.

Weg met het middenkader

Frederick Taylor, grondlegger van het ‘wetenschappelijk management’ en leidend figuur in de ‘Efficiency Movement’, was één van de eersten die systematisch arbeiders ging observeren om patronen te identificeren en in te zetten om de productiviteit te verhogen. Het werd een opdracht die tegenwoordig in het takenpakket van een manager uit het middenkader zit. Op bijna onzichtbare wijze is de rol van het middenkader inzake supervisie en evaluatie van het personeel in heel wat sectoren echter aan het verdwijnen. Observatie en evaluatie is iets wat dankzij technologische ontwikkelingen namelijk kan gecrouwdsourcet worden. Een sterretje hier, een smiley daar. En waarom niet? Heeft de consument dan niet altijd gelijk? Is de klant geen koning? Waarom zou evaluatie in de handen van het middenkader moeten zitten als de technologie het mogelijk maakt om het in de handen van elke klant te steken?

Het crowdsourcen van evaluatie maakt de werknemer verantwoordelijk voor al zijn daden. Daarenboven versterkt het de rol van de klant. Empowerment heet dat. Maar er zit een addertje onder het gras. Empowerment is niet gratis. Nee, supervisie en evaluatie is wederom één van de vele traditionele bedrijfsverantwoordelijkheden die in onze handen is terecht gekomen. We kunnen het schaduwwerk  noemen: een lijst van onbetaalde taakjes die klanten doen in naam van een bedrijf die stilletjes in onze dagelijkse routine slopen. ‘Boodschappen scannen’ en ‘benzine tanken’ worden sinds kort vergezeld door ‘supervisie en evaluatie’.

Je zou misschien verwachten dat jouw beoordeling, net zoals in die oude science-fictionfilms, door een pneumatische buis wordt gezogen en uitgespuwd wordt in een grijs kantoorgebouw met tapis-plain waar een team van hoge bonzen ongeduldig jouw mening staat op te wachten. ‘Alweer vijf sterren! Kraak de Dom Perignon!’ Jammer genoeg is de realiteit minder amusant. Na je evaluatie verwerkt een algoritme je score en wordt het een factor in de bepaling of een werknemer bepaalde criteria haalt. Op het eerste zicht lijkt het niets nieuws onder de zon; geautomatiseerde monitoring gebeurt al decennia in de vorm van software die toetsaanslagen telt of telefoontjes bijhoudt.

De geniale symbiose tussen mens en machine die gecrowdsourcete evaluatie mogelijk maakt is echter relatief nieuw en dankt zijn bestaan aan de constant toenemende rekenkracht van computers, snel internet en mobiele toestellen. Het beoordelen gebeurt met een druk op de knop, eender waar, eender wanneer; tussen het openen van de deur voor de pizzajongen en het binnenspelen van dat laatste stukje. Met de snelheid van het licht wordt de geaggregeerde wereldwijde data verwerkt door een computer in een kunstmatig gekoeld datacenter ergens diep onder de grond.

Karen Levy en Luke Stark zijn onderzoekers aan de Universiteit van New York die onderzoek doen naar de rol van nieuwe vormen van monitoring in onze economie. In hun nog te verschijnen paper leggen ze uit dat klantenfeedback vaak hand in hand gaat met wat marketeers en managers customer engagement noemen. Bedrijven willen niet langer alleen de rationele noden van de consument bespelen (door het leveren van een goed of dienst). Nee, ze willen zich ook beroepen op niet-rationele factoren zoals gevoelens, verlangens, herinneringen en attitudes tegenover hun merk. Die feedback zorgt er ook voor dat de kennisongelijkheid tussen klant en bedrijf verdwijnt, wat in veel gevallen botst met de belangen van de werknemer die onderdeel is van de klantenervaring: empowerment heeft namelijk altijd een subject nodig waarover geëmpowered wordt.

Het is de geboorte van de consument-als-manager. Hij is verantwoordelijk voor de evaluatie van de werkers die onderdeel zijn van zijn klantenervaring. Het zijn de call-centermedewerkers die geëvalueerd worden op basis van de feedback die door de klanten worden gegevens. Maar het zijn evengoed de obers in restaurants die constant op hun hoede moeten zijn voor slechte recensies op TripAdvisor, Yelp en Foursquare. Maar het is iedereen die werkt in het tankstation, in de supermarkt of in de cinema waar online enquêtes worden gehouden over de geleverde diensten.

Maar wanneer we praten over ‘het personeel’, dan praten we vaak over de schijnbaar oneindige pool van werkmieren die actief zijn op één van de vele platformen uit de gig economy die betaald worden om microtaakjes uit te voeren. Voor online platformen zoals Handy, Lyft en TaskRabbit zijn beoordelingen en recensies cruciaal voor hun bestaan. ‘Dankzij de bemiddelende kracht van beoordelingssystemen kunnen bedrijven en platformen verwachtingen creëren over de dienst die hun werkkrachten uitvoeren.’ Dat zeggen Alex Rosenblat en Luke Stark in hun onderzoekswerk bij Uber-chauffeurs. Een beoordelingssysteem dwingt een minimale kwaliteit af en dat creëert een bepaald vertrouwen tussen de vragers en aanbieders van de dienst. Wie wil er ten slotte betalen voor een dienst waarvan men niet weet wat de kwaliteit zal zijn?

Aan de andere zijde, of het nu een levering is via Postmates, een taxirit via Lyft, een poetsbeurt via Handy of boodschappen via Alfred; voor de ‘verzoekwerker’ zijn beoordelingen cruciaal om in de toekomst ook zijn diensten te kunnen verkopen. Is dat niet geweldig? De gedachte dat elke beoordeling cruciaal is voor jobzekerheid zou de veiligheid, de geleverde diensten en het contact met de klant moeten verbeteren? Toch?

Een beoordeling: de fooi van de 21ste eeuw

Een manifest voorbeeld van hoe klantenbeoordelingen jobzekerheid beïnvloeden is Uber’s beruchte gevreesde 4.6-beoordeling. Uber’s partner-bestuurders zijn technisch gezien geen personeel van Uber, dus ze kunnen niet ontslagen worden. Maar als hun gemiddelde beoordeling onder de drempel van 4.6 valt dan kunnen ze tijdelijk of permanent gedeactiveerd worden van het platform. Bestuurders krijgen op regelmatige basis feedback waarin ze in een rangschikking geplaatst worden tegenover andere bestuurders.

Zoals bij elk online platform is het beoordelingssysteem een cruciale factor in het succes van Uber. Wie in een auto stapt bij een vreemde laat de bestuurder ten slotte toe in zijn of haar comfortzone. Desalnietemin zou een systeem van 24/7-monitoring, het screenen van bestuurders en team dat snel kan reageren op incidenten alle veiligheidsbezwaren overbodig moeten maken.

Toen UberPop naar Noorwegen kwam, schreef Sverre op zijn blog over zijn eerste week als bestuurder: ‘Het is onvoorstelbaar hoe veilig mensen zich voelen in een Uber-taxi. Ik vervoerde een een blond en aantrekkelijk meisje die een hekel had aan taxi’s. Ze vertelde dat ze verschillende vreselijke situaties had meegemaakt in een taxi en dat er geen enkele manier was om alarm te slaan. Sinds ze regelmatig met Uber reis heeft ze zich nog nooit onveilig gevoeld.’

Maar het beoordelingssysteem heeft ook enkele onbedoelde consequenties voor de doorsnee taxirit. De bestuurder wordt min of meer verplicht om zich te gedragen op een manier die zo weinig mogelijk mensen als ongepast zouden ervaren. Een nachtelijke discussie over politiek en een gepolariseerd onderwerp zit er dus niet in. Het is net zoals bij verkoopsters in klerenwinkels die verplicht moeten glimlachen of helpdeskmedewerkers die gevraagd worden om een joviale band met de klant te onderhouden; de angst voor slechte beoordelingen zorgt ervoor dat het private emotionele systeem onderworpen wordt aan de commerciële logica van de gig economy. Arlie Russell Hochschild, verbonden aan UC Berkeley en beroemd voor haar onderzoek met stewards en stewardessen noemt het ‘emotionele arbeid’: de productie en commercialisering van emoties die weinig te maken hebben met wie we zijn.

De bestuurder is vriendelijk, zijn achtergrond is nagegaan, de wagen is netjes en de passagier wordt van A naar B vervoerd. Wat moeten passagiers dan eigenlijk beoordelen? Wat stellen de nummers van 1 tot 5 voor? Verdienen enkel chauffeurs die je jas aannemen en de deur openhouden 5 sterren? Of is een rit van A naar B zonder noemenswaardige problemen voldoende? Wat met dat snoeppapiertje dat vanonder de zetel steekt, of die bocht die de bestuurder miste? Socioloog Robin Leidner observeerde een interessant detail in de gig economy: ‘In deze jobs is het onmogelijk om een onderscheid te maken tussen de werkkracht, het werkproces, het product en de uitkomst want de kwaliteit van de interactie is een onderdeel van de geleverde dienst.’ Met andere woorden: men betaalt niet voor een taxirit, maar voor de ervaring van vervoerd te worden.

Het moet gezegd worden dat Uber ook haar partner-bestuurders toelaat om klanten te beoordelen. Maar we kunnen er niet om heen dat er een enorme machtsongelijkheid in het wederzijds beoordelingssysteem schuilt. Als een klant een lage gemiddelde  score heeft wordt hij niet opgepikt. Als een bestuurder een lage gemiddelde score heeft is hij zijn job kwijt. Deze bestuurder vatte het als volgt samen: ‘Ligt het aan mij of voelt het aan alsof Uber ons goed bij ons ballen heeft? Er is een asymmetrisch beoordelingssysteem waarbij we bij een score van 4 een stap dichter bij het ballingschap staan. Passagiers hebben geen flauw benul dat bij een gemiddelde score van 4.6 onze voorwaardelijke veroordeling begint. In de geest van veel passagiers is een 4 op 5 een geweldige score.’

Zijn klantenwaarderingen onfeilbaar?

Doet Big Data het beter dan de baas of is het vatbaar voor dezelfde vertekeningen die ontstaan wanneer één verantwoordelijke zijn personeel beoordeelt? Kan Big Data cruciale informatie en patronen opsporen waar het middenkader faalt? Het extreme voorbeeld van Jason Dalton, de Uber-bestuurder die zowel een screening succesvol had doorstaan als een gemiddelde beoordeling van 4.73 had, vermoordde zes mensen en verwondde twee mensen terwijl hij aan het werk was. Dat vertelt ons alvast dat we geen mirakels moeten verwachten van een gecrowdsourcete en constante beoordeling.

Want ondanks het feit dat het algoritme van Uber wereldwijde de beoordelingen van passagiers en bestuurders verwerkt, wordt de input nog steeds door een mens van vlees en bloed gedaan. Mensen, dezelfde categorie van wezens waartoe ook het middenkader behoort, zijn imperfect en vatbaar voor tal van vertekeningen en vooroordelen. Ga er eender welke inleiding tot de psychologie op na: er is het halo en horn effect, leniency error en contrast bias. Klant is koning, maar we zouden hem overschatten indien we verwachten dat hij geen vooroordelen heeft.

Ten slotte wijzen verschillende studies – zoals deze en deze – op systematische discriminatie tegenover minderheden, zowel in traditionele werkplaatsen als in online marktplaatsen. In heel wat landen is het voor bedrijven verboden om te discrimineren bij het aanwerven van nieuwe mensen, zelf als hun klanten bepaalde ras- of geslachtsvoorkeuren hebben. Luke stark wijst erop dat bij het verdwijnen van het middenkader, online platformen de vooroordelen van hun klanten erven.

En als dat nog niet genoeg is belicht het onderzoek van Rosenblat en Stark, waarbij tal van Uber-bestuurders geïnterviewd werden, dat heel wat bestuurders vermoedden dat ze lage beoordelingen ontvingen voor zaken waar zij geen controle over hebben: GPS-problemen, een passagier die zijn oppiklocatie verkeerd doorgeeft, het niet toelaten van alcohol in de wagen, en surge pricing: een plotse stijging in de prijs tijdens spitsuren of door weersomstandigheden die bepaald wordt door de automatische prijszetting van het algoritme.

Omwille van deze redenen zijn klantenbeoordelingen een bron van stress en angst. Onderzoek wijst er nochtans op dat verzoekwerkers de beoordeling van een algoritme waarschijnlijk zouden kunnen aanvaarden indien het aan verschillende vereisten zou voldoen. Een belangrijk aspect is een procedure om de individuele data aan te vechten indien de score gebaseerd is op zaken waar de verzoekwerker geen controle over heeft. Ten tweede zou de data ook enkel voor de werknemer beschikbaar mogen zijn. In dat opzicht is de name-blame-shame-methode van Uber een slecht voorbeeld: ‘van taxietje spelen’ is geen competitie waar een rangschikking voor nodig is. Integendeel, voor velen is het een job waar een inkomen van afhangt.

Oude wereld, nieuwe technologieën

Zijn online platformen zoals Uber, AirBnb, Handy, Taskrabbit, Alfred en Postmates bedrijven die diensten verkopen, of zijn ze de juridische belichaming van een algoritme dat vraag met aanbod verbindt? Moeten hun partners geclassificeerd worden als werknemers of zijn ze slechts gebruikers van een platform? Het zijn belangrijke vragen omdat hun antwoorden het politieke en juridische framework bepalen waar ze in hoeven te werken.

Veel online platformen worden met argusogen bekeken door de lokale overheden in steden waar ze hun activiteiten uitrollen. In sommige steden wordt er een gemeenschappelijke grond gevonden maar in andere steden en landen worden hun activiteiten simpelweg verbannen omdat ze als oneerlijke competitie worden beschouwd. In sommige landen wordt de gig economy gezien als een voorbode van het einde van de welvaartsstaat aangezien de verzoekwerker niet kan genieten van dezelfde sociale rechten en bescherming als zijn buurman met een voltijdse job.

Maar zoals in dit artikel beschreven is ook het crowdsourcen van beoordelingen niet zonder vraagtekens. Het is een uiterst efficiënte manier van evaluatie, dus de kans is klein dat het zal verdwijnen. Maar we mogen niet blind zijn voor de keerzijde ervan. Als beoordelingen zo cruciaal zijn voor werkzekerheid, hoe moet de verwerking ervan omgaan met vooroordelen, racisme en grappenmakerij? Misschien moeten beoordelingen overzetbaar zijn naar andere platformen? Misschien moeten de berekening gestandaardiseerd worden? Hoe wordt de data opgeslaan en beschermd? Welke data mag er gedeeld worden met anderen?

In de plaats van technologische vooruitgang te temmen door het te onderwerpen aan oude wetten die gebouwd werden in het naoorlogse denkkader van de 20ste eeuw, moet er misschien nagedacht worden over hoe de hele maatschappij de vruchten van technologische vooruitgang kan plukken?

Hoe willen we als maatschappij de verzoekwerkers beschermen? Steken we ze in een apart statuut? Geven we ze een basisinkomen? Hoe moeten de platformen waar ze voor werken belast worden zodat een taxirit in Brussel, Frankfurt of Parijs niet in Ierland belast wordt? In de plaats van een race to the bottom te organiseren kunnen overheden samenwerken om er samen vooruit op te gaan. Mag tewerkstelling afhangen van het oordeel van een computer? En wie is er verantwoordelijk wanneer het beoordelingssysteem faalt en de dingen grondig fout gaan?

Het zijn allemaal vragen waar we morgen nog geen antwoord zullen op hebben maar die we vandaag al moeten stellen om een e-dystopie te vermijden. Hier is alvast een tip voor je: Als je een verzoekwerker inhuurt, laat je niet in met details zoals ongestrikte veters of ongewassen haar. Een luide niesbui? Kan iedereen overkomen. Geef die man of vrouw een dikke fooi en vijf grote sterren. Je zal je er niet alleen beter door voelen, de kans is groot dat je zelf vijf sterren terug krijgt.

Deel dit bericht

4 Reacties

BNNY

Goed geschreven! 8/10!

Egbert van Keulen

:-)))))

Stein Peeters

Er bestaan veel artikels over waarom je Airbnb ratings best niet vertrouwt. Zo blijkt het psychologisch heel moeilijk te zijn voor mensen om negatieve feedback achter te laten nadat ze iemand in levende lijve ontmoet hebben. Het ligt niet in onze natuur en lijkt zelfs sociaal onbeleefd om negatief te zijn tegen mensen die we net kennen. De mogelijkheid die Airbnb je geeft om privé feedback achter te laten aan een huurder of verhuurder speelt hier dan ook perfect op in.

Het zou niet de eerste keer dat je terecht komt in een licht smerige kamer met een mooi uitzicht op het aanpalende treinstation, maar er toch voor kiest om dan maar geen review na te laten.

Dat gezegd zijnde kan ik alleen dergelijke, moderne platformen alleen maar aanmoedigen!

ferdinandes

Herkenbaar verhaal die deze keer ook de rating kant van de aanbieder/verzoekwerker laat zien.
Verder verbaas ik me over de gretigheid waarvan bedrijven gebruik maken van rating en nps scores. Nadat ik net anderhalve seconde op een website ben willen ze al weten wat ik daar doe en of het bevalt. Op dat moment is het antwoord dan een duidelijke nee. Kunnen ze niet gewoon blij zijn als ik wat koop? ratings zijn de irritante popups van deze tijd en laten zien dat bedrijven altijd meer meer meer willen van je als klant.

Plaats een reactie

Uw e-mailadres wordt niet op de site getoond