-

Wacht niet op perfectie – leer van je fouten!

Zolang mensen dingen proberen, zullen ze fouten maken. De grote Duitse dichter Goethe stelde dat 200 jaar geleden al vast. Hoewel dat vandaag de dag nog steeds geldt, is er één groot verschil: alleen proberen is niet genoeg: je moet dingen sneller dan de rest proberen. Streven naar perfectie is niet verkeerd, maar in de hedendaagse digitale wereld kun je niet meer wachten tot je producten bijna af zijn, voor je ze aan je klanten aanbiedt. Doe je dat wel, dan riskeer je dat je achteropraakt. Hoe pak je dat het beste aan? Volgens mij is experimenteren in productontwikkeling de oplossing – zolang je accepteert dat sommige experimenten zullen mislukken.

Iedereen die weleens heeft geluisterd naar of heeft gewerkt met managementgoeroes kent het mantra: mislukkingen zijn nodig om vooruit te komen. Dat kan wel zo zijn, maar er is vaak een groot gat tussen theorie en realiteit. Mensen willen experimenteren en leren van zaken die fout gaan, maar hebben in de haastige dagelijkse realiteit vaak te weinig tijd voor reflectie, oorzaken van fouten en wat ze de volgende keer anders moeten doen. De oplossing schuilt in het vinden van een systematische aanpak, waarmee je voorkomt dat fouten zich kunnen herhalen.

Van perfectie naar anti-fragiel

Financieel wiskundige en essayist Nassim Taleb heeft een interessante kijk op fouten: hij stelt dat ze ongelooflijk waardevol zijn, omdat ze leiden tot innovatie. Hij illustreert dat met de term ‘anti-fragility’: digitale businessmodellen vragen om kleinere, frequente releases om risico’s te voorkomen. Dat betekent dat de technologie die deze nieuwe businessmodellen aandrijft, meer dan robuust moet zijn: anti-fragiel. De belangrijkste eigenschap van anti-fragiele technologie is dat mislukkingen mogelijk zijn zonder dat deze stopt met werken. Integendeel: crises maken de technologie zelfs sterker.

Bij Amazon streven we ook naar anti-fragiele systemen en oplossingen. Dat doen we door ze zo te ontwerpen dat ze de tand des tijds goed doorstaan, evolueren, en beter gewapend zijn tegen mislukkingen. Door feedback van klanten worden ze bovendien krachtiger en functioneler.

Een voorbeeld van een Duits bedrijf dat anti-fragiel is geworden, is HARTING, wereldwijd de grootste aanbieder van connectors voor machines en planten. HARTING laat zien hoe je het best een stap vooruitdenkt over kwaliteitsstandaarden in de digitale wereld. Kwaliteit en vertrouwen zijn de belangrijkste waarden voor dit traditionele bedrijf, en Industry 4.0 en de digitale transformatie zijn al sinds 2011 belangrijke focusgebieden. Hoewel het eerst moeilijk te accepteren bleek, heeft HARTING inmiddels ingezien dat fouten niet te voorkomen zijn. Om die reden is het bedrijf overgestapt naar ‘agile’ ontwikkelingsmethoden: het gebruikt microservices voor software, en kiest voor de benadering van “minimum-viable-products”: producten die beschikken over de allerkleinste basis om te kunnen werken, en daarmee levensvatbaar zijn. Hierdoor kan HARTING veel sneller producten afschrijven en nieuwe dingen proberen.

Dat is onder meer te zien aan HARTING MICA, een edge computing-oplossing waarmee oudere apparaten en fabrieken een digitaal nieuw jasje krijgen. De hardware weerspiegelt nog altijd het streven van HARTING naar perfectie, maar de software mag ‘goed genoeg’ zijn: een microservice is nooit klaar en nooit perfect: foute beslissingen en vergissingen kunnen snel worden rechtgezet, systemen groeien harder en benaderen sneller de anti-fragiele toestand. Mochten de omstandigheden veranderen, of mocht betere technologie beschikbaar zijn, dan kan een microservice worden weggegooid, en een nieuwe worden gecreëerd. Zo vergaar je snelheid, digitaliseer je oude machines heel snel en verbind je ze met de cloud – terwijl de kosten beheersbaar blijven.

Mislukkingen minder erg maken

Wie net als HARTING en vele andere bedrijven anti-fragiel wil worden, moet proactief op zoek naar de zwakke plekken in een systeem tijdens het experimenteren. Wanneer je dat niet doet, en een systeem evolueert, zullen er allerlei problemen optreden die je niet had voorspeld – zeker wanneer systemen naar onbekende grootten moeten kunnen schalen. Onderwerp je systeem daarom aan continue mislukkingen, en zorg ervoor dat subsystemen kunstmatig mislukken met tools als Chaos Monkey van Netflix.

Wie dat doet, zal zien dat mislukkingen en het omgaan daarmee een normaal iets wordt. En wanneer fouten ‘business as usual’ worden, zal niemand meer bang zijn om een risico te nemen, een nieuw idee of een nieuwe dienst te proberen en te kijken wat er gebeurt wanneer klanten deze in gebruik nemen. Zo vind je snel de oplossingen voor de toekomst die echt werken.

Bij Amazon noemen we onze benadering voor het systematisch en constructief omgaan met fouten de “oorzaak voor een fout methode”: in plaats van te zoeken naar daders, wordt de leerervaring gedocumenteerd, en worden er acties uit afgeleid die de beschikbaarheid van de systemen uiteindelijk verbeteren.  

Van onderliggende oorzaak tot innovatie

De methode vraagt eerst om oplossing van een probleem door analyse van de onderliggende oorzaak. Het is zaak de schade op te lossen en de zaak weer zo snel mogelijk draaiende te krijgen. Maar dan zijn we nog niet tevreden: we gaan verder, en proberen de maximale hoeveelheid inzichten uit het incident af te leiden. Dat proces begint pas wanneer we de klant weer op weg hebben geholpen.

Een belangrijk onderdeel van onze methode is het stellen van vijf waaromvragen. Alleen zo kun je bij de oorspronkelijke oorzaak van een probleem komen. Neem bijvoorbeeld een website: waarom was deze offline? De webservers deden verslag van timeouts. Waarom waren er timeouts? Omdat onze webservers overladen werden en de grote hoeveelheid verkeer niet aankonden. Waarom hebben we niet genoeg webservers? Omdat we de verkeerspieken niet in onze planning hadden opgenomen. Waarom namen we die pieken niet on onze planning op? Aan het einde van dit proces weten we precies wat er is gebeurd en welke klanten er last van hebben gehad. Pas dan zijn we in een positie om een actieplan op te stellen dat ervoor zorgt dat specifieke fouten niet meer voorkomen.

Door deze aanpak bereiken we behoorlijk vaak doorbraken, volledig in de geest van Nassim Taleb. Op deze manier werd onze Auto Scaling-oplossing gebouwd, nadat een bepaald klantsegment herhaaldelijk problemen had met sterk op- en aflopend verkeer. Wanneer de load groter wordt, zorgt Auto Scaling ervoor dat er een extra webserver wordt ingeschakeld om dit stijgende aantal verzoeken aan te kunnen. Andersom zorgt Auto Scaling er ook voor dat webservers die niet nodig zijn worden uitgeschakeld om kosten te besparen.

Wat ik duidelijk wil maken, is dat organisaties verder moeten kijken dan oppervlakkig succes. Dat geldt zowel voor de ontwikkeling van systemen, als businessmodellen: als je agile wil blijven in een complexe omgeving, moet je deze weg volgen. Zelfs als dat betekent dat je je comfortzone moet verlaten. Als we deze ideeën in een de context van een organisatie plaatsen, zijn er drie zaken om rekening mee te houden.

Omarm fouten als iets logisch

Jeff Bezos zei ooit dat hij Amazon ziet als ‘de beste plek ter wereld om te mislukken’. Dat inspireert veel van onze mensen om te experimenteren, fouten op te sporen en ze om te zetten naar iets innovatiefs. Het is daarom ook belangrijk om werknemers te belonen wanneer ze fouten vinden: onze beste producten komen voor uit fouten.

Leer om te gaan met incomplete informatie

In de digitale wereld moeten grondigheid en perfectionisme wat meer worden losgelaten. Technologie verandert razendsnel, wat betekent dat je zelf ook snel moet zijn. Neem dus ook besluiten op basis van incomplete informatie. Jeff Bezos verwoordde dat onlangs mooi: in een brief naar aandeelhouders schreef hij dat ‘de meeste beslissingen moeten worden genomen op basis van ongeveer 70 procent van de informatie die je denkt nodig te hebben. Wanneer je wacht tot 90 procent, ben je in de meeste gevallen te langzaam. Bovendien moet je goed zijn in het snel herkennen en corrigeren van slechte beslissingen. Wie dat goed doet, is minder geld kwijt aan fouten. Wie langzaam is, is sowieso veel geld kwijt.

Onderstreep de toegevoegde waarde van leren

Ik kan niet vaak genoeg zeggen hoe belangrijk een systematische aanpak bij het omgaan met fouten is. Maar een benadering werkt alleen als deze onderdeel is van de algehele cultuur. Zorg dat je het DNA van de cultuur kent en weet wat de mensen op de werkvloer denken en waar ze over praten. Experimenten in productontwikkeling prijzen en mensen aanmoedigen om fouten te vinden komt over als lege retoriek wanneer werknemers een gegronde reden hebben om de repercussies van mislukkingen te vrezen. Het creëren van een werkpraktijk waarin geëxperimenteerd mag worden vraagt om goed leiderschap.

Maar hoe bedrijven die cultuur ook instellen, één ding is zeker: wanneer het lukt, maakt het ze competitiever in de digitale wereld. En geeft het hen de vrijheid én moed om hun systemen, oplossingen en businessmodellen naar een hoger niveau te tillen.

Deel dit bericht

Plaats een reactie

Uw e-mailadres wordt niet op de site getoond