-

Hoe doen computers slimme dingen? Zo werkt reïnforcement leren

Supervised en unsupervised leren zijn erg nuttig, maar we gaan er dan wel telkens vanuit dat er voldoende data beschikbaar zijn: wat doen we als dat niet zo is? Kunnen we computers dan ook leren zelf data te verzamelen? En, welke data zijn dan interessant? Deze vragen zijn het domein van het zogenaamde reïnforcement leren.

In een poging om de zin van de onzin te scheiden op het gebied van Machine Learning, Data Science en AI – de naam doet er eigenlijk niet zoveel toe – schrijft Maurits Kaptein een serie van zes artikelen over “hoe computers slimme dingen doen”. Het eerste artikel liet zien hoe computers, door middel van een goed idee, een (wiskundige) formalisatie, en daarna optimalisatie, een leuke film voor vanavond kunnen aanraden. Het tweede artikel en het derde artikel lieten samen zien hoe computers leren van voorbeelden (supervised leren). In het vierde artikel bekeken we hoe computers data kunnen samenvatten (unsupervised leren).

Dit artikel is voor premium abonnees . Log in of meld je aan!