Hoe doen computers slimme dingen? Zo werkt reïnforcement leren
Supervised en unsupervised leren zijn erg nuttig, maar we gaan er dan wel telkens vanuit dat er voldoende data beschikbaar zijn: wat doen we als dat niet zo is? Kunnen we computers dan ook leren zelf data te verzamelen? En, welke data zijn dan interessant? Deze vragen zijn het domein van het zogenaamde reïnforcement leren.