Industry Wire

Taaltechnologen voorspellen TIME’s ‘Person of the Year’ met computermodel

Woensdag 11 december maakt het Amerikaanse TIME Magazine bekend wie de ‘Person of the year 2013’ is. Een internationale groep taaltechnologen afkomstig van de Universiteit Antwerpen, de Radboud Universiteit Nijmegen, het Meertens Instituut en de University of Illinois heeft nu een computermodel gebouwd waarmee zij de uitkomst voor 2013 hebben voorspeld.

Al sinds 1927 verkiest TIME Magazine jaarlijks een ‘Person of the Year’. Het Amerikaanse blad vestigt zo de aandacht op een figuur die een belangrijke positieve of negatieve rol heeft gespeeld in het voorbije jaar. Taaltechnologen hebben nu een computermodel gebouwd waarmee zij de uitkomst voor 2013 hebben voorspeld. Dit model maakt uitsluitend gebruik van de artikelen die tijdens de voorafgaande jaargang door het blad zelf zijn gepubliceerd.

Learning to rank
Via kwantitatieve methodes uit de computertaalkunde kan men de ‘culturele impact’ van personen meten in teksten. Als iemand bijvoorbeeld gedurende lange tijd wordt vermeld in een onafgebroken reeks nummers van TIME, is dat veelzeggend. In plaats van gebruik te maken van louter frequentie-informatie, maakt het model gebruik van ‘learning to rank’, een geavanceerde technologie die vaak door online zoekmachines wordt toegepast. Het model maakt bovendien handig gebruik van informatie op Wikipedia om dubbelzinnige persoonsnamen te ‘desambiguëren’. Een computer weet immers niet onmiddellijk over welke ‘Clinton’ het gaat in een tekst.

29 procent bij het rechte eind
De onderzoekers hebben hun model getest op eerdere ‘Persons of the year’. Voor de periode 1923-2006, stond de ‘Person of the Year’ in maar liefst 78 procent van de gevallen in de top-10 van het model. In 29 procent van de gevallen kon het model de juiste persoon op de eerste plaats rangschikken.
Dit zijn uitmuntende scores omdat het magazine in elke jaargang vaak meer dan 5000 verschillende personen vermeldt. Soms verkiest het tijdschrift ook abstracte groepen zoals ‘The American Soldier’ in 2003 of ‘You’ in 2006. ‘Op dergelijke keuzes bijt het model, begrijpelijk, zijn tanden stuk’, aldus Mike Kestemont (Universiteit Antwerpen).
Folgert Karsdorp (Meertens Instituut / Radboud Universiteit Nijmegen) licht verder toe: ‘Het is verrassend dat deze beslissing in veel gevallen vrij goed is te modelleren. Misschien hebben we het voor 2013 bij het juiste eind, misschien niet. De redactie van TIME heeft steeds het laatste woord en zij deinzen er niet voor terug om helemaal op het einde nog voor een aardige verrassing te zorgen.’

Barack Obama?
Voor 2013 voorspelde het model onderstaande rangschikking, met Barack Obama in eerste positie en een opvallende derde plaats voor actrice Miley Cyrus. De zopas overleden Mandela valt net buiten de top 10 in deze lijst. Voor de onderzoekers is het nu nieuwsgierig wachten op de officiële bekendmaking door TIME op woensdagochtend. Binnenkort zullen zij hun methode voor peer review indienen bij een vooraanstaand vaktijdschrift. Deze resultaten spreken boekdelen wat betreft de belangrijke rol die computers nog zullen spelen in geesteswetenschappelijk onderzoek, in het bijzonder de Digital Humanities of eHumanities.

1: Barack Obama
2: Vladimir Putin
3: Miley Cyrus
4: George W. Bush
5: Angelina Jolie
6: Katie Couric
7: David Bowie
8: Rush Limbaugh
9: John Kerry
10: Hamid Karzai

Het TIME Person of the Year 2013-model is ontwikkeld door:
– Folgert Karsdorp, Meertens Instituut / Radboud Universiteit Nijmegen,folgert.karsdorp@meertens.knaw.nl (contactpersoon Nederland; 00-31-641422136);
– Mike Kestemont, Universiteit Antwerpen / FWO-Vlaanderen, mike.kestemont@uantwerpen.be(contactpersoon België; 00-32-477918668);
– Antal van den Bosch, Radboud Universiteit Nijmegen (a.vandenbosch@let.ru.nl; 00-31-624422434 – woensdag 11 december niet goed bereikbaar)
– Walter Daelemans, Universiteit Antwerpen
– Dan Roth, University of Illinois at Urbana-Champaign

Dit artikel is een ingezonden bericht en valt buiten de verantwoordelijkheid van de redactie.

Deel dit bericht