Deel dit artikel
-

Nederlands algoritme reikt nieuwe Wikipedia onderwerpen aan

Onderzoekers van de Universiteit van Amsterdam hebben een nieuwe methode ontwikkeld die suggesties voor nieuwe Wikipedia-pagina’s aanreikt. Dit gebeurt op basis van populariteit op sociale media.

David Graus, promovendus bij het Intelligent Systems Lab Amsterdam (ISLA) van de UvA, ontwikkelde met collega’s een methode om automatisch nieuwe, opkomende of onbekende concepten te herkennen, nog voordat ze zijn opgenomen in Wikipedia. Het algoritme werkt door sociale media (Twitter) te analyseren, en leert onbekende concepten te herkennen door te kijken naar hoe mensen over concepten praten die al wel bekend zijn.

De onderzoekers gebruikten hiervoor ‘semantisch linken’, waarbij betekenis wordt gekoppeld aan woorden. Dit helpt bij het interpreteren van grote hoeveelheden content. Semantisch linken draait om het koppelen (linken) van woorden aan concepten die beschreven zijn in kennisbanken zoals Wikipedia of Freebase. Zo wordt slim gebruik gemaakt van de grote omvang van online kennisbanken, die samen miljoenen concepten beschrijven. Maar hoe link je concepten die (nog) niet op Wikipedia of Freebase staan beschreven?

Die vraag is van belang in verschillende domeinen, waaronder de digital forensics, waarbij rechercheurs ‘onbekende’ personen in e-mail willen herkennen en linken, om zo bijvoorbeeld een profiel te genereren van sleutelpersonen binnen een netwerk. Ook in de context van nieuws speelt het identificeren van nog niet bekende concepten een belangrijke rol.

Het algoritme is zelflerend, en maakt gebruik van de ‘voorkennis’ uit Wikipedia om nieuwe concepten te leren herkennen. Dit is een eerste stap naar het automatisch aanvullen van Wikipedia met nieuwe inhoud op basis van wat wordt besproken op sociale media.

Deel dit bericht

Plaats een reactie

Uw e-mailadres wordt niet op de site getoond