Robotjournalistiek: opmaat naar algorithm economy
Over robotjournalistiek bestaat veel scepsis, maar inmiddels begint automated journalism wel echt een serieuze toepassing te worden. Forbes, Associated Press en News Corp laten algoritmen al langer artikelen schrijven. In Nederland participeren mediabedrijven vooral in wetenschappelijk onderzoek. Maar er is meer.
‘The crime-ridden family of quinoa has taken US by storm this month.’ Het is heel eenvoudig om op internet voorbeelden te vinden van mislukte berichten, geschreven door robotjournalisten. Wellicht stelt het redacteuren die vrezen voor hun baan gerust, maar een dieper gravende journalist weet al gauw dat deze trend niet te keren is.
De voorbeelden zijn legio. Aardbevingen halen direct nadat ze hebben plaatsgevonden de website van LA Times, omdat de meldingen door computers automatisch worden omgezet in nieuwsberichten. Persbureau Associated Press werkt sinds vorig jaar met de software van Automated Insights, die het mogelijk maakt om niet driehonderd financiële berichten per kwartaal te leveren, maar 4.400. Het softwarebedrijf zelf claimt dat het eigen algoritme jaarlijks meer dan één miljard artikelen kan produceren.
In de machtsstrijd om het snelle nieuws doet AP-concurrent Forbes zaken met Narrative Science, dat met de tool Quill een serieuze tegenstrever is van Automated Insights. Hoe anders was dat in 2009, toen een student het programma Stats Monkey ontwikkelde om het verslaan van highschoolwedstrijden te automatiseren. Zes jaar later staat er een miljoenenbusiness. “Dit is een bedrijf dat getallen omzet in woorden”, zei voormalig CEO David Rosenblatt van DoubleClick (en bestuurslid van Narrative Science) een paar jaar geleden al in Wired. “Journalism might be only the sizzle, the steak might be management reports.”
Sprookjes
Dat berichten uit de koker van automated journalism steeds vaker niet meer te onderscheiden zijn van mensenwerk, heeft Eric Ariëns aan den lijve kunnen ervaren. De Country Manager van Strossle Benelux, een digitaal platform voor syndicatie en recommendation van artikelen en video’s voor digitale uitgevers, was aanwezig bij een test ontwikkeld door The New York Times. Een groep jonge journalisten moest van acht webteksten aangeven wie de auteur was: een mens of een robot. “Bijna iedereen heeft de helft fout”, lacht Ariëns. “Feitelijke teksten hoeven niet per se van robots te zijn, terwijl automated content zelf inmiddels al heel stijlvol kan worden opgeschreven.” De computer is tegenwoordig zelfs in staat om sentiment toe te voegen. “Dat is echt een grote stap. Dagbladen als NY Times en Financial Times zetten robotjournalistiek nog vooral in voor beurs- en sportberichten, maar de techniek is al in staat om zelfs gedichten of sprookjes te schrijven.”
Computers leren razendsnel van de fouten die ze maken, dus is het logisch dat automated journalism voortdurend verbetert. “Voor een gemiddelde journalist lijkt het best eng, maar dat is het helemaal niet”, beaamt Ariëns. “Het vak wordt er juist leuker door: journalisten kunnen saaie dingen uitbesteden, waardoor ze meer tijd hebben voor diepgravende verhalen.”
Indrukwekkend
Het belangrijkste Nederlandse onderzoek naar automated journalism wordt momenteel uitgevoerd door het interdisciplinaire Fontys Lectoraat Media (Journalistiek, Economie, ICT, Communicatie en Kunsten), dat afgelopen voorjaar een subsidie van zevenhonderdduizend euro binnenhaalde van het onderzoeksorgaan SIA voor de ontwikkeling van een geautomatiseerde nieuwsredactie. Samen met de Universiteit van Tilburg ontwikkelt het lectoraat onder meer tools die het mogelijk maken om automatisch nieuwsverhalen te vertellen. Het onderzoek krijgt ook steun van brancheorganisatie NDP Nieuwsmedia, waar onder meer de Persgroep, RTL Nederland en ANP bij zijn aangesloten. Een gedeelte van het onderzoek vindt plaats bij Telegraaf Media Groep.
Initiatiefneemster Hille van der Kaa werd onlangs benoemd tot hoofdredacteur bij Persgroep-krant BN DeStem, maar is nog steeds betrokken bij het Fontys-onderzoek. “Toen ik voor het eerst zag waar Narrative Science toe in staat is, stond ik versteld. Indrukwekkend hoe ze erin slagen om emotie en een speciale tone of voice toe te voegen aan algoritmen voor tekstproductie. Zo kun je een robotjournalist de opdracht meegeven om een sportverslag te schrijven als fan van ploeg B.”
GoalGetter
De techniek achter automated journalism schuilt vooral in het aanleren van taal aan computers. Specialist op het gebied van taalgeneratie is Mariët Theune, universitair docent Human Media Interaction (HMI) aan de Universiteit Twente. Hoewel ze dit onderwerp heel breed aanvliegt (van volksverhalen tot 3D-gaming), ontwikkelde ze tien jaar geleden met enkele collega-wetenschappers al een basale applicatie (GoalGetter) die voetbaluitslagen op Teletekst omzet in een redactioneel wedstrijdverslag.
“Dat oude onderzoek krijgt nu min of meer een vervolg, omdat we een NWO-subsidie hebben gekregen om samen met de Universiteit van Tilburg aan de slag te gaan met sportverslagen”, zegt Theune. “We gaan ditmaal niet puur inzetten op neutraal taalgebruik, maar steken in op emotionele taalgeneratie. Technisch gezien is dat al mogelijk. De content ligt er al: alles draait om het voeden van algoritmen met data. Lastiger is om daar via de achterdeur semantiek aan te koppelen.”
Theune is eerlijk over taalgeneratie door computers: “Die is nog niet perfect, er sluipen nog genoeg fouten en rare dingen in. Zodra meer duiding en wereldkennis gewenst is, wordt het lastig voor een algoritme. Veel ambitieuze voorspellingen zijn ook niet uitgekomen.” Zo ontstijgt automatisch vertalen in de praktijk nog altijd niet het niveau van Google Translate. “Een perfect opiniestuk zie ik voorlopig dan ook nog niet via automated journalism tot stand komen, maar voor factuele berichten, zoals weer, verkeer en politiezaken, is dat al prima mogelijk.”
The Wall Street Journal
Een medium dat al jaren digitaal vooroploopt, is The Wall Street Journal. Ook automated journalism speelt daarbij een rol, vertelt de Nederlander Almar Latour, die als Executive Editor onder meer verantwoordelijk is voor alle digitale activiteiten van de mediamerken WSJ, MarketWatch en Dow Jones. “Al heel lang passen wij vormen van automatisering toe op onderdelen van onze newsroom. Zo hebben we een algoritme gekoppeld aan tradinginformatie, zodat we de workflow van dat nieuws kunnen verbeteren. Daardoor kunnen verslaggevers tijd vrijmaken voor value-added content, zoals een unieke analyse.” Ook de productie van grafieken en infographics is deels geautomatiseerd. “Onze geschiedenis draait om cijfers, dus was het voor ons belangrijk om voor dit tijdrovende werk iets te ontwikkelen”, zegt Latour. “Datzelfde geldt voor data-analyse: doordat elke verslaggever nu razendsnel enorme datasets kan uitpluizen, ontstaat een nieuw soort investigative journalism. Daarbij sturen we ook op een veel systematischere aanpak van data.”
Door al dit soort ontwikkelingen wordt de journalistiek geleidelijk hervormd, meent de Nederlander. “Iedere verandering zorgt voor een klein stroomversnelling. Daarbij hebben we ook onze werkwijze veranderd: in het begin werden in de newsroom veel ‘one-of’ experimenten gedaan, maar we zetten nu actief in op de herbruikbaarheid ervan, op het kunnen voortbouwen. Een goed voorbeeld hiervan is ons recente virtual reality-initiatief, waarvoor we een eigen player hebben laten bouwen, met de bedoeling deze veelvuldig te gaan gebruiken voor tal van zaken.”
Text-to-video
Automated journalism is volgens Van der Kaa (Persgroep) veel breder dan alleen ‘robot-artikelen’. “Mensen worden er al veel vaker mee geconfronteerd dan ze doorhebben. Denk aan nieuwstrackers of politieberichten via Twitter. De toekomst schuilt in vormen die je niet meer van handwerk kunt onderscheiden. Over vier jaar hebben we het niet meer over losse artikelen. Een bedrijf als Narrative Science verdient ook geen geld met die berichtjes, maar met integrale salesrapporten.”
Behalve andere opdrachtgevers zijn ook compleet andere vormen van automatisering mogelijk, meent Ariëns. “De computer kan ook de juiste beelden bij artikelen zoeken, bewerken en plaatsen. Je hebt zelfs applicaties die zonder menselijke tussenkomst een video monteren, inclusief door robots ingesproken voice-overs.” Goed voorbeeld is Wibbitz, een ‘text-to-video’-technologie die ‘je favoriete verhaal’ in een paar seconden omzet in een trendy gemonteerde nieuwsvideo.
De basale vorm van automated journalism is volgens Latour (WSJ) onmisbaar voor de ‘wapenwedloop’ tussen concurrerende titels, zoals in zijn geval de financiële media. “Snelheid speelt bij ‘algo-artikelen’ een grote rol: wie het snelst kan publiceren, is het interessantst voor klanten. Daarbij speelt mee hoeveel je als uitgever investeert in technologie. Ook voor de productie van korte video’s vind ik automatisering interessant, met het oog op snelheid.”
Het toonaangevende dagblad van News Corp zet ook al enkele jaren in op een Audience Development Desk, die analyseert hoelang lezers bij een verhaal blijven en hoe de cursor beweegt over online infographics van de zakenkrant. Voor de redactie is al die innovatie allesbehalve wennen, meent Latour. “Iedereen hier is al goed thuis in informatie vergaren. Aan nieuwe ontwikkelingen doet onze newsdesk bijkans sneller mee dan dat wij informatie kunnen aanslepen.”
Netwerkanalyse
Van der Kaa denkt niet dat deze technologische ontwikkeling tot een ontslaggolf gaat leiden in de journalistiek. “Ik geloof niet dat er één redactiebaan wegvalt door automated journalism. De techniek is ook niet nieuw: het vakgebied van Natural Language Generation (NLG) bestaat al sinds de jaren zeventig, maar treft nu pas de mediawereld. Redacties bestaan straks nog wel, maar faciliteren veel meer op technisch gebied. Negeer het niet, maar zorg dat je ermee verbonden bent.”
De ontwikkelingen zullen breder zijn dan alleen journalistiek, verwacht ze. “Je kunt algoritmes ook inzetten om informatie te verzamelen of analyseren. Bijvoorbeeld sociale netwerkanalyse, waarbij je in grote hoeveelheden data nieuwe relaties zoekt.” Daarnaast denkt Van der Kaa aan informatie voor niches – van berichtgeving over MKB-bedrijven tot verslagen van amateurwedstrijden waar toch al nooit een verslaggever langs de kant stond. En het slim uitlezen van allerhande sensoren. “Denk aan automatisch gegenereerde data van schokmeters in Groningen.”
De ontwikkeling van geautomatiseerde journalistiek ligt volgens Theune (Universiteit Twente) in meerdere richtingen. “Ik verwacht veel van information retrieval, bijvoorbeeld het zoeken in videodatabases. Daar wordt steeds meer mogelijk door taal- en spraaktechnologie. Door in de toekomst al die aspecten aan elkaar te koppelen, ontstaat er misschien wel echt een robotjournalist.”
—————————
R.I.P. Circa News
Vooroplopen in de automation van nieuws is geen garantie voor succes. Dat ondervond Circa News, een nieuwsdienst opgericht door Matt Galligan en CEO Ben Huh van The Cheezburger Network. Deze app biedt ‘atomization’ van nieuws, ofwel het opknippen van nieuws in hapklare brokken, waarbij geïnteresseerden de mogelijkheid hebben om zich te abonneren op verdere updates. De lancering in 2012 trok redelijk wat aandacht, maar afgelopen voorjaar werd de app alweer ten grave gedragen vanwege gebrek aan funding.
“We hadden echt vernieuwende ideeën over het modulair aanbieden van nieuws als brokjes data”, vertelt Huh, dit najaar nog keynotespreker op Emerce eDay. “Deze werkwijze met ‘atomische’ content biedt de optie om precies te bepalen wat mensen wel en niet willen lezen. Helaas is het zonder groot marketingbudget lastig om uit te groeien tot een gevestigde, betrouwbare nieuwsbron.”
Hoewel Circa News het zelf niet heeft gered, ziet Huh wel dat andere mediabedrijven ‘zijn’ innovaties inmiddels toepassen in hun digitale strategie. “Wij slaagden erin om softwaregedreven productiviteit te verhogen, door middel van specifieke tools en een nadrukkelijk mobiele focus. Die trends gaan door. Ik vind Vox daarbij een echte technologische voorloper. Ook Buzzfeed heeft achter de schermen geweldige technologie ontwikkeld, met name gericht op contentdistributie. Daarnaast krijg ik de indruk dat The New York Times zwaar aan het investeren is in innovatie, al heeft dat nog niet allemaal de markt bereikt.”
Vertrouwen
Automated journalism is een kenmerkend voorbeeld van de Algorithm Economy, die in oktober door onderzoeksdirecteur Peter Sondergaard van Gartner werd aangekondigd op vakbeurs ITxpro in Orlando. “Data zijn op zichzelf dom, algoritmen halen er de echte waarde uit”, aldus Sondergaard. “Bedrijven zullen niet alleen beoordeeld worden op hun big data, maar vooral op de aanwezige algoritmen die data omzetten in acties en consumenten beïnvloeden.”
Volgens Gartner slaagt het bedrijfsleven er eindelijk in om de Internet of Things naar zijn hand te zetten. Volgend jaar zal er 2,5 miljoen dollar per minuut aan worden uitgegeven. Digitale opbrengsten zitten tegelijk ook in de lift: in 2020 verdient het bedrijfsleven er tachtig procent meer mee.
“Mensen gaan software vertrouwen die voor hen denkt en handelt”, aldus Sondergaard. De volgende stap: algoritmen die zelf leren van ervaring en uitkomsten die hun bedenkers nooit hadden verwacht. “Uiteindelijk gaan algoritmen zelf andere algoritmen ontwerpen, en ontstaan robots uit robots. Daarom is het belangrijk om nu goede algoritmen te ontwerpen.”
* Dit artikel verscheen eerder in het decembernummer van Emerce magazine (#145)
Deel dit bericht
Plaats een reactie
Uw e-mailadres wordt niet op de site getoond
2 Reacties
Astrid Maria Boshuisen
Grapjasjes, die geinterviewden. Automated journalism is geen bedreiging voor de journalist. En er gaan geen banen aan verloren, we kunnen juist fijn diepte-interviews gaan schrijven. Ik voeg hier nog enkele even geloofwaardige aanvullingen aan toe: de maan is van witte chocolade, Cher heeft nooit plastische chirurgie ondergaan, en de AOW-leeftijd gaat niet verder omhoog.
Edwin Kisman
Ik zou daar maar niet zo zeker van zijn.
In ieder geval alert zijn en tijdig omscholen.
Zie http://vakblad.info/twitter-bestaat-niet-meer/