BREIN haalt Artificial Intelligence dataset offline
Stichting BREIN heeft een grote Nederlandstalige dataset offline gehaald die werd gebruikt om kunstmatige intelligentie (AI) modellen te trainen. Na een tip ontdekte BREIN dat deze dataset bestond uit illegale kopieën van tienduizenden boeken, miljoenen regels uit nieuwsartikelen van websites zoals nu.nl en ondertitels van talloze films en tv-series uit illegale bron.
De enorme dataset was gecomprimeerd zodat deze makkelijk te gebruiken was door AI computermodellen zoals large language models (LLMs). Hoewel de dataset daarmee niet direct geschikt was voor consumenten om te lezen als e-book of nieuwswebsite, is dit niet toegestaan. Het kopiëren en dus ook het dataminen uit illegale bron is nooit toegestaan. Ook voor het dataminen van legale bronnen met een auteursrechtenvoorbehoud is toestemming van de auteursrechthebbenden vereist.
De dataset is inmiddels offline gehaald. De maker van de dataset heeft een verklaring ondertekend waarin hij belooft geen inbreuk meer te maken en heeft informatie gegeven over wie de dataset heeft ontvangen. BREIN onderzoekt nu welke AI-modellen deze dataset hebben gebruikt en zal de betrokken partijen aanspreken.
Om te helpen voorkomen dat partijen auteursrechtelijk beschermd materiaal massaal scrapen uit legale bronnen, raadt BREIN aan dat rechthebbenden een voorbehoud maken in lijn met de Auteurswet (artikel 15o.1). Veel bij BREIN aangesloten rechthebbenden doen dit al.
Plaats een reactie
Uw e-mailadres wordt niet op de site getoond