Deel dit artikel
-

‘Google sluit AI-datadeal met Reddit’

Socialmediagigant en beurskandidaat Reddit heeft naar verluidt een datadeal gesloten met Google om diens AI’s te trainen.

Persbureau Reuters baseert zich op drie bronnen die bekend zijn met de deal. Deze is zestig miljoen dollar per jaar waard, geld dat naar de bankrekening van Reddit stroomt.

Google is de eerste en vermoedelijk niet de laatste partij die tegen betaling aansluit op de waterslang met ruim zestien miljard talige uitingen van rond de zeventig miljoen actieve gebruikers van het discussieforum.

Reddit staat op het punt om naar de beurs te gaan. De commerciële waarde van het bedrijf ligt ten eerste in het bereik voor adverteerders, maar een opkomend domein is het leveren van trainingsdata voor AI-modellen. Zonder expliciete toestemming daartoe mag een partij niet zomaar alle data van een website ‘opdrinken’ en die voor eigen profijt aanwenden.

Typische databronnen waarmee LLM-makers hun systemen mee trainen zijn bijvoorbeeld: Common Crawl, RefinedWeb, The Pile en Wikipedia. Grok gebruikt Twitter.

Het is niet duidelijk waar Googles specifieke interesse naar uitgaat. Zelf heeft het ook doorlopend taalinput van miljarden internetgebruikers.

Foto: Eric Steuer (cc)

Deel dit bericht

Plaats een reactie

Uw e-mailadres wordt niet op de site getoond