Deel dit artikel
-

Synthetische media: de positieve businesscases van deepfakes

Van geinige face swaps tot bedrieglijke nepvideo’s van politici. Deepfaketechnologie ziet vooral aandacht op zich gericht door humor of angstscenario’s. Synthetische media, zoals het bredere veld genoemd wordt, maken echter ook nieuwe, positieve businessmodellen mogelijk. Zo verandert het al de manier waarop stilstaand en bewegend beeld worden geproduceerd.

Met de ontwikkeling van kunstmatige intelligentie streeft de wetenschap kort gesteld naar het zo goed mogelijk nabootsen van het menselijke brein. De heilige graal hierbij lijkt het vatten van de tamelijk onaantastbare menselijke creativiteit. En het lukt zelflerende, kunstmatig intelligente systemen steeds beter om die na te bootsen. Recent baarde OpenAI, bekend van tekstgenerator GTP-3, bijvoorbeeld nog opzien met door software gegenereerde afbeeldingen van ‘an armchair in the shape of an avocado’. Die frase was de enige input die het systeem DALL-E kreeg, met als resultaat een keur aan ontwerpen, waarvan vele niet zouden misstaan op de site van een high-end woonwinkel. En ook de opdracht tot het maken van afbeeldingen van winkelpuien met het OpenAI-logo erop en zelfs ‘een illustratie van een babydaikonradijs in een tutu die een hond uitlaat’ gaf goede resultaten.

Dat hier een enorme complexiteit achter schuilgaat, laat zich raden. Kenmerkend aan het voorbeeld is echter dat het aan de voorkant steeds eenvoudiger zal worden om er gebruik van te maken. Techexpert en spreker Jarno Duursma, die al enkele boeken schreef over AI en synthetische media, merkt op dat de drempel steeds lager wordt. En ziet vooral heil in de rol van kunstmatig intelligente systemen als ‘meefantaserende machines’ die het creatieve proces ondersteunen. “Een systeem kan telkens nieuwe content maken en nieuwe invalshoeken creëren, en zo de menselijke creativiteit prikkelen. Met de meest geniale en bizarre dingen. Alles wat we in de echte wereld al kennen, maar dan met oneindige variatie. Ergens daartussen zitten de gouden ideeën.”

Duursma ziet design dan ook als een belangrijke tak van sport voor solide businesscases. Denk aan creatie van logo’s, albumhoezen, websites en bloemenvazen, of een oneindige bron van stockfoto’s. En vooral de mogelijkheid om geschreven teksten te kunnen omzetten naar afbeeldingen en video’s, is volgens hem kansrijk. Denk aan synthetisch gegenereerde avatars die het mogelijk maken om heel snel video’s te produceren. Op basis van een alinea tekst genereer je een video waarin een niet-bestaande, maar realistische mensfiguur het verhaal vertelt. Desgewenst met één druk op de kop in een andere taal.

Zakelijke impact
Synthesia.io, dat onder andere WPP, Reuters en de BBC tot zijn klanten mag rekenen, is een van de bedrijven die dit terrein verkent. Momenteel is de kloof tussen hoeveel mediabedrijven willen produceren en wat ze zich qua kosten en tijd kunnen veroorloven nog erg groot, meent CEO en medeoprichter Victor Riparbelli. Zonder dure fysieke processen is die kloof te dichten, stelt hij. Synthetisch gegenereerde content zal in zijn visie, die hij op Medium uit de doeken doet, tot stand komen in drie automatiseringsslagen. Elk met hun eigen usecases, schaalbaarheid en mate van interactie tussen mens en machine. Hij ziet hierbij parallellen met synthetische instrumenten (muziek maken op een computer) en Photoshop (digitaal afbeeldingen maken). Momenteel zitten we volgens hem in de fase van videocontent die wordt geproduceerd met behulp van AI. Video’s worden samengesteld door mensen die AI-tools gebruiken om video en audio in elke taal te synthetiseren. Daarna volgt programmeerbare video, waarbij algoritmen de productie van video’s op schaal mogelijk maken. De sjablonen worden door mensen ontworpen, maar algoritmen zullen dagelijks automatisch miljoenen video’s samenstellen: gepersonaliseerde video’s, datagestuurde nieuwsbulletins en schaalbare videochatbots die automatisch via API’s zullen verschijnen.

Om ten slotte uit te komen bij volledig generatieve video waarbij algoritmen vrijwel autonoom inhoud kunnen creëren. Daarbij zal de daadwerkelijke zakelijke impact minder opwindend zijn dan momenteel verwacht, denkt Riparbelli. Stel je bijvoorbeeld een AI-bot voor die automatisch geschreven artikelen omzet in een video door de tekst samen te vatten, om te zetten in gesproken taal en overeenkomende afbeeldingen op te halen om een korte video te maken. En dat in tientallen talen doet.

Diepe
Een van de Nederlandse bedrijven die met synthetische media actief zijn, is Lalaland.ai. De software van deze Nederlandse start-up – begonnen in 2019 – genereert afbeeldingen van niet-bestaande menselijke modellen die onder andere gebruikt kunnen worden in modewebwinkels. Met het doel om meer inclusiviteit en diversiteit in e-commerce te brengen, vertelt medeoprichter en CEO Michael Musandu. Doorgaans zien consumenten de kleding getoond door één of slechts enkele verschillende modellen, die bovendien slechts één maat van de kleding showen. “Veel mensen herkennen zich niet in de modellen, merken kiezen bijna altijd voor aspirational beauty. Hierdoor missen bedrijven kansen om nieuwe klanten voor zich te winnen.”

Consumenten kunnen onder andere de etniciteit en maten van de modellen aanpassen, op een manier die vergelijkbaar is met het selecteren van maten. Het is echter niet alleen de consument waardoor Lalaland.ai tot zijn businessmodel kwam. Ook een, in Musandu’s woorden, logistieke nachtmerrie wordt ermee opgelost. Shoots zijn met zaken als locaties, fotografen, opmaak et cetera kostbaar en collecties volgen elkaar in rap tempo op. “Dat kon een tijd uit voor merken, totdat er hoge retouren kwamen. Je kunt niet langer een droom verkopen, alleen nog de realiteit.” Volgens eigen berekeningen van de start-up kunnen de kosten met zo’n zeventig procent omlaag. En uit A/B-tests blijkt dat er 140 procent vaker doorgeklikt wordt, wat weer leidt tot gemiddeld vijftien procent meer omzet. “Op basis van zaken als zoekopdrachten en verkopen kunnen wij vertellen welke modellen goed verkopen. Ook monitoren we de interactie en het engagement.”

Het leverde de start-up een samenwerking met lingeriemerk Sapph op als launching customer, dat met een beperkte versie van de toepassing van start is gegaan. Met andere grote modespelers wordt momenteel getest. “De meeste merken testen nu of klanten het verschil zien tussen echte modellen en onze beelden.” Dat gestart is met lingerie is nu een voordeel voor verder werk in de modebranche, meent de oprichter. Lingerie is erg getailleerd en moet heel goed lijken en passen. “Het was een sprong in het diepe met een geweldige leercurve.”

Hollywood
Duursma ziet ook kansen voor digital twins (digitale varianten) van bekendheden, zodat ze altijd inzetbaar zijn. “Met een acteur als dubbelganger waarop hun hoofd wordt ‘gedeepfaket’, hoeven ze zelf niet meer bij een opname te zijn.” Voice cloning, het digitaal namaken van iemands stem, speelt hier ook bij mee. De beroemdheid spreekt een aantal A4’tjes tekst in, waarna zijn stem gebruikt kan worden om hem via een toetsenbord van alles te laten zeggen of oplezen. Van journaals tot boeken en versjes. Brand voices zullen eenvoudiger zijn in te zetten, voorziet Duursma. Bekende Nederlanders kunnen hun stem eenvoudige uitlenen aan wie ze willen. Tegen lagere productiekosten dan voorheen gebruikelijk.

Op veel vlakken bevindt dit alles zich echter nog in het prille begin. Maar volgens Duursma zullen synthetische media een nieuwe categorie worden, zoals sociale media en het internet zelf dat ook zijn. Het is een volgende fase in contentcreatie.

Verder in de toekomst ligt de inzet van synthetische media in online marketing. Zoals voor individuele productplacement. Denk aan een gaming-scene die gegenereerd wordt op basis van iemands favoriete merken. Omdat ze zo gepersonaliseerd zijn, worden ze geloofwaardiger, aldus Duursma.

Een vraag die opkomt bij het zien en horen van voorbeelden, is hoe bereikbaar de technologieën op dit moment zijn. De apps die op het fundamentele onderzoek worden gebouwd, zijn vooral nog grappig: je gezicht wisselen met dat van een celebrity is mogelijk, maar een authentiek ogende video maken waarin een bestaand persoon iets zegt dat hij nog nooit heeft uitgesproken, gaat verder dan even stoeien en vraagt om serieuze kennis van videocreatie. Waar ook stevige prijzen voor worden gevraagd, weet Duursma. Voor een hoge kwaliteit deepfakefilmpje van een halve minuut wordt al gauw vijf- à zesduizend euro gerekend. “De mensen die het echt kunnen, zijn schaars.” Kijkend naar de ontwikkeling van reguliere videoproductie weten we echter dat die naarmate van tijd democratiseert: steeds meer mensen zullen toegang krijgen tot kwalitatief hoogwaardige productiemiddelen.

Vooruitkijkend ziet Musandu het genereren van volledige persoonsfiguren in video, virtuele catwalks, digitale fashion en virtuele influencers toenemen. Mede geholpen door “een explosie aan computerkracht en talent”. Verschillende (online) bijeenkomsten rond het onderwerp afgelopen jaar laten volgens hem zien dat de manier waarop we content maken en consumeren verandert. “Het gaat ook Hollywood in. Contentproductie wordt aanzienlijk goedkoper.”

Schaduwzijde
Hoewel synthetische media kansen met zich meebrengen, blijft het cruciaal om de donkere kant niet uit het oog te verliezen, zegt Jarno Duursma. De scheidslijn tussen echt en nep wordt steeds dunner. Je kunt echt je oren en ogen niet meer vertrouwen. “Wil je iemand in een kwaad daglicht zetten, dan kun je steeds makkelijker deepfake content genereren die dat onderstreept. Denk aan op verschillende fora schrijven dat iemand iets slechts heeft gedaan, met geautomatiseerde botposts eronder die het bevestigen. We gaan met synthetische media echt van post-truth naar post-reality. De gedeelde werkelijkheid brokkelt nu af. Je bent het niet meer eens over wat de feiten zijn, want je weet niet meer of die feiten daadwerkelijk zijn gebeurd. En andersom: als iets wel gebeurd is, kan iemand deepfake claimen.”

Daarnaast is er aandacht nodig voor eigendomsrechten. Wat is nu eigendom van wie? Als een stem is gekloond en daar een radiospotje of een liedje mee wordt gemaakt, wie kan daar dan een claim op leggen? Vergelijkbare vragen dienen er gesteld te worden over ‘digitale onsterfelijkheid’. Duursma: “De kloon van iemands stem kun je oneindig blijven gebruiken. Je kunt een avatar van iemand laten maken. Moet je dan het recht om niet gekloond te worden ook in je testament hebben staan in de toekomst?”

En, een overkoepelende vraag, wat doet de digitalisering met de beleving van ons menszijn? In theorie kan alle contact door een avatar vervangen worden. De komende tijd volgt een extra golf van plekken waar we menselijk contact digitaliseren, zeker in het tijdperk van corona. Nu kom je tot in de spreekkamer van de dokter al niemand meer tegen in het ziekenhuis. Boodschappen doen we met een scanner. En bij de bestelkiosk van McDonald’s krijg je alleen nog een papieren zak van iemand. “Door menselijke vaardigheden en menselijke verschijningsvormen te digitaliseren, drukken we echt menselijk contact nog verder naar de achtergrond, en moeten we ons afvragen of we dat wel willen.”

Shutterstock
Stockfotografiebedrijf Shutterstock maakte onlangs bekend dat het TurboSquid, een digitaal mediabedrijf dat 3D-assets verkoopt, heeft overgenomen voor 75 miljoen dollar. Hiermee zal het zijn gebruikers elementen in handen geven om zelf afbeeldingen te fabriceren. En suggereert het dat voor de toekomst van fotografie geen camera nodig is.

Volgens CEO Stan Pavlovsky moet de overname twee tot drie procent toevoegen aan de totale omzet van Shutterstock. Een groeidomein bovendien. Momenteel is 3D gericht op zeer hoogopgeleide professionals en op meer nichecategorieën, zoals industriële toepassingen, meent de CEO. In andere branches zullen synthetische content en bijbehorende workflows echter ook belangrijker worden.

Pavlovsky zegt open te staan voor regelgeving, zodat 3D-media op verantwoorde wijze worden gemaakt. Enige regelgeving is volgens hem nodig door onder andere privacyproblemen.

Unreal
In het streven de creatie van levensechte, niet-bestaande personen toegankelijker te maken, heeft 3D-egine Unreal de MetaHuman Creator ontwikkeld, een in de cloud gestreamde app die volgens de maker het proces van weken of maanden terugbrengt naar ongeveer een uur. Dit door gebruikers te laten putten uit een steeds groter wordende bibliotheek van varianten van menselijk uiterlijk en beweging. Op een manier die zich laat vergelijken met het kiezen van een custom gamepersonage en het manipuleren van beelden in Photoshop. Zo is er te kiezen uit ongeveer dertig kapsels en is er een set voorbeeldkleding, evenals achttien lichaamstypes met verschillende proporties.

Een gemaakt persoon kan daarna op verschillende manieren geanimeerd worden, zoals via automatische herkenning van gezichtsuitdrukking. En animaties die voor de ene MetaHuman zijn gemaakt, kunnen op elke andere MetaHuman worden toegepast, wat hergebruik in verschillende projecten mogelijk maakt.

Afbeelding: o.b.v. ThisPersonDoesNotExist.com

* Dit artikel verscheen eerder in het maartnummer van Emerce magazine (#182).

Deel dit bericht

Plaats een reactie

Uw e-mailadres wordt niet op de site getoond