Microsoft werkt aan AI-tool voor text-to-speech

Microsoft, aandeelhouder in OpenAI, werkt aan een AI-tool die iemands stem kan klonen op basis van drie seconden tekstinput.
Vooralsnog spreekt het model VALL-E alleen Engels, maar het kan dan wel weer unieke dialecten, tongvallen en emoties overbrengen. Een recent gepubliceerd onderzoek geeft tal van voorbeelden die dat illustreren.
VALL-E converteert een geschreven set woorden of hele zinnen in een behoorlijk natuurlijk klinkende audioweergave.
Wat Microsofts plannen met dit model zijn, is niet bekend. Andere OpenAI-modellen worden op dit moment beschikbaar gemaakt in de Azure-cloud als losstaande diensten, maar ook verwerkt in Microsoft-producten als Bing en Microsoft 365.
Foto: Steven Straiton (cc)
Plaats een reactie
Uw e-mailadres wordt niet op de site getoond