Deel dit artikel
-

Nederlands toegevoegd aan Mozilla Common Voice

Zo’n tweehonderd uur gesproken Nederlands, afkomstig van 2.549 stemmen, is toegevoegd aan Mozilla’s open source stemmenbibliotheek. Onderzoekers en ontwikkelaars kunnen er voicetoepassingen mee gaan bouwen.

Het Nederlands is, samen met onder meer het Esperanto, Farsi, Basksich en Spaans, nieuw toegevoegd aan Mozilla Common Voice. De stemmenbibliotheek bevat nu 1.400 uur aan gevalideerd stemfragmenten die zinnen voorlezen. Tot op heden spraken 42.000 vrijwilligers in 18 talen de teksten in.

Momenteel worden er van nog eens zestig andere talen fragmenten verzameld. Die worden in de loop van de kwartalen en jaren vrijgegeven.

De datasets uit Common Voice zijn bedoeld iedere enthousiasteling die privé, voor onderzoek, werk of studie digitale stemfragmenten wil gebruiken. Een logische toepassing is in voice-apps, maar aan het gebruik zijn geen voorwaarden verbonden.

Mozilla licht toe: “Ons doel is om zelf spraakgestuurde producten te ontwikkelen, maar ook om onderzoekers en kleinere spelers te faciliteren. Common Voice is hier onderdeel van, zo ook de Speech-to-Text en Text-to-Speech engines en modellen in DeepSpeech van onze Machine Learning-groep.”

DeepSpeech, gebaseerd op onderzoek van Baidu en draaiend op Google TensorFlow, heeft al concrete toepassingen opgeleverd. Mozilla: “Het kan met menselijke nauwkeurigheid en realtime spraak in geschreven tekst omzetten terwijl het wordt gestreamd. Hierdoor kun je bijvoorbeeld lezingen live transcriberen of telefoongesprekken, tv- en radioprogramma’s en andere live streams.”

Foto: Ed Schipul (cc)

Deel dit bericht

Plaats een reactie

Uw e-mailadres wordt niet op de site getoond