Deel dit artikel
-

Eerste tekstzoekmachine voor beeld en geluid

Het bedrijf Com Vision uit het Duitse Wismar heeft een zoekmachine ontwikkeld die radio- en tv-fragmenten op trefwoorden kan doorzoeken. Via spraakherkenningssoftware wordt gesproken woord in tekst omgezet. De zoekmachine indexeert de laatste 24 uur van Duitse televisie en radiozenders.

Het is de eerste zoekmotor die zoiets doet. Er bestaan al wel zoekmachines voor beeld en geluid, maar dan moeten trefwoorden meestal handmatig worden toegevoegd. Om gesproken woord naar tekst te vertalen, wordt gebruik gemaakt van de technologie van de Amerikaanse firma Nuance. Spraak wordt eerst in kleine spraakeenheden omgezet met behulp van zware Unisys systemen.

De zoekmotor  zal uiteindelijk niet gratis zijn. Voor de index van de zenders Antenne Brandenburg, Bayern 1, Bremen 1, NDR Info, SWR 3 en WDR Eins Live moet straks 70,50 per maand worden betaald. Onduidelijk is hoe het zit met de auteursrechten op de doorzochte teksten.

Het idee voor de zoekmotor is al twee jaar oud, maar de ambities gaan verder. Uiteindelijk wil het Duitse bedrijf, dat in spraaktechnologie is gespecialiseerd, een audioversie van Google ontwikkelen die podcasts en internet radiostreams kan indexeren. Directeur Manfred Buttner houdt rekening met een marktpotentie in Europa van 25 tot 30 miljoen euro in de komende twee jaar.

Deel dit bericht

1 Reactie

Arjan van Hessen

LS.aardig stukje maar niet heel actueel. Het geeft aan dat het zoeken in gesproken media een interessant onderzoeks/ontwikkelingsgebied is. In Nederland draait er echter al 4-jaar lang een proef waarbij 3xdaags de 2uur van het radio-1 journaal herkend wordt. De herkende uitzendingen kunnen eenvoudig onderzocht worden door het invoeren van zoekwoorden (zie: http://speech.tm.tno.nl/radio1/bin/index ).De volgende stap is nu het direct koppelen van radio en TV uitzendingen aan verschenen kranten. Dit gaat als volgt. We herkennen de spraak van het 8-uur journaal (zo goed en kwaad als mogelijk) en koppelen de herkende tekst aan krantenartiekelen van NRC-Handelsblad, Volkskrant, Trouw en AD. p deze manier krijg je dus een multimediabeeld waarbij je moeiteloos van beeld en geluid kunt switchen naar tekst (en andersom). Deze technologie maakt het mogelijk om te zien wat de kranten (wanneer) schreven over onderwerpen in het journaal en wanneer er op het journaal iets werd behandeld dat ook al in de krant stond. Deze technologie is een combinatie van spraakherkenning en tekst (taal) begrijpen.Een demo kan bekeken worden op: http://hmi.ewi.utwente.nl/?page=journaal_en_krant  Arjan van HessenHMI-groep, Universiteit Twente

Plaats een reactie

Uw e-mailadres wordt niet op de site getoond