Die Firma Com Vision hat eine mit Audio Clipping eine Suchmaschine gestartet, die Radio- und Fernsehbeiträge nach Schlagworten durchsuchen kann. Ermöglicht wird dies durch eine Spracherkennungssoftware, die Gesprochenes in Phonem-Texte umwandelt. Aktuell (Jan. 2006) werden die Inhalte von 16 deutschen Sendern nach 24 Stunden Aufschub veröffentlicht.
Zur Umwandelung von Sprache in Text greift das Unternehmen auf Technik aus dem Hause Nuance zurück. Ein Algorithmus teilt die Sprache in kleine Lauteinheiten, so genannte Phoneme, die aneinandergereiht ein Wort ergeben. Ein Sprachmodell ordnet diese Einheiten zu einem sinnvollen Text zusammen. Dazu wird die Wahrscheinlichkeit errechnet, wann ein Phonem typischerweise auf ein anderes folgt. "Dies ist pure Mathematik und erfordert deshalb auch enorme Rechenleistung.
"Ziel von Audio-Clipping ist es, multimediale Inhalte für Suchabfragen greifbar zu machen", erklärte Kneidl. "Der Vorteil unserer Dienstleistung gegenüber anderen Medienbeobachtern ist, dass wir auch in der Vergangenheit suchen können, da die Daten ein Jahr gespeichert werden", meinte Kneidl.
Von der Idee für Audio-Clipping bis zur Marktreife benötigte das Unternehmen zwei Jahre. Am Ende der Entwicklung wollen die Programmierer eine Art Audio-Google bieten, das Podcasts, Internet-Sendungen und Streams in die Suche mit einbezieht.