Ob Laptops, PDAs, Handys oder Diktiergeräte:

Spracherkennung wird mobil - Anwendungen für Juristen, Mediziner und Kfz-Sachverständige

Von Gunnar Sohn

Düsseldorf/Bonn, www.ne-na.de, 5. April 2007 - In den USA begann in den 60er-Jahren die Spracherkennungsforschung, die Transformation von Sprache in Text, doch erst in den 90er-Jahren konnten Dragon Systems und IBM mit Entwicklungen auf sich aufmerksam machen, die mit 5. 000 erkennbaren Einzelwörtern praxisrelevante Anwendungen zuließen. „1991 stellte IBM ein System vor, das bis zu 30.000 Wörter unterschied. Ende 1993 folgte eine für einen normalen PC taugliche Erkennungssoftware“, berichtet die Zeitschrift Creditreform http://creditreform-magazin.mittelstandswissen.de.

Mittlerweile sind Systeme am Markt, die über 60.000 Wörter verfügen. Über ein Hintergrundlexikon kommt man auf bis zu 400.000 ergänzende Begriffe. Mehrsprachigkeit ist auch kein Problem. „Angebote gibt es unter anderem von Philips, Nuance, Dicta Net, Ling Com, Loquendo, Siemens, IBM und Linguatec. Für Windows, Mac und Linux, für PCs und Laptops, auch für PDAs, zurückzuführen auf Entwicklungen des belgischen Sprachspezialisten Lernout und Hauspie“, so Creditreform.

„Durch die Ausweitung der sprecherunabhängigen Spracherkennung, durch die gezielte Softwareoptimierung für moderne PC-Prozessoren von Intel und AMD ab 1,5 GHz und durch die verbesserte Abstimmung der Eingabetechnik konnte eine deutliche Verbesserung der Erkennungsrate und der Verarbeitungsgeschwindigkeit erreicht werden“, bemerkt Carsten Günther, Leiter der Spracherkennungstechnologie im IBM-Entwicklungszentrum in Böblingen. Erkannt werde beispielsweise fließende, also kontinuierliche Sprache. Vorbei seien die Zeiten, in denen nach jedem Wort eine künstliche Pause eingelegt werden musste. Die gesprochene PC-Eingabe sei laut IBM dreimal schneller als die Eingabe mit der Tastatur. Dazu komme der Vorteil, dass die Sprachtextdateien dank dem hinterlegten Wörterlexikon samt Rechtschreibung fehlerfrei seien.

„Mit der Ausweitung der sprecherunabhängigen Spracherkennung ist gemeint, dass deren Worterkennungsrate mittlerweile an die einer sprecherabhängigen Variante heranreicht, bei der das Sprachprofil, die Diktierweise und Aussprache des Systemnutzers trainiert und eingespeichert ist. Laut IBM-Manager Günther sind die Grenzen inzwischen sogar fließend“, schreibt Creditreform. Die Erkennungsrate liege bei 97 bis 98 Prozent und mit fortschreitender Nutzung verbessere sich sogar die Rate durch Sprecheranpassung.

Auch Fachsprachen sind zunehmend ein Thema für die Anbieter von Sprachtechnik - etwa für Recht, Medizin, Finanzen und Versicherungen: Bei Branchenanwendungen für Juristen, Mediziner oder Kfz-Sachverständige wird häufig mit mobilen Digitaldiktiergeräten gearbeitet. Nach Expertenmeinung sei der reibungslose Datenaustausch von solchen Mobilgeräten mit allen gängigen Computereinrichtungen gewährleistet.

Mobile Spracherkennungssysteme sind auch nach Einschätzung von Bernhard Steimel, Herausgeber des Fachdienstes Voice Community http://www.voice-community.de und Sprecher der Initiative Voice Business http://www.voicedays.de, im Kommen. „Das konnte man auf der 3GSM-Konferenz in Barcelona verfolgen. Das Thema wird von Suchanwendungen getrieben, die mittlerweile hoch konvergent sind und oft auf intelligenter Hybridtechnik beruhen. So wurden erste Handys vorgestellt, die ein so genanntes ‚One Button Voice Control’ ermöglichen: Drückt man den „Voice-Knopf“, schreibt die Sprachsteuerung ähnlich wie Nuance Dragon am PC direkt in den Cursor oder liest bei einem anderen Kommando das gerade offene Display vor. Das erleichtert zum Beispiel die Nutzung von E-Mails oder SMS: Wer eine E-Mail empfangen und gelesen hat, drückt einfach den Voice-Knopf, befiehlt ‚Antworten’, das Handy öffnet die Antwort-Mail und der Cursor springt in die Adresszeile. Oder man drückt den Voice-Knopf, öffnet mit ‚Börsenkurse’ die gewünschte Applikation, nennt das Nasdaq-Kürzel der Aktie und schon sendet der Server die Kursdaten als übersichtlichen Chart aufs Handy-Display“, erklärt Steimel.

05.04.2007: