Spracherkennung: Gesprochenes Wort in geschriebenen Text umwandeln

Bei der Spracherkennung handelt es sich um eine Technologie, die gesprochene Wörter genau erkennen und in Text umwandeln kann. Abhängig von der Tiefe der Entwicklung der Spracherkennungssoftware greift sie über ein weites oder eingeschränktes Vokabular zu. Im Gegensatz zu rudimentären Anwendungen verfügt hoch entwickelte Software über einen ausgesprochen großen Wortschatz, Akzenterkennung und die Fähigkeit, unterschiedliche Sprachen zu erkennen. Für die Entwicklung von Spracherkennungssoftware fliesen Erkenntnisse aus den Gebieten der Computertechnik, Linguistik und Informatik zusammen. 

Mit der gängigen Software erwerben Sie die Möglichkeit, zwischen dem Diktiermodus und dem Befehlsmodus zu switchen. Der Unterschied der beiden Modi liegt in den Reaktionen der Software zur Spracherkennung. Im Befehlsmodus wird sie die verwendeten Befehle zur Steuerung ihres PCs nutzen, im Diktiermodus wird es Ihnen ermöglicht, Texte via Diktat zu erstellen. 

Wie funktioniert die automatische Spracherkennung? 

Eine Spracherkennungssoftware nimmt gesprochene Worte über ein Mikrofon auf und gibt sie als Text aus bzw. führt geforderte Aktionen durch. Die Umwandlung findet in vier Handlungseinheiten statt. Zunächst wird das aufgenommene akustische Signal analysiert (u. a. werden Hintergrundgeräusche herausgefiltert), um im zweiten Schritt Wörter, Wortgruppen und Sätze zu zerteilten. Es folgt die Codierung in ein durch die Software lesbares Format. Zuletzt wird durch die Befolgung programmierter Algorithmen die Sprache als Text oder Handlungen interpretiert. Programme zur Spracherkennung sind hoch komplexe Systeme, da jeder Anwender teils bewusst, teils unbewusst kontext- und situationsbedingt Intonation und Vokabular seiner Sprache ändert. Das liegt in der Natur des Menschen. Hinzu kommen die verschiedenen Akzente und Dialekte, welche in die Algorithmen einer Sprachsoftware integriert sein müssen, um sie für jedweden Anwender nutzbar zu machen. 

Mit der eigenen Stimme sämtliche Funktionen steuern

Zugegeben so einfach wie bei K.I.T.T. und Michael Knight aus Knight Rider lässt sich die Spracherkennung der heutigen Spracherkennungssysteme noch nicht einrichten. Als kleine Erinnerung: Michael befand sich auf seiner ersten Mission mit K.I.T.T. und sagte beim Blick auf das Armaturenbrett “Bei all diesen komischen Knöpfen wird doch wohl auch ein Radio dabei sein!” Worauf K.I.T.T. die Frage stellte: “Was möchten Sie gern hören?” Bevor Sie ähnlich hilfreiche Reaktionen von Ihrem Computer erhalten, müssen Sie die folgenden zwei Dinge tun: 

  1. Ein Mikrofon am PC einrichten. 

  1. Dem Prorgramm zur Spracherkennung lehren Ihre Stimme und Ihre Befehle zu transkribieren. (Üblicherweise führt Sie die Spracherkennungssoftware durch diesen Prozess.) 

Schneller und effizienter Arbeiten dank Diktiersoftware 

Captain Jean-Luc Picard konnte Eintragungen für das Logbuch diktieren, während er zu Abend aß. Ähnlichen Komfort bietet Ihnen eine Spracherkennungssoftware in Verwendung als Diktiersoftware. Während Sie Ihre Hände frei haben, können Sie Ihre Gedanken und Ideen als Diktat festhalten. Das ermöglicht Ihnen kreative Prozesse oder Forschungsarbeiten noch schneller voranzubringen. 

Es erleichtert Ihnen zum Beispiel die Arbeit im Labor. Statt Zetteln und Stiften oder einem sperrigen Laptop haben Sie auf Ihrem Arbeitstisch ausschließlich Ihrer Arbeitsmittel und die Versuchsobjekte liegen. Über ein Headset und Ihre Stimme diktieren Sie alle Gedanken und Erkenntnisse in ein Textprogramm. Nutzen dafür Sie Ihr Programm für Spracherkennung als Diktiersoftware. Später können Sie somit ohne Informationsverlust alles nachvollziehen und in Ihre zu veröffentlichenden Arbeiten einfließen lassen. Es ist sogar möglich, einer Spracherkennungssoftware über Sprachkennzeichnung mehrere Stimmen anzutrainieren und Gesprächsprotokolle zu führen. 

Trotz allen Quantensprüngen in der Entwicklung, welche die Spracherkennungssysteme vollzogen haben, empfiehlt es sich dennoch, die eingesprochenen Texte nochmals zu Lesen und auf eventuelle Fehler im Vokabular zu überprüfen und zu korrigieren, bevor sie an Dritte weitergegeben werden. 

Professionelle Spracherkennungssoftware: Nuance Dragon Professional Individual v15

Die intelligente Spracherkennungssoftware Nuance Dragon in der Ausführung Professional Individual Version 15 befähigt Sie, zu jeder Zeit und an jedem Ort Texte zu diktieren oder Computer, Tablets und Smartphones via Sprachsteuerung zu verwenden. Ein aufwendiges Training der Software ist unnötig, mit einem einfachen Setup gelingt die Transkription Ihrer Stimme mit geringem Zeitaufwand. 

Selbst das Korrekturlesen wird Ihnen ohne Tastatur ermöglicht. Dafür bietet Naunce Dragon Professional Individual Version 15 die Möglichkeit, den diktierten Text via Audiowiedergabe vorlesen zu lassen und mit Hilfe der Befehlsfunktion via Spracherkennung zu korrigieren und zu formatieren. 

Zusammenfassung

Wie funktioniert die Spracherkennungssoftware? 

Spracherkennungssoftware bedient sich zweier Modelle. Entweder dem akustischen Modell, bei dem zwischen dem Eingesprochenem und den Audiosignalen eine Beziehung hergestellt wird und dem Sprachmodell, welches Schlussfolgerungen aus den Klängen der gesprochenen Worte und der erlernten Worte schließt. 

Wie kann man die Spracheingabe aktivieren? 

Die Spracheingabe kann entweder über Sprachbefehle oder händisch aktiviert werden, sobald die erforderliche Software installiert ist und die Voraussetzungen in Bezug auf die Hardware erfüllt sind. 

Wie kann man Sprache in Text umwandeln?

Mithilfe der Diktierfunktion eines Spracherkennungssystems kann Sprache in Text umgewandelt werden. 

Was ist die beste Spracherkennungssoftware?

Eine gute Spracherkennungssoftware unterscheidet sich von einer weniger guten in der Fähigkeit, Akzente, Dialekte, Sprachmuster und Sprachstile zu erkennen und umzusetzen. All das und noch viele weitere Gadgets bietet Nuance Dragon Professional Indiviual Version 15. 

Wofür kann man Spracherkennungssoftware nutzen?

Sie können Spracherkennungssoftware überall da nutzen, wo es Ihnen nützlich erscheint zum Beispiel: 

  • auf einer Baustellenbegehung, um Fotos zu Baumängeln mit Notizen zu hinterlegen 

  • im Labor, um Gedanken zu Experimenten während des Versuchsablaufs zu diktieren 

  • zum Exzerpieren von Texten, um für Prüfungen und Klausuren zu lernen 

  • für die Texterstellung im Kreativbereich u.v.m. 

Welches Mikrofon für Spracherkennung?

Spracherkennungssoftware auf hohem Niveau unterstützt jedmögliche Mikrofone z. B. eingebaute Mikrofone in PCs, Laptops und Mobiltelefonen oder externe Mikrofone. 

Die mit einem * markierten Felder sind Pflichtfelder.

Ich habe die Datenschutzbestimmungen zur Kenntnis genommen.