Spracherkennung
Was bedeutet "Spracherkennung"?
- Fähigkeit des Computers, mit einer Software gesprochene Wörter zu erkennen und sie als Dateneingaben (zum Beispiel Text) vom Sprecher entgegenzunehmen.
- Dem Computer wird gesagt, was er machen soll. Er setzt die Sprache in ausführbare Befehle um.
Geschichte der Spracherkennung?
- Schon der Erfinder des Telefons, Alexander Graham Bell, dachte Anfang des Jahr-hunderts über Maschinen nach, die aufs Wort gehorchen.
- Eine nennenswerte Forschung kam erst in den 70er-Jahren in Gang. Vorreiter war das amerikanische Militär.
- Spitzenleistung: die Software erkannte damals 100 einzelne Wörter!!
- 1984 stellte IBM ein erstes Spracherkennungssystem vor (Erkennung von 5 000 englischen Einzelwörtern).
- 1991 stellte IBM ein System vor, das 20 000 bis 30 000 deutsche Wörter erkennen konnte.
- 1993 stellte IBM das erste für den Massenmarkt entwickelte System vor.
- 1997 „kontinuierliche Spracherkennung „d. h. fast normale Spracheingabe (ohne sog. Kunststottern, d. h. Sprechpausen) durch die Software der Firma Dragon Systems (Ehepaar Baker), verfügbarer Sprachschatz: bereits 64 000 Wörter.
- Intensive Forschungen haben heute zu Systemen geführt, die bereits nach 5 Minuten eine hohe Fehlerfreiheit bieten.
Sprechen statt "Tippen"?
- Spracherkennung ist auf dem Vormarsch.
- Heute können pro Minute 160 Wörter diktiert werden.
- Der Standardwortschatz umfasst heute 16 000 Wörter; es können 300 000 Wörter ergänzt werden.
- Heutige PCs sind so ausgestattet, dass sie für die Spracherkennung geeignet sind.
- Software wird zunehmend ausgereifter und billiger. Die Version Windows Vista liefert eine Spracherkennungssoftware mit. Die Leistungsfähigkeit ist im Vergleich zu professionellen Produkten sehr eingeschränkt.
So funktioniert die Spracherkennung:
- Mit Hilfe von grammatischen Modellen wird auf Satzbau und Inhalt hin überprüft.
- Alle diese Prozesse laufen während des Diktats im Hintergrund ab.
- Deshalb muss der PC sehr viel Rechenleistung und Speicherplatz haben.
- Gesprochenes Wort kann zu Korrekturzwecken als Sprache wiedergegeben werden.
In welchen Bereichen ist die Spracherkennung besonders sinnvoll?
- Geeignet für Personen, die mit der Tastatur und der Maus nicht umgehen können.
- Anwälte, Mediziner
- Behinderte, die ihre Arme nicht zum Schreiben einsetzen können.
- Vielschreiber und Journalisten
Was benötigt man zur Spracherkennung?
- Software (ab 99 Euro)
-
Computer-Hardware
- mind. 512 MB DDR-RAM, reichlich Festplattenspeicher sowie Soundkarte (besser externe Soundkarte)
- Kopfbügelmikrofone bzw. Headsets von sehr guter Qualität
- Digitale Diktiergeräte
- Sie sprechen beim Spazieren in ein digitales Diktiergerät, stecken den Chip in ein passendes Lesegerät Ihres Computers und lassen sich den Text automatisch ausdrucken (bis 98 % Erkennungsgenauigkeit).
Grenzen der Spracherkennung
- Undeutliche Aussprache sowie starker Dialekt erhöhen die Fehlerquote.
- Groß- und Kleinschreibung wird oft nicht erkannt (sie - Sie).
- Hintergrundgeräusche stören das Diktat.
- In Büros, in denen mehrere Personen arbeiten, ist die Spracherkennung ungeeignet.
- Bedienung des 10-Finger-Systems ist immer noch die rationellste Art, Texte einzugeben (z. B. beim kreativem Gestalten).