Zur Hauptnavigation springen [Alt]+[0] Zum Seiteninhalt springen [Alt]+[1]

Spracherkennung

Was bedeutet "Spracherkennung"?

  • Fähigkeit des Computers, mit einer Software gesprochene Wörter zu erkennen und sie als Dateneingaben (zum Beispiel Text) vom Sprecher entgegenzunehmen.
  • Dem Computer wird gesagt, was er machen soll. Er setzt die Sprache in ausführbare Befehle um.

Geschichte der Spracherkennung?

  • Schon der Erfinder des Telefons, Alexander Graham Bell, dachte Anfang des Jahr-hunderts über Maschinen nach, die aufs Wort gehorchen.
  • Eine nennenswerte Forschung kam erst in den 70er-Jahren in Gang. Vorreiter war das amerikanische Militär.
  • Spitzenleistung: die Software erkannte damals 100 einzelne Wörter!!
  • 1984 stellte IBM ein erstes Spracherkennungssystem vor (Erkennung von 5 000 englischen Einzelwörtern).
  • 1991 stellte IBM ein System vor, das 20 000 bis 30 000 deutsche Wörter erkennen konnte.
  • 1993 stellte IBM das erste für den Massenmarkt entwickelte System vor.
  • 1997 „kontinuierliche Spracherkennung „ d. h. fast normale Spracheingabe (ohne sog. Kunststottern, d. h. Sprechpausen) durch die Software der Firma Dragon Systems (Ehepaar Baker), verfügbarer Sprachschatz: bereits 64 000 Wörter.
  • Intensive Forschungen haben heute zu Systemen geführt, die bereits nach 5 Minuten eine hohe Fehlerfreiheit bieten.

Sprechen statt "Tippen"?

  • Spracherkennung ist auf dem Vormarsch.
  • Heute können pro Minute 160 Wörter diktiert werden.
  • Der Standardwortschatz umfasst heute 16 000 Wörter; es können 300 000 Wörter ergänzt werden.
  • Heutige PCs sind so ausgestattet, dass sie für die Spracherkennung geeignet sind.
  • Software wird zunehmend ausgereifter und billiger. Die Version Windows Vista liefert eine Spracherkennungssoftware mit. Die Leistungsfähigkeit ist im Vergleich zu professionellen Produkten sehr eingeschränkt.

So funktioniert die Spracherkennung:

  • Mit Hilfe von grammatischen Modellen wird auf Satzbau und Inhalt hin überprüft.
  • Alle diese Prozesse laufen während des Diktats im Hintergrund ab.
  • Deshalb muss der PC sehr viel Rechenleistung und Speicherplatz haben.
  • Gesprochenes Wort kann zu Korrekturzwecken als Sprache wiedergegeben werden.

In welchen Bereichen ist die Spracherkennung besonders sinnvoll?

  • Geeignet für Personen, die mit der Tastatur und der Maus nicht umgehen können.
  • Anwälte, Mediziner
  • Behinderte, die ihre Arme nicht zum Schreiben einsetzen können.
  • Vielschreiber und Journalisten

Was benötigt man zur Spracherkennung?

  • Software (ab 99 Euro)
  • Computer-Hardware
    • mind. 512 MB DDR-RAM, reichlich Festplattenspeicher sowie Soundkarte (besser externe Soundkarte)
    • Kopfbügelmikrofone bzw. Headsets von sehr guter Qualität
  • Digitale Diktiergeräte
    • Sie sprechen beim Spazieren in ein digitales Diktiergerät, stecken den Chip in ein passendes Lesegerät Ihres Computers und lassen sich den Text automatisch ausdrucken (bis 98 % Erkennungsgenauigkeit).

Grenzen der Spracherkennung

  • Undeutliche Aussprache sowie starker Dialekt erhöhen die Fehlerquote.
  • Groß- und Kleinschreibung wird oft nicht erkannt (sie - Sie).
  • Hintergrundgeräusche stören das Diktat.
  • In Büros, in denen mehrere Personen arbeiten, ist die Spracherkennung ungeeignet.
  • Bedienung des 10-Finger-Systems ist immer noch die rationellste Art, Texte einzugeben (z. B. beim kreativem Gestalten).