Zur Haupt­na­vi­ga­ti­on sprin­gen [Alt]+[0] Zum Sei­ten­in­halt sprin­gen [Alt]+[1]

Sprach­er­ken­nung

Was be­deu­tet "Sprach­er­ken­nung"?

  • Fä­hig­keit des Com­pu­ters, mit einer Soft­ware ge­spro­che­ne Wör­ter zu er­ken­nen und sie als Da­ten­ein­ga­ben (zum Bei­spiel Text) vom Spre­cher ent­ge­gen­zu­neh­men.
  • Dem Com­pu­ter wird ge­sagt, was er ma­chen soll. Er setzt die Spra­che in aus­führ­ba­re Be­feh­le um.

Ge­schich­te der Sprach­er­ken­nung?

  • Schon der Er­fin­der des Te­le­fons, Alex­an­der Gra­ham Bell, dach­te An­fang des Jahr-hun­derts über Ma­schi­nen nach, die aufs Wort ge­hor­chen.
  • Eine nen­nens­wer­te For­schung kam erst in den 70er-Jah­ren in Gang. Vor­rei­ter war das ame­ri­ka­ni­sche Mi­li­tär.
  • Spit­zen­leis­tung: die Soft­ware er­kann­te da­mals 100 ein­zel­ne Wör­ter!!
  • 1984 stell­te IBM ein ers­tes Sprach­er­ken­nungs­sys­tem vor (Er­ken­nung von 5 000 eng­li­schen Ein­zel­wör­tern).
  • 1991 stell­te IBM ein Sys­tem vor, das 20 000 bis 30 000 deut­sche Wör­ter er­ken­nen konn­te.
  • 1993 stell­te IBM das erste für den Mas­sen­markt ent­wi­ckel­te Sys­tem vor.
  • 1997 „kon­ti­nu­ier­li­che Sprach­er­ken­nung „ d. h. fast nor­ma­le Sprach­ein­ga­be (ohne sog. Kunst­stot­tern, d. h. Sprech­pau­sen) durch die Soft­ware der Firma Dra­gon Sys­tems (Ehe­paar Baker), ver­füg­ba­rer Sprach­schatz: be­reits 64 000 Wör­ter.
  • In­ten­si­ve For­schun­gen haben heute zu Sys­te­men ge­führt, die be­reits nach 5 Mi­nu­ten eine hohe Feh­ler­frei­heit bie­ten.

Spre­chen statt "Tip­pen"?

  • Sprach­er­ken­nung ist auf dem Vor­marsch.
  • Heute kön­nen pro Mi­nu­te 160 Wör­ter dik­tiert wer­den.
  • Der Stan­dard­wort­schatz um­fasst heute 16 000 Wör­ter; es kön­nen 300 000 Wör­ter er­gänzt wer­den.
  • Heu­ti­ge PCs sind so aus­ge­stat­tet, dass sie für die Sprach­er­ken­nung ge­eig­net sind.
  • Soft­ware wird zu­neh­mend aus­ge­reif­ter und bil­li­ger. Die Ver­si­on Win­dows Vista lie­fert eine Sprach­er­ken­nungs­soft­ware mit. Die Leis­tungs­fä­hig­keit ist im Ver­gleich zu pro­fes­sio­nel­len Pro­duk­ten sehr ein­ge­schränkt.

So funk­tio­niert die Sprach­er­ken­nung:

  • Mit Hilfe von gram­ma­ti­schen Mo­del­len wird auf Satz­bau und In­halt hin über­prüft.
  • Alle diese Pro­zes­se lau­fen wäh­rend des Dik­tats im Hin­ter­grund ab.
  • Des­halb muss der PC sehr viel Re­chen­leis­tung und Spei­cher­platz haben.
  • Ge­spro­che­nes Wort kann zu Kor­rek­tur­zwe­cken als Spra­che wie­der­ge­ge­ben wer­den.

In wel­chen Be­rei­chen ist die Sprach­er­ken­nung be­son­ders sinn­voll?

  • Ge­eig­net für Per­so­nen, die mit der Tas­ta­tur und der Maus nicht um­ge­hen kön­nen.
  • An­wäl­te, Me­di­zi­ner
  • Be­hin­der­te, die ihre Arme nicht zum Schrei­ben ein­set­zen kön­nen.
  • Viel­schrei­ber und Jour­na­lis­ten

Was be­nö­tigt man zur Sprach­er­ken­nung?

  • Soft­ware (ab 99 Euro)
  • Com­pu­ter-Hard­ware
    • mind. 512 MB DDR-RAM, reich­lich Fest­plat­ten­spei­cher sowie Sound­kar­te (bes­ser ex­ter­ne Sound­kar­te)
    • Kopf­bü­gel­mi­kro­fo­ne bzw. Head­sets von sehr guter Qua­li­tät
  • Di­gi­ta­le Dik­tier­ge­rä­te
    • Sie spre­chen beim Spa­zie­ren in ein di­gi­ta­les Dik­tier­ge­rät, ste­cken den Chip in ein pas­sen­des Le­se­ge­rät Ihres Com­pu­ters und las­sen sich den Text au­to­ma­tisch aus­dru­cken (bis 98 % Er­ken­nungs­ge­nau­ig­keit).

Gren­zen der Sprach­er­ken­nung

  • Un­deut­li­che Aus­spra­che sowie star­ker Dia­lekt er­hö­hen die Feh­ler­quo­te.
  • Groß- und Klein­schrei­bung wird oft nicht er­kannt (sie - Sie).
  • Hin­ter­grund­ge­räu­sche stö­ren das Dik­tat.
  • In Büros, in denen meh­re­re Per­so­nen ar­bei­ten, ist die Sprach­er­ken­nung un­ge­eig­net.
  • Be­die­nung des 10-Fin­ger-Sys­tems ist immer noch die ra­tio­nells­te Art, Texte ein­zu­ge­ben (z. B. beim krea­ti­vem Ge­stal­ten).