Ihr Smartphone versteht Sie

18. Oktober 2011 07:03; Akt: 18.10.2011 08:32 Print

Plappern statt tippen

von Kurt Haupt, sda - Die Spracherkennung macht Smartphones, Navis oder PCs zu meist verständnisvollen Helfern im Alltag. Sprechen statt klicken heisst die Devise.

storybild

Apple Mitgründer Steve Wozniak spricht in sein neues iPhone 4S, um die Fähigkeiten des sprachgesteuerten Assistenten Siri zu demonstrieren.

Zum Thema
Fehler gesehen?

Dass ein Computer gesprochene Worte versteht, war 1984 an der Ausstellung Phänomena in Zürich eine Sensation. Der Wortschatz des von IBM entwickelten Rechners war zwar auf wenige tausend englische Begriffe beschränkt und seine Bedenkzeit bis zum Erscheinen der Worte auf dem Computerdisplay nervtötend lange - aber die Besucher staunten.

Heute verspricht Apple in Werbevideos, dass man sein nächstes Smartphone einfach fragen kann: «Brauche ich morgen einen Regenschirm?» und dann innert Sekunden vom Handy die lokalen Wetterprognose vorgelesen erhält. 20 Minuten Online konnte sich bereits während der Vorstellung des iPhone 4S am 4. Oktober von den Qualitäten der Sprachassistentin Siri ein Bild machen. Siri zeigt, die Spracherkennung hat sich innert 30 Jahren vom «dummen Erkennen einzelner Worte» zum «Verstehen ganzer Fragen» gewandelt.

Hände bleiben frei

Spracherkennung ist insbesondere dann hilfreich, wenn die Hände weder für das Notieren noch für das Tippen oder Drücken irgendwelcher Tasten frei sind. Das trifft nicht nur auf Pathologen in amerikanischen Fernsehserien zu, sondern auch auf helvetische Automobilisten und Tastatur-Phobiker. Letztere wollen ihre SMS lieber diktieren statt mühsam zusammenklicken.

Bereits seit Jahren verfügen Mobiltelefone mit der Funktion «Sprachwahl» über eine rudimentäre und kaum genutzte Spracherkennung. Dabei kann man die Telefonnummer von Chef oder Lieblingspizzeria mit einem selbst ins Handy gesprochenen Sprachmuster hinterlegen. Danach genügt der Ausruf «Wähle Pizza» oder «Wähle Boss», um mit der entsprechenden Nummer verbunden zu werden.

Spracherkennung ohne lernen

Neuere Telefone beherrschen Spracherkennung nun sogar ohne Training. Dabei kann man einen beliebigen Namen aus dem Telefonbuch aussprechen. Die meisten Telefone mit dem Betriebssystem Android können mit der kostenlosen App «Sprachsuche» auch nachträglich «verständnisvoller» gemacht werden.

Spracherkennung ist aber nicht auf Telefone beschränkt. Auch viele Navigationsgeräte bieten eine Spracherkennung. Statt das Reiseziel mühsam einzutippen, darf man es laut aussprechen. Während verbreitete Ausdrücke wie «Bahnhofstrasse 7 Zürich» dabei meist funktionieren, stolpert die Erkennung oft über schwierige Begriffe wie «Weihermätteli in Schnottwil».

Immer häufiger bauen Autohersteller Spracherkennung ab Werk in Edelkarossen ein. Neben Telefon und Navigation lassen sich so auch Klima und Musik per Sprachbefehl steuern. Über 10 000 Sprachbefehle soll beispielsweise das auch für Mittelklassenautos erhältliche System von Ford erkennen.

Diktieren statt tippen

Am ausgereiftesten ist die Spracherkennung am PC. Bei Windows- Rechnern ist sie vorinstalliert und lässt sich via «Zubehör, Erleichterte Bedienung, Windows-Spracherkennung» aktivieren. Noch zuverlässiger sind Profi-Lösungen wie Dragon Naturally Speaking. Dessen Anwender dürfen sich gemütlich zurücklehnen und mit den Händen auf dem Buch dem PC fliessend einen ganzen Brief diktieren.

Bei Google kann man sogar per Sprachbefehle im Internet suchen. Dazu muss man Googles Webbrowser Chrome auf dem PC installieren. Da die Spracherkennung nur auf Englisch funktioniert, muss man dann die amerikanische Google-Seite www.google.com/ncr aufrufen. Klickt man auf das Mikrofonsymbol neben dem Suchfenster, bringt der Ausspruch «Weather San Francisco» die Wetterprognose für die Stadt auf den Bildschirm.

Hilfe aus dem Internet

Besonders ausgereift sind Spracherkennungslösungen auf den neusten Smartphone-Modellen. Android-Geräte gehorchen dann aufs Wort. Der Befehl «Text an Peter Müller senden: Ich komme 20 Minuten zu spät» verfasst und adressiert die entsprechende Kurzmitteilung.

Smartphones arbeiten zudem sogar bereits als Dolmetscher. Bei der App Translate für Android und iPhone spricht man beispielsweise «Ich möchte einen Kuchen» ins Mikrofon und innerhalb einer Sekunde erscheint «I want a cake» auf dem Bildschirm. Ein weiterer Tastendruck lässt das Handy sogar mit einer synthetischen Stimme Englisch sprechen.

Dies funktioniert mit Dutzenden von Sprachkombinationen von Afrikaans bis Weissrussisch. Der Nutzen intelligenter Spracherkennung wird derzeit von Apple intensiv beworben. Im neusten Iphone-Modell 4S soll das Sprachsystem Siri das Handy zum verständnisvollen Diener machen.

Bei ersten Vorführungen verblüffte die Lösung vor allem durch die anscheinende Intelligenz. So brachte die Frage «Brauche ich morgen einen Regenschirm» den Wetterbericht für die aktuelle Position auf das Display. Die «Intelligenz» aller obigen Lösungen liegt allerdings nicht in den Geräten, sondern im Internet.

Denn sowohl Siri als auch Google Translate schicken die Sprachaufzeichnung ins Internet. Dort greift ein Rechnerpark auf riesige Datenvolumen zurück, um auf die Sprachfetzen eine «intelligente» Antwort zu liefern.

Bei Apple ist die «Intelligenz» ferner auch mit Privatsphärenverlust verbunden. Nur wer Siri persönliche Daten, Adressen und seinen Standort ausliefert, darf auf intelligente Antworten hoffen. Wer hofft, dank den Sprachdienern und Übersetzern in seinen nächsten Ferien als gewandter Kosmopolit aufzutreten, sei gewarnt. Die für die Funktionen nötigen Datenverbindungen ins Internet können im Ausland recht teuer werden.

Kommentarfunktion geschlossen
Die Kommentarfunktion für diese Story wurde automatisch deaktiviert. Der Grund ist die hohe Zahl eingehender Meinungsbeiträge zu aktuellen Themen. Uns ist wichtig, diese möglichst schnell zu sichten und freizuschalten. Wir bitten um Verständnis.

Die beliebtesten Leser-Kommentare

  • Beat am 18.10.2011 14:15 Report Diesen Beitrag melden

    Wie schön...

    ... und demnächst sitzen wir im Tram oder einer Bar, quasseln hypnotisch fixiert und selbstverliebt mit unserem Smartphone, schütten ihm unsere Sorgen aus, erwarten gute Ratschläge, fragen es, ob es nun besser wäre, ins Kino oder an die frische Luft zu gehen, erkunden, wo sich unsere (virtuellen) Freunde herumtreiben ... und merken gar nicht mehr, dass da um uns herum doch tatsächlich reale Menschen sind.

    einklappen einklappen
  • Your IT guy am 18.10.2011 11:02 Report Diesen Beitrag melden

    Lieber mit richtigen Personen sprechen

    Microsoft hatte ja mit Office Communicatio Server 2007 und dem Unified Communication Konzept ja schon vor Jahren eine brauchbare Sprachsteuerung. Es ist zwar für Business zugeschnitten, hat aber gut funktioniert. (YT: Devil Wears Prada Microsoft) - Ich selbst habes aber nicht genutz weil mich da nur jeder schief anschauen würde, wenn ich so mit dem Telefon spreche. Es konnte E-mails vorlesen, Meetings verschieben, Kaleder vorplappern etc.

  • Ramir Qrasniqi am 18.10.2011 09:17 via via Mobile Report Diesen Beitrag melden

    Siri

    Aber im Bus oder im Tram würde sich niemand getrauen, Siri zu verwenden.

Die neusten Leser-Kommentare

  • iAm am 18.10.2011 18:40 via via Mobile Report Diesen Beitrag melden

    Lieber ein Applejünger als ein Androidprophet!

    Der Satz spricht für sich selbst...

  • Andreas Steiner am 18.10.2011 16:56 Report Diesen Beitrag melden

    Tamagotchi

    In den schönen 90-er Jahren gabe es mal diese virtuellen Tiere, Tamagotchi, füttern, streicheln, u.s.w. Wenn ich mir gewisse Leute im ÖV oder irgendwo anschaue, die permanent auf ihrem Smartphone herumklicken, dann habe ich das Gefühl, wir haben die 90-er Jahren noch nicht hinter uns. :-)

  • Beat am 18.10.2011 14:15 Report Diesen Beitrag melden

    Wie schön...

    ... und demnächst sitzen wir im Tram oder einer Bar, quasseln hypnotisch fixiert und selbstverliebt mit unserem Smartphone, schütten ihm unsere Sorgen aus, erwarten gute Ratschläge, fragen es, ob es nun besser wäre, ins Kino oder an die frische Luft zu gehen, erkunden, wo sich unsere (virtuellen) Freunde herumtreiben ... und merken gar nicht mehr, dass da um uns herum doch tatsächlich reale Menschen sind.

    • Siri am 19.10.2011 14:57 via via Mobile Report Diesen Beitrag melden

      Oh Mann...

      ...ist den tippen besser? Jeder tippt vor sich hin? Hey, die Welt verändert sich! Siri, I love you?

    einklappen einklappen
  • Steve am 18.10.2011 13:23 Report Diesen Beitrag melden

    Apfelwurm

    hmmm und wenn das soooo toll ist, warum kann dann meine intuitive Wortsuche des Iphones noch immer den Unterschied zwischen den Wörtern nicht kapieren? Einfach was anfangen, nix zuende bringen, wird das auch so mit SIRI ? :)

  • Dominik Gwerder am 18.10.2011 13:21 Report Diesen Beitrag melden

    Schweizerdeutsch geht nicht!!

    Als Schweizer können wir die Funktion einmal mehr nicht nutzen, genau wie die T9-Tastatur oder die Rechtschreibkorrektur... Diese Funktionen verstehen nur Hochdeutsch, nicht unsere "natürliche" Sprache.

    • Gert am 18.10.2011 15:34 Report Diesen Beitrag melden

      Keine Sprache

      Schweizerdeutsch ist auch keine Sprache sondern ein Dialekt!

    • Stefan am 18.10.2011 16:21 Report Diesen Beitrag melden

      @Gert ...

      lass mich raten, Du bist Deutscher ?? :-) Schweizerdeutsch ist eine eigene Sprache mit verschiedenen Dialekten !!!

    • Mark N am 18.10.2011 18:02 Report Diesen Beitrag melden

      So siehts aus

      Wo er Recht hat, hat er recht. Auch hat ja jedes Kantönli seinen eigenen Dialekt und zum Teil versteht man sich ja nicht mal selber untereinander. Das iPhone in D versteht ja auch kein Plattdeutsch. Da beschwert sich auch keiner.

    • Platonicus am 19.10.2011 14:27 Report Diesen Beitrag melden

      Des Schweizers liebster Komplex

      Sind wir denn noch immer nicht über diesen Komplex hinweg?

    einklappen einklappen