SilentVoice: Microsoft ermöglicht die unhörbare Sprachsteuerung

Christian Kahle, 16.10.2018 15:00 Uhr 7 Kommentare
Die Sprachsteuerung von Computersystemen ist vor allem in der Öffentlichkeit für viele Nutzer keine Option - insbesondere für solche, denen es aufgrund einer guten Erziehung unangenehm ist, andere Menschen zu nerven. Bei Microsoft arbeitet man aber daran, ein Aufnahmesystem zu schaffen, das auch ein extrem leises Flüstern sehr gut interpretieren kann. SilentVoice nennt sich die neue Technologie, die Mitarbeiter von Microsoft Research jetzt auf einer Fachkonferenz vorstellten. Der Kern der Technik ist ein kleines Aufnahmemodul, das der Anwender sich direkt an den Mund halten kann und das die Äußerungen des Nutzers auch dann aufnehmen kann, wenn diese so leise sind, dass sie für andere Personen im direkten Umfeld nicht wahrnehmbar sind.

Das neue System wird dabei nicht einmal von den Gesprächen irritiert, die vielleicht von anderen Menschen in direkter Hörweite geführt werden. Denn SilentVoice funktioniert nur bedingt wie ein normales Mikrofon. Vielmehr erfassen Sensoren hier den Luftstrom, der durch die Lippen des Nutzers kommt. Gänzlich lautlos ist der Vorgang nicht, doch wirkt die Sprache des Anwenders hier mit weniger als 39 Dezibel auf die Umgebung, was einem leisen Flüstern entspricht.

Unhörbare Diktate in der Bahn

Und mit einem solchen wird man in Umgebungen, für die SilentVoice vorgesehen ist, wahrscheinlich überhaupt nicht wahrgenommen. Das gilt beispielsweise in Büros, in denen auch mehrere andere Beschäftigte arbeiten, oder aber in öffentlichen Verkehrsmitteln. Hier ist der Umgebungspegel in der Regel so laut, dass man sich mit dem Flüstern in der genannten Lautstärke schon nur mit Mühe einer anderen Person verständlich machen könnte - und das Gehirn eines Hörenden ist wesentlich besser auf das Ausfiltern von Störgeräuschen konditioniert als ein Mikrofon.

Die Microsoft-Forscher geben an, dass sie die sehr leisen Sprachbefehle eines SilentVoice-Nutzers bereits mit einer Genauigkeit von 98,8 Prozent von Gesprächen in der Umgebung unterscheiden können. So steht auch der längeren Spracheingabe eines Textes während einer Zugfahrt, von der sonst niemand etwas mitbekommt, nichts mehr im Wege.

Download DSpeech - Sprachausgabe und -erkennung für Windows
Siehe auch: Sprachsteuerung bei Smartphones wird tatsächlich häufig genutzt
7 Kommentare lesen & antworten
Folge WinFuture auf Google News
Verwandte Themen
Microsoft Research
Desktop-Version anzeigen
Hoch © 2023 WinFuture Impressum Datenschutz Cookies