Sprachgesteuerte Benutzeroberflächen gewinnen in der UX-Welt zunehmend an Bedeutung - aber was macht ein gutes UI aus? Sehen Sie sich diese wichtigen Richtlinien zur Benutzerfreundlichkeit an und finden Sie es heraus.
Die Zeiten ändern sich. Wenn Bob Dylan nur wüsste, dass die Aufforderung an ein kleines Metallkästchen, die Kaffeemaschine einzuschalten, während Sie duschen, heute schon Realität ist. Es stimmt, dass das Design von Benutzeroberflächen mit Sprachsteuerung alles andere als futuristisch ist – auch wenn es das Konzept der Sprachsteuerung für digitale Produkte schon seit einiger Zeit gibt.
Das Design von sprachgesteuerten Benutzeroberflächen ist in den letzten Jahren ein heißes Thema. Mit dem Aufschwung von Alexa und Google Assistant stehen die Menschen dieser neuen Technologie immer offener gegenüber. Als Designer ist es jetzt vielleicht an der Zeit, sich genauer mit sprachgesteuerten Benutzeroberflächen zu befassen – und damit, was eine gute von einer schlechten unterscheidet.
Es gibt viele Unbekannte, wenn es um Voice User Interfaces (VUIs) geht. Wie Sie es von einem so jungen Gebiet erwarten würden, lernen wir jeden Tag neue Dinge über das Design von UI und UX für die Sprache. Doch in der Zwischenzeit sollten wir uns ansehen, was wir wissen – und dieses Wissen für uns nutzen. Das bedeutet, dass Sie beim Lesen Ihr bevorzugtes Prototyping-Tool geöffnet lassen sollten!
- Was ist VUI-Design und wie funktioniert es?
- Bewährte Verfahren für das Design von Benutzeroberflächen mit Sprachausgabe
- Wie man eine sprachgesteuerte Benutzeroberfläche designt
- Fehlerbehandlung und Wiederherstellung
- Personalisierung und Kontextbewusstsein
- Beispiele für die Implementierung einer sprachgesteuerten Benutzeroberfläche
- Herausforderungen beim Design von sprachgesteuerten Benutzeroberflächen
Das Design sprachgesteuerter Benutzeroberflächen macht unser Leben so viel einfacher. Es ist, als hätten Sie einen persönlichen Assistenten, der Sie versteht und Ihnen zur Seite steht, wann immer Sie ihn brauchen.
Sie ermöglichen es uns, mit unseren Geräten wie Telefonen und intelligenten Lautsprechern zu sprechen, um Dinge zu erledigen, ohne eine Taste zu berühren. So können Sie z.B. Ihr Telefon anweisen, einen Freund anzurufen oder Ihren Lautsprecher bitten, Ihren Lieblingssong abzuspielen.

Diese sprachgesteuerten Benutzeroberflächen machen die Technologie für Menschen mit Behinderungen zugänglicher, z. B. für Menschen mit Sehbehinderungen oder motorischen Schwierigkeiten. Sie ermöglichen uns auch Multitasking, z. B. die Steuerung unserer Musik beim Kochen oder die Abfrage des Wetters beim Autofahren. Außerdem macht die Nutzung von Technologie mehr Spaß und ist natürlicher, ohne das ganze Klicken und Tippen.
Die Sprachtechnologie wird immer intelligenter und beliebter! Wir beobachten einen starken Anstieg bei Geräten wie intelligenten Lautsprechern und anderen Sprachschnittstellen, mit denen wir mit unserer Technik sprechen können. Dies ist den Verbesserungen in der Art und Weise zu verdanken, wie Computer die menschliche Sprache verstehen und auf sie reagieren.
Während das Konzept der sprachgesteuerten Technologie bis in die Mitte des 20. Jahrhunderts zurückreicht, begann die moderne Ära der Sprachassistenten in den frühen 2010er Jahren mit der Einführung von Siri durch Apple.
Seitdem haben Fortschritte bei der künstlichen Intelligenz und der Verarbeitung natürlicher Sprache zur Entwicklung ausgefeilterer Sprachschnittstellen geführt, auf die wir etwas später eingehen werden. Diese virtuellen Assistenten – Sie haben vielleicht schon erraten, welche – haben sich zunehmend in unser tägliches Leben integriert und steuern intelligente Lautsprecher, Smartphones und andere Geräte.
Da diese Technologie immer besser wird, können wir eine Zukunft erwarten, in der das Sprechen mit unseren Geräten die Norm ist.
Es ist genau wie im richtigen Leben! Wenn Sie z.B. mit einem Freund sprechen, hört er auf Ihre Worte, zerlegt sie in kleinere Teile und versteht ihre Bedeutung. Die Spracherkennungstechnologie funktioniert ähnlich, allerdings mit Maschinen.
Wenn Sie mit einer sprachgesteuerten Benutzeroberfläche sprechen, nimmt das Gerät zunächst Ihre Stimme auf. Dieses Roh-Audio wird dann verarbeitet, um Rauschen und andere Störungen zu entfernen. Anschließend wird das Audiomaterial in kleinere Einheiten, die so genannten Phoneme, zerlegt, die die Grundlaute der Sprache darstellen.

Ab hier übernimmt die natürliche Sprachverarbeitung (NLP). Sie analysiert die Abfolge der Phoneme, identifiziert Wörter und versteht die grammatikalische Struktur des Satzes. Durch die Erkennung von Schlüsselwörtern und Phrasen kann die Sprachschnittstelle die Absicht des Benutzers bestimmen und eine entsprechende Antwort erzeugen.
Sprachsynthese ist eine schicke Umschreibung dafür, dass ein Roboter für Sie laut vorliest. Sie können es auch als Text-to-Speech-Technologie bezeichnen. Das System nimmt geschriebene Wörter und wandelt sie in gesprochene Sprache um.
Wenn Sie zum Beispiel eine Sprachschnittstelle bitten, Ihnen einen Nachrichtenartikel vorzulesen, wird der Text des Artikels in ein Sprachsynthesesystem eingespeist. Wie geschieht das?
Zunächst zerlegt das System den Text in kleinere Einheiten, wandelt diese in Tonsignale um und kombiniert sie dann, um eine natürlich klingende Stimme zu erzeugen, die den Artikel vorliest. Klingt kompliziert, ist es aber eigentlich nicht!

Nehmen wir an, Sie bitten einen Freund, etwas zu tun. Sie schreien nicht einfach „Tu etwas!“ Sie sagen etwas Bestimmtes, z.B. „Spielen Sie etwas Jazzmusik.“
Das Design der sprachgesteuerten Benutzeroberfläche funktioniert ganz ähnlich. Wenn Sie sagen: „Spielen Sie etwas Jazzmusik“, erkennt der Assistent, dass Sie Musik abspielen möchten (die Absicht) und identifiziert die Art der Musik, die Sie wünschen (den Slot). So kann der Assistent die richtige Musik für Sie finden und abspielen.
Es schadet auch nicht, höflich zu fragen, für den Fall, dass sie sich eines Tages gegen uns wenden. Sie möchten nicht den Zorn des Systems zu spüren bekommen. Es wäre klug, ab und zu ein „Bitte“ oder „Danke“ hinzuzufügen.
Die Technologie für sprachgesteuerte Benutzeroberflächen hat zwar große Fortschritte gemacht, stößt aber immer noch an ihre Grenzen. Eine der größten Herausforderungen ist die Erkennung von Akzenten und Dialekten. Spracherkennungssysteme haben unter Umständen Schwierigkeiten, Akzente und Dialekte richtig zu interpretieren, was zu Missverständnissen und Fehlern führt.
Auch Geräusche im Hintergrund können es dem Assistenten erschweren, Ihre Befehle zu verstehen. Eine weitere Herausforderung ist, wenn Menschen nicht genau sagen, was sie wollen.
Wenn Sie einen vagen oder unklaren Befehl geben, kann der Assistent möglicherweise nicht verstehen, was Sie wollen. Deshalb ist es wichtig, dass Sie sich klar und deutlich ausdrücken, wenn Sie mit einem Sprachassistenten sprechen.

Um diese Einschränkungen zu überwinden, konzentrieren sich die laufenden Forschungs- und Entwicklungsarbeiten auf die Verbesserung der Spracherkennungsgenauigkeit, der Techniken zur Geräuschunterdrückung und der Fähigkeiten zum Verstehen natürlicher Sprache.
Das Design von Benutzeroberflächen per Sprache hängt von einer klaren Kommunikation ab. Sie können sicherstellen, dass die Verbraucher die Aufforderungen verstehen und problemlos darauf reagieren können, indem Sie eine einfache Sprache verwenden. Klare und präzise Anweisungen führen den Benutzer mühelos durch seine Aktivitäten.
Anstatt z.B. zu sagen: „Starten Sie die Musikwiedergabesequenz“, könnte eine sprachgesteuerte Benutzeroberfläche sagen: „Spielen Sie etwas Musik“. Die Nachahmung einer natürlichen Unterhaltung macht das Design der Interaktion intuitiver und angenehmer.
Wie bei allen Ihren Beziehungen – ob elektronisch oder persönlich – führt eine klare Kommunikation zu effizienten und zufriedenstellenden Interaktionen.
Eine benutzerorientierte Sprache muss oberste Priorität haben, um eine wirklich intuitive Sprachsteuerung zu ermöglichen. Wir können die Kommunikationslücke zwischen Menschen und Maschinen schließen, indem wir eine Sprache verwenden, die vertraut und natürlich ist. Eine Sprachschnittstelle könnte zum Beispiel sagen: „Suchen Sie ein italienisches Restaurant in der Nähe?“ und nicht: „Bitte starten Sie eine Suchanfrage nach dem nächstgelegenen italienischen Restaurant.“
Kurze Aufforderungen und Antworten erhalten die Aufmerksamkeit der Benutzer aufrecht und verhindern, dass sie mit Informationen überfrachtet werden. Eine effektive Fehlerbehandlung und klare Korrekturhinweise sorgen für eine reibungslose Benutzererfahrung, selbst wenn Fehler auftreten. Indem wir die Benutzer zu erfolgreichen Ergebnissen führen, können wir sie in die Lage versetzen, ihre Ziele effizient zu erreichen.

Stellen Sie sich vor, Sie hören sich eine lange, weitschweifige Erklärung an. Würden Sie sich nicht langweilen und die Konzentration verlieren? Das Gleiche gilt für die Kommunikation zwischen einer sprachgesteuerten Benutzeroberfläche und den Benutzern.
Um sie bei der Stange zu halten, ist es wichtig, sich kurz zu fassen. Kurze und knappe Antworten sind viel effektiver. Anstatt zum Beispiel zu sagen: „Das aktuelle Wetter in Tokio ist überwiegend bewölkt mit einer Höchsttemperatur von 15 Grad Celsius und einer Tiefsttemperatur von 8 Grad Celsius“, könnte eine Sprachschnittstelle einfach sagen: „In Tokio ist es heute überwiegend bewölkt mit einer Höchsttemperatur von 15 Grad und einer Tiefsttemperatur von 8 Grad.“
Kein System ist perfekt, und bei der Interaktion mit der Benutzeroberfläche können Fehler auftreten. Das Design für eine reibungslose Fehlerbehandlung ist entscheidend für ein positives Benutzererlebnis.
Wenn Fehler auftreten, geben Sie klare und präzise Fehlermeldungen aus, die den Benutzer über das Problem informieren und Hinweise zum weiteren Vorgehen geben. Wenn Sie zum Beispiel „Musik abspielen“ sagen und der Assistent dies nicht versteht, könnte er sagen: „Tut mir leid, das habe ich nicht verstanden. Könnten Sie bitte versuchen, das noch einmal zu sagen?“
Außerdem sollten Sie die Implementierung von Funktionen wie automatische Fehlerbehebung oder Selbstkorrektur in Betracht ziehen, um Störungen zu minimieren.
Irgendwann müssen wir es alle zugeben. Apps können verwirrend sein, nicht wahr? Aber was wäre, wenn die App Sie durch jeden Schritt führen würde? Wie viel einfacher könnten die Dinge sein?

Das Gleiche gilt für Sprachassistenten. Wenn Benutzer mit einer Funktion oder Aufgabe nicht vertraut sind, kann die Sprachschnittstelle Schritt-für-Schritt-Anweisungen geben. Wenn ein Nutzer zum Beispiel eine wiederkehrende Erinnerung einrichten möchte, könnte der Assistent sagen: „Sagen Sie mir zuerst, woran Sie erinnert werden möchten. Dann sagen Sie mir, wie oft Sie erinnert werden möchten.“ So werden komplexe Aufgaben viel einfacher und leichter zugänglich.
Um ein ansprechendes und informatives Design für die Benutzeroberfläche zu entwerfen, ist es wichtig, dass Sie die Zielgruppe genau kennen. Handelt es sich um technikbegeisterte Millennials oder ältere Erwachsene? Sind sie in erster Linie an Unterhaltung oder Produktivität interessiert?
Die Durchführung von UX-Forschungsarbeiten ist unerlässlich, um die spezifischen Bedürfnisse und Ziele zu ermitteln, die die Benutzer durch die Sprachinteraktion zu erreichen hoffen. Dazu gehört es, die Herausforderungen und Frustrationen der Benutzer zu ermitteln, z. B. bei der Interaktion mit komplexen Menüs oder langen Formularen. Auf welche Probleme stoßen sie bei der Verwendung herkömmlicher Schnittstellen?
Um eine wirklich effektive sprachgesteuerte Benutzeroberfläche zu designen, müssen Sie sich reale Benutzerszenarien vorstellen, in denen die Interaktion mit einer sprachgesteuerten Benutzeroberfläche einen Unterschied machen kann. Im Gesundheitswesen könnte eine Sprachschnittstelle beispielsweise die Terminplanung vereinfachen, den Zugang zu medizinischen Informationen erleichtern und personalisierte Gesundheitsberatung anbieten. Wenn Sie sich in die Lage Ihrer Zielbenutzer versetzen, können Sie eine ganze Reihe potenzieller Lösungen für sprachgesteuerte Benutzeroberflächen erschließen.
Sprachbefehle
Sprachbefehle bieten eine freihändige und effiziente Möglichkeit, mit Geräten und Anwendungen zu interagieren. Sie können Dinge sagen wie „Schalten Sie das Licht ein“ oder „Spielen Sie meinen Lieblingssong ab“ und Ihr Gerät wird darauf reagieren. Das ist eine bequeme und handfreie Art, Dinge zu erledigen. Dies kann die Produktivität erheblich verbessern, insbesondere in Multitasking-Szenarien.

Informationsabfrage
Sprachgesteuerte Benutzeroberflächensysteme können schnell und präzise Informationen aus einer Vielzahl von Quellen abrufen, z. B. aus dem Internet, Datenbanken und persönlichen Kalendern. Sie können ihnen Fragen wie „Wie ist das Wetter heute?“ oder „Was sind die neuesten Nachrichten?“ oder sogar komplexe Themen wie Geschichte oder Wissenschaft stellen und erhalten sofort relevante Antworten.
Diese Funktion kann Zeit und Mühe sparen, insbesondere bei Aufgaben, die eine Suche nach bestimmten Informationen erfordern. Es ist, als hätten Sie einen sachkundigen Freund immer zur Hand.
Transaktionsbezogene Interaktionen
Sprachgesteuerte Benutzeroberflächen können komplexe Transaktionsvorgänge wie Einkäufe, Terminbuchungen oder Geldüberweisungen vereinfachen. Sie können Dinge sagen wie „Bestellen Sie eine Pizza“ oder „Buchen Sie ein Hotelzimmer“ und die Sprachschnittstelle erledigt den Rest.
Durch die Verwendung von Sprachbefehlen können Benutzer diese Aufgaben effizienter und bequemer erledigen, ohne dass manuelle Eingaben oder die Navigation durch komplexe Schnittstellen erforderlich sind. Dies ist eine bequeme und effiziente Art, Dinge zu erledigen, insbesondere für Menschen, die Schwierigkeiten mit herkömmlichen Schnittstellen haben.
Benachrichtigungen und Alarme
Sprachgesteuerte Benutzeroberflächensysteme können zeitnahe und relevante Benachrichtigungen und Warnungen liefern und so sicherstellen, dass die Benutzer informiert bleiben, ohne überfordert zu werden. Eine sprachgesteuerte Benutzeroberfläche kann Sie zum Beispiel an einen Arzttermin erinnern oder Sie auf einen Stau auf dem Weg zum Arbeitsplatz hinweisen. Sprachgesteuerte Benutzeroberflächen können die Benutzererfahrung und die Entscheidungsfindung verbessern, indem sie einen unaufdringlichen, personalisierten Ansatz verfolgen.
Sie müssen Alltagssprache verwenden und allzu formale oder technische Begriffe vermeiden, damit sich die Interaktion mit der Benutzeroberfläche natürlicher anfühlt. Auch ein wenig Persönlichkeit kann die Interaktion angenehmer machen.
Eine sprachgesteuerte Benutzeroberfläche könnte einen Witz reißen, einen lustigen Fakt mitteilen oder einfach in einem freundlichen Tonfall antworten. Dies kann dazu beitragen, eine Verbindung mit dem Benutzer aufzubauen und das Erlebnis einnehmender und menschlicher zu gestalten.

Nehmen wir an, Sie treffen sich mit einem alten Freund, den Sie schon lange nicht mehr gesehen haben, und Sie beide haben sich viel zu erzählen. Sie können natürlich nicht mit Punkt Z beginnen, ohne auf Punkt A einzugehen. Sie könnten also zunächst eine Frage stellen, auf die Ihr Freund antwortet, und dann mit einer weiteren Frage oder Bitte nachhaken.
Das ist ähnlich wie bei Dialogen mit mehreren Schritten in einer Sprachschnittstelle. Um diese effektiv zu handhaben, muss sich die Sprachschnittstelle den Kontext des Gesprächs merken und den Benutzer durch jeden Schritt führen. Wenn ein Benutzer z.B. fragt: „Wie wird das Wetter morgen?“ und daraufhin „Wie sieht es übermorgen aus?“, sollte die Sprachschnittstelle in der Lage sein, den Kontext zu verstehen und die Wettervorhersage für den nächsten Tag zu liefern.
Wenn ein Benutzer eine unerwartete Antwort gibt, sollte die Sprachbenutzerschnittstelle damit umgehen können. Wenn der Benutzer beispielsweise nach einer Restaurantempfehlung fragt, dann aber plötzlich das Thema wechselt, könnte die Sprachschnittstelle die Änderung höflich zur Kenntnis nehmen und den Benutzer fragen, ob er mit der Restaurantsuche fortfahren oder etwas anderes besprechen möchte. Wie im richtigen Leben!
Für reibungslose VUI-Interaktionen ist es wichtig, dass Sie klar definieren, wer an der Reihe ist. Um Verwirrung zu vermeiden, verwenden Sprachassistenten Techniken wie Audiohinweise und Stilleerkennung. Auf diese Weise kann das System effektiv signalisieren, wann es zuhört und wann es spricht.

Wenn Sie zum Beispiel eine Frage stellen, könnte der Assistent einen Ton abspielen, um anzuzeigen, dass er zuhört. Sobald er die Bearbeitung Ihrer Anfrage abgeschlossen hat, wird er sie weitergeben.
Unterbrechungen und Pausen sind bei menschlichen Gesprächen üblich. Um sie elegant zu behandeln, sollte die Benutzeroberfläche so designt sein, dass sie Unterbrechungen erkennt und angemessen darauf reagiert.
Eine Zeitüberschreitung bei Stille kann helfen, festzustellen, wann der Benutzer zu Ende gesprochen hat oder nicht mehr beteiligt ist. Wenn die Eingaben des Benutzers unklar sind, kann das System die Frage neu formulieren oder um Klärung bitten. Hier sind einige Beispiele dafür, wie das aussehen kann:
Benutzer: „Hey, können Sie eine Erinnerung einstellen für…“ pausiert
Sprachgesteuerte Benutzeroberfläche: „Sicher, woran möchten Sie erinnert werden?“
Die Fehlerbehandlung ist ein wichtiger Aspekt des VUI-Designs. Indem Sie häufige Fehler vorhersehen und effektive Wiederherstellungsstrategien implementieren, können Sie die Frustration der Benutzer minimieren und ein positives Erlebnis aufrechterhalten. Sie könnten zum Beispiel einen Befehl falsch interpretieren, ein Wort nicht erkennen oder den gesamten Kontext einer Anfrage nicht verstehen. Um diese Situationen zu bewältigen, sollte die Benutzeroberfläche so designt sein, dass sie:
- Gestehen Sie den Fehler ein: Eine einfache Entschuldigung kann viel dazu beitragen, ein positives Benutzererlebnis zu erhalten.
- Bieten Sie klare Anleitungen: Die VUI kann spezifische Vorschläge machen oder klärende Fragen stellen, um dem Benutzer zu helfen, den Fehler zu beheben.
- Lernen Sie aus Fehlern: Die VUI kann den Fehler nutzen, um ihr Verständnis von Sprache und Kontext in Zukunft zu verbessern.

Bestätigungen und Rückmeldungen sind notwendig, um Genauigkeit und Transparenz bei VUI-Interaktionen zu gewährleisten. Indem Sie den Benutzer auffordern, seine Absichten oder Entscheidungen zu bestätigen, können Sie die Wahrscheinlichkeit von Fehlern verringern. Außerdem trägt die Rückmeldung über die Aktionen des Systems dazu bei, Vertrauen und Transparenz zu schaffen.
In der Praxis sieht das so aus, dass Sie einen Sprachassistenten bitten, eine Aufgabe auszuführen, und er dann um eine Bestätigung bittet, um sicherzustellen, dass er das Richtige tut. Wenn Sie zum Beispiel sagen: „Bestellen Sie eine große Peperoni-Pizza“, könnte der Assistent sagen: „Wollten Sie eine große Peperoni-Pizza?“ Dies hilft, Missverständnisse zu vermeiden und stellt sicher, dass Ihre Anfrage korrekt ausgeführt wird.

Wenn die VUI auf ein Missverständnis oder eine unvollständige Anfrage stößt, ist es wichtig, den Benutzer auf höfliche und hilfreiche Weise erneut aufzufordern. Vermeiden Sie eine anklagende Sprache oder machen Sie den Benutzer für den Fehler verantwortlich. Verwenden Sie stattdessen eine einfühlsame Sprache und bieten Sie eine klare Anleitung.
Die VUI könnte zum Beispiel sagen: „Ich bin nicht sicher, ob ich Sie verstehe. Könnten Sie Ihre Anfrage bitte anders formulieren?“ oder „Ich kann Ihnen dabei helfen. Bitte geben Sie das Datum und die Uhrzeit an.“
Durch das Anbieten von Hilfeoptionen können Benutzer die Kontrolle über die Interaktion übernehmen und bei Bedarf Hilfe anfordern. Dies kann durch verschiedene Methoden erreicht werden, z. B. durch die Bereitstellung eines „Hilfe“-Befehls oder einer Liste der verfügbaren Befehle. Indem Sie einen einfachen Zugang zur Hilfe anbieten, können Sie Frustration vermeiden, denn das ist das Schlimmste.
Eines der Schlüsselelemente einer erfolgreichen VUI ist die Fähigkeit, den Kontext während eines Gesprächs beizubehalten. Wenn sich die VUI an frühere Anfragen und Antworten des Benutzers erinnert, kann sie relevantere und persönlichere Erfahrungen bieten. Wenn ein Benutzer beispielsweise nach dem Wetter fragt, kann die VUI daraufhin eine Frage zu seinen Reiseplänen an einen bestimmten Ort stellen.
Die Personalisierung von Antworten auf der Grundlage von Benutzerpräferenzen und -historie kann den entscheidenden Unterschied in der VUI-Erfahrung ausmachen. Die Analyse von Benutzerdaten hilft der VUI, ihre Antworten auf individuelle Bedürfnisse und Vorlieben zuzuschneiden.
Eine VUI kann Sie zum Beispiel mit Ihrem Namen begrüßen, Produkte auf der Grundlage früherer Einkäufe empfehlen und sogar die Lautstärke und Sprechgeschwindigkeit an Ihre Vorlieben anpassen!

Stellen Sie sich vor: Sie fahren zur Arbeit und Ihr Sprachassistent weist Sie auf einen Stau vor Ihnen hin und schlägt Ihnen eine andere Route vor. Oder Sie sind auf der Suche nach einem Restaurant und Ihr Assistent empfiehlt Ihnen ein Restaurant in der Nähe, das Ihren Ernährungsgewohnheiten entspricht.
Dies sind nur einige Beispiele dafür, wie Sprachschnittstellen Standort- und Umgebungsdaten nutzen können, um kontextrelevante Informationen und Dienste bereitzustellen. Wenn Sie Ihren Standort und Ihre Vorlieben kennen, kann die Sprachsteuerung maßgeschneiderte Vorschläge machen und Ihnen das Leben erleichtern.
Wenn Sie z.B. in eine neue Stadt reisen, kann Ihre Sprachschnittstelle Informationen über lokale Sehenswürdigkeiten, Transportmöglichkeiten und Restaurants in der Nähe liefern. Sie kann Ihnen auch dabei helfen, sich in unbekannten Straßen zurechtzufinden und die besten Orte zu finden.
Die langfristige Kontextverwaltung umfasst das Speichern und Abrufen von Informationen über die Interaktionen des Benutzers im Laufe der Zeit. Dies kann dazu genutzt werden, die Fähigkeit der sprachgesteuerten Benutzeroberfläche zu verbessern, personalisierte Empfehlungen zu geben und Ihre Bedürfnisse zu antizipieren.
Wenn Sie zum Beispiel häufig Jazzmusik hören, könnte die Sprachsteuerung Ihnen Jazz-Playlists oder Interpreten vorschlagen. Oder wenn Sie mitten in einer Aufgabe stecken und eine Pause machen müssen, kann sich die Sprachschnittstelle merken, wo Sie aufgehört haben und die Aufgabe fortsetzen, wenn Sie bereit sind. Welch reizvolle Erfahrungen!
Intelligente Lautsprecher wie Amazon Echo (Alexa) und Google Home haben die Sprachinteraktion in Ihrem Zuhause populär gemacht. Diese Geräte sind für den freihändigen Betrieb optimiert und ermöglichen es dem Benutzer, verschiedene Geräte und Dienste mit Sprachbefehlen zu steuern. Zu den wichtigsten Überlegungen beim Design der VUI für intelligente Lautsprecher gehören:
- Eindeutige Weckwörter: Verwenden Sie eindeutige Weckwörter wie „Alexa“ oder „Hey Google“, um das Gerät auszulösen.
- Natürliches Sprachverständnis: Interpretation komplexer Sprachbefehle und Erfüllung von Benutzeranfragen.
- Kontexterkennung: Verstehen der Absicht des Benutzers und Bereitstellen relevanter Antworten auf der Grundlage des Kontexts.
Datenschutz und Sicherheit: Gewährleistung eines sicheren Umgangs mit Daten und Schutz der Privatsphäre der Benutzer.

Mobile Apps haben auch Sprachinteraktionen eingeführt, um die Benutzererfahrung zu verbessern. Mit Google Assistant und Siri können Sie beispielsweise per Sprachbefehl Aufgaben wie Anrufe tätigen, Nachrichten versenden und Erinnerungen einstellen. Diese sprachgesteuerten Apps fügen sich nahtlos in die Funktionen und die Benutzeroberfläche des Geräts ein und ermöglichen eine freihändige und effiziente Interaktion mit dem Telefon.
- Nahtlose Integration: Integration von Sprachbefehlen mit den bestehenden Funktionen und der Benutzeroberfläche der App.
- Kontexterkennung: Verstehen der aktuellen Aufgabe des Benutzers und Bereitstellung relevanter Sprachbefehle.
- Fehlerbehandlung: Anständiger Umgang mit Fehlern und klare Rückmeldung an den Benutzer.
- Zugänglichkeit: Design der Sprachschnittstelle, um sie für Benutzer mit Behinderungen zugänglich zu machen.
VUI-Systeme im Auto, wie sie in Tesla-Fahrzeugen und Ford Sync zu finden sind, stellen die Sicherheit in den Vordergrund, indem sie die Anzahl der für die Ausführung von Aufgaben erforderlichen Sprachbefehle begrenzen. Diese Systeme verwenden klare und prägnante Aufforderungen und Sprachbestätigungen, um Ablenkungen zu minimieren und das Unfallrisiko zu verringern.
- Minimale Ablenkung: Begrenzung der Anzahl von Sprachbefehlen, die für die Erledigung einer Aufgabe erforderlich sind.
- Klare und prägnante Aufforderungen: Verwenden Sie eine klare und prägnante Sprache, um Verwirrung zu vermeiden.
- Sprachliche Bestätigung: Bestätigen Sie kritische Aktionen, um das Risiko von Fehlern zu verringern.
- Ruhige Umgebung: Optimierung der VUI für eine effektive Funktion in lauten Umgebungen.

User Scenario with Tesla Model 3’s Redesigned Voice User Interface (VUI). Photo by Diana Lu.
Wearable Devices und IoT-Geräte wie Smartwatches und intelligente Thermostate verlassen sich aus Gründen der Bequemlichkeit und Effizienz häufig auf Sprachinteraktionen. Durch die Verwendung kurzer und prägnanter Befehle können diese Geräte schnelle und relevante Informationen liefern und gleichzeitig den Akkuverbrauch minimieren.
- Kurze und prägnante Befehle: Halten Sie die Sprachbefehle kurz und prägnant.
- Klare und prägnante Antworten: Präzise und relevante Informationen bereitstellen.
- Akku-Effizienz: Optimierung der VUI zur Minimierung des Akkuverbrauchs.
- Datenschutz und Sicherheit: Schutz der Benutzerdaten und Gewährleistung einer sicheren Kommunikation.
Eine der größten Herausforderungen beim VUI design sind die inhärenten Grenzen der Spracherkennungstechnologie. Akzente und Unterschiede in der Aussprache können die Genauigkeit von Spracherkennungssystemen erheblich beeinträchtigen.
Um diese Herausforderungen zu meistern, verwenden die Entwickler Sprachmodelle, die dem Assistenten helfen, verschiedene Akzente und Dialekte zu verstehen.
Diese Techniken helfen Sprachassistenten, Benutzerbefehle besser zu verstehen und diskriminierungsfrei darauf zu reagieren.
Wenn Sie einen Sprachassistenten verwenden, geben Sie persönliche Daten wie Ihre Adresse oder Ihre Kreditkartennummer preis. Es ist wichtig, dass Sie darauf vertrauen, dass das Unternehmen, das hinter dem Assistenten steht, Ihre Daten schützt. Dies erfordert robuste Sicherheitsmaßnahmen wie Verschlüsselung, sichere Datenspeicherung und Zugangskontrollen. Außerdem sind transparente Datenpraktiken und klare Datenschutzrichtlinien unerlässlich, um das Vertrauen der Nutzer zu gewinnen.

Es ist wichtig, realistische Erwartungen an die VUI-Funktionen zu stellen. Die VUI-Technologie hat sich zwar erheblich weiterentwickelt, aber es ist wichtig, nicht zu viel zu versprechen und zu wenig zu liefern. Wenn Sie die Grenzen und Möglichkeiten des Systems klar kommunizieren, können die Benutzer realistische Erwartungen entwickeln und Frustrationen vermeiden.
Hatten Sie schon einmal das Gefühl, dass Ihr Sprachassistent Sie ausblendet? Nun, Hintergrundgeräusche können ein echter Spielverderber sein! Aber keine Sorge, die Entwickler haben Ihnen den Rücken freigehalten. Sie verwenden eine spezielle Geräuschunterdrückung, damit Ihr Assistent Sie auch in einem überfüllten Raum laut und deutlich hört.
Das Design von sprachgesteuerten Benutzeroberflächen ist wahrlich futuristisch. Es gibt noch so viel zu entdecken, wenn es um das Potenzial dieses Bereichs geht, und um all das, was er wirklich werden kann. Genauso wie das UX design Gestalt annimmt und sich zu neuen Dingen entwickelt, so ist es auch bei der sprachgesteuerten Benutzeroberfläche.
Wenn wir die Prinzipien des Designs von Sprachschnittstellen verstehen und die damit verbundenen Herausforderungen meistern, können wir sprachgesteuerte Erlebnisse schaffen, die nicht nur effizient sind, sondern auch Spaß machen. Lassen Sie uns also die Zukunft der Sprache annehmen und die Art und Weise, wie wir mit unseren Geräten kommunizieren, weiter innovativ gestalten und verbessern!
PROTOTYP - KOMMUNIZIEREN - VALIDIEREN
ALL-IN-ONE PROTOTYPING-TOOL FÜR SPRACHSCHNITTSTELLEN
Related Content
- Vom wireframing bis zum responsiven Design bietet dieser Leitfaden praktische, umsetzbare Ratschläge für das Layoutdesign von Websites und mobilen Anwendungen. Lernen Sie, wie Sie visuell ansprechende UIs erstellen, die die gewünschten Ergebnisse liefern!44 min Read
- Beim Design von Spielen geht es vor allem darum, ein einzigartiges und fesselndes Erlebnis für die Spieler zu schaffen. Lesen Sie in diesem Beitrag, wie UI-Designer das machen!10 min Read
- Lernen Sie, wie Sie nahtlose Sucherlebnisse mit intelligenten Suchfeldern, intuitiven Filtern und benutzerfreundlichen Ergebnisseiten designen, damit Benutzer schneller finden, was sie brauchen.34 min Read