Anzeige

Anzeige
Sichern Sie sich mit Text-to-Speech neue und innovative Absatzmärkte!

TTS-Technologie (TTS: Text-to-Speech) ist an sich nichts Neues, aber die Art, wie diese Technologie in Zukunft eingesetzt werden kann. Ob in Smart Speakers oder Sprachassistenten, TTS nimmt in den alltäglichen Interaktionen zwischen Marken und Endnutzern eine immer wichtigere Position ein.

Was ist ein Sponsored Post?

1. März 2021

Anzeige

Bis vor Kurzem war TTS einer ganz bestimmten Situation vorbehalten: der Umwandlung von geschriebenem Text in Computersprache für Personen mit Sehbeeinträchtigungen oder Leseschwierigkeiten. Die Technologie diente also einem nützlichen Zweck, nämlich der Zugänglichkeit von bildschirmgebundenen Inhalten. Die synthetischen Stimmen klangen somit ziemlich digital, und Audioqualität sowie Sprechweise ließen stark zu wünschen übrig. Mit den Fortschritten bei der Sprachtechnologie und der damit einhergehenden Explosion von TTS in unterschiedlichen Branchen und bei unterschiedlichen Anwendungen kommt nun aber bei neuen und kreativen Anwendungen eine „menschliche“ Komponente ins Spiel – ermöglicht durch Mensch-Maschine-Schnittstellen.

Die Möglichkeiten von TTS

Personalisierbarkeit, Einfachheit, nahtlose Integrierbarkeit und Effizienz – das sind aktuell die wichtigsten Argumente für Unternehmen und ihre Kunden. TTS wird dabei an verschiedenen Kontaktpunkten für Neuerungen verwendet, mit denen die Erwartungen übertroffen werden können. Die Möglichkeiten, die die aktuelle TTS-Technologie bietet, werden bereits jetzt von einigen Marken genutzt. Sie stehen damit an der Spitze eines neuen Erlebnisstandards, der ihnen gegenüber den Mitbewerbern Vorteile verschafft und sie stärker im Bewusstsein der Verbraucher verankert.

Von der Masse abheben – mit individuellen Stimmen

Mithilfe digitaler Erlebnisse wird um die Aufmerksamkeit der Kunden gebuhlt. Um hier erfolgreich zu sein, setzen Einzelhändler auf die Voice Economy. Damit sind völlig neue Erlebnisse möglich, mit denen ein größerer Kundenkreis erreicht werden kann.

Hearables und Wearables

Hearables und Wearables machen es möglich, dass Menschen über KI-basierte Kopfhörer, Armbanduhren und Brillen mit Marken interagieren. Durch Konversations-KI in Verbindung mit den Verhaltensdaten, die von solchen Geräten erfasst werden, erstellen Einzelhändler interaktive Voice Ads, die die Kunden jederzeit, überall und als Reaktion auf ihre Aktivitäten in Echtzeit erreichen. Interaktive Voice Ads können gesprochene Fragen von Benutzern erfassen und darauf adäquat mit Produktinformationen oder in Form von Produktfotos auf dem Smartphone oder der Smartwatch des Benutzers reagieren, bevor der Kauf dann, ebenfalls per Stimme, getätigt wird. Auf diese Weise interagieren Marken sowohl vor als auch nach dem Verkauf und währenddessen mit den Verbrauchern, denn sie sind in der Lage, Bedürfnisse unmittelbar mithilfe von Konversations-KI und einer lebensechten TTS-Stimme zu befriedigen.

Individuelle TTS-Stimmen

Individuelle TTS-Stimmen sind der Schlüssel, wenn es darum geht, die Markenidentität zum Ausdruck zu bringen und den Wandel voranzutreiben. Die Internet-Buchhandlung bol.com, eine Tochter von Ahold Delhaize und eine der Top-15-Einzelhandelsketten weltweit, hat vor Kurzem ihr eigenes Branded-Voice-Erlebnis für den Google Assistant präsentiert. Das Unternehmen legt großen Wert auf sehr persönliche und dialogorientierte E-Commerce-Erlebnisse. Daher brauchte man eine individuelle Stimme, die sich von der Masse der Standardstimmen auf der Google-Plattform abhebt. Die Entwicklung dieser exklusiven, lebensechten TTS-Stimme für den Google Assistant vertraute bol.com ReadSpeaker an. Wenn die Benutzer jetzt zum Beispiel sagen „Talk to bol.com“ („Sprich mit bol.com“), wird der Assistent von bol.com für Verkaufsaktivitäten und Service-Anfragen aktiviert. Er beantwortet Fragen, informiert über tägliche Angebote und hält über frühere Anfragen auf dem Laufenden. So werden die bekannten Kernwerte von bol.com mithilfe von KI, TTS und auf personalisierte Weise den Verbrauchern direkt vermittelt, wenn sie über ein Google-Gerät mit dem Assistenten interagieren.

Sprachdialogsysteme und TTS mit Emotionen runden den Verkaufsprozess ab

Sprachdialogsysteme (Interactive Voice Response/IVR) sind ein bekanntes Anwendungsbeispiel für TTS-Technologie. Tatsächlich hat TTS das Callcenter-Erlebnis über Jahrzehnte hinweg geprägt: Die Verbraucher rufen eine Servicenummer an und interagieren anhand vorgefertigter und vorab aufgenommener Antworten mit den Unternehmen. Dank der jüngsten Fortschritte bei der Konversations-KI und der TTS-Technologie bieten Callcenter Unternehmen jetzt aber die Möglichkeit, die eingehenden Anrufe effizienter zu managen und die Bedürfnisse der Kunden besser zu befriedigen.

Callcenter-Stimmen mit Emotionen

In Callcentern wird eine Vielzahl von Anrufen erledigt. Anrufbäume erleichtern zwar die Arbeit der Mitarbeiter etwas, allerdings leidet dabei nicht selten das Kundenerlebnis. Besser fallen die Reaktionen bei natürlichen und personalisierten Sprachkontakten aus. Nun werden die Mitarbeiter zwar dafür geschult, Anfragen in einem empathischen Ton zu beantworten, ist jedoch ein aufgeregter oder frustrierter Anrufer in der Leitung, ist das gar nicht so leicht. Damit Sorgen möglichst effektiv und schnell und ohne zusätzliche Belastung für die Mitarbeiter beseitigt werden können, kommen anstelle von mehr Beschäftigten und intensiveren Schulungen immer häufiger Konversations-KI und TTS-Stimmen mit Emotionen zum Einsatz.

Sprachdialogsysteme können die Merkmale in der Stimme des Anrufers analysieren und erkennen so, ob er glücklich, wütend oder aber gestresst ist. Daraufhin wird der Tonfall der Antworten daran angepasst. Ein Anruf bei einer Fluggesellschaft über einen Sprachassistenten kann sich beispielsweise in verschiedene Richtungen entwickeln. Wenn ein Urlaubsflug gebucht werden soll, ist der Ton vermutlich neutral bis glücklich. Wenn es um eine Verspätung geht, sieht es schon anders aus: Der Ton ist frustriert oder verärgert. KI-basierte Sprachassistenten können diese Unterschiede erkennen und reagieren jeweils mit der TTS-Stimme, die am besten zur Situation passt. Tonlose Antworten für jeden Gemütszustand sind damit passé.

Digitale Stimmen auf einem neuen Level

Die digitale Sprachtechnologie setzt sich immer mehr durch, wird immer besser und sorgt für eine Modernisierung des Verkaufsprozesses. Gleichzeitig schafft sie Innovationsmöglichkeiten für Kundenerlebnisse und eine größere Reichweite. Die Welt wird immer mobiler, weniger abhängig von Bildschirmen und stärker nachfrageorientiert. Personalisierte Spracherlebnisse mit individueller TTS bringen die Marken verbindlicher und zielführender mit potenziellen Kunden in Kontakt. Sofern nicht bereits geschehen, sollten Marken daher ihre besten Köpfe auf die Sprachtechnologie ansetzen, die dann Pläne für einen zeitgemäßen und überzeugenden Umbau erarbeiten können.

Laden Sie die KOSTENLOSE Checkliste von ReadSpeaker herunter und erfahren Sie, wie Sie Spracherlebnisse in Ihre Marketing-Strategie einbetten können.

Anzeige